Pregunta 1 - ¿Es igual o diferente el ingreso corriente entre la zonas rurales y urbanas en este Estado? (Ciudad de México, código 9)

Diagrama de caja

baseDatos = read.csv("Centro.csv")

options(scipen=999)

Morelos = subset(baseDatos,baseDatos$Estado=="17") 
Morelos$localidad <- as.factor(Morelos$localidad)
levels(Morelos$localidad) <- c("Rural", "Urbana")
boxplot(Morelos$ing_cor ~ Morelos$localidad, col= c("blue", "magenta"), ylab="Ingreso corriente", xlab="Zona", main="Ingreso Corriente en Zonas Rurales y Urbanas de Morelos")

Histogramas

baseDatos = read.csv("Centro.csv")

Morelos = subset(baseDatos,baseDatos$Estado=="17") 

options(scipen=999)

par(cex = 0.7) 
par(mfrow=c(1,2)) #dividirá en seis partes, un renglón y tres columnas y en cada uno de esos espacios va una gráfica

# Rural

Rural = subset(Morelos,Morelos$localidad=="R") 

hist(Rural$ing_cor, col="magenta", ylab="Frecuencia", xlab="Ingreso corriente", main="Zona Rural de Morelos")

# Urbano

Urbano = subset(Morelos,Morelos$localidad=="U") 

hist(Urbano$ing_cor, col="blue", ylab="Frecuencia", xlab="Ingreso corriente", main="Zona Urbana de Morelos")

Medidas descriptivas

library(knitr)
library(kableExtra)
media=tapply(Morelos$ing_cor,Morelos$localidad,mean) #calcula media de ingreso por localidad
mediana=tapply(Morelos$ing_cor,Morelos$localidad,median)
rangointer=tapply(Morelos$ing_cor,Morelos$localidad,IQR)
desviacionstd=tapply(Morelos$ing_cor,Morelos$localidad,sd)
descriptive<-data.frame(media,mediana,rangointer,desviacionstd) #data.frame une las medidas anteriores en una tabla
colnames(descriptive)=c("Media", "Mediana", "Rango Inter", "Desviación Std")
rownames(descriptive)=c("Zona Rural", "Zona Urbana")
kable(descriptive, caption = "Medidas Descriptivas", format = "html") %>%
  kable_styling(full_width = FALSE) %>%
  column_spec(1, width = "3.5cm") %>%
  column_spec(2, width = "3cm") %>%
  column_spec(3, width = "3cm") %>%
  column_spec(4, width = "3cm") %>%
  column_spec(5, width = "3.2cm")
Medidas Descriptivas
Media Mediana Rango Inter Desviación Std
Zona Rural 48684.07 40170.32 30166.45 32694.93
Zona Urbana 63163.39 44071.29 46866.37 70364.04

Pregunta 2 - ¿Es igual o diferente el gasto monetario entre los diferentes estratos socioeconómicos en este Estado? (Ciudad de México, código 9)

Diagrama de caja

baseDatos = read.csv("Centro.csv")

options(scipen=999)

Morelos = subset(baseDatos,baseDatos$Estado=="17") 
Morelos$est_socio <- as.factor(Morelos$est_socio)
levels(Morelos$est_socio) <- c("Bajo", "Medio Bajo", "Medio Alto", "Alto")
boxplot(Morelos$gasto_mon ~ Morelos$est_socio, col= c("cyan", "orange", "purple", "green"), ylab="Gasto monetario", xlab="Estrato socioeconómico", main="Gasto Monetario en los estratos socioeconómicos de Morelos")

Histogramas

baseDatos = read.csv("Centro.csv")

Morelos = subset(baseDatos,baseDatos$Estado=="17") 

options(scipen=999)

par(cex = 0.7) 
par(mfrow=c(2,2)) #dividirá en seis partes, un renglón y tres columnas y en cada uno de esos espacios va una gráfica

# Bajo

Bajo = subset(Morelos,Morelos$est_socio=="1") 

hist(Bajo$gasto_mon, col="cyan", ylab="Frecuencia", xlab="Gasto monetario", main="Estrato Socioeconómico Bajo en Morelos")

# Medio Bajo

Mediobajo = subset(Morelos,Morelos$est_socio=="2") 

hist(Mediobajo$gasto_mon, col="orange", ylab="Frecuencia", xlab="Gasto monetario", main="Estrato Socioeconómico Medio Bajo en Morelos")

# Medio Alto

Medioalto = subset(Morelos,Morelos$est_socio=="3") 

hist(Medioalto$gasto_mon, col="purple", ylab="Frecuencia", xlab="Gasto monetario", main="Estrato Socioeconómico Medio Alto en Morelos")

# Alto

Alto = subset(Morelos,Morelos$est_socio=="4") 

hist(Alto$gasto_mon, col="green", ylab="Frecuencia", xlab="Gasto monetario", main="Estrato Socioeconómico Alto en Morelos")

Medidas descriptivas

library(knitr)
library(kableExtra)
media=tapply(Morelos$gasto_mon,Morelos$est_socio,mean) #calcula media de ingreso por estrato socioeconómico
mediana=tapply(Morelos$gasto_mon,Morelos$est_socio,median)
rangointer=tapply(Morelos$gasto_mon,Morelos$est_socio,IQR)
desviacionstd=tapply(Morelos$gasto_mon,Morelos$est_socio,sd)
descriptive<-data.frame(media,mediana,rangointer,desviacionstd) #data.frame une las medidas anteriores en una tabla
colnames(descriptive)=c("Media", "Mediana", "Rango Inter", "Desviación Std")
rownames(descriptive)=c("Bajo", "Medio Bajo", "Medio Alto", "Alto")
kable(descriptive, caption = "Medidas Descriptivas", format = "html") %>%
  kable_styling(full_width = FALSE) %>%
  column_spec(1, width = "3.5cm") %>%
  column_spec(2, width = "3cm") %>%
  column_spec(3, width = "3cm") %>%
  column_spec(4, width = "3cm") %>%
  column_spec(5, width = "3.2cm")
Medidas Descriptivas
Media Mediana Rango Inter Desviación Std
Bajo 30757.93 27670.87 20432.18 21493.40
Medio Bajo 36755.61 30307.82 28019.66 28301.30
Medio Alto 52169.97 39624.40 32203.85 42773.48
Alto 85354.13 72525.00 34224.83 45767.97