Area: urbano = 1 rural = 2

URBANO

1 Pregunta TIPO_OPERATIVO: TIPO_OPERATIVO

1 Hogar en vivienda particular
2 Vivienda colectiva (no es hogar)
3 Operativo personas en tránsito (no es hogar)
4 Operativo calle (no es hogar)

1.1 Cálculo de frecuencias

Leemos las respuestas a la pregunta TIPO_OPERATIVO del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:

tabla_con_clave <- readRDS("../censo_hogares_con_clave_17.rds")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$TIPO_OPERATIVO
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
 
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:4){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
 
 
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
 
names(comuna_corr)[13] <- "código" 
 
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_urbano_nacional.rds")


df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
código unlist.c..x Freq.x anio.x unlist.c..y Freq.y anio.y unlist.c..x.1 Freq.x.1 anio.x.1 unlist.c..y.1 Freq.y.1 anio.y.1 comuna.x promedio_i año comuna.y personas Ingresos_expandidos tipo
01101 1 59435 2017 NA NA NA NA NA NA NA NA NA Iquique 356487.6 2017 1101 191468 68255976664 Urbano
01107 1 29652 2017 NA NA NA NA NA NA NA NA NA Alto Hospicio 301933.4 2017 1107 108375 32722034397 Urbano
01401 1 2829 2017 NA NA NA NA NA NA NA NA NA Pozo Almonte 299998.6 2017 1401 15711 4713278189 Urbano
01404 1 358 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
01405 1 1313 2017 NA NA NA NA NA NA NA NA NA Pica 330061.1 2017 1405 9296 3068247619 Urbano
02101 1 105521 2017 NA NA NA NA NA NA NA NA NA Antofagasta 347580.2 2017 2101 361873 125779893517 Urbano
02102 1 3292 2017 NA NA NA NA NA NA NA NA NA Mejillones 369770.7 2017 2102 13467 4979702302 Urbano
02104 1 3317 2017 NA NA NA NA NA NA NA NA NA Taltal 376328.9 2017 2104 13317 5011572025 Urbano
02201 1 47501 2017 NA NA NA NA NA NA NA NA NA Calama 416281.1 2017 2201 165731 68990679686 Urbano
02203 1 1624 2017 NA NA NA NA NA NA NA NA NA San Pedro de Atacama 437934.7 2017 2203 10996 4815529626 Urbano
02301 1 7780 2017 NA NA NA NA NA NA NA NA NA Tocopilla 271720.8 2017 2301 25186 6843559467 Urbano
02302 1 1395 2017 NA NA NA NA NA NA NA NA NA María Elena 466266.9 2017 2302 6457 3010685220 Urbano
03101 1 45919 2017 NA NA NA NA NA NA NA NA NA Copiapó 330574.6 2017 3101 153937 50887663717 Urbano
03102 1 5007 2017 NA NA NA NA NA NA NA NA NA Caldera 299314.8 2017 3102 17662 5286498241 Urbano
03103 1 2955 2017 NA NA NA NA NA NA NA NA NA Tierra Amarilla 315860.6 2017 3103 14019 4428049932 Urbano
03201 1 3337 2017 NA NA NA NA NA NA NA NA NA Chañaral 286389.3 2017 3201 12219 3499391196 Urbano
03202 1 4345 2017 NA NA NA NA NA NA NA NA NA Diego de Almagro 325861.5 2017 3202 13925 4537621312 Urbano
03301 1 14292 2017 NA NA NA NA NA NA NA NA NA Vallenar 311577.0 2017 3301 51917 16176145007 Urbano
03303 1 1432 2017 NA NA NA NA NA NA NA NA NA Freirina 289049.9 2017 3303 7041 2035200054 Urbano
03304 1 2893 2017 NA NA NA NA NA NA NA NA NA Huasco 337414.8 2017 3304 10149 3424422750 Urbano
04101 1 63584 2017 NA NA NA NA NA NA NA NA NA La Serena 272136.8 2017 4101 221054 60156924947 Urbano
04102 1 65051 2017 NA NA NA NA NA NA NA NA NA Coquimbo 264340.0 2017 4102 227730 60198159091 Urbano
04103 1 3133 2017 NA NA NA NA NA NA NA NA NA Andacollo 251267.7 2017 4103 11044 2775000288 Urbano
04104 1 396 2017 NA NA NA NA NA NA NA NA NA La Higuera 214257.0 2017 4104 4241 908664019 Urbano
04106 1 5471 2017 NA NA NA NA NA NA NA NA NA Vicuña 245957.4 2017 4106 27771 6830481918 Urbano
04201 1 6862 2017 NA NA NA NA NA NA NA NA NA Illapel 270316.5 2017 4201 30848 8338722128 Urbano
04202 1 711 2017 NA NA NA NA NA NA NA NA NA Canela 233397.3 2017 4202 9093 2122281844 Urbano
04203 1 5835 2017 NA NA NA NA NA NA NA NA NA Los Vilos 282415.6 2017 4203 21382 6038609501 Urbano
04204 1 5166 2017 NA NA NA NA NA NA NA NA NA Salamanca 262056.9 2017 4204 29347 7690585032 Urbano
04301 1 27402 2017 NA NA NA NA NA NA NA NA NA Ovalle 274771.4 2017 4301 111272 30574361012 Urbano
04302 1 2132 2017 NA NA NA NA NA NA NA NA NA Combarbalá 228990.4 2017 4302 13322 3050610572 Urbano
04303 1 4923 2017 NA NA NA NA NA NA NA NA NA Monte Patria 225369.1 2017 4303 30751 6930326684 Urbano
04304 1 1937 2017 NA NA NA NA NA NA NA NA NA Punitaqui 212496.1 2017 4304 10956 2328107498 Urbano
05101 1 100951 2017 NA NA NA NA NA NA NA NA NA Valparaíso 297929.0 2017 5101 296655 88382118059 Urbano
05102 1 5802 2017 NA NA NA NA NA NA NA NA NA Casablanca 341641.8 2017 5102 26867 9178890241 Urbano
05103 1 13146 2017 NA NA NA NA NA NA NA NA NA Concón 318496.3 2017 5103 42152 13425257057 Urbano
05105 1 5458 2017 NA NA NA NA NA NA NA NA NA Puchuncaví 296035.5 2017 5105 18546 5490274928 Urbano
05107 1 8975 2017 NA NA NA NA NA NA NA NA NA Quintero 308224.7 2017 5107 31923 9839456903 Urbano
05109 1 119381 2017 NA NA NA NA NA NA NA NA NA Viña del Mar 337006.1 2017 5109 334248 112643604611 Urbano
05201 1 2358 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05301 1 19637 2017 NA NA NA NA NA NA NA NA NA Los Andes 339720.2 2017 5301 66708 22662055502 Urbano
05302 1 3375 2017 NA NA NA NA NA NA NA NA NA Calle Larga 246387.3 2017 5302 14832 3654416747 Urbano
05303 1 2524 2017 NA NA NA NA NA NA NA NA NA Rinconada 273904.7 2017 5303 10207 2795744821 Urbano
05304 1 3686 2017 NA NA NA NA NA NA NA NA NA San Esteban 219571.6 2017 5304 18855 4140022481 Urbano
05401 1 8777 2017 NA NA NA NA NA NA NA NA NA La Ligua 250134.4 2017 5401 35390 8852256241 Urbano
05402 1 3903 2017 NA NA NA NA NA NA NA NA NA Cabildo 262745.9 2017 5402 19388 5094117762 Urbano
05403 1 1793 2017 NA NA NA NA NA NA NA NA NA Papudo 294355.2 2017 5403 6356 1870921373 Urbano
05404 1 1449 2017 NA NA NA NA NA NA NA NA NA Petorca 237510.8 2017 5404 9826 2333781007 Urbano
05405 1 1686 2017 NA NA NA NA NA NA NA NA NA Zapallar 294389.2 2017 5405 7339 2160521991 Urbano
05501 1 25631 2017 NA NA NA NA NA NA NA NA NA Quillota 286029.5 2017 5501 90517 25890529852 Urbano
names(df_2017_2)[3] <- "Hogar en vivienda particular"
names(df_2017_2)[6] <- "Vivienda colectiva (no es hogar)"
names(df_2017_2)[9] <- "Operativo personas en tránsito (no es hogar)"
names(df_2017_2)[12] <- "Operativo calle (no es hogar)" 

1.2 Correlaciones

1.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

Solamente podemos establecer correlaciones para Hogar en vivienda particular , mas allá no podemos por la presencia masiva de NAs

kbl(df_2017_2[,c(6:12)]) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
Vivienda colectiva (no es hogar) anio.y unlist.c..x.1 Operativo personas en tránsito (no es hogar) anio.x.1 unlist.c..y.1 Operativo calle (no es hogar)
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA
NA NA NA NA NA NA NA

1.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

1.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)



RURAL

2 Pregunta TIPO_OPERATIVO: TIPO_OPERATIVO

1 Hogar en vivienda particular
2 Vivienda colectiva (no es hogar)
3 Operativo personas en tránsito (no es hogar)
4 Operativo calle (no es hogar)

2.1 Cálculo de frecuencias

Leemos las respuestas a la pregunta TIPO_OPERATIVO del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:

tabla_con_clave <- readRDS("../censo_hogares_con_clave_17.rds")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$TIPO_OPERATIVO
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
 
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:4){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
 
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
 
names(comuna_corr)[13] <- "código" 
 
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_rural_nacional.rds")


df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
 tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
código unlist.c..x Freq.x anio.x unlist.c..y Freq.y anio.y unlist.c..x.1 Freq.x.1 anio.x.1 unlist.c..y.1 Freq.y.1 anio.y.1 comuna.x promedio_i año comuna.y personas Ingresos_expandidos tipo
01101 1 791 2017 NA NA NA NA NA NA NA NA NA Iquique 289375.3 2017 1101 191468 55406102543 Rural
01107 1 47 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
01401 1 1359 2017 NA NA NA NA NA NA NA NA NA Pozo Almonte 263069.6 2017 1401 15711 4133086727 Rural
01402 1 484 2017 NA NA NA NA NA NA NA NA NA Camiña 262850.3 2017 1402 1250 328562901 Rural
01403 1 488 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
01404 1 607 2017 NA NA NA NA NA NA NA NA NA Huara 253968.5 2017 1404 2730 693334131 Rural
01405 1 330 2017 NA NA NA NA NA NA NA NA NA Pica 290496.7 2017 1405 9296 2700457509 Rural
02101 1 342 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
02102 1 138 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
02103 1 358 2017 NA NA NA NA NA NA NA NA NA Sierra Gorda 403458.5 2017 2103 10186 4109628188 Rural
02104 1 310 2017 NA NA NA NA NA NA NA NA NA Taltal 345494.0 2017 2104 13317 4600943086 Rural
02201 1 980 2017 NA NA NA NA NA NA NA NA NA Calama 310025.0 2017 2201 165731 51380756402 Rural
02202 1 102 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
02203 1 1382 2017 NA NA NA NA NA NA NA NA NA San Pedro de Atacama 356147.9 2017 2203 10996 3916202829 Rural
02301 1 214 2017 NA NA NA NA NA NA NA NA NA Tocopilla 180218.1 2017 2301 25186 4538972205 Rural
02302 1 58 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
03101 1 976 2017 NA NA NA NA NA NA NA NA NA Copiapó 308502.8 2017 3101 153937 47489990283 Rural
03102 1 814 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
03103 1 948 2017 NA NA NA NA NA NA NA NA NA Tierra Amarilla 312457.3 2017 3103 14019 4380339153 Rural
03201 1 415 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
03202 1 250 2017 NA NA NA NA NA NA NA NA NA Diego de Almagro 374511.6 2017 3202 13925 5215073473 Rural
03301 1 1951 2017 NA NA NA NA NA NA NA NA NA Vallenar 254290.6 2017 3301 51917 13202005308 Rural
03302 1 1772 2017 NA NA NA NA NA NA NA NA NA Alto del Carmen 227130.4 2017 3302 5299 1203563833 Rural
03303 1 894 2017 NA NA NA NA NA NA NA NA NA Freirina 214803.3 2017 3303 7041 1512429891 Rural
03304 1 506 2017 NA NA NA NA NA NA NA NA NA Huasco 227560.7 2017 3304 10149 2309513927 Rural
04101 1 5847 2017 NA NA NA NA NA NA NA NA NA La Serena 233184.2 2017 4101 221054 51546306303 Rural
04102 1 4144 2017 NA NA NA NA NA NA NA NA NA Coquimbo 231810.7 2017 4102 227730 52790242466 Rural
04103 1 417 2017 NA NA NA NA NA NA NA NA NA Andacollo 242908.2 2017 4103 11044 2682678345 Rural
04104 1 1086 2017 NA NA NA NA NA NA NA NA NA La Higuera 250699.6 2017 4104 4241 1063217069 Rural
04105 1 1612 2017 NA NA NA NA NA NA NA NA NA Paiguano 205942.1 2017 4105 4497 926121774 Rural
04106 1 3451 2017 NA NA NA NA NA NA NA NA NA Vicuña 176130.6 2017 4106 27771 4891322768 Rural
04201 1 3404 2017 NA NA NA NA NA NA NA NA NA Illapel 191976.8 2017 4201 30848 5922099530 Rural
04202 1 2713 2017 NA NA NA NA NA NA NA NA NA Canela 171370.3 2017 4202 9093 1558270441 Rural
04203 1 1453 2017 NA NA NA NA NA NA NA NA NA Los Vilos 173238.5 2017 4203 21382 3704185607 Rural
04204 1 3729 2017 NA NA NA NA NA NA NA NA NA Salamanca 223234.2 2017 4204 29347 6551254640 Rural
04301 1 7975 2017 NA NA NA NA NA NA NA NA NA Ovalle 241393.7 2017 4301 111272 26860360045 Rural
04302 1 2830 2017 NA NA NA NA NA NA NA NA NA Combarbalá 179139.6 2017 4302 13322 2386498044 Rural
04303 1 5489 2017 NA NA NA NA NA NA NA NA NA Monte Patria 201205.8 2017 4303 30751 6187280931 Rural
04304 1 1865 2017 NA NA NA NA NA NA NA NA NA Punitaqui 171931.7 2017 4304 10956 1883683880 Rural
04305 1 1699 2017 NA NA NA NA NA NA NA NA NA Río Hurtado 182027.2 2017 4305 4278 778712384 Rural
05101 1 285 2017 NA NA NA NA NA NA NA NA NA Valparaíso 331716.1 2017 5101 296655 98405237576 Rural
05102 1 2984 2017 NA NA NA NA NA NA NA NA NA Casablanca 268917.1 2017 5102 26867 7224996933 Rural
05103 1 786 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05104 1 353 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05105 1 976 2017 NA NA NA NA NA NA NA NA NA Puchuncaví 279614.4 2017 5105 18546 5185728335 Rural
05107 1 1627 2017 NA NA NA NA NA NA NA NA NA Quintero 334628.2 2017 5107 31923 10682335196 Rural
05201 1 151 2017 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05301 1 1243 2017 NA NA NA NA NA NA NA NA NA Los Andes 324402.1 2017 5301 66708 21640215030 Rural
05302 1 1329 2017 NA NA NA NA NA NA NA NA NA Calle Larga 242743.8 2017 5302 14832 3600375502 Rural
05303 1 668 2017 NA NA NA NA NA NA NA NA NA Rinconada 326532.5 2017 5303 10207 3332917471 Rural
names(df_2017_2)[3] <- "Hogar en vivienda particular"
names(df_2017_2)[6] <- "Vivienda colectiva (no es hogar)"
names(df_2017_2)[9] <- "Operativo personas en tránsito (no es hogar)"
names(df_2017_2)[12] <- "Operativo calle (no es hogar)" 

2.2 Correlaciones

2.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

2.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

2.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)