Abstract
Calculamos correlaciones entre el ingreso promedio comunal multiplicado por la población comunal que llamaremos multi_pop extraído de la Casen 2017 y las frecuencias de categorías de respuesta para todas las variables del Censo de viviendas, hogares y personas al 2017, también extraídas a nivel comunal.
Importante es aplicar la libreria dplyr para evitar que en los filtros se desplieguen series de tiempo.
Area: urbano = 1 rural = 2
1 Hogar en vivienda particular
2 Vivienda colectiva (no es hogar)
3 Operativo personas en tránsito (no es hogar)
4 Operativo calle (no es hogar)
Leemos las respuestas a la pregunta TIPO_OPERATIVO del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:
tabla_con_clave <- readRDS("../censo_hogares_con_clave_17.rds")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$TIPO_OPERATIVO
cross_tab = xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:4){
d_i <- filter(d,d$unlist.c. == i)
d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[13] <- "código"
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_urbano_nacional.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")
código | unlist.c..x | Freq.x | anio.x | unlist.c..y | Freq.y | anio.y | unlist.c..x.1 | Freq.x.1 | anio.x.1 | unlist.c..y.1 | Freq.y.1 | anio.y.1 | comuna.x | promedio_i | año | comuna.y | personas | Ingresos_expandidos | tipo |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
01101 | 1 | 59435 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Iquique | 356487.6 | 2017 | 1101 | 191468 | 68255976664 | Urbano |
01107 | 1 | 29652 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Alto Hospicio | 301933.4 | 2017 | 1107 | 108375 | 32722034397 | Urbano |
01401 | 1 | 2829 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Pozo Almonte | 299998.6 | 2017 | 1401 | 15711 | 4713278189 | Urbano |
01404 | 1 | 358 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
01405 | 1 | 1313 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Pica | 330061.1 | 2017 | 1405 | 9296 | 3068247619 | Urbano |
02101 | 1 | 105521 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Antofagasta | 347580.2 | 2017 | 2101 | 361873 | 125779893517 | Urbano |
02102 | 1 | 3292 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Mejillones | 369770.7 | 2017 | 2102 | 13467 | 4979702302 | Urbano |
02104 | 1 | 3317 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Taltal | 376328.9 | 2017 | 2104 | 13317 | 5011572025 | Urbano |
02201 | 1 | 47501 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Calama | 416281.1 | 2017 | 2201 | 165731 | 68990679686 | Urbano |
02203 | 1 | 1624 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | San Pedro de Atacama | 437934.7 | 2017 | 2203 | 10996 | 4815529626 | Urbano |
02301 | 1 | 7780 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Tocopilla | 271720.8 | 2017 | 2301 | 25186 | 6843559467 | Urbano |
02302 | 1 | 1395 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | María Elena | 466266.9 | 2017 | 2302 | 6457 | 3010685220 | Urbano |
03101 | 1 | 45919 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Copiapó | 330574.6 | 2017 | 3101 | 153937 | 50887663717 | Urbano |
03102 | 1 | 5007 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Caldera | 299314.8 | 2017 | 3102 | 17662 | 5286498241 | Urbano |
03103 | 1 | 2955 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Tierra Amarilla | 315860.6 | 2017 | 3103 | 14019 | 4428049932 | Urbano |
03201 | 1 | 3337 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Chañaral | 286389.3 | 2017 | 3201 | 12219 | 3499391196 | Urbano |
03202 | 1 | 4345 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Diego de Almagro | 325861.5 | 2017 | 3202 | 13925 | 4537621312 | Urbano |
03301 | 1 | 14292 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Vallenar | 311577.0 | 2017 | 3301 | 51917 | 16176145007 | Urbano |
03303 | 1 | 1432 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Freirina | 289049.9 | 2017 | 3303 | 7041 | 2035200054 | Urbano |
03304 | 1 | 2893 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Huasco | 337414.8 | 2017 | 3304 | 10149 | 3424422750 | Urbano |
04101 | 1 | 63584 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | La Serena | 272136.8 | 2017 | 4101 | 221054 | 60156924947 | Urbano |
04102 | 1 | 65051 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Coquimbo | 264340.0 | 2017 | 4102 | 227730 | 60198159091 | Urbano |
04103 | 1 | 3133 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Andacollo | 251267.7 | 2017 | 4103 | 11044 | 2775000288 | Urbano |
04104 | 1 | 396 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | La Higuera | 214257.0 | 2017 | 4104 | 4241 | 908664019 | Urbano |
04106 | 1 | 5471 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Vicuña | 245957.4 | 2017 | 4106 | 27771 | 6830481918 | Urbano |
04201 | 1 | 6862 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Illapel | 270316.5 | 2017 | 4201 | 30848 | 8338722128 | Urbano |
04202 | 1 | 711 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Canela | 233397.3 | 2017 | 4202 | 9093 | 2122281844 | Urbano |
04203 | 1 | 5835 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Los Vilos | 282415.6 | 2017 | 4203 | 21382 | 6038609501 | Urbano |
04204 | 1 | 5166 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Salamanca | 262056.9 | 2017 | 4204 | 29347 | 7690585032 | Urbano |
04301 | 1 | 27402 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Ovalle | 274771.4 | 2017 | 4301 | 111272 | 30574361012 | Urbano |
04302 | 1 | 2132 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Combarbalá | 228990.4 | 2017 | 4302 | 13322 | 3050610572 | Urbano |
04303 | 1 | 4923 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Monte Patria | 225369.1 | 2017 | 4303 | 30751 | 6930326684 | Urbano |
04304 | 1 | 1937 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Punitaqui | 212496.1 | 2017 | 4304 | 10956 | 2328107498 | Urbano |
05101 | 1 | 100951 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Valparaíso | 297929.0 | 2017 | 5101 | 296655 | 88382118059 | Urbano |
05102 | 1 | 5802 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Casablanca | 341641.8 | 2017 | 5102 | 26867 | 9178890241 | Urbano |
05103 | 1 | 13146 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Concón | 318496.3 | 2017 | 5103 | 42152 | 13425257057 | Urbano |
05105 | 1 | 5458 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Puchuncaví | 296035.5 | 2017 | 5105 | 18546 | 5490274928 | Urbano |
05107 | 1 | 8975 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Quintero | 308224.7 | 2017 | 5107 | 31923 | 9839456903 | Urbano |
05109 | 1 | 119381 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Viña del Mar | 337006.1 | 2017 | 5109 | 334248 | 112643604611 | Urbano |
05201 | 1 | 2358 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
05301 | 1 | 19637 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Los Andes | 339720.2 | 2017 | 5301 | 66708 | 22662055502 | Urbano |
05302 | 1 | 3375 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Calle Larga | 246387.3 | 2017 | 5302 | 14832 | 3654416747 | Urbano |
05303 | 1 | 2524 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Rinconada | 273904.7 | 2017 | 5303 | 10207 | 2795744821 | Urbano |
05304 | 1 | 3686 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | San Esteban | 219571.6 | 2017 | 5304 | 18855 | 4140022481 | Urbano |
05401 | 1 | 8777 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | La Ligua | 250134.4 | 2017 | 5401 | 35390 | 8852256241 | Urbano |
05402 | 1 | 3903 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Cabildo | 262745.9 | 2017 | 5402 | 19388 | 5094117762 | Urbano |
05403 | 1 | 1793 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Papudo | 294355.2 | 2017 | 5403 | 6356 | 1870921373 | Urbano |
05404 | 1 | 1449 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Petorca | 237510.8 | 2017 | 5404 | 9826 | 2333781007 | Urbano |
05405 | 1 | 1686 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Zapallar | 294389.2 | 2017 | 5405 | 7339 | 2160521991 | Urbano |
05501 | 1 | 25631 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Quillota | 286029.5 | 2017 | 5501 | 90517 | 25890529852 | Urbano |
names(df_2017_2)[3] <- "Hogar en vivienda particular"
names(df_2017_2)[6] <- "Vivienda colectiva (no es hogar)"
names(df_2017_2)[9] <- "Operativo personas en tránsito (no es hogar)"
names(df_2017_2)[12] <- "Operativo calle (no es hogar)"
El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.
\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]
III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)
Solamente podemos establecer correlaciones para Hogar en vivienda particular , mas allá no podemos por la presencia masiva de NAs
kbl(df_2017_2[,c(6:12)]) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")
Vivienda colectiva (no es hogar) | anio.y | unlist.c..x.1 | Operativo personas en tránsito (no es hogar) | anio.x.1 | unlist.c..y.1 | Operativo calle (no es hogar) |
---|---|---|---|---|---|---|
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA |
Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.
\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]
III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)
Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).
\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]
\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]
III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)
1 Hogar en vivienda particular
2 Vivienda colectiva (no es hogar)
3 Operativo personas en tránsito (no es hogar)
4 Operativo calle (no es hogar)
Leemos las respuestas a la pregunta TIPO_OPERATIVO del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:
tabla_con_clave <- readRDS("../censo_hogares_con_clave_17.rds")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$TIPO_OPERATIVO
cross_tab = xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:4){
d_i <- filter(d,d$unlist.c. == i)
d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[13] <- "código"
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_rural_nacional.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")
código | unlist.c..x | Freq.x | anio.x | unlist.c..y | Freq.y | anio.y | unlist.c..x.1 | Freq.x.1 | anio.x.1 | unlist.c..y.1 | Freq.y.1 | anio.y.1 | comuna.x | promedio_i | año | comuna.y | personas | Ingresos_expandidos | tipo |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
01101 | 1 | 791 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Iquique | 289375.3 | 2017 | 1101 | 191468 | 55406102543 | Rural |
01107 | 1 | 47 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
01401 | 1 | 1359 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Pozo Almonte | 263069.6 | 2017 | 1401 | 15711 | 4133086727 | Rural |
01402 | 1 | 484 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Camiña | 262850.3 | 2017 | 1402 | 1250 | 328562901 | Rural |
01403 | 1 | 488 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
01404 | 1 | 607 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Huara | 253968.5 | 2017 | 1404 | 2730 | 693334131 | Rural |
01405 | 1 | 330 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Pica | 290496.7 | 2017 | 1405 | 9296 | 2700457509 | Rural |
02101 | 1 | 342 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
02102 | 1 | 138 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
02103 | 1 | 358 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Sierra Gorda | 403458.5 | 2017 | 2103 | 10186 | 4109628188 | Rural |
02104 | 1 | 310 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Taltal | 345494.0 | 2017 | 2104 | 13317 | 4600943086 | Rural |
02201 | 1 | 980 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Calama | 310025.0 | 2017 | 2201 | 165731 | 51380756402 | Rural |
02202 | 1 | 102 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
02203 | 1 | 1382 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | San Pedro de Atacama | 356147.9 | 2017 | 2203 | 10996 | 3916202829 | Rural |
02301 | 1 | 214 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Tocopilla | 180218.1 | 2017 | 2301 | 25186 | 4538972205 | Rural |
02302 | 1 | 58 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
03101 | 1 | 976 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Copiapó | 308502.8 | 2017 | 3101 | 153937 | 47489990283 | Rural |
03102 | 1 | 814 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
03103 | 1 | 948 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Tierra Amarilla | 312457.3 | 2017 | 3103 | 14019 | 4380339153 | Rural |
03201 | 1 | 415 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
03202 | 1 | 250 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Diego de Almagro | 374511.6 | 2017 | 3202 | 13925 | 5215073473 | Rural |
03301 | 1 | 1951 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Vallenar | 254290.6 | 2017 | 3301 | 51917 | 13202005308 | Rural |
03302 | 1 | 1772 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Alto del Carmen | 227130.4 | 2017 | 3302 | 5299 | 1203563833 | Rural |
03303 | 1 | 894 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Freirina | 214803.3 | 2017 | 3303 | 7041 | 1512429891 | Rural |
03304 | 1 | 506 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Huasco | 227560.7 | 2017 | 3304 | 10149 | 2309513927 | Rural |
04101 | 1 | 5847 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | La Serena | 233184.2 | 2017 | 4101 | 221054 | 51546306303 | Rural |
04102 | 1 | 4144 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Coquimbo | 231810.7 | 2017 | 4102 | 227730 | 52790242466 | Rural |
04103 | 1 | 417 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Andacollo | 242908.2 | 2017 | 4103 | 11044 | 2682678345 | Rural |
04104 | 1 | 1086 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | La Higuera | 250699.6 | 2017 | 4104 | 4241 | 1063217069 | Rural |
04105 | 1 | 1612 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Paiguano | 205942.1 | 2017 | 4105 | 4497 | 926121774 | Rural |
04106 | 1 | 3451 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Vicuña | 176130.6 | 2017 | 4106 | 27771 | 4891322768 | Rural |
04201 | 1 | 3404 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Illapel | 191976.8 | 2017 | 4201 | 30848 | 5922099530 | Rural |
04202 | 1 | 2713 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Canela | 171370.3 | 2017 | 4202 | 9093 | 1558270441 | Rural |
04203 | 1 | 1453 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Los Vilos | 173238.5 | 2017 | 4203 | 21382 | 3704185607 | Rural |
04204 | 1 | 3729 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Salamanca | 223234.2 | 2017 | 4204 | 29347 | 6551254640 | Rural |
04301 | 1 | 7975 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Ovalle | 241393.7 | 2017 | 4301 | 111272 | 26860360045 | Rural |
04302 | 1 | 2830 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Combarbalá | 179139.6 | 2017 | 4302 | 13322 | 2386498044 | Rural |
04303 | 1 | 5489 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Monte Patria | 201205.8 | 2017 | 4303 | 30751 | 6187280931 | Rural |
04304 | 1 | 1865 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Punitaqui | 171931.7 | 2017 | 4304 | 10956 | 1883683880 | Rural |
04305 | 1 | 1699 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Río Hurtado | 182027.2 | 2017 | 4305 | 4278 | 778712384 | Rural |
05101 | 1 | 285 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Valparaíso | 331716.1 | 2017 | 5101 | 296655 | 98405237576 | Rural |
05102 | 1 | 2984 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Casablanca | 268917.1 | 2017 | 5102 | 26867 | 7224996933 | Rural |
05103 | 1 | 786 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
05104 | 1 | 353 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
05105 | 1 | 976 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Puchuncaví | 279614.4 | 2017 | 5105 | 18546 | 5185728335 | Rural |
05107 | 1 | 1627 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Quintero | 334628.2 | 2017 | 5107 | 31923 | 10682335196 | Rural |
05201 | 1 | 151 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
05301 | 1 | 1243 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Los Andes | 324402.1 | 2017 | 5301 | 66708 | 21640215030 | Rural |
05302 | 1 | 1329 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Calle Larga | 242743.8 | 2017 | 5302 | 14832 | 3600375502 | Rural |
05303 | 1 | 668 | 2017 | NA | NA | NA | NA | NA | NA | NA | NA | NA | Rinconada | 326532.5 | 2017 | 5303 | 10207 | 3332917471 | Rural |
names(df_2017_2)[3] <- "Hogar en vivienda particular"
names(df_2017_2)[6] <- "Vivienda colectiva (no es hogar)"
names(df_2017_2)[9] <- "Operativo personas en tránsito (no es hogar)"
names(df_2017_2)[12] <- "Operativo calle (no es hogar)"
El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.
\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]
III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)
Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.
\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]
III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)
Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).
\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]
\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]
III <- seq(3,3,3)
my_data <- df_2017_2[, c(III,19)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)