Area: urbano = 1 rural = 2

URBANO

1 Pregunta TIPO_HOGAR: TIPO_HOGAR

1 Hogar unipersonal
2 Hogar nuclear monoparental
3 Hogar nuclear biparental sin hijos
4 Hogar nuclear biparental con hijos
5 Hogar compuesto
6 Hogar extenso
7 Hogar sin núcleo

1.1 Cálculo de frecuencias

Leemos las respuestas a la pregunta TIPO_HOGAR del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:

tabla_con_clave <- readRDS("../censo_hogares_con_clave_17.rds")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$TIPO_HOGAR
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
 
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:7){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
 
 
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]

names(comuna_corr)[22] <- "código" 
 
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_urbano_nacional.rds")


df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
código unlist.c..x Freq.x anio.x unlist.c..y Freq.y anio.y unlist.c..x.1 Freq.x.1 anio.x.1 unlist.c..y.1 Freq.y.1 anio.y.1 unlist.c..x.2 Freq.x.2 anio.x.2 unlist.c..y.2 Freq.y.2 anio.y.2 unlist.c. Freq anio comuna.x promedio_i año comuna.y personas Ingresos_expandidos tipo
01101 1 11897 2017 2 7146 2017 3 7045 2017 4 15188 2017 5 1924 2017 6 12244 2017 7 3991 2017 Iquique 356487.6 2017 1101 191468 68255976664 Urbano
01107 1 4028 2017 2 4300 2017 3 2440 2017 4 9205 2017 5 970 2017 6 7176 2017 7 1533 2017 Alto Hospicio 301933.4 2017 1107 108375 32722034397 Urbano
01401 1 579 2017 2 438 2017 3 297 2017 4 785 2017 5 60 2017 6 540 2017 7 130 2017 Pozo Almonte 299998.6 2017 1401 15711 4713278189 Urbano
01404 1 100 2017 2 35 2017 3 34 2017 4 95 2017 5 12 2017 6 58 2017 7 24 2017 NA NA NA NA NA NA NA
01405 1 309 2017 2 165 2017 3 179 2017 4 287 2017 5 39 2017 6 248 2017 7 86 2017 Pica 330061.1 2017 1405 9296 3068247619 Urbano
02101 1 17351 2017 2 12534 2017 3 11166 2017 4 28432 2017 5 3829 2017 6 24265 2017 7 7944 2017 Antofagasta 347580.2 2017 2101 361873 125779893517 Urbano
02102 1 680 2017 2 356 2017 3 309 2017 4 794 2017 5 161 2017 6 756 2017 7 236 2017 Mejillones 369770.7 2017 2102 13467 4979702302 Urbano
02104 1 643 2017 2 393 2017 3 331 2017 4 781 2017 5 115 2017 6 805 2017 7 249 2017 Taltal 376328.9 2017 2104 13317 5011572025 Urbano
02201 1 8967 2017 2 5861 2017 3 5168 2017 4 12843 2017 5 1300 2017 6 10222 2017 7 3140 2017 Calama 416281.1 2017 2201 165731 68990679686 Urbano
02203 1 498 2017 2 202 2017 3 176 2017 4 326 2017 5 54 2017 6 202 2017 7 166 2017 San Pedro de Atacama 437934.7 2017 2203 10996 4815529626 Urbano
02301 1 1535 2017 2 1073 2017 3 860 2017 4 1897 2017 5 169 2017 6 1712 2017 7 534 2017 Tocopilla 271720.8 2017 2301 25186 6843559467 Urbano
02302 1 325 2017 2 177 2017 3 168 2017 4 369 2017 5 30 2017 6 263 2017 7 63 2017 María Elena 466266.9 2017 2302 6457 3010685220 Urbano
03101 1 7081 2017 2 5829 2017 3 5174 2017 4 14321 2017 5 960 2017 6 9922 2017 7 2632 2017 Copiapó 330574.6 2017 3101 153937 50887663717 Urbano
03102 1 1004 2017 2 677 2017 3 591 2017 4 1212 2017 5 133 2017 6 1080 2017 7 310 2017 Caldera 299314.8 2017 3102 17662 5286498241 Urbano
03103 1 460 2017 2 377 2017 3 297 2017 4 939 2017 5 52 2017 6 686 2017 7 144 2017 Tierra Amarilla 315860.6 2017 3103 14019 4428049932 Urbano
03201 1 603 2017 2 437 2017 3 398 2017 4 920 2017 5 40 2017 6 734 2017 7 205 2017 Chañaral 286389.3 2017 3201 12219 3499391196 Urbano
03202 1 975 2017 2 524 2017 3 540 2017 4 1384 2017 5 52 2017 6 619 2017 7 251 2017 Diego de Almagro 325861.5 2017 3202 13925 4537621312 Urbano
03301 1 2569 2017 2 2042 2017 3 1555 2017 4 3302 2017 5 351 2017 6 3424 2017 7 1049 2017 Vallenar 311577.0 2017 3301 51917 16176145007 Urbano
03303 1 282 2017 2 219 2017 3 136 2017 4 320 2017 5 29 2017 6 356 2017 7 90 2017 Freirina 289049.9 2017 3303 7041 2035200054 Urbano
03304 1 620 2017 2 387 2017 3 330 2017 4 722 2017 5 56 2017 6 604 2017 7 174 2017 Huasco 337414.8 2017 3304 10149 3424422750 Urbano
04101 1 10843 2017 2 9560 2017 3 7167 2017 4 16323 2017 5 1879 2017 6 12962 2017 7 4850 2017 La Serena 272136.8 2017 4101 221054 60156924947 Urbano
04102 1 9704 2017 2 9459 2017 3 7048 2017 4 17891 2017 5 2051 2017 6 14790 2017 7 4108 2017 Coquimbo 264340.0 2017 4102 227730 60198159091 Urbano
04103 1 574 2017 2 466 2017 3 323 2017 4 813 2017 5 62 2017 6 721 2017 7 174 2017 Andacollo 251267.7 2017 4103 11044 2775000288 Urbano
04104 1 70 2017 2 66 2017 3 44 2017 4 106 2017 5 12 2017 6 79 2017 7 19 2017 La Higuera 214257.0 2017 4104 4241 908664019 Urbano
04106 1 1023 2017 2 880 2017 3 555 2017 4 1465 2017 5 139 2017 6 1090 2017 7 319 2017 Vicuña 245957.4 2017 4106 27771 6830481918 Urbano
04201 1 1336 2017 2 1070 2017 3 750 2017 4 1667 2017 5 209 2017 6 1428 2017 7 402 2017 Illapel 270316.5 2017 4201 30848 8338722128 Urbano
04202 1 182 2017 2 100 2017 3 88 2017 4 173 2017 5 20 2017 6 107 2017 7 41 2017 Canela 233397.3 2017 4202 9093 2122281844 Urbano
04203 1 1318 2017 2 825 2017 3 786 2017 4 1325 2017 5 137 2017 6 1046 2017 7 398 2017 Los Vilos 282415.6 2017 4203 21382 6038609501 Urbano
04204 1 997 2017 2 739 2017 3 545 2017 4 1341 2017 5 148 2017 6 1047 2017 7 349 2017 Salamanca 262056.9 2017 4204 29347 7690585032 Urbano
04301 1 4668 2017 2 4543 2017 3 2769 2017 4 6643 2017 5 664 2017 6 6341 2017 7 1774 2017 Ovalle 274771.4 2017 4301 111272 30574361012 Urbano
04302 1 536 2017 2 337 2017 3 239 2017 4 433 2017 5 27 2017 6 414 2017 7 146 2017 Combarbalá 228990.4 2017 4302 13322 3050610572 Urbano
04303 1 913 2017 2 849 2017 3 506 2017 4 1299 2017 5 117 2017 6 981 2017 7 258 2017 Monte Patria 225369.1 2017 4303 30751 6930326684 Urbano
04304 1 392 2017 2 353 2017 3 202 2017 4 504 2017 5 36 2017 6 358 2017 7 92 2017 Punitaqui 212496.1 2017 4304 10956 2328107498 Urbano
05101 1 21858 2017 2 12840 2017 3 12918 2017 4 24217 2017 5 2769 2017 6 17742 2017 7 8607 2017 Valparaíso 297929.0 2017 5101 296655 88382118059 Urbano
05102 1 951 2017 2 852 2017 3 646 2017 4 1782 2017 5 132 2017 6 1146 2017 7 293 2017 Casablanca 341641.8 2017 5102 26867 9178890241 Urbano
05103 1 2463 2017 2 1724 2017 3 1835 2017 4 3973 2017 5 381 2017 6 2067 2017 7 703 2017 Concón 318496.3 2017 5103 42152 13425257057 Urbano
05105 1 1169 2017 2 615 2017 3 865 2017 4 1394 2017 5 143 2017 6 943 2017 7 329 2017 Puchuncaví 296035.5 2017 5105 18546 5490274928 Urbano
05107 1 1783 2017 2 1219 2017 3 1285 2017 4 2252 2017 5 260 2017 6 1642 2017 7 534 2017 Quintero 308224.7 2017 5107 31923 9839456903 Urbano
05109 1 27012 2017 2 15053 2017 3 17042 2017 4 28527 2017 5 2887 2017 6 18481 2017 7 10379 2017 Viña del Mar 337006.1 2017 5109 334248 112643604611 Urbano
05201 1 585 2017 2 243 2017 3 288 2017 4 525 2017 5 117 2017 6 326 2017 7 274 2017 NA NA NA NA NA NA NA
05301 1 3383 2017 2 2680 2017 3 2575 2017 4 5688 2017 5 387 2017 6 3761 2017 7 1163 2017 Los Andes 339720.2 2017 5301 66708 22662055502 Urbano
05302 1 441 2017 2 468 2017 3 397 2017 4 1189 2017 5 53 2017 6 679 2017 7 148 2017 Calle Larga 246387.3 2017 5302 14832 3654416747 Urbano
05303 1 363 2017 2 349 2017 3 310 2017 4 812 2017 5 49 2017 6 531 2017 7 110 2017 Rinconada 273904.7 2017 5303 10207 2795744821 Urbano
05304 1 513 2017 2 523 2017 3 485 2017 4 1313 2017 5 63 2017 6 641 2017 7 148 2017 San Esteban 219571.6 2017 5304 18855 4140022481 Urbano
05401 1 1587 2017 2 1322 2017 3 1097 2017 4 2350 2017 5 190 2017 6 1701 2017 7 530 2017 La Ligua 250134.4 2017 5401 35390 8852256241 Urbano
05402 1 625 2017 2 626 2017 3 508 2017 4 1009 2017 5 81 2017 6 849 2017 7 205 2017 Cabildo 262745.9 2017 5402 19388 5094117762 Urbano
05403 1 316 2017 2 178 2017 3 260 2017 4 523 2017 5 58 2017 6 344 2017 7 114 2017 Papudo 294355.2 2017 5403 6356 1870921373 Urbano
05404 1 335 2017 2 246 2017 3 201 2017 4 314 2017 5 39 2017 6 234 2017 7 80 2017 Petorca 237510.8 2017 5404 9826 2333781007 Urbano
05405 1 297 2017 2 198 2017 3 261 2017 4 477 2017 5 45 2017 6 294 2017 7 114 2017 Zapallar 294389.2 2017 5405 7339 2160521991 Urbano
05501 1 4297 2017 2 3957 2017 3 3168 2017 4 7284 2017 5 591 2017 6 4774 2017 7 1560 2017 Quillota 286029.5 2017 5501 90517 25890529852 Urbano
names(df_2017_2)[3] <- "Hogar unipersonal"
names(df_2017_2)[6] <- "Hogar nuclear monoparental"
names(df_2017_2)[9] <- "nuclear biparental sin hijos"
names(df_2017_2)[12] <- "nuclear biparental con hijos"
names(df_2017_2)[15] <- "compuesto"
names(df_2017_2)[18] <- "extenso"
names(df_2017_2)[21] <- "sin núcleo"

1.2 Correlaciones

1.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

III <- seq(3,21,3)
my_data <- df_2017_2[, c(III,28)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

1.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,21,3)
my_data <- df_2017_2[, c(III,28)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

1.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,21,3)
my_data <- df_2017_2[, c(III,28)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)



RURAL

2 Pregunta TIPO_HOGAR: TIPO_HOGAR

1 Hogar unipersonal
2 Hogar nuclear monoparental
3 Hogar nuclear biparental sin hijos
4 Hogar nuclear biparental con hijos
5 Hogar compuesto
6 Hogar extenso
7 Hogar sin núcleo

2.1 Cálculo de frecuencias

Leemos las respuestas a la pregunta TIPO_HOGAR del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:

tabla_con_clave <- readRDS("../censo_hogares_con_clave_17.rds")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$TIPO_HOGAR
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
 
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:7){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
 
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
 
names(comuna_corr)[22] <- "código" 
 
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_rural_nacional.rds")


df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
 tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
código unlist.c..x Freq.x anio.x unlist.c..y Freq.y anio.y unlist.c..x.1 Freq.x.1 anio.x.1 unlist.c..y.1 Freq.y.1 anio.y.1 unlist.c..x.2 Freq.x.2 anio.x.2 unlist.c..y.2 Freq.y.2 anio.y.2 unlist.c. Freq anio comuna.x promedio_i año comuna.y personas Ingresos_expandidos tipo
01101 1 254 2017 2 45 2017 3 109 2017 4 162 2017 5 26 2017 6 124 2017 7 71 2017 Iquique 289375.3 2017 1101 191468 55406102543 Rural
01107 1 23 2017 2 5 2017 3 6 2017 4 5 2017 5 2 2017 6 4 2017 7 2 2017 NA NA NA NA NA NA NA
01401 1 427 2017 2 121 2017 3 213 2017 4 267 2017 5 25 2017 6 184 2017 7 122 2017 Pozo Almonte 263069.6 2017 1401 15711 4133086727 Rural
01402 1 185 2017 2 44 2017 3 69 2017 4 93 2017 5 7 2017 6 62 2017 7 24 2017 Camiña 262850.3 2017 1402 1250 328562901 Rural
01403 1 174 2017 2 43 2017 3 95 2017 4 75 2017 5 13 2017 6 52 2017 7 36 2017 NA NA NA NA NA NA NA
01404 1 236 2017 2 46 2017 3 100 2017 4 83 2017 5 14 2017 6 71 2017 7 57 2017 Huara 253968.5 2017 1404 2730 693334131 Rural
01405 1 79 2017 2 38 2017 3 49 2017 4 81 2017 5 9 2017 6 48 2017 7 26 2017 Pica 290496.7 2017 1405 9296 2700457509 Rural
02101 1 113 2017 2 30 2017 3 39 2017 4 58 2017 5 20 2017 6 41 2017 7 41 2017 NA NA NA NA NA NA NA
02102 1 48 2017 2 5 2017 3 18 2017 4 20 2017 5 6 2017 6 26 2017 7 15 2017 NA NA NA NA NA NA NA
02103 1 90 2017 2 55 2017 3 29 2017 4 72 2017 5 11 2017 6 80 2017 7 21 2017 Sierra Gorda 403458.5 2017 2103 10186 4109628188 Rural
02104 1 110 2017 2 24 2017 3 31 2017 4 52 2017 5 8 2017 6 32 2017 7 53 2017 Taltal 345494.0 2017 2104 13317 4600943086 Rural
02201 1 291 2017 2 108 2017 3 108 2017 4 181 2017 5 20 2017 6 172 2017 7 100 2017 Calama 310025.0 2017 2201 165731 51380756402 Rural
02202 1 48 2017 2 13 2017 3 4 2017 4 7 2017 NA NA NA 6 15 2017 7 15 2017 NA NA NA NA NA NA NA
02203 1 484 2017 2 163 2017 3 142 2017 4 241 2017 5 44 2017 6 156 2017 7 152 2017 San Pedro de Atacama 356147.9 2017 2203 10996 3916202829 Rural
02301 1 94 2017 2 7 2017 3 32 2017 4 16 2017 5 10 2017 6 32 2017 7 23 2017 Tocopilla 180218.1 2017 2301 25186 4538972205 Rural
02302 1 17 2017 2 4 2017 3 8 2017 4 10 2017 5 1 2017 6 13 2017 7 5 2017 NA NA NA NA NA NA NA
03101 1 242 2017 2 75 2017 3 140 2017 4 285 2017 5 26 2017 6 159 2017 7 49 2017 Copiapó 308502.8 2017 3101 153937 47489990283 Rural
03102 1 339 2017 2 45 2017 3 145 2017 4 95 2017 5 30 2017 6 73 2017 7 87 2017 NA NA NA NA NA NA NA
03103 1 249 2017 2 102 2017 3 139 2017 4 251 2017 5 24 2017 6 128 2017 7 55 2017 Tierra Amarilla 312457.3 2017 3103 14019 4380339153 Rural
03201 1 121 2017 2 48 2017 3 52 2017 4 100 2017 5 8 2017 6 59 2017 7 27 2017 NA NA NA NA NA NA NA
03202 1 83 2017 2 27 2017 3 31 2017 4 49 2017 5 3 2017 6 38 2017 7 19 2017 Diego de Almagro 374511.6 2017 3202 13925 5215073473 Rural
03301 1 489 2017 2 176 2017 3 237 2017 4 490 2017 5 59 2017 6 371 2017 7 129 2017 Vallenar 254290.6 2017 3301 51917 13202005308 Rural
03302 1 519 2017 2 211 2017 3 224 2017 4 340 2017 5 50 2017 6 301 2017 7 127 2017 Alto del Carmen 227130.4 2017 3302 5299 1203563833 Rural
03303 1 262 2017 2 93 2017 3 109 2017 4 170 2017 5 30 2017 6 151 2017 7 79 2017 Freirina 214803.3 2017 3303 7041 1512429891 Rural
03304 1 185 2017 2 26 2017 3 91 2017 4 72 2017 5 7 2017 6 84 2017 7 41 2017 Huasco 227560.7 2017 3304 10149 2309513927 Rural
04101 1 1002 2017 2 634 2017 3 868 2017 4 1735 2017 5 173 2017 6 1167 2017 7 268 2017 La Serena 233184.2 2017 4101 221054 51546306303 Rural
04102 1 732 2017 2 413 2017 3 601 2017 4 1210 2017 5 124 2017 6 867 2017 7 197 2017 Coquimbo 231810.7 2017 4102 227730 52790242466 Rural
04103 1 133 2017 2 37 2017 3 73 2017 4 91 2017 5 7 2017 6 48 2017 7 28 2017 Andacollo 242908.2 2017 4103 11044 2682678345 Rural
04104 1 349 2017 2 100 2017 3 175 2017 4 186 2017 5 23 2017 6 184 2017 7 69 2017 La Higuera 250699.6 2017 4104 4241 1063217069 Rural
04105 1 397 2017 2 210 2017 3 251 2017 4 344 2017 5 38 2017 6 264 2017 7 108 2017 Paiguano 205942.1 2017 4105 4497 926121774 Rural
04106 1 735 2017 2 413 2017 3 438 2017 4 823 2017 5 116 2017 6 705 2017 7 221 2017 Vicuña 176130.6 2017 4106 27771 4891322768 Rural
04201 1 759 2017 2 420 2017 3 526 2017 4 844 2017 5 72 2017 6 600 2017 7 183 2017 Illapel 191976.8 2017 4201 30848 5922099530 Rural
04202 1 759 2017 2 332 2017 3 413 2017 4 567 2017 5 29 2017 6 412 2017 7 201 2017 Canela 171370.3 2017 4202 9093 1558270441 Rural
04203 1 342 2017 2 154 2017 3 204 2017 4 363 2017 5 42 2017 6 254 2017 7 94 2017 Los Vilos 173238.5 2017 4203 21382 3704185607 Rural
04204 1 812 2017 2 476 2017 3 531 2017 4 903 2017 5 86 2017 6 687 2017 7 234 2017 Salamanca 223234.2 2017 4204 29347 6551254640 Rural
04301 1 1730 2017 2 960 2017 3 1077 2017 4 2078 2017 5 181 2017 6 1442 2017 7 507 2017 Ovalle 241393.7 2017 4301 111272 26860360045 Rural
04302 1 890 2017 2 362 2017 3 410 2017 4 479 2017 5 40 2017 6 439 2017 7 210 2017 Combarbalá 179139.6 2017 4302 13322 2386498044 Rural
04303 1 1402 2017 2 741 2017 3 737 2017 4 1276 2017 5 82 2017 6 926 2017 7 325 2017 Monte Patria 201205.8 2017 4303 30751 6187280931 Rural
04304 1 490 2017 2 233 2017 3 253 2017 4 415 2017 5 38 2017 6 320 2017 7 116 2017 Punitaqui 171931.7 2017 4304 10956 1883683880 Rural
04305 1 553 2017 2 212 2017 3 241 2017 4 276 2017 5 28 2017 6 259 2017 7 130 2017 Río Hurtado 182027.2 2017 4305 4278 778712384 Rural
05101 1 87 2017 2 19 2017 3 63 2017 4 52 2017 5 6 2017 6 35 2017 7 23 2017 Valparaíso 331716.1 2017 5101 296655 98405237576 Rural
05102 1 589 2017 2 234 2017 3 494 2017 4 916 2017 5 75 2017 6 507 2017 7 169 2017 Casablanca 268917.1 2017 5102 26867 7224996933 Rural
05103 1 136 2017 2 73 2017 3 104 2017 4 260 2017 5 24 2017 6 161 2017 7 28 2017 NA NA NA NA NA NA NA
05104 1 98 2017 2 35 2017 3 53 2017 4 85 2017 5 12 2017 6 39 2017 7 31 2017 NA NA NA NA NA NA NA
05105 1 241 2017 2 87 2017 3 166 2017 4 278 2017 5 14 2017 6 128 2017 7 62 2017 Puchuncaví 279614.4 2017 5105 18546 5185728335 Rural
05107 1 279 2017 2 121 2017 3 272 2017 4 574 2017 5 40 2017 6 265 2017 7 76 2017 Quintero 334628.2 2017 5107 31923 10682335196 Rural
05201 1 37 2017 2 20 2017 3 20 2017 4 47 2017 5 2 2017 6 18 2017 7 7 2017 NA NA NA NA NA NA NA
05301 1 205 2017 2 144 2017 3 196 2017 4 363 2017 5 26 2017 6 241 2017 7 68 2017 Los Andes 324402.1 2017 5301 66708 21640215030 Rural
05302 1 211 2017 2 134 2017 3 216 2017 4 398 2017 5 24 2017 6 272 2017 7 74 2017 Calle Larga 242743.8 2017 5302 14832 3600375502 Rural
05303 1 124 2017 2 69 2017 3 101 2017 4 198 2017 5 7 2017 6 145 2017 7 24 2017 Rinconada 326532.5 2017 5303 10207 3332917471 Rural
names(df_2017_2)[3] <- "Hogar unipersonal"
names(df_2017_2)[6] <- "Hogar nuclear monoparental"
names(df_2017_2)[9] <- "nuclear biparental sin hijos"
names(df_2017_2)[12] <- "nuclear biparental con hijos"
names(df_2017_2)[15] <- "compuesto"
names(df_2017_2)[18] <- "extenso"
names(df_2017_2)[21] <- "sin núcleo"

2.2 Correlaciones

2.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

III <- seq(3,21,3)
my_data <- df_2017_2[, c(III,28)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

2.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,21,3)
my_data <- df_2017_2[, c(III,28)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

2.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,21,3)
my_data <- df_2017_2[, c(III,28)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)