Area: urbano = 1 rural = 2

URBANO

1 Pregunta P13: Asiste actualmente a la educación formal

1 Sí
2 No asiste actualmente
3 CNunca asistió

1.1 Cálculo de frecuencias

Leemos las respuestas a la pregunta P13 del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:

tabla_con_clave <- readRDS("../censo_personas_con_clave_17")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$P13
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:3){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
 
codigos <- d_t$
unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
 
names(comuna_corr)[10] <- "código" 
 
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_urbano_nacional.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
código unlist.c..x Freq.x anio.x unlist.c..y Freq.y anio.y unlist.c. Freq anio comuna.x promedio_i año comuna.y personas Ingresos_expandidos tipo
01101 1 57714 2017 2 120765 2017 3 6886 2017 Iquique 356487.6 2017 1101 191468 68255976664 Urbano
01107 1 39226 2017 2 58863 2017 3 4718 2017 Alto Hospicio 301933.4 2017 1107 108375 32722034397 Urbano
01401 1 3388 2017 2 5986 2017 3 489 2017 Pozo Almonte 299998.6 2017 1401 15711 4713278189 Urbano
01404 1 332 2017 2 683 2017 3 54 2017 NA NA NA NA NA NA NA
01405 1 1177 2017 2 2448 2017 3 138 2017 Pica 330061.1 2017 1405 9296 3068247619 Urbano
02101 1 115135 2017 2 215152 2017 3 14349 2017 Antofagasta 347580.2 2017 2101 361873 125779893517 Urbano
02102 1 3299 2017 2 8840 2017 3 480 2017 Mejillones 369770.7 2017 2102 13467 4979702302 Urbano
02104 1 3202 2017 2 6943 2017 3 475 2017 Taltal 376328.9 2017 2104 13317 5011572025 Urbano
02201 1 47453 2017 2 97019 2017 3 8055 2017 Calama 416281.1 2017 2201 165731 68990679686 Urbano
02203 1 1360 2017 2 3730 2017 3 256 2017 San Pedro de Atacama 437934.7 2017 2203 10996 4815529626 Urbano
02301 1 7273 2017 2 15549 2017 3 942 2017 Tocopilla 271720.8 2017 2301 25186 6843559467 Urbano
02302 1 1205 2017 2 3416 2017 3 176 2017 María Elena 466266.9 2017 2302 6457 3010685220 Urbano
03101 1 48018 2017 2 93937 2017 3 6822 2017 Copiapó 330574.6 2017 3101 153937 50887663717 Urbano
03102 1 5192 2017 2 9531 2017 3 583 2017 Caldera 299314.8 2017 3102 17662 5286498241 Urbano
03103 1 3239 2017 2 6090 2017 3 509 2017 Tierra Amarilla 315860.6 2017 3103 14019 4428049932 Urbano
03201 1 3309 2017 2 7189 2017 3 489 2017 Chañaral 286389.3 2017 3201 12219 3499391196 Urbano
03202 1 3916 2017 2 8734 2017 3 411 2017 Diego de Almagro 325861.5 2017 3202 13925 4537621312 Urbano
03301 1 13368 2017 2 29052 2017 3 2297 2017 Vallenar 311577.0 2017 3301 51917 16176145007 Urbano
03303 1 1389 2017 2 2884 2017 3 258 2017 Freirina 289049.9 2017 3303 7041 2035200054 Urbano
03304 1 2547 2017 2 5795 2017 3 335 2017 Huasco 337414.8 2017 3304 10149 3424422750 Urbano
04101 1 67411 2017 2 121727 2017 3 7175 2017 La Serena 272136.8 2017 4101 221054 60156924947 Urbano
04102 1 68560 2017 2 131791 2017 3 8938 2017 Coquimbo 264340.0 2017 4102 227730 60198159091 Urbano
04103 1 2849 2017 2 6544 2017 3 523 2017 Andacollo 251267.7 2017 4103 11044 2775000288 Urbano
04104 1 440 2017 2 733 2017 3 99 2017 La Higuera 214257.0 2017 4104 4241 908664019 Urbano
04106 1 5218 2017 2 10634 2017 3 808 2017 Vicuña 245957.4 2017 4106 27771 6830481918 Urbano
04201 1 6054 2017 2 13589 2017 3 905 2017 Illapel 270316.5 2017 4201 30848 8338722128 Urbano
04202 1 454 2017 2 1332 2017 3 124 2017 Canela 233397.3 2017 4202 9093 2122281844 Urbano
04203 1 4238 2017 2 11452 2017 3 812 2017 Los Vilos 282415.6 2017 4203 21382 6038609501 Urbano
04204 1 4535 2017 2 11094 2017 3 772 2017 Salamanca 262056.9 2017 4204 29347 7690585032 Urbano
04301 1 26161 2017 2 55203 2017 3 3827 2017 Ovalle 274771.4 2017 4301 111272 30574361012 Urbano
04302 1 1543 2017 2 3982 2017 3 288 2017 Combarbalá 228990.4 2017 4302 13322 3050610572 Urbano
04303 1 4440 2017 2 9554 2017 3 960 2017 Monte Patria 225369.1 2017 4303 30751 6930326684 Urbano
04304 1 1812 2017 2 3517 2017 3 324 2017 Punitaqui 212496.1 2017 4304 10956 2328107498 Urbano
05101 1 91198 2017 2 188173 2017 3 10225 2017 Valparaíso 297929.0 2017 5101 296655 88382118059 Urbano
05102 1 5543 2017 2 11452 2017 3 683 2017 Casablanca 341641.8 2017 5102 26867 9178890241 Urbano
05103 1 12486 2017 2 25050 2017 3 1247 2017 Concón 318496.3 2017 5103 42152 13425257057 Urbano
05105 1 4273 2017 2 10539 2017 3 601 2017 Puchuncaví 296035.5 2017 5105 18546 5490274928 Urbano
05107 1 7620 2017 2 17328 2017 3 1216 2017 Quintero 308224.7 2017 5107 31923 9839456903 Urbano
05109 1 102636 2017 2 213767 2017 3 10229 2017 Viña del Mar 337006.1 2017 5109 334248 112643604611 Urbano
05201 1 1774 2017 2 5006 2017 3 239 2017 NA NA NA NA NA NA NA
05301 1 17686 2017 2 39206 2017 3 2255 2017 Los Andes 339720.2 2017 5301 66708 22662055502 Urbano
05302 1 3228 2017 2 6637 2017 3 489 2017 Calle Larga 246387.3 2017 5302 14832 3654416747 Urbano
05303 1 2506 2017 2 5113 2017 3 313 2017 Rinconada 273904.7 2017 5303 10207 2795744821 Urbano
05304 1 3423 2017 2 7116 2017 3 487 2017 San Esteban 219571.6 2017 5304 18855 4140022481 Urbano
05401 1 7049 2017 2 17275 2017 3 1113 2017 La Ligua 250134.4 2017 5401 35390 8852256241 Urbano
05402 1 3578 2017 2 7644 2017 3 614 2017 Cabildo 262745.9 2017 5402 19388 5094117762 Urbano
05403 1 1311 2017 2 3760 2017 3 184 2017 Papudo 294355.2 2017 5403 6356 1870921373 Urbano
05404 1 1066 2017 2 2686 2017 3 245 2017 Petorca 237510.8 2017 5404 9826 2333781007 Urbano
05405 1 1266 2017 2 3467 2017 3 158 2017 Zapallar 294389.2 2017 5405 7339 2160521991 Urbano
05501 1 23843 2017 2 50413 2017 3 2799 2017 Quillota 286029.5 2017 5501 90517 25890529852 Urbano
names(df_2017_2)[3] <- "Sí"
names(df_2017_2)[6] <- "No asiste actualmente"
names(df_2017_2)[9] <- "CNunca asistió"

1.2 Correlaciones

1.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

III <- seq(3,9,3)
my_data <- df_2017_2[, c(III,16)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

1.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,9,3)
my_data <- df_2017_2[, c(III,16)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

1.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,9,3)
my_data <- df_2017_2[, c(III,16)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)



RURAL

2 Pregunta P13: Asiste actualmente a la educación formal

1 Sí
2 No asiste actualmente
3 CNunca asistió

2.1 Cálculo de frecuencias

Leemos las respuestas a la pregunta P13 del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría de respuesta:

tabla_con_clave <- readRDS("../censo_personas_con_clave_17")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$P13
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
 
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:3){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
 
codigos <- d_t$
unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
 
names(comuna_corr)[10] <- "código" 
 
ingresos_expandidos_2017 <- readRDS("ingresos_expandidos_17_rural_nacional.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
tablamadre <- head(df_2017_2,50)
kbl(tablamadre) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
código unlist.c..x Freq.x anio.x unlist.c..y Freq.y anio.y unlist.c. Freq anio comuna.x promedio_i año comuna.y personas Ingresos_expandidos tipo
01101 1 568 2017 2 1650 2017 3 121 2017 Iquique 289375.3 2017 1101 191468 55406102543 Rural
01107 1 497 2017 2 1922 2017 3 34 2017 NA NA NA NA NA NA NA
01401 1 1121 2017 2 4120 2017 3 224 2017 Pozo Almonte 263069.6 2017 1401 15711 4133086727 Rural
01402 1 349 2017 2 729 2017 3 122 2017 Camiña 262850.3 2017 1402 1250 328562901 Rural
01403 1 437 2017 2 1013 2017 3 160 2017 NA NA NA NA NA NA NA
01404 1 395 2017 2 1026 2017 3 138 2017 Huara 253968.5 2017 1404 2730 693334131 Rural
01405 1 611 2017 2 4608 2017 3 50 2017 Pica 290496.7 2017 1405 9296 2700457509 Rural
02101 1 1046 2017 2 6438 2017 3 116 2017 NA NA NA NA NA NA NA
02102 1 96 2017 2 370 2017 3 18 2017 NA NA NA NA NA NA NA
02103 1 1020 2017 2 9002 2017 3 53 2017 Sierra Gorda 403458.5 2017 2103 10186 4109628188 Rural
02104 1 225 2017 2 1843 2017 3 86 2017 Taltal 345494.0 2017 2104 13317 4600943086 Rural
02201 1 886 2017 2 5896 2017 3 213 2017 Calama 310025.0 2017 2201 165731 51380756402 Rural
02202 1 72 2017 2 223 2017 3 19 2017 NA NA NA NA NA NA NA
02203 1 940 2017 2 4134 2017 3 245 2017 San Pedro de Atacama 356147.9 2017 2203 10996 3916202829 Rural
02301 1 80 2017 2 403 2017 3 24 2017 Tocopilla 180218.1 2017 2301 25186 4538972205 Rural
02302 1 141 2017 2 1366 2017 3 15 2017 NA NA NA NA NA NA NA
03101 1 848 2017 2 1908 2017 3 163 2017 Copiapó 308502.8 2017 3101 153937 47489990283 Rural
03102 1 370 2017 2 1356 2017 3 76 2017 NA NA NA NA NA NA NA
03103 1 783 2017 2 3006 2017 3 179 2017 Tierra Amarilla 312457.3 2017 3103 14019 4380339153 Rural
03201 1 281 2017 2 780 2017 3 53 2017 NA NA NA NA NA NA NA
03202 1 166 2017 2 449 2017 3 41 2017 Diego de Almagro 374511.6 2017 3202 13925 5215073473 Rural
03301 1 1597 2017 2 3715 2017 3 442 2017 Vallenar 254290.6 2017 3301 51917 13202005308 Rural
03302 1 1327 2017 2 3387 2017 3 397 2017 Alto del Carmen 227130.4 2017 3302 5299 1203563833 Rural
03303 1 562 2017 2 1608 2017 3 220 2017 Freirina 214803.3 2017 3303 7041 1512429891 Rural
03304 1 258 2017 2 877 2017 3 66 2017 Huasco 227560.7 2017 3304 10149 2309513927 Rural
04101 1 5772 2017 2 12964 2017 3 1057 2017 La Serena 233184.2 2017 4101 221054 51546306303 Rural
04102 1 3778 2017 2 8336 2017 3 690 2017 Coquimbo 231810.7 2017 4102 227730 52790242466 Rural
04103 1 235 2017 2 695 2017 3 95 2017 Andacollo 242908.2 2017 4103 11044 2682678345 Rural
04104 1 646 2017 2 1969 2017 3 250 2017 La Higuera 250699.6 2017 4104 4241 1063217069 Rural
04105 1 1071 2017 2 3138 2017 3 151 2017 Paiguano 205942.1 2017 4105 4497 926121774 Rural
04106 1 2804 2017 2 7131 2017 3 556 2017 Vicuña 176130.6 2017 4106 27771 4891322768 Rural
04201 1 2238 2017 2 6611 2017 3 755 2017 Illapel 191976.8 2017 4201 30848 5922099530 Rural
04202 1 1416 2017 2 4806 2017 3 772 2017 Canela 171370.3 2017 4202 9093 1558270441 Rural
04203 1 876 2017 2 2885 2017 3 404 2017 Los Vilos 173238.5 2017 4203 21382 3704185607 Rural
04204 1 2716 2017 2 8675 2017 3 733 2017 Salamanca 223234.2 2017 4204 29347 6551254640 Rural
04301 1 5761 2017 2 15489 2017 3 1660 2017 Ovalle 241393.7 2017 4301 111272 26860360045 Rural
04302 1 1346 2017 2 5191 2017 3 576 2017 Combarbalá 179139.6 2017 4302 13322 2386498044 Rural
04303 1 3656 2017 2 10175 2017 3 1184 2017 Monte Patria 201205.8 2017 4303 30751 6187280931 Rural
04304 1 1108 2017 2 3341 2017 3 451 2017 Punitaqui 171931.7 2017 4304 10956 1883683880 Rural
04305 1 928 2017 2 2953 2017 3 348 2017 Río Hurtado 182027.2 2017 4305 4278 778712384 Rural
05101 1 155 2017 2 534 2017 3 37 2017 Valparaíso 331716.1 2017 5101 296655 98405237576 Rural
05102 1 2174 2017 2 6103 2017 3 449 2017 Casablanca 268917.1 2017 5102 26867 7224996933 Rural
05103 1 780 2017 2 1789 2017 3 102 2017 NA NA NA NA NA NA NA
05104 1 210 2017 2 682 2017 3 20 2017 NA NA NA NA NA NA NA
05105 1 685 2017 2 1819 2017 3 135 2017 Puchuncaví 279614.4 2017 5105 18546 5185728335 Rural
05107 1 1527 2017 2 3184 2017 3 185 2017 Quintero 334628.2 2017 5107 31923 10682335196 Rural
05201 1 129 2017 2 253 2017 3 25 2017 NA NA NA NA NA NA NA
05301 1 1116 2017 2 4261 2017 3 182 2017 Los Andes 324402.1 2017 5301 66708 21640215030 Rural
05302 1 1087 2017 2 2743 2017 3 186 2017 Calle Larga 242743.8 2017 5302 14832 3600375502 Rural
05303 1 606 2017 2 1419 2017 3 91 2017 Rinconada 326532.5 2017 5303 10207 3332917471 Rural
names(df_2017_2)[3] <- "Sí"
names(df_2017_2)[6] <- "No asiste actualmente"
names(df_2017_2)[9] <- "CNunca asistió"

2.2 Correlaciones

2.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida más utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente “coeficiente de correlación”. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mínimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

Jefe/a de hogar - Cuñado/a

III <- seq(3,9,3)
my_data <- df_2017_2[, c(III,16)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

2.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. Además, su uso no solo está restringido a datos continuos, sino que también puede usarse en análisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,9,3)
my_data <- df_2017_2[, c(III,16)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

2.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización más fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,9,3)
my_data <- df_2017_2[, c(III,16)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)