Correlaciones entre variables del CENSO de Viviendas, Hogares y Personas e Ingresos promedios comunales de la CASEN 2017.

VE-CC-AJ

DataIntelligence

Jueves 09-07-2021

1 Nivel nacional URBANO (código 1)

1.1 Pregunta P05: Origen del agua

Esta pregunta posee 4 categorias de respuesta:

1 Red pública
2 Pozo o noria
3 Camión aljibe
4 Río, vertiente, estero, canal, lago, etc.

Leemos las respuestas a la pregunta P05 del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

tabla_con_clave <- readRDS("../censo_viviendas_con_clave_17.rds")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$P05
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"


categorias <- sort(unique(tabla_con_clave_u$P05 ))
categorias <- as.data.frame(categorias)
names(categorias)[1] <- "cat"

categorias <- filter(categorias, categorias$cat != 99)
categorias <- filter(categorias, categorias$cat != 98)

d_t <- filter(d,d$unlist.c. == categorias[1,1])
for(i in categorias[2,1]:categorias[nrow(categorias),1]){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
 
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
 
names(comuna_corr)[ncol(comuna_corr)] <- "código"
 
quitar <- seq(3,(ncol(comuna_corr)-1),3)

comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
names(comuna_corr )[2] <- "Red pública"
names(comuna_corr )[4] <- "Pozo o noria"
names(comuna_corr )[6] <- "Camión aljibe"
names(comuna_corr )[8] <- " Río, vertiente, estero, canal, lago, etc." 

renombrar <- seq(1,(ncol(comuna_corr)-2),2)
vv <- 0
for (v in renombrar) {
  vv <- vv+1
  contador <- paste0("categoria_",vv)
  names(comuna_corr )[v] <- contador
}
 
kbl(head(comuna_corr,50)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
categoria_1 Red pública categoria_2 Pozo o noria categoria_3 Camión aljibe categoria_4 Río, vertiente, estero, canal, lago, etc. código
1 54612 2 22 3 57 4 15 01101
1 26433 2 75 3 1622 4 21 01107
1 2617 2 20 3 75 4 1 01401
1 327 2 3 3 15 4 5 01404
1 1106 2 132 3 28 4 5 01405
1 95652 2 151 3 1032 4 550 02101
1 2629 2 2 3 255 4 1 02102
1 2818 2 1 3 339 4 2 02104
1 44502 2 33 3 299 4 31 02201
1 1361 2 5 3 136 4 11 02203
1 7504 2 2 3 31 4 1 02301
1 1348 NA NA 3 2 NA NA 02302
1 42747 2 142 3 1351 4 31 03101
1 4544 2 8 3 272 NA NA 03102
1 2559 2 7 3 286 4 2 03103
1 3105 NA NA 3 150 4 2 03201
1 3902 2 1 3 311 4 5 03202
1 13501 2 22 3 141 4 51 03301
1 1231 2 7 3 137 4 6 03303
1 2663 2 5 3 151 4 3 03304
1 60898 2 310 3 90 4 61 04101
1 61957 2 266 3 769 4 73 04102
1 2962 2 8 3 66 4 7 04103
1 370 2 10 3 10 4 4 04104
1 5321 2 9 3 10 4 10 04106
1 6631 2 27 3 60 4 22 04201
1 621 2 5 3 69 4 3 04202
1 5656 2 37 3 35 4 19 04203
1 4753 2 47 3 180 4 11 04204
1 26376 2 59 3 110 4 57 04301
1 2046 2 12 3 15 4 8 04302
1 4691 2 14 3 80 4 8 04303
1 1737 2 62 3 92 4 6 04304
1 94666 2 452 3 1442 4 125 05101
1 5629 2 41 3 22 4 3 05102
1 12814 2 11 3 22 4 3 05103
1 3511 2 1146 3 682 4 14 05105
1 7196 2 1365 3 99 4 14 05107
1 114028 2 392 3 1051 4 139 05109
1 2247 2 23 3 11 4 5 05201
1 19133 2 14 3 52 4 7 05301
1 3200 2 94 3 10 4 3 05302
1 2440 2 25 3 2 4 3 05303
1 3586 2 17 3 4 4 15 05304
1 8289 2 208 3 52 4 19 05401
1 3788 2 19 3 11 4 4 05402
1 1737 2 8 3 3 4 3 05403
1 1351 2 54 3 23 4 1 05404
1 1564 2 83 3 4 4 4 05405
1 24708 2 102 3 47 4 33 05501

1.2 Generación de ingresos promedios a nivel urbano y su unión con la tabla de contingencia

ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
comuna_corr <- readRDS("cant_personas_17.rds")
df_2017_exp = merge( x = df_2017_2, y = comuna_corr, by = "código", all.x = TRUE)
df_2017_exp$Ingresos_expandidos <- df_2017_exp$promedio_i*df_2017_exp$personas
df_2017_exp <- filter(df_2017_exp, df_2017_exp$Ingresos_expandidos != 'is.na')
write_xlsx(df_2017_exp,"P05_urbano.xlsx")
kbl(head(df_2017_exp,50)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
código categoria_1 Red pública categoria_2 Pozo o noria categoria_3 Camión aljibe categoria_4 Río, vertiente, estero, canal, lago, etc. comuna.x promedio_i año comuna.y personas Ingresos_expandidos
01101 1 54612 2 22 3 57 4 15 Iquique 375676.9 2017 1101 191468 71930106513
01107 1 26433 2 75 3 1622 4 21 Alto Hospicio 311571.7 2017 1107 108375 33766585496
01401 1 2617 2 20 3 75 4 1 Pozo Almonte 316138.5 2017 1401 15711 4966851883
01405 1 1106 2 132 3 28 4 5 Pica 330061.1 2017 1405 9296 3068247619
02101 1 95652 2 151 3 1032 4 550 Antofagasta 368221.4 2017 2101 361873 133249367039
02102 1 2629 2 2 3 255 4 1 Mejillones 369770.7 2017 2102 13467 4979702302
02104 1 2818 2 1 3 339 4 2 Taltal 383666.2 2017 2104 13317 5109282942
02201 1 44502 2 33 3 299 4 31 Calama 434325.1 2017 2201 165731 71981127235
02203 1 1361 2 5 3 136 4 11 San Pedro de Atacama 442861.0 2017 2203 10996 4869699464
02301 1 7504 2 2 3 31 4 1 Tocopilla 286187.2