Correlaciones entre variables del CENSO de Viviendas, Hogares y Personas e Ingresos promedios comunales de la CASEN 2017.

VE-CC-AJ

DataIntelligence

Martes 13-07-2021

1 Nivel nacional URBANO (código 1)

1.1 Antecedentes Pregunta TIPO_OPERATIVO:

POBLACIÓN TOTAL POR TIPO DE OPERATIVO En este tabulado se presenta la cantidad de personas efectivamente censadas de acuerdo al tipo de operativo en que fueron censadas. Es decir, se muestra la cantidad de población censada en viviendas particulares ocupadas con moradores presentes, en viviendas colectivas, en operativo especial de tránsito y en operativo especial calle.

  1. Población efectivamente censada: Corresponde al total de personas que fueron censadas en los distintos operativos de empadronamiento, es decir, viviendas particulares ocupadas con moradores presentes, viviendas colectivas, operativo especial tránsito y operativo especial calle.

  2. Personas en viviendas particulares ocupadas con moradores presentes: Corresponde a aquellas personas que fueron censadas en viviendas dentro de una propiedad, destinada total o parcialmente a la habitación permanente o temporal de personas. Para ser considerada vivienda particular, debe necesariamente disponer de acceso independiente para sus moradores. El concepto de propiedad no hace alusión a la propiedad legal, sino que se refiere a un espacio geográfico con límites reconocibles, en el que se ubica una o más viviendas particulares.

  3. Personas en otros operativos: Hace alusión a aquellas personas que fueron censadas a través de alguno de los operativos adicionales al de viviendas particulares. Estos son: operativo de viviendas colectivas, operativo especial tránsito y operativo especial calle.

El objetivo de estos operativos fue censar a las personas que pasaron el momento censal (00:00 horas del 19 de abril de 2017) en territorio nacional, pero que no alojaron esa noche en una vivienda particular.

1.2 Las categorías de respuesta:

Esta pregunta posee 4 categorías de respuesta:

1 Hogar en vivienda particular
8 Vivienda colectiva (no es hogar)
9 Operativo personas en tránsito (no es hogar)
10 Operativo calle (no es hogar)

Leemos las respuestas a la pregunta TIPO_OPERATIVO del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

URBANO

tabla_con_clave <- readRDS("censos/censo_hogares_con_clave_17")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$TIPO_OPERATIVO
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
# apilamos:
 d_t <- filter(d,d$unlist.c. == 1)
for(i in c(8,9,10)){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
names(comuna_corr)[ncol(comuna_corr)] <- "código"
quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
comuna_corr <- comuna_corr[,-c(1,3,5,7)]
names(comuna_corr)[1] <- "Hogar en vivienda particular"
names(comuna_corr)[2] <- "Vivienda colectiva (no es hogar)"
names(comuna_corr)[3] <- "Operativo personas en tránsito (no es hogar)"
names(comuna_corr)[4] <- "Operativo calle (no es hogar)"
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)

df_2017_2 <- df_2017_2[,-c(6)] 

df_2017_3 <- df_2017_2 
kbl(head(df_2017_2)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código Hogar en vivienda particular Vivienda colectiva (no es hogar) Operativo personas en tránsito (no es hogar) Operativo calle (no es hogar) ingresos_expandidos
01101 59435 236 1 1 71930106513
01107 29652 11 NA 1 33766585496
01401 2829 22 1 NA 4966851883
01404 358 3 NA NA NA
01405 1313 13 NA NA 3068247619
02101 105521 164 1 1 133249367039

1.2.0.1 Tabla a correlacionar:

comuna_corr <- df_2017_2

#union_final_urb_corr  <- union_final_urb[,-c(1)]
write_xlsx(comuna_corr, "TIPO_OPERATIVO_urbano.xlsx")

1.2.0.2 Estadísticos básicos de nuestras frecuencias

data_sum <- summary(comuna_corr)

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código Hogar en vivienda particular Vivienda colectiva (no es hogar) Operativo personas en tránsito (no es hogar) Operativo calle (no es hogar) ingresos_expandidos
Length:319 Min. : 320 Min. : 1.00 Min. :1 Min. :1 Min. :7.054e+08
Class :character 1st Qu.: 1842 1st Qu.: 6.00 1st Qu.:1 1st Qu.:1 1st Qu.:2.954e+09
Mode :character Median : 4522 Median : 11.50 Median :1 Median :1 Median :5.697e+09
NA Mean : 15524 Mean : 32.41 Mean :1 Mean :1 Mean :1.784e+10
NA 3rd Qu.: 15622 3rd Qu.: 30.00 3rd Qu.:1 3rd Qu.:1 3rd Qu.:1.857e+10
NA Max. :173881 Max. :365.00 Max. :1 Max. :1 Max. :1.870e+11

1.2.0.3 Gráficas:

df_2017_exp_subset <- comuna_corr
library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
grafica_fn <- function(g){
  fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
                 width=7000, height=400) 
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig 

2 \(\tau\) de Kendall

df_2017_4 <- df_2017_3[,-c(1,4,5)]
df_2017_2 <- df_2017_4
df_2017_2f <- filter(df_2017_2, df_2017_2$ingresos_expandidos != 'is.na')

my_data <- df_2017_2f[,-c(3)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla <- as.data.frame(tabla)
saveRDS(tabla,"C_TIPO_OPERATIVO_URB.rds")

names(tabla)[1] <- "Correlación"
saveRDS(tabla,"tablas_de_corr/C_TIPO_OPERATIVO_URBANO.rds")

tabla %>% rownames_to_column("Tipo de operativo")%>%  
  mutate(Correlación = cell_spec(Correlación, background=ifelse(Correlación == max(Correlación), "#fc0303", "#5cb81f"))) %>% 
  kbl(booktabs = T, linesep = "", escape=FALSE) %>% 
    kable_paper(full_width = F) %>%
    column_spec(1, color = "black")%>%
    column_spec(2, color = "white")
Tipo de operativo Correlación
Hogar en vivienda particular 0.860283755002406
Vivienda colectiva (no es hogar) 0.513870008636653

2.1 Kendall

df_2017_2[df_2017_2 == -99] <- NA
df_2017_fig <- df_2017_2
chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "kendall"), pch=20)

2.2 Pearson

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "pearson"), pch=20)

2.3 Spearman

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "spearman"), pch=20)




RURAL

tabla_con_clave <- readRDS("censos/censo_hogares_con_clave_17")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$TIPO_OPERATIVO
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
# apilamos:
 d_t <- filter(d,d$unlist.c. == 1)
for(i in c(8,9,10)){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
names(comuna_corr)[ncol(comuna_corr)] <- "código"
quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
comuna_corr <- comuna_corr[,-c(1,3,5,7)]
names(comuna_corr)[1] <- "Hogar en vivienda particular"
names(comuna_corr)[2] <- "Vivienda colectiva (no es hogar)"
names(comuna_corr)[3] <- "Operativo personas en tránsito (no es hogar)"
names(comuna_corr)[4] <- "Operativo calle (no es hogar)"
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_rural_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)

df_2017_2 <- df_2017_2[,-c(6)] 

df_2017_3 <- df_2017_2 
kbl(head(df_2017_2)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código Hogar en vivienda particular Vivienda colectiva (no es hogar) Operativo personas en tránsito (no es hogar) Operativo calle (no es hogar) ingresos_expandidos
01101 791 25 NA NA 52180713221
01107 47 5 NA NA NA
01401 1359 20 NA NA 3822052676
01402 484 4 NA NA 283538750
01403 488 5 1 NA NA
01404 607 5 NA NA 645917134

2.3.0.1 Tabla a correlacionar:

comuna_corr <- df_2017_2

#union_final_urb_corr  <- union_final_urb[,-c(1)]
write_xlsx(comuna_corr, "TIPO_OPERATIVO_rural.xlsx")

2.3.0.2 Estadísticos básicos de nuestras frecuencias

data_sum <- summary(comuna_corr)

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código Hogar en vivienda particular Vivienda colectiva (no es hogar) Operativo personas en tránsito (no es hogar) Operativo calle (no es hogar) ingresos_expandidos
Length:319 Min. : 3.0 Min. : 1.000 Min. :1 Min. : NA Min. :2.792e+08
Class :character 1st Qu.: 883.5 1st Qu.: 2.000 1st Qu.:1 1st Qu.: NA 1st Qu.:1.809e+09
Mode :character Median : 1750.0 Median : 5.000 Median :1 Median : NA Median :3.546e+09
NA Mean : 2192.3 Mean : 8.859 Mean :1 Mean :NaN Mean :8.206e+09
NA 3rd Qu.: 2978.5 3rd Qu.:11.000 3rd Qu.:1 3rd Qu.: NA 3rd Qu.:7.252e+09
NA Max. :16405.0 Max. :84.000 Max. :1 Max. : NA Max. :7.585e+10

2.3.0.3 Gráficas:

df_2017_exp_subset <- comuna_corr
library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
grafica_fn <- function(g){
  fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
                 width=7000, height=400) 
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig 

3 \(\tau\) de Kendall

union_final_urb <- df_2017_3
df_2017_2f <- filter(union_final_urb, union_final_urb$ingresos_expandidos != 'is.na')
my_data <- df_2017_2f[, -c(1,4,5,6)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla 
##                                       [,1]
## Hogar en vivienda particular     0.3239732
## Vivienda colectiva (no es hogar) 0.0934850
tabla <- as.data.frame(tabla)

names(tabla)[1] <- "Correlación"
saveRDS(tabla,"tablas_de_corr/C_P01_RURAL.rds")

tabla %>% rownames_to_column("Tipo de vivienda")%>%  
  mutate(Correlación = cell_spec(Correlación, background=ifelse(Correlación == max(Correlación), "#fc0303", "#5cb81f"))) %>% 
  kbl(booktabs = T, linesep = "", escape=FALSE) %>% 
    kable_paper(full_width = F) %>%
    column_spec(1, color = "black")%>%
    column_spec(2, color = "white")
Tipo de vivienda Correlación
Hogar en vivienda particular 0.323973174745707
Vivienda colectiva (no es hogar) 0.0934850007284526

3.1 Kendall

df_2017_2f <- df_2017_2f[,-c(1,4,5)]
df_2017_fig <- df_2017_2f
chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "kendall"), pch=20)

3.2 Pearson

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "pearson"), pch=20)

3.3 Spearman

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "spearman"), pch=20)