Correlaciones entre variables del CENSO de Viviendas, Hogares y Personas e Ingresos promedios comunales de la CASEN 2017.

VE-CC-AJ

DataIntelligence

Martes 13-07-2021

1 Nivel nacional URBANO (código 1)

1.1 Pregunta CANT_HOG: Cantidad de hogares

Esta pregunta posee 36 categorías de respuesta.

Leemos las respuestas a la pregunta CANT_HOG del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

tabla_con_clave <- readRDS("censos/censo_viviendas_con_clave_17.rds")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$CANT_HOG
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
categorias <- sort(unique(tabla_con_clave_u$CANT_HOG ))
categorias <- as.data.frame(categorias)
names(categorias)[1] <- "cat"
categorias <- filter(categorias, categorias$cat != 99)
categorias <- filter(categorias, categorias$cat != 98)
d_t <- filter(d,d$unlist.c. == categorias[1,1])
for(i in categorias[2,1]:categorias[nrow(categorias),1]){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
names(comuna_corr)[ncol(comuna_corr)] <- "código"


quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]

k <- 2
secuencia_777 <- seq(0,36,1)
for (i in secuencia_777){
  j<-  paste(i,'hogar',sep = "_")
  names(comuna_corr)[k] <- j
  k <- k+2
}

renombrar <- seq(1,(ncol(comuna_corr)-2),2)
vv <- -1
for (v in renombrar) {
  vv <- vv+1
  contador <- paste0("categoria_",vv)
  names(comuna_corr)[v] <- contador
}
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
df_2017_exp_subset <- df_2017_2 [,-c(2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76),drop=FALSE] 


kbl(head(df_2017_exp_subset,50)) %>% kable_styling(bootstrap_options = c("striped", "hover")) %>% kable_paper() %>% scroll_box(width = "100%", height = "300px")
código 0_hogar 1_hogar 2_hogar 3_hogar 4_hogar 5_hogar 6_hogar 7_hogar 8_hogar 9_hogar 10_hogar 11_hogar 12_hogar 13_hogar 14_hogar 15_hogar 16_hogar 17_hogar 18_hogar 19_hogar 20_hogar 21_hogar 22_hogar 23_hogar 24_hogar 25_hogar 26_hogar 27_hogar 28_hogar 29_hogar 30_hogar 31_hogar 32_hogar 33_hogar 34_hogar 35_hogar 36_hogar ingresos_expandidos
01101 10027 52780 1599 487 171 77 45 32 16 9 5 5 3 4 NA 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 71930106513
01107 4673 27500 675 164 42 13 8 3 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 33766585496
01401 608 2667 58 5 4 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4966851883
01404 187 348 5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
01405 776 1252 18 7 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3068247619
02101 13100 94209 2844 871 284 110 70 39 19 18 7 6 1 2 2 2 NA NA NA 2 1 NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA 133249367039
02102 494 2708 113 48 23 11 3 3 2 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4979702302
02104 691 3108 66 11 5 1 2 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 5109282942
02201 7333 44121 834 224 102 43 29 15 3 3 2 NA 2 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA 71981127235
02203 340 1463 37 17 2 3 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4869699464
02301 1491 7477 101 18 5 4 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 7207910819
02302 337 1354 16 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3084818966
03101 8962 43516 845 160 41 5 3 1 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 52819016037
03102 2454 4742 91 9 6 5 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 5628052276
03103 380 2808 49 9 3 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4671058718
03201 951 3221 42 8 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3499391196
03202 1853 4202 54 9 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4895805596
03301 2323 13512 255 50 11 6 3 1 NA NA 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 16404810756
03303 361 1354 27 8 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2035200054
03304 895 2809 34 2 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3424422750
04101 16820 60491 991 201 59 22 14 3 1 3 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 61749247282
04102 18321 62486 856 172 50 14 5 1 NA NA NA NA 1 NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 61277269093
04103 734 2993 56 8 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2855312920
04104 159 396 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 908664019
04106 814 5288 63 7 4 2 NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 7058750373
04201 1081 6717 64 4 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 8703433491
04202 303 691 7 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2122281844
04203 4731 5743 33 6 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 6098444926
04204 926 4962 65 18 2 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 7690585032
04301 4137 26329 379 65 14 6 2 2 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 31197719080
04302 542 2069 24 5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3124505460
04303 685 4755 55 13 1 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 6930326684
04304 511 1894 17 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2328107498
05101 18081 95226 1628 420 153 54 31 8 5 5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 90946261553
05102 512 5684 40 7 NA 2 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 9352095757
05103 6285 12729 165 22 4 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 14075920021
05105 10114 5351 47 3 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 5490274928
05107 6114 8681 116 13 3 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 9839456903
05109 30474 114199 1604 409 105 31 8 7 3 1 NA 1 NA NA 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 118563074323
05201 421 2262 29 8 2 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05301 2681 19169 193 22 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 23711104774
05302 575 3319 25 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3654416747
05303 300 2473 18 5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2855998928
05304 400 3612 34 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4140022481
05401 1413 8477 111 19 4 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 9183080280
05402 445 3814 37 5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 5094117762
05403 3622 1735 27 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1921527704
05404 366 1415 17 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2333781007
05405 3491 1644 15 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2160521991
05501 3493 24604 382 52 8 4 1 3 NA NA 1 NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 26131733924

1.1.0.1 Tabla a correlacionar:

#union_final_urb_corr  <- union_final_urb[,-c(1)]
write_xlsx(df_2017_exp_subset, "CANT_HOG_urbano.xlsx")

1.1.0.2 Estadísticos básicos de nuestras frecuencias

data_sum <- summary(df_2017_exp_subset)

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código 0_hogar 1_hogar 2_hogar 3_hogar 4_hogar 5_hogar 6_hogar 7_hogar 8_hogar 9_hogar 10_hogar 11_hogar 12_hogar 13_hogar 14_hogar 15_hogar 16_hogar 17_hogar 18_hogar 19_hogar 20_hogar 21_hogar 22_hogar 23_hogar 24_hogar 25_hogar 26_hogar 27_hogar 28_hogar 29_hogar 30_hogar 31_hogar 32_hogar 33_hogar 34_hogar 35_hogar 36_hogar ingresos_expandidos
Length:319 Min. : 72 Min. : 280 Min. : 1.0 Min. : 1.00 Min. : 1.00 Min. : 1.00 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.00 Min. :1 Min. :1.00 Min. :1.000 Min. : NA Min. :1 Min. : NA Min. : NA Min. :1 Min. : NA Min. :1 Min. :1 Min. : NA Min. :1 Min. : NA Min. : NA Min. : NA Min. : NA Min. : NA Min. :1 Min. :7.054e+08
Class :character 1st Qu.: 307 1st Qu.: 1819 1st Qu.: 14.0 1st Qu.: 3.00 1st Qu.: 1.00 1st Qu.: 1.00 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.00 1st Qu.:1 1st Qu.:1.25 1st Qu.:1.000 1st Qu.: NA 1st Qu.:1 1st Qu.: NA 1st Qu.: NA 1st Qu.:1 1st Qu.: NA 1st Qu.:1 1st Qu.:1 1st Qu.: NA 1st Qu.:1 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.:1 1st Qu.:2.954e+09
Mode :character Median : 754 Median : 4424 Median : 41.5 Median : 7.00 Median : 3.00 Median : 3.50 Median : 4.000 Median : 3.000 Median : 2.000 Median : 2.000 Median : 1.000 Median : 1.000 Median : 1.000 Median :3.000 Median :1.000 Median :2.000 Median :1.000 Median :1.00 Median :1 Median :1.50 Median :1.000 Median : NA Median :1 Median : NA Median : NA Median :1 Median : NA Median :1 Median :1 Median : NA Median :1 Median : NA Median : NA Median : NA Median : NA Median : NA Median :1 Median :5.697e+09
NA Mean : 2219 Mean : 14793 Mean : 232.4 Mean : 56.39 Mean : 22.32 Mean : 12.25 Mean : 9.099 Mean : 5.915 Mean : 4.259 Mean : 3.864 Mean : 2.262 Mean : 2.115 Mean : 2.429 Mean :2.818 Mean :1.583 Mean :1.667 Mean :1.857 Mean :1.50 Mean :1 Mean :1.50 Mean :1.333 Mean :NaN Mean :1 Mean :NaN Mean :NaN Mean :1 Mean :NaN Mean :1 Mean :1 Mean :NaN Mean :1 Mean :NaN Mean :NaN Mean :NaN Mean :NaN Mean :NaN Mean :1 Mean :1.784e+10
NA 3rd Qu.: 2282 3rd Qu.: 15196 3rd Qu.: 162.0 3rd Qu.: 39.00 3rd Qu.: 23.00 3rd Qu.: 14.00 3rd Qu.: 8.500 3rd Qu.: 6.500 3rd Qu.: 3.000 3rd Qu.: 3.250 3rd Qu.: 2.000 3rd Qu.: 1.750 3rd Qu.: 2.000 3rd Qu.:4.000 3rd Qu.:1.250 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:1.25 3rd Qu.:1 3rd Qu.:1.75 3rd Qu.:1.500 3rd Qu.: NA 3rd Qu.:1 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.:1 3rd Qu.: NA 3rd Qu.:1 3rd Qu.:1 3rd Qu.: NA 3rd Qu.:1 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.:1 3rd Qu.:1.857e+10
NA Max. :30474 Max. :159223 Max. :3577.0 Max. :1038.00 Max. :412.00 Max. :182.00 Max. :120.000 Max. :59.000 Max. :47.000 Max. :25.000 Max. :13.000 Max. :10.000 Max. :14.000 Max. :6.000 Max. :6.000 Max. :3.000 Max. :5.000 Max. :4.00 Max. :1 Max. :2.00 Max. :2.000 Max. : NA Max. :1 Max. : NA Max. : NA Max. :1 Max. : NA Max. :1 Max. :1 Max. : NA Max. :1 Max. : NA Max. : NA Max. : NA Max. : NA Max. : NA Max. :1 Max. :1.870e+11

1.1.0.3 Gráficas:

library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
grafica_fn <- function(g){
  fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
                 width=7000, height=400) 
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig 

2 \(\tau\) de Kendall

df_2017_2 <- df_2017_fig

df_2017_2f <- filter(df_2017_2, df_2017_2$ingresos_expandidos != 'is.na')
III <- seq(2,(ncol(df_2017_2))-17,1)
my_data <- df_2017_2f[, c(III)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla <- as.data.frame(tabla)
names(tabla)[1] <- "Correlación"
saveRDS(tabla,"tablas_de_corr/C_CANT_HOG_URBANO.rds")
tabla %>% rownames_to_column("Hogares")%>%  
  mutate(Correlación = cell_spec(Correlación, background=ifelse(Correlación == max(Correlación), "#fc0303", "#5cb81f"))) %>% 
  kbl(booktabs = T, linesep = "", escape=FALSE) %>% 
    kable_paper(full_width = F) %>%
    column_spec(1, color = "black")%>%
    column_spec(2, color = "white")
Hogares Correlación
0_hogar 0.676155535304055
1_hogar 0.859027884901738
2_hogar 0.780422736945696
3_hogar 0.699306057070795
4_hogar 0.668724341965606
5_hogar 0.606551409163688
6_hogar 0.517189893264121
7_hogar 0.5247893282221
8_hogar 0.46906387458193
9_hogar 0.434179612636807
10_hogar 0.399444038189912
11_hogar 0.326300310170205
12_hogar 0.202646303752479
13_hogar 0.207733213504476
14_hogar 0.213072114278386
15_hogar 0.20782606044725
16_hogar 0.172431981344319
17_hogar 0.188916947041082
18_hogar 0.111659856813325
19_hogar 0.109814947579633
20_hogar 0.128835631558939

2.1 Kendall

df_2017_fig <- df_2017_2[,-c(1,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38)]
chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "kendall"), pch=20)

2.2 Pearson

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "pearson"), pch=20)

2.3 Spearman

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "spearman"), pch=20)



3 Nivel nacional RURAL (código 1)

3.1 Pregunta CANT_HOG: Cantidad de hogares

Esta pregunta posee 36 categorías de respuesta.

Leemos las respuestas a la pregunta CANT_HOG del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

tabla_con_clave <- readRDS("censos/censo_viviendas_con_clave_17.rds")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$CANT_HOG
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
categorias <- sort(unique(tabla_con_clave_u$CANT_HOG ))
categorias <- as.data.frame(categorias)
names(categorias)[1] <- "cat"
categorias <- filter(categorias, categorias$cat != 99)
categorias <- filter(categorias, categorias$cat != 98)
d_t <- filter(d,d$unlist.c. == categorias[1,1])
for(i in categorias[2,1]:categorias[nrow(categorias),1]){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
names(comuna_corr)[ncol(comuna_corr)] <- "código"
quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
k <- 2
secuencia_777 <- seq(0,14,1)
for (i in secuencia_777){
  j<-  paste(i,'hogar',sep = "_")
  names(comuna_corr)[k] <- j
  k <- k+2
}
renombrar <- seq(1,(ncol(comuna_corr)-2),2)
vv <- -1
for (v in renombrar) {
  vv <- vv+1
  contador <- paste0("categoria_",vv)
  names(comuna_corr)[v] <- contador
}
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_rural_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)

df_2017_exp_subset <- df_2017_2 [,-c(2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76),drop=FALSE] 



kbl(head(df_2017_exp_subset,50)) %>% kable_styling(bootstrap_options = c("striped", "hover")) %>% kable_paper() %>% scroll_box(width = "100%", height = "300px")
código 0_hogar 1_hogar 2_hogar 3_hogar 4_hogar 5_hogar 6_hogar 7_hogar 8_hogar 9_hogar 10_hogar 11_hogar 12_hogar 13_hogar 14_hogar ingresos_expandidos
01101 691 755 15 2 NA NA NA NA NA NA NA NA NA NA NA 52180713221
01107 36 47 NA NA NA NA NA NA NA NA NA NA NA NA NA NA
01401 4192 1337 9 NA 1 NA NA NA NA NA NA NA NA NA NA 3822052676
01402 611 470 7 NA NA NA NA NA NA NA NA NA NA NA NA 283538750
01403 1553 459 10 3 NA NA NA NA NA NA NA NA NA NA NA NA
01404 1733 580 6 2 1 1 NA NA NA NA NA NA NA NA NA 645917134
01405 322 324 3 NA NA NA NA NA NA NA NA NA NA NA NA 2502464414
02101 370 301 10 4 1 1 NA NA NA NA NA NA NA NA NA NA
02102 432 138 NA NA NA NA NA NA NA NA NA NA NA NA NA NA
02103 184 334 5 3 NA 1 NA NA NA NA NA NA NA NA NA 3290056742
02104 362 295 5 NA NA 1 NA NA NA NA NA NA NA NA NA 3844002134
02201 3283 956 9 2 NA NA NA NA NA NA NA NA NA NA NA 39457387800
02202 333 87 6 1 NA NA NA NA NA NA NA NA NA NA NA NA
02203 772 1307 20 5 1 2 1 NA NA NA NA NA NA NA NA 2985112297
02301 1310 212 1 NA NA NA NA NA NA NA NA NA NA NA NA 4183793832
02302 98 58 NA NA NA NA NA NA NA NA NA NA NA NA NA NA
03101 958 946 12 2 NA NA NA NA NA NA NA NA NA NA NA 38699138722
03102 7499 798 5 2 NA NA NA NA NA NA NA NA NA NA NA NA
03103 518 928 5 2 1 NA NA NA NA NA NA NA NA NA NA 4034940816
03201 1483 415 NA NA NA NA NA NA NA NA NA NA NA NA NA NA
03202 444 246 2 NA NA NA NA NA NA NA NA NA NA NA NA 4545663075
03301 1250 1908 15 NA 2 1 NA NA NA NA NA NA NA NA NA 11299454698
03302 1150 1737 14 1 1 NA NA NA NA NA NA NA NA NA NA 1039186477
03303 875 855 16 1 1 NA NA NA NA NA NA NA NA NA NA 1425547554
03304 1956 500 3 NA NA NA NA NA NA NA NA NA NA NA NA 2089066548
04101 2893 5704 52 6 4 1 NA NA NA NA NA NA NA NA NA 44274327972
04102 3347 4036 42 5 1 1 NA NA NA NA NA NA NA NA NA 46918711304
04103 288 405 6 NA NA NA NA NA NA NA NA NA NA NA NA 2397612293
04104 1020 1055 9 3 1 NA NA NA NA NA NA NA NA NA NA 982530309
04105 749 1587 11 1 NA NA NA NA NA NA NA NA NA NA NA 786383423
04106 1187 3296 63 5 2 NA 1 NA NA NA NA NA NA NA NA 4695441470
04201 1041 3359 17 NA NA NA NA NA NA NA NA 1 NA NA NA 5109649759
04202 1571 2679 17 NA NA NA NA NA NA NA NA NA NA NA NA 1558270441
04203 1279 1434 8 1 NA NA NA NA NA NA NA NA NA NA NA 3704185607
04204 932 3683 20 2 NA NA NA NA NA NA NA NA NA NA NA 5681637894
04301 3208 7834 51 8 1 1 1 NA NA NA NA NA NA NA NA 25683781418
04302 1547 2767 21 3 NA 1 NA 1 NA NA NA NA NA NA NA 2300832587
04303 2112 5358 55 4 1 1 NA NA NA NA NA NA NA NA NA 5835357638
04304 537 1828 11 5 NA NA NA NA NA NA NA NA NA NA NA 1817183694
04305 1064 1675 12 NA NA NA NA NA NA NA NA NA NA NA NA 778712384
05101 945 275 3 NA 1 NA NA NA NA NA NA NA NA NA NA 74756602991
05102 2384 2938 17 1 1 1 NA NA NA NA NA NA NA NA NA 6779018483
05103 281 772 7 NA NA NA NA NA NA NA NA NA NA NA NA NA
05104 87 349 2 NA NA NA NA NA NA NA NA NA NA NA NA NA
05105 950 965 4 1 NA NA NA NA NA NA NA NA NA NA NA 4295363979
05107 875 1600 12 1 NA NA NA NA NA NA NA NA NA NA NA 9102071069
05201 157 138 3 NA NA NA NA 1 NA NA NA NA NA NA NA NA
05301 285 1214 11 1 1 NA NA NA NA NA NA NA NA NA NA 18714795984
05302 242 1313 8 NA NA NA NA NA NA NA NA NA NA NA NA 3471349123
05303 162 660 4 NA NA NA NA NA NA NA NA NA NA NA NA 2512319225

3.1.0.1 Tabla a correlacionar:

#union_final_urb_corr  <- union_final_urb[,-c(1)]
write_xlsx(df_2017_exp_subset, "CANT_HOG_rural.xlsx")

3.1.0.2 Estadísticos básicos de nuestras frecuencias

data_sum <- summary(df_2017_exp_subset)

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código 0_hogar 1_hogar 2_hogar 3_hogar 4_hogar 5_hogar 6_hogar 7_hogar 8_hogar 9_hogar 10_hogar 11_hogar 12_hogar 13_hogar 14_hogar ingresos_expandidos
Length:319 Min. : 1.0 Min. : 3.0 Min. : 1.00 Min. : 1.00 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1 Min. :1 Min. : NA Min. :1 Min. :1 Min. : NA Min. : NA Min. :1 Min. :2.792e+08
Class :character 1st Qu.: 331.5 1st Qu.: 856.5 1st Qu.: 6.00 1st Qu.: 1.00 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1 1st Qu.:1 1st Qu.: NA 1st Qu.:1 1st Qu.:1 1st Qu.: NA 1st Qu.: NA 1st Qu.:1 1st Qu.:1.809e+09
Mode :character Median : 594.0 Median : 1720.0 Median :13.00 Median : 2.00 Median :1.000 Median :1.000 Median :1.000 Median :1 Median :1 Median : NA Median :1 Median :1 Median : NA Median : NA Median :1 Median :3.546e+09
NA Mean : 846.8 Mean : 2154.1 Mean :16.89 Mean : 2.69 Mean :1.208 Mean :1.079 Mean :1.167 Mean :1 Mean :1 Mean :NaN Mean :1 Mean :1 Mean :NaN Mean :NaN Mean :1 Mean :8.206e+09
NA 3rd Qu.:1049.5 3rd Qu.: 2922.0 3rd Qu.:21.50 3rd Qu.: 4.00 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1 3rd Qu.:1 3rd Qu.: NA 3rd Qu.:1 3rd Qu.:1 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.:1 3rd Qu.:7.252e+09
NA Max. :7499.0 Max. :16205.0 Max. :83.00 Max. :10.00 Max. :4.000 Max. :2.000 Max. :2.000 Max. :1 Max. :1 Max. : NA Max. :1 Max. :1 Max. : NA Max. : NA Max. :1 Max. :7.585e+10

3.1.0.3 Gráficas:

library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
grafica_fn <- function(g){
  fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
                 width=7000, height=400) 
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig 

4 \(\tau\) de Kendall

df_2017_2 <- df_2017_fig
df_2017_2f <- filter(df_2017_2, df_2017_2$ingresos_expandidos != 'is.na')
df_2017_2f[df_2017_2f == -99] <- NA
III <- seq(2,(ncol(df_2017_2f))-9,1)
III
## [1] 2 3 4 5 6 7 8
my_data <- df_2017_2f[, c(III)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla <- as.data.frame(tabla)
names(tabla)[1] <- "Correlación"
saveRDS(tabla,"tablas_de_corr/C_CANT_HOG_RURAL.rds")
tabla %>% rownames_to_column("Hogares")%>%  
  mutate(Correlación = cell_spec(Correlación, background=ifelse(Correlación == max(Correlación), "#fc0303", "#5cb81f"))) %>% 
  kbl(booktabs = T, linesep = "", escape=FALSE) %>% 
    kable_paper(full_width = F) %>%
    column_spec(1, color = "black")%>%
    column_spec(2, color = "white")
Hogares Correlación
0_hogar 0.170800502711448
1_hogar 0.322094417685775
2_hogar 0.324024662304965
3_hogar 0.235841830409904
4_hogar 0.213100608037777
5_hogar 0.0760791635165139
6_hogar 0.440385506050544

4.1 Kendall

df_2017_exp_subset <- df_2017_exp_subset[,-c(1,9,10,11,12,13,14,15,16)]
df_2017_fig<- df_2017_exp_subset
chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "kendall"), pch=20)

4.2 Pearson

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "pearson"), pch=20)

4.3 Spearman

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "spearman"), pch=20)