Correlaciones entre variables del CENSO de Viviendas, Hogares y Personas e Ingresos promedios comunales de la CASEN 2017.

VE-CC-AJ

DataIntelligence

Martes 13-07-2021

1 Nivel nacional URBANO (código 1)

1.1 Pregunta CANT_PER: Cantidad de personas

Esta pregunta posee un rango de categorías de respuestade 0-9999:

Leemos las respuestas a la pregunta CANT_PER del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

tabla_con_clave <- readRDS("censos/censo_viviendas_con_clave_17.rds")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$CANT_PER
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

# Nos encontramos con una anomalía estadística. 
# Tenemos una vivienda cuya cantidad de personas es de  # 5912, lo que es absurdo. Vamos a fijar un punto de  #corte arbitrario que nos permita trabajar con #coherencia.
# A partir del número 30, las frecuencias tienden a 1.

d_t <- filter(d,d$unlist.c. == 0)
for(i in 1:30){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}

# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada código:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[94] <- "código" 

# Hacemos la unión con los ingresos promedio comunales expandidos:
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)

quitar <- seq(4,(ncol(df_2017_2)-1),3)
comuna_corr <- df_2017_2[,-c(quitar),drop=FALSE]

quitar_2 <- seq(2,(ncol(comuna_corr)-1),2)
comuna_corr <- comuna_corr[,-c(quitar_2),drop=FALSE]

secuencia_777 <- seq(2,32,1)

for (i in secuencia_777){
  j <- paste(i-2,'personas',sep = "_")
  names(comuna_corr)[i] <- j
}

comuna_corr[comuna_corr == -99] <- NA
kbl(head(comuna_corr,50)) %>% kable_styling(bootstrap_options = c("striped", "hover")) %>% kable_paper() %>% scroll_box(width = "100%", height = "300px")
código 0_personas 1_personas 2_personas 3_personas 4_personas 5_personas 6_personas 7_personas 8_personas 9_personas 10_personas 11_personas 12_personas 13_personas 14_personas 15_personas 16_personas 17_personas 18_personas 19_personas 20_personas 21_personas 22_personas 23_personas 24_personas 25_personas 26_personas 27_personas 28_personas 29_personas 30_personas ingresos_expandidos
01101 10027 9550 12024 11856 9801 5528 2889 1565 877 433 309 202 124 75 62 32 26 26 13 9 6 8 8 3 3 3 2 5 3 2 1 71930106513
01107 4673 3424 4743 6028 5910 3983 2007 1021 611 280 199 87 46 30 22 9 6 2 3 NA NA NA 1 3 1 1 NA NA NA NA NA 33766585496
01401 608 519 545 525 469 343 170 68 52 24 15 8 2 5 1 3 1 1 NA NA 1 1 NA NA NA NA NA NA NA NA NA 4966851883
01404 187 97 59 71 61 33 15 14 1 1 NA NA 1 1 NA NA NA NA 1 NA NA NA NA NA 1 NA NA NA NA NA NA NA
01405 776 291 318 237 198 123 71 21 16 9 2 3 1 NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA 3068247619
02101 13100 13546 20037 20964 19467 11302 5788 3073 1867 895 620 330 228 156 106 66 55 25 19 11 17 8 7 4 5 4 3 1 2 2 3 133249367039
02102 494 411 525 593 591 406 219 132 71 41 54 25 18 18 3 11 2 7 2 3 NA 4 2 3 1 NA 1 1 NA NA NA 4979702302
02104 691 558 638 649 588 359 182 115 67 26 10 7 3 3 2 2 1 NA 2 1 NA NA NA 1 NA NA NA NA NA NA NA 5109282942
02201 7333 7713 9409 9696 8599 4967 2284 1283 741 318 216 125 87 75 36 27 27 16 15 6 11 1 4 5 4 NA 2 2 3 NA 1 71981127235
02203 340 437 399 296 207 104 64 43 20 6 15 15 4 4 2 5 1 1 2 1 1 NA 2 NA 2 NA NA 2 1 1 NA 4869699464
02301 1491 1429 1677 1696 1361 784 354 171 102 32 15 15 6 2 3 NA 1 NA 2 1 1 NA NA NA NA NA NA NA NA NA NA 7207910819
02302 337 323 303 278 298 130 51 30 25 4 3 2 2 1 NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA 3084818966
03101 8962 6415 9485 9981 9100 5077 2367 1066 575 255 147 78 51 27 15 4 10 3 3 1 2 1 2 1 NA NA 1 2 1 NA NA 52819016037
03102 2454 908 1092 996 819 596 242 110 58 29 12 13 4 NA 4 1 NA 1 NA NA 1 NA NA NA NA NA NA 1 NA NA NA 5628052276
03103 380 423 542 635 568 355 193 92 34 14 8 5 2 2 NA 1 1 NA NA NA NA NA NA NA NA 1 NA NA NA NA NA 4671058718
03201 951 567 715 714 586 354 168 84 54 23 13 11 6 1 1 NA 1 NA NA NA 1 NA NA NA NA NA NA NA 1 NA NA 3499391196
03202 1853 917 953 987 830 384 170 47 36 8 8 2 4 2 1 2 1 1 1 1 2 NA NA 2 NA NA NA NA 1 NA NA 4895805596
03301 2323 2278 3113 3035 2529 1466 715 367 175 82 54 33 17 7 5 1 2 2 2 3 NA 1 NA 1 1 NA NA NA NA NA 1 16404810756
03303 361 259 300 293 257 128 75 36 33 4 4 5 NA 1 NA NA NA NA NA NA NA NA NA NA NA 1 NA NA NA NA NA 2035200054
03304 895 593 632 645 508 256 121 51 34 10 7 6 3 2 NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 1 NA 3424422750
04101 16820 9591 14318 14114 12002 6373 2907 1324 692 248 161 77 45 32 20 19 10 3 6 2 4 NA 2 2 NA 1 2 2 NA 1 1 61749247282
04102 18321 8858 13920 14399 12798 7116 3358 1591 849 351 203 107 75 39 26 11 13 7 3 NA 2 1 4 1 NA NA NA 1 1 NA NA 61277269093
04103 734 541 661 612 589 351 170 85 30 19 7 3 3 NA NA 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA 2855312920
04104 159 71 81 89 73 42 22 10 6 2 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 908664019
04106 814 961 1175 1235 986 575 249 107 56 21 10 7 1 1 NA NA NA 2 NA 1 NA NA NA 1 NA NA NA NA NA NA NA 7058750373
04201 1081 1289 1564 1592 1198 619 314 123 54 29 8 3 4 NA 4 NA 1 2 NA 1 NA NA NA NA NA NA NA NA NA 1 NA 8703433491
04202 303 175 171 169 100 48 27 7 3 4 NA 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2122281844
04203 4731 1280 1524 1249 922 481 196 85 43 15 13 7 1 1 1 NA 2 NA NA NA NA 1 1 NA NA NA NA 1 NA NA NA 6098444926
04204 926 920 1141 1153 953 491 218 111 45 28 17 10 2 2 1 1 2 NA 1 1 1 1 1 NA 2 2 NA 2 2 NA 1 7690585032
04301 4137 4305 6115 6136 5058 2705 1281 615 302 132 89 30 30 14 11 5 1 3 NA NA 1 NA NA NA NA NA NA 1 1 NA 1 31197719080
04302 542 509 539 455 320 156 67 31 15 8 3 1 4 1 2 NA NA 1 NA NA NA NA NA NA NA NA NA NA 1 NA NA 3124505460
04303 685 857 1075 1092 902 468 221 109 62 20 14 2 4 3 NA NA 3 NA NA NA 1 NA NA NA NA 1 NA NA NA NA NA 6930326684
04304 511 373 438 410 383 167 91 33 14 2 4 2 1 NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA 2328107498
05101 18081 18837 25277 22024 16577 8454 3639 1598 697 301 204 86 71 31 17 19 9 5 6 3 2 3 1 4 1 4 NA NA 1 2 2 90946261553
05102 512 895 1301 1378 1220 562 231 97 31 12 11 3 1 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 9352095757
05103 6285 2300 3159 2910 2389 1302 522 194 104 31 16 7 2 4 NA NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA 14075920021
05105 10114 1138 1440 1074 911 504 196 87 45 5 6 5 2 2 NA NA 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA 5490274928
05107 6114 1695 2270 2012 1459 772 338 158 57 27 18 7 7 2 2 1 NA 1 NA NA 2 1 NA NA 1 1 NA 1 NA NA 1 9839456903
05109 30474 23874 32494 25779 19199 9031 3562 1438 675 234 133 65 37 22 14 17 12 4 6 3 7 2 2 2 3 4 NA 2 1 NA 2 118563074323
05201 421 556 618 498 368 193 78 43 21 7 5 3 4 2 3 1 3 1 2 NA NA NA NA NA 1 NA 1 NA 1 NA NA NA
05301 2681 3186 4873 4690 3794 1762 645 284 107 40 25 11 8 1 2 3 3 1 3 1 1 1 NA NA NA NA NA NA NA NA NA 23711104774
05302 575 424 755 886 702 369 129 42 28 6 3 4 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3654416747
05303 300 346 552 618 526 248 127 50 24 3 6 NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2855998928
05304 400 491 885 908 800 361 134 44 12 11 NA 1 1 1 NA NA 1 NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 4140022481
05401 1413 1494 2158 2150 1506 710 351 134 60 25 19 8 3 3 1 NA NA 1 NA NA NA 2 NA NA NA NA NA NA NA NA NA 9183080280
05402 445 603 976 859 741 375 168 70 38 14 8 8 3 1 NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA 5094117762
05403 3622 308 419 417 335 169 67 32 17 3 1 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1921527704
05404 366 324 374 341 230 96 49 18 3 1 4 NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA 1 NA NA 2333781007
05405 3491 292 439 375 297 152 64 34 11 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2160521991
05501 3493 3984 6170 6042 4838 2333 983 425 162 66 37 10 14 10 4 2 1 NA NA NA 2 NA 1 NA NA NA NA NA 2 1 NA 26131733924

1.1.0.1 Tabla a correlacionar:

#union_final_urb_corr  <- union_final_urb[,-c(1)]
write_xlsx(comuna_corr, "CANT_PER_urbano.xlsx")

1.1.0.2 Estadísticos básicos de nuestras frecuencias

data_sum <- summary(comuna_corr)

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código 0_personas 1_personas 2_personas 3_personas 4_personas 5_personas 6_personas 7_personas 8_personas 9_personas 10_personas 11_personas 12_personas 13_personas 14_personas 15_personas 16_personas 17_personas 18_personas 19_personas 20_personas 21_personas 22_personas 23_personas 24_personas 25_personas 26_personas 27_personas 28_personas 29_personas 30_personas ingresos_expandidos
Length:319 Min. : 72 Min. : 71.0 Min. : 55 Min. : 43.0 Min. : 35 Min. : 21.0 Min. : 2.0 Min. : 1.00 Min. : 1.00 Min. : 1.00 Min. : 1.00 Min. : 1.00 Min. : 1.00 Min. : 1.0 Min. : 1.00 Min. : 1.000 Min. : 1.000 Min. : 1.00 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :7.054e+08
Class :character 1st Qu.: 307 1st Qu.: 311.5 1st Qu.: 435 1st Qu.: 428.5 1st Qu.: 331 1st Qu.: 159.5 1st Qu.: 64.5 1st Qu.: 27.25 1st Qu.: 10.75 1st Qu.: 4.00 1st Qu.: 3.00 1st Qu.: 2.00 1st Qu.: 2.00 1st Qu.: 1.0 1st Qu.: 1.00 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.00 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:2.954e+09
Mode :character Median : 754 Median : 818.0 Median : 1088 Median : 1005.0 Median : 815 Median : 399.0 Median : 178.0 Median : 70.00 Median : 33.00 Median : 13.00 Median : 8.00 Median : 5.00 Median : 4.00 Median : 2.0 Median : 2.00 Median : 2.000 Median : 2.000 Median : 2.00 Median : 2.000 Median : 2.000 Median : 2.000 Median : 1.000 Median : 1.000 Median : 1.000 Median : 1.000 Median : 1.000 Median : 1.000 Median :1.000 Median :1.000 Median :1.000 Median :1.000 Median :5.697e+09
NA Mean : 2219 Mean : 2441.5 Mean : 3580 Mean : 3445.2 Mean : 2912 Mean : 1505.3 Mean : 654.6 Mean : 295.07 Mean : 144.11 Mean : 61.93 Mean : 41.02 Mean : 23.65 Mean : 16.89 Mean : 10.7 Mean : 8.45 Mean : 6.878 Mean : 5.451 Mean : 3.89 Mean : 3.586 Mean : 2.979 Mean : 2.562 Mean : 2.299 Mean : 2.247 Mean : 1.941 Mean : 1.806 Mean : 1.859 Mean : 1.661 Mean :1.562 Mean :1.346 Mean :1.512 Mean :1.351 Mean :1.784e+10
NA 3rd Qu.: 2282 3rd Qu.: 2325.0 3rd Qu.: 3472 3rd Qu.: 3662.5 3rd Qu.: 3072 3rd Qu.: 1566.5 3rd Qu.: 642.0 3rd Qu.: 252.50 3rd Qu.: 109.00 3rd Qu.: 47.25 3rd Qu.: 33.00 3rd Qu.: 21.25 3rd Qu.: 15.75 3rd Qu.: 12.0 3rd Qu.: 9.00 3rd Qu.: 9.000 3rd Qu.: 7.000 3rd Qu.: 5.00 3rd Qu.: 4.500 3rd Qu.: 3.000 3rd Qu.: 3.000 3rd Qu.: 2.000 3rd Qu.: 2.000 3rd Qu.: 2.000 3rd Qu.: 2.000 3rd Qu.: 2.000 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:1.000 3rd Qu.:2.000 3rd Qu.:1.000 3rd Qu.:1.857e+10
NA Max. :30474 Max. :53112.0 Max. :54910 Max. :39064.0 Max. :39458 Max. :20732.0 Max. :8929.0 Max. :3814.00 Max. :1867.00 Max. :895.00 Max. :620.00 Max. :330.00 Max. :228.00 Max. :156.0 Max. :106.00 Max. :66.000 Max. :55.000 Max. :28.00 Max. :23.000 Max. :28.000 Max. :22.000 Max. :14.000 Max. :14.000 Max. :16.000 Max. :17.000 Max. :12.000 Max. :12.000 Max. :7.000 Max. :4.000 Max. :7.000 Max. :4.000 Max. :1.870e+11

1.1.0.3 Gráficas:

df_2017_exp_subset <- comuna_corr
library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
grafica_fn <- function(g){
  fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
                 width=7000, height=400) 
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig 

2 \(\tau\) de Kendall

df_2017_2 <- df_2017_fig
df_2017_2f <- filter(df_2017_2, df_2017_2$ingresos_expandidos != 'is.na')
III <- seq(2,(ncol(df_2017_2))-1,1)
my_data <- df_2017_2f[, c(III)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla <- as.data.frame(tabla)
names(tabla)[1] <- "Correlación"
saveRDS(tabla,"tablas_de_corr/C_CANT_PER_URBANO.rds")
tabla %>% rownames_to_column("Cantidad de personas")%>%  
  mutate(Correlación = cell_spec(Correlación, background=ifelse(Correlación == max(Correlación), "#fc0303", "#5cb81f"))) %>% 
  kbl(booktabs = T, linesep = "", escape=FALSE) %>% 
    kable_paper(full_width = F) %>%
    column_spec(1, color = "black")%>%
    column_spec(2, color = "white")
Cantidad de personas Correlación
0_personas 0.676155535304055
1_personas 0.825510185492653
2_personas 0.842497721645101
3_personas 0.854587080373328
4_personas 0.860910826621912
5_personas 0.855434761828548
6_personas 0.848280369864547
7_personas 0.829933667772473
8_personas 0.798208725562652
9_personas 0.775212135670352
10_personas 0.744770054998035
11_personas 0.707285560170116
12_personas 0.678784845339468
13_personas 0.58064994431352
14_personas 0.586955626834241
15_personas 0.595642491723914
16_personas 0.54157982199293
17_personas 0.532138320636595
18_personas 0.476276819821296
19_personas 0.523236081686924
20_personas 0.535418514973453
21_personas 0.443740125208579
22_personas 0.417210731487864
23_personas 0.3517476083376
24_personas 0.39165740870945
25_personas 0.358493708912031
26_personas 0.365718552554913
27_personas 0.356077365712377
28_personas 0.313147819206157
29_personas 0.268855411283532
30_personas 0.331923881462259

2.1 Kendall

df_2017_2[df_2017_2 == -99] <- NA

2.1.1 de 1 a 15 personas

df_2017_fig <- df_2017_2[,-c(1,16:30)]
chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "kendall"), pch=20)

2.2 Pearson

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "pearson"), pch=20)

2.3 Spearman

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "spearman"), pch=20)

2.3.1 de 16 a 30 personas

df_2017_fig <- df_2017_2[,-c(1,2:15)]
chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "kendall"), pch=20)

2.4 Pearson

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "pearson"), pch=20)

2.5 Spearman

chart.Correlation(df_2017_fig, histogram=TRUE, method = c( "spearman"), pch=20)




3 Nivel nacional RURAL (código 2)

3.1 Pregunta CANT_PER: Cantidad de personas

Esta pregunta posee un rango de categorías de respuestade 0-9999:

Leemos las respuestas a la pregunta CANT_PER del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

tabla_con_clave <- readRDS("censos/censo_viviendas_con_clave_17.rds")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$CANT_PER
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

# Nos encontramos con una anomalía estadística. 
# Tenemos una vivienda cuya cantidad de personas es de  # 5912, lo que es absurdo. Vamos a fijar un punto de  #corte arbitrario que nos permita trabajar con #coherencia.
# A partir del número 30, las frecuencias tienden a 1.

d_t <- filter(d,d$unlist.c. == 0)
for(i in 1:30){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}

# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada código:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[94] <- "código" 

# Hacemos la unión con los ingresos promedio comunales expandidos:
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_rural_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)

quitar <- seq(4,(ncol(df_2017_2)-1),3)
comuna_corr <- df_2017_2[,-c(quitar),drop=FALSE]

quitar_2 <- seq(2,(ncol(comuna_corr)-1),2)
comuna_corr <- comuna_corr[,-c(quitar_2),drop=FALSE]

secuencia_777 <- seq(2,32,1)

for (i in secuencia_777){
  j <- paste(i-2,'personas',sep = "_")
  names(comuna_corr)[i] <- j
}

comuna_corr[comuna_corr == -99] <- NA
kbl(head(comuna_corr,50)) %>% kable_styling(bootstrap_options = c("striped", "hover")) %>% kable_paper() %>% scroll_box(width = "100%", height = "300px")
código 0_personas 1_personas 2_personas 3_personas 4_personas 5_personas 6_personas 7_personas 8_personas 9_personas 10_personas 11_personas 12_personas 13_personas 14_personas 15_personas 16_personas 17_personas 18_personas 19_personas 20_personas 21_personas 22_personas 23_personas 24_personas 25_personas 26_personas 27_personas 28_personas 29_personas 30_personas ingresos_expandidos
01101 691 247 179 116 107 64 33 21 15 3 3 2 1 2 NA 1 NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA 52180713221
01107 36 24 12 4 4 3 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
01401 4192 419 346 205 165 107 54 21 13 9 11 3 2 1 1 NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA 3822052676
01402 611 180 115 56 53 40 19 9 3 4 NA 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 283538750
01403 1553 165 131 66 38 28 20 11 2 3 2 3 2 2 NA 1 NA 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA
01404 1733 224 152 79 45 36 22 18 4 3 6 2 NA NA 2 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA 645917134
01405 322 80 92 60 47 28 11 5 6 1 NA 1 1 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2502464414
02101 370 98 71 42 42 22 18 11 4 5 3 2 2 NA 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
02102 432 49 33 23 13 8 6 3 4 NA NA NA NA NA 1 NA NA NA NA NA 1 NA 1 1 NA NA NA NA NA NA NA NA
02103 184 77 61 69 52 45 19 13 8 7 2 2 1 1 NA 3 NA NA NA NA 1 NA NA NA 1 NA NA NA 1 NA 1 3290056742
02104 362 106 79 49 29 20 7 5 3 2 4 NA 5 NA NA 2 1 1 1 NA NA 2 NA NA NA NA NA NA NA NA 3 3844002134
02201 3283 284 224 147 147 71 47 26 14 6 1 1 1 1 NA 1 2 NA NA 1 NA NA NA NA NA NA 1 NA NA NA NA 39457387800
02202 333 41 18 21 7 9 3 NA 1 1 NA 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 NA NA
02203 772 441 335 244 162 78 43 26 25 6 5 3 5 2 1 NA NA 1 1 1 1 2 NA NA 1 1 NA NA NA NA NA 2985112297
02301 1310 92 54 24 13 12 7 4 2 NA 4 2 NA NA NA NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 4183793832
02302 98 18 15 8 8 9 NA 3 1 NA 1 1 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
03101 958 231 206 196 167 83 51 17 5 4 2 2 NA NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA 38699138722
03102 7499 333 238 96 67 31 16 6 13 6 1 1 NA NA 1 NA 1 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA
03103 518 241 233 183 139 81 36 18 9 7 2 NA 1 1 NA NA NA 1 NA 1 1 NA NA 1 NA NA NA 1 NA 1 1 4034940816
03201 1483 121 100 82 57 31 12 8 6 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
03202 444 80 62 45 31 23 8 3 1 NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4545663075
03301 1250 466 426 363 320 170 95 46 21 13 8 5 NA 1 NA NA 1 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA 11299454698
03302 1150 512 422 338 241 123 60 32 20 9 7 1 3 1 NA 2 1 NA NA NA NA NA NA NA NA NA NA NA 1 NA NA 1039186477
03303 875 256 205 157 132 55 33 24 8 5 NA 2 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1425547554
03304 1956 181 137 69 56 26 20 12 NA 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2089066548
04101 2893 961 1358 1203 1041 653 270 156 62 28 18 10 4 2 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 44274327972
04102 3347 706 948 851 736 436 207 106 51 16 12 8 6 3 1 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA 46918711304
04103 288 127 119 68 48 29 14 2 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2397612293
04104 1020 336 273 182 122 86 42 21 13 2 3 NA NA NA 1 NA 1 NA NA NA NA 1 NA NA NA NA NA NA NA NA NA 982530309
04105 749 390 459 313 248 121 47 23 10 4 6 2 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 786383423
04106 1187 687 820 667 573 327 156 66 47 17 14 5 3 3 1 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4695441470
04201 1041 739 872 763 524 253 124 61 26 12 7 2 1 1 NA NA 1 NA NA 1 NA NA NA NA 1 NA NA NA NA NA NA 5109649759
04202 1571 743 744 535 379 146 86 31 19 6 3 2 2 1 NA NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 1558270441
04203 1279 334 356 316 244 107 41 21 13 4 1 3 4 NA 1 1 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA 3704185607
04204 932 798 931 827 591 300 151 56 32 17 7 1 NA 3 NA 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA 5681637894
04301 3208 1697 1903 1660 1350 667 319 147 85 38 13 11 7 2 3 1 1 NA NA NA NA 2 NA NA NA NA NA 1 NA NA NA 25683781418
04302 1547 865 763 528 329 176 74 34 10 6 6 1 2 1 NA NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA 2300832587
04303 2112 1357 1362 1111 861 412 178 73 39 20 11 8 3 2 1 NA NA NA NA NA NA 1 NA NA NA 1 NA NA NA NA NA 5835357638
04304 537 482 463 371 278 146 54 25 9 10 5 2 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1817183694
04305 1064 543 480 281 209 111 41 16 11 2 2 1 NA 1 NA NA 1 1 NA NA NA NA NA NA NA NA NA NA NA NA NA 778712384
05101 945 81 92 42 28 22 10 3 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 NA NA NA 74756602991
05102 2384 567 733 673 542 262 103 42 22 13 2 3 1 1 NA NA NA NA NA NA 1 NA NA NA NA NA NA NA NA NA NA 6779018483
05103 281 133 159 177 147 102 33 17 2 6 3 NA NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05104 87 96 102 72 58 20 4 4 1 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05105 950 238 253 190 159 80 27 16 4 1 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 4295363979
05107 875 266 388 361 317 169 63 28 10 4 5 1 NA 1 NA NA NA NA 1 1 NA NA NA NA NA NA NA NA NA NA NA 9102071069
05201 157 28 37 34 21 14 6 2 NA NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
05301 285 202 310 266 215 143 59 22 8 6 2 2 2 NA NA 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA 1 NA 18714795984
05302 242 207 342 272 255 141 55 33 9 1 3 1 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3471349123
05303 162 120 163 121 132 84 31 13 1 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2512319225

3.1.0.1 Tabla a correlacionar:

#union_final_urb_corr  <- union_final_urb[,-c(1)]
write_xlsx(comuna_corr, "CANT_PER_rural.xlsx")

3.1.0.2 Estadísticos básicos de nuestras frecuencias

data_sum <- summary(comuna_corr)

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
código 0_personas 1_personas 2_personas 3_personas 4_personas 5_personas 6_personas 7_personas 8_personas 9_personas 10_personas 11_personas 12_personas 13_personas 14_personas 15_personas 16_personas 17_personas 18_personas 19_personas 20_personas 21_personas 22_personas 23_personas 24_personas 25_personas 26_personas 27_personas 28_personas 29_personas 30_personas ingresos_expandidos
Length:319 Min. : 1.0 Min. : 2.0 Min. : 1.0 Min. : 1.0 Min. : 2.0 Min. : 1.0 Min. : 1.00 Min. : 1.00 Min. : 1.00 Min. : 1.000 Min. : 1.000 Min. : 1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.00 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1 Min. :1.000 Min. :1 Min. :1.000 Min. :1 Min. :1 Min. :1 Min. :1.000 Min. :2.792e+08
Class :character 1st Qu.: 331.5 1st Qu.: 187.2 1st Qu.: 225.2 1st Qu.: 182.0 1st Qu.: 137.0 1st Qu.: 69.0 1st Qu.: 30.00 1st Qu.: 13.00 1st Qu.: 6.00 1st Qu.: 2.000 1st Qu.: 2.000 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.00 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1 1st Qu.:1.000 1st Qu.:1 1st Qu.:1.000 1st Qu.:1 1st Qu.:1 1st Qu.:1 1st Qu.:1.000 1st Qu.:1.809e+09
Mode :character Median : 594.0 Median : 346.5 Median : 436.5 Median : 370.5 Median : 297.0 Median : 145.0 Median : 61.00 Median : 26.00 Median : 12.00 Median : 5.000 Median : 3.000 Median : 2.000 Median :1.000 Median :1.000 Median :1.000 Median :1.000 Median :1.00 Median :1.000 Median :1.000 Median :1.000 Median :1.000 Median :1.000 Median :1.000 Median :1 Median :1.000 Median :1 Median :1.000 Median :1 Median :1 Median :1 Median :1.000 Median :3.546e+09
NA Mean : 846.8 Mean : 418.3 Mean : 544.3 Mean : 483.0 Mean : 388.1 Mean : 198.3 Mean : 86.59 Mean : 37.61 Mean : 17.43 Mean : 6.894 Mean : 4.421 Mean : 2.545 Mean :1.913 Mean :1.491 Mean :1.464 Mean :1.291 Mean :1.25 Mean :1.175 Mean :1.182 Mean :1.158 Mean :1.062 Mean :1.154 Mean :1.062 Mean :1 Mean :1.176 Mean :1 Mean :1.111 Mean :1 Mean :1 Mean :1 Mean :1.429 Mean :8.206e+09
NA 3rd Qu.:1049.5 3rd Qu.: 573.8 3rd Qu.: 755.2 3rd Qu.: 671.5 3rd Qu.: 524.0 3rd Qu.: 255.0 3rd Qu.:107.50 3rd Qu.: 48.00 3rd Qu.: 22.00 3rd Qu.: 8.750 3rd Qu.: 5.000 3rd Qu.: 3.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:1.000 3rd Qu.:1.00 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1 3rd Qu.:1.000 3rd Qu.:1 3rd Qu.:1.000 3rd Qu.:1 3rd Qu.:1 3rd Qu.:1 3rd Qu.:1.500 3rd Qu.:7.252e+09
NA Max. :7499.0 Max. :2490.0 Max. :3944.0 Max. :3759.0 Max. :3239.0 Max. :1709.0 Max. :754.00 Max. :312.00 Max. :148.00 Max. :51.000 Max. :27.000 Max. :12.000 Max. :7.000 Max. :6.000 Max. :7.000 Max. :5.000 Max. :3.00 Max. :3.000 Max. :4.000 Max. :2.000 Max. :2.000 Max. :2.000 Max. :2.000 Max. :1 Max. :3.000 Max. :1 Max. :2.000 Max. :1 Max. :1 Max. :1 Max. :3.000 Max. :7.585e+10

3.1.0.3 Gráficas:

df_2017_exp_subset <- comuna_corr
library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
grafica_fn <- function(g){
  fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
                 width=7000, height=400) 
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig 

4 \(\tau\) de Kendall

df_2017_2 <- df_2017_fig
df_2017_2f <- filter(df_2017_2, df_2017_2$ingresos_expandidos != 'is.na')
df_2017_2f[df_2017_2f == -99] <- NA

### este dataframe se utilizara para el despliegue de los graficos:
df_2017_2fff <- df_2017_2f[,-c(1,24:32)]
III <- seq(2,(ncol(df_2017_2))-10,1)
my_data <- df_2017_2f[, c(III)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla <- as.data.frame(tabla)
names(tabla)[1] <- "Correlación"
saveRDS(tabla,"tablas_de_corr/C_CANT_PER_RURAL.rds")
tabla %>% rownames_to_column("Cantidad de personas")%>%  
  mutate(Correlación = cell_spec(Correlación, background=ifelse(Correlación == max(Correlación), "#fc0303", "#5cb81f"))) %>% 
  kbl(booktabs = T, linesep = "", escape=FALSE) %>% 
    kable_paper(full_width = F) %>%
    column_spec(1, color = "black")%>%
    column_spec(2, color = "white")
Cantidad de personas Correlación
0_personas 0.170800502711448
1_personas 0.229165053975841
2_personas 0.280939468744448
3_personas 0.317132692414128
4_personas 0.362881472744249
5_personas 0.383159679328186
6_personas 0.382004199652978
7_personas 0.378517878226572
8_personas 0.356476817554122
9_personas 0.324889356724139
10_personas 0.295971857165435
11_personas 0.302940857568375
12_personas 0.253535039489337
13_personas 0.201579921072238
14_personas 0.275063721986974
15_personas -0.0361089306859598
16_personas 0.105240213129363
17_personas -0.0418753739951559
18_personas -0.0644764952748886
19_personas 0.10432810619146
20_personas 0.146550668371643
21_personas -0.0865394616767029

4.1 Kendall

4.1.1 de 1 a 12 personas

df_2017_2ffff <- df_2017_2fff[,-c(14:22)]
chart.Correlation(df_2017_2ffff, histogram=TRUE, method = c( "kendall"), pch=20)

4.2 Pearson

chart.Correlation(df_2017_2ffff, histogram=TRUE, method = c( "pearson"), pch=20)

4.3 Spearman

chart.Correlation(df_2017_2ffff, histogram=TRUE, method = c( "spearman"), pch=20)