1 Nivel nacional URBANO (código 1)
1.1 Pregunta TIPO_HOGAR:
Esta pregunta posee 7 categorias de respuesta:
1 Hogar unipersonal
2 Hogar nuclear monoparental
3 Hogar nuclear biparental sin hijos
4 Hogar nuclear biparental con hijos
5 Hogar compuesto
6 Hogar extenso
7 Hogar sin núcleo
Leemos las respuestas a la pregunta TIPO_HOGAR del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:
tabla_con_clave <- readRDS("censos/censo_hogares_con_clave_17")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$TIPO_HOGAR
cross_tab = xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
# apilamos:
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:7){
d_i <- filter(d,d$unlist.c. == i)
d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[ncol(comuna_corr)] <- "código"
quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
names(comuna_corr )[2] <- "Hogar unipersonal"
names(comuna_corr )[4] <- "Hogar nuclear monoparental"
names(comuna_corr )[6] <- "Hogar nuclear biparental sin hijos "
names(comuna_corr )[8] <- "Hogar nuclear biparental con hijos"
names(comuna_corr )[10] <- "Hogar compuesto"
names(comuna_corr )[12] <- "Hogar extenso"
names(comuna_corr )[14] <- "Hogar sin núcleo"
quitar <- seq(1,(ncol(comuna_corr)-1),2)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
df_2017_2 <- df_2017_2[,-c(9)]
df_2017_3 <- df_2017_2
1.1.0.1 Tabla a correlacionar:
1.1.0.2 Estadísticos básicos de nuestras frecuencias
data_sum <- summary(comuna_corr)
kbl(head(data_sum)) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "500px")
código | Hogar unipersonal | Hogar nuclear monoparental | Hogar nuclear biparental sin hijos | Hogar nuclear biparental con hijos | Hogar compuesto | Hogar extenso | Hogar sin núcleo | ingresos_expandidos | |
---|---|---|---|---|---|---|---|---|---|
Length:319 | Min. : 70.0 | Min. : 31.0 | Min. : 19 | Min. : 56 | Min. : 6.0 | Min. : 30 | Min. : 18.0 | Min. :7.054e+08 | |
Class :character | 1st Qu.: 322.5 | 1st Qu.: 245.5 | 1st Qu.: 231 | 1st Qu.: 524 | 1st Qu.: 38.5 | 1st Qu.: 327 | 1st Qu.: 99.0 | 1st Qu.:2.954e+09 | |
Mode :character | Median : 837.0 | Median : 615.0 | Median : 545 | Median : 1236 | Median : 101.0 | Median : 842 | Median : 258.0 | Median :5.697e+09 | |
NA | Mean : 2719.3 | Mean : 2039.2 | Mean : 1903 | Mean : 4445 | Mean : 398.7 | Mean : 2980 | Mean : 1038.8 | Mean :1.784e+10 | |
NA | 3rd Qu.: 2502.5 | 3rd Qu.: 2197.0 | 3rd Qu.: 1821 | 3rd Qu.: 4748 | 3rd Qu.: 379.0 | 3rd Qu.: 3098 | 3rd Qu.: 858.5 | 3rd Qu.:1.857e+10 | |
NA | Max. :61429.0 | Max. :21508.0 | Max. :32189 | Max. :60836 | Max. :4865.0 | Max. :37967 | Max. :22623.0 | Max. :1.870e+11 |
1.1.0.3 Gráficas:
library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
width=7000, height=400)
grafica_fn <- function(g){
fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
width=7000, height=400)
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig
2 \(\tau\) de Kendall
df_2017_2 <- df_2017_3
df_2017_2f <- filter(df_2017_2, df_2017_2$ingresos_expandidos != 'is.na')
III <- seq(2,(ncol(df_2017_2))-1,1)
my_data <- df_2017_2f[, c(III)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla <- as.data.frame(tabla)
tabla %>% rownames_to_column("Hogares")%>%
mutate(V1 = cell_spec(V1, background=ifelse(V1 == max(V1), "#fc0303", "#5cb81f"))) %>%
kbl(booktabs = T, linesep = "", escape=FALSE) %>%
kable_paper(full_width = F) %>%
column_spec(1, color = "black")%>%
column_spec(2, color = "white")
Hogares | V1 |
---|---|
Hogar unipersonal | 0.831065787830482 |
Hogar nuclear monoparental | 0.846679987244619 |
Hogar nuclear biparental sin hijos | 0.835240831084656 |
Hogar nuclear biparental con hijos | 0.857360622755979 |
Hogar compuesto | 0.843828832944469 |
Hogar extenso | 0.84671610909709 |
Hogar sin núcleo | 0.833911631261774 |
2.1 Kendall
3 Nivel nacional RURAL (código 2)
3.1 Pregunta TIPO_HOGAR:
Esta pregunta posee 7 categorias de respuesta:
1 Hogar unipersonal
2 Hogar nuclear monoparental
3 Hogar nuclear biparental sin hijos
4 Hogar nuclear biparental con hijos
5 Hogar compuesto
6 Hogar extenso
7 Hogar sin núcleo
Leemos las respuestas a la pregunta TIPO_HOGAR del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:
tabla_con_clave <- readRDS("censos/censo_hogares_con_clave_17")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$TIPO_HOGAR
cross_tab = xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
# apilamos:
d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:7){
d_i <- filter(d,d$unlist.c. == i)
d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[ncol(comuna_corr)] <- "código"
quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
names(comuna_corr )[2] <- "Hogar unipersonal"
names(comuna_corr )[4] <- "Hogar nuclear monoparental"
names(comuna_corr )[6] <- "Hogar nuclear biparental sin hijos "
names(comuna_corr )[8] <- "Hogar nuclear biparental con hijos"
names(comuna_corr )[10] <- "Hogar compuesto"
names(comuna_corr )[12] <- "Hogar extenso"
names(comuna_corr )[14] <- "Hogar sin núcleo"
quitar <- seq(1,(ncol(comuna_corr)-1),2)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_rural_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
df_2017_2 <- df_2017_2[,-c(9)]
df_2017_3 <- df_2017_2
3.1.0.1 Tabla a correlacionar:
3.1.0.2 Estadísticos básicos de nuestras frecuencias
data_sum <- summary(comuna_corr)
kbl(head(data_sum)) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "500px")
código | Hogar unipersonal | Hogar nuclear monoparental | Hogar nuclear biparental sin hijos | Hogar nuclear biparental con hijos | Hogar compuesto | Hogar extenso | Hogar sin núcleo | ingresos_expandidos | |
---|---|---|---|---|---|---|---|---|---|
Length:318 | Min. : 2.0 | Min. : 1.0 | Min. : 1.0 | Min. : 5.0 | Min. : 1.00 | Min. : 1.0 | Min. : 2.0 | Min. :2.792e+08 | |
Class :character | 1st Qu.: 194.8 | 1st Qu.: 90.0 | 1st Qu.: 140.0 | 1st Qu.: 224.8 | 1st Qu.: 21.00 | 1st Qu.: 136.8 | 1st Qu.: 55.0 | 1st Qu.:1.809e+09 | |
Mode :character | Median : 358.0 | Median : 161.0 | Median : 272.0 | Median : 491.0 | Median : 39.00 | Median : 298.0 | Median :102.0 | Median :3.546e+09 | |
NA | Mean : 429.9 | Mean : 212.7 | Mean : 344.5 | Mean : 655.3 | Mean : 49.66 | Mean : 387.3 | Mean :126.8 | Mean :8.206e+09 | |
NA | 3rd Qu.: 588.8 | 3rd Qu.: 285.5 | 3rd Qu.: 472.0 | 3rd Qu.: 847.0 | 3rd Qu.: 63.00 | 3rd Qu.: 509.2 | 3rd Qu.:172.5 | 3rd Qu.:7.252e+09 | |
NA | Max. :2561.0 | Max. :1565.0 | Max. :2599.0 | Max. :5573.0 | Max. :374.00 | Max. :2997.0 | Max. :736.0 | Max. :7.585e+10 |
3.1.0.3 Gráficas:
library(plotly)
df_2017_fig <- df_2017_exp_subset
df_2017_fig <- mutate_all(df_2017_fig, ~replace(., is.na(.), -99))
fig <- plot_ly(df_2017_fig, x = df_2017_fig$código, y = df_2017_fig[,2]
, name = colnames(df_2017_fig[2]), type = 'scatter', mode = 'lines',
width=7000, height=400)
grafica_fn <- function(g){
fig <<- fig %>% add_trace(y = ~df_2017_fig[,g]
, name = colnames(df_2017_fig[g]), mode = 'lines',
width=7000, height=400)
}
for (g in 3:(ncol(df_2017_fig))) {
grafica_fn(g)
}
fig <- fig %>% layout(autosize = T)
fig
4 \(\tau\) de Kendall
df_2017_2 <- df_2017_3
df_2017_2f <- filter(df_2017_2, df_2017_2$ingresos_expandidos != 'is.na')
III <- seq(2,(ncol(df_2017_2))-1,1)
my_data <- df_2017_2f[, c(III)]
tabla <- cor(x=my_data, y=df_2017_2f$ingresos_expandidos, method=c("kendall"), use = "pairwise")
tabla <- as.data.frame(tabla)
tabla %>% rownames_to_column("Hogares")%>%
mutate(V1 = cell_spec(V1, background=ifelse(V1 == max(V1), "#fc0303", "#5cb81f"))) %>%
kbl(booktabs = T, linesep = "", escape=FALSE) %>%
kable_paper(full_width = F) %>%
column_spec(1, color = "black")%>%
column_spec(2, color = "white")
Hogares | V1 |
---|---|
Hogar unipersonal | 0.236416863959986 |
Hogar nuclear monoparental | 0.26923953892542 |
Hogar nuclear biparental sin hijos | 0.301239166580422 |
Hogar nuclear biparental con hijos | 0.366435594228793 |
Hogar compuesto | 0.398431125789511 |
Hogar extenso | 0.338373987890383 |
Hogar sin núcleo | 0.249033536316092 |