Abstract
Calculamos correlaciones entre el ingreso promedio comunal multiplicado por la población comunal que llamaremos ingresos expandidos extraÃdo de la Casen 2017 y las frecuencias de categorÃas de respuesta para todas las variables del Censo de viviendas, hogares y personas al 2017, también extraÃdas a nivel comunal.
Haremos las correlaciones tanto a nivel Urbano como rural.
Importante es aplicar la libreria dplyr para evitar que en los filtros se desplieguen series de tiempo.
Area: urbano = 1 rural = 2
1 Hombre
2 Mujer
tabla_con_clave <- readRDS("../censo_personas_con_clave_17")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$P08
cross_tab = xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
d_t <- filter(d,d$unlist.c. == 1)
d_i <- filter(d,d$unlist.c. == 2)
d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
# Agregamos un cero a los códigos comunales de 4 dÃgitos, que queda en la columna llamada código:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[7] <- "código"
# Hacemos la unión con los ingresos promedio comunales expandidos:
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
names(df_2017_2)[3] <- "hombre"
names(df_2017_2)[6] <- "mujer"
Pearson
my_data <- df_2017_2[, c(3,6,12)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)
Spearman
my_data <- df_2017_2[, c(3,6,12)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)
Kendall
my_data <- df_2017_2[, c(3,6,12)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)
Area: urbano = 1 rural = 2
1 Hombre
2 Mujer
tabla_con_clave <- readRDS("../censo_personas_con_clave_17")
tabla_con_clave <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave$COMUNA
c <- tabla_con_clave$P08
cross_tab = xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
d_t <- filter(d,d$unlist.c. == 1)
d_i <- filter(d,d$unlist.c. == 2)
d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
# Agregamos un cero a los códigos comunales de 4 dÃgitos, que queda en la columna llamada código:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[7] <- "código"
# Hacemos la unión con los ingresos promedio comunales expandidos:
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_rural_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
names(df_2017_2)[3] <- "hombre"
names(df_2017_2)[6] <- "mujer"
Pearson
my_data <- df_2017_2[, c(3,6,12)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)
Spearman
my_data <- df_2017_2[, c(3,6,12)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)
Kendall
my_data <- df_2017_2[, c(3,6,12)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)