Area: urbano = 1 rural = 2

URBANO

1 Construcción de tablas con frecuencias de respuesta por categoría desde el Censo: Viviendas

1.1 Pregunta P01: Tipo de vivienda

Ɖsta pregunta posee 10 categorƭas de respuesta:

1 Casa
2 Departamento en edificio
3 Vivienda tradicional indĆ­gena (ruka, pae pae u otras)
4 Pieza en casa antigua o en conventillo
5 Mediagua, mejora, rancho o choza
6 Móvil (carpa, casa rodante o similar)
7 Otro tipo de vivienda particular
8 Vivienda colectiva
9 Operativo personas en trƔnsito (no es vivienda)
10 Operativo calle (no es vivienda)

1.2 CƔlculo de correlaciones a nivel nacional

Leemos las respuestas a la pregunta P01 del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categorĆ­a de respuesta:

tabla_con_clave <- readRDS("../censo_viviendas_con_clave_17.rds")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$P01
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:10){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
names(comuna_corr)[31] <- "código"
#Hacemos la unión con los ingresos promedio comunales expandidos:
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)

# Renombre de columnas
names(df_2017_2)[3] <- "Casa"
names(df_2017_2)[6] <- "Departamento"
names(df_2017_2)[9] <- "Vivienda_tradicional_ind "
names(df_2017_2)[12] <- "Pieza"
names(df_2017_2)[15] <- "Mediagua"
names(df_2017_2)[18] <- "Móvil"
names(df_2017_2)[21] <- "Otro_tipo"
names(df_2017_2)[24] <- "Vivienda_colectiva"
names(df_2017_2)[27] <- "Operativo_personas"
names(df_2017_2)[30] <- "Operativo_calle "

1.2 Correlaciones

1.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida mĆ”s utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente ā€œcoeficiente de correlaciónā€. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mĆ­nimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

III <- seq(3,ncol(df_2017_2),3)
my_data <- df_2017_2[, c(III)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

1.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. AdemÔs, su uso no solo estÔ restringido a datos continuos, sino que también puede usarse en anÔlisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,ncol(df_2017_2),3)
my_data <- df_2017_2[, c(III)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

1.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización mÔs fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,ncol(df_2017_2),3)
my_data <- df_2017_2[, c(III)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)



RURAL

2 CƔlculo de correlaciones a nivel nacional rural

tabla_con_clave <- readRDS("../censo_viviendas_con_clave_17.rds")

tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)


b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$P01
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:10){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}

# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE]
names(comuna_corr)[31] <- "código" 
# Hacemos la unión con los ingresos promedio comunales expandidos:
ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_rural_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)
# Renombre de columnas
names(df_2017_2)[3] <- "Casa"
names(df_2017_2)[6] <- "Departamento"
names(df_2017_2)[9] <- "Vivienda_tradicional_ind "
names(df_2017_2)[12] <- "Pieza"
names(df_2017_2)[15] <- "Mediagua"
names(df_2017_2)[18] <- "Móvil"
names(df_2017_2)[21] <- "Otro_tipo"
names(df_2017_2)[24] <- "Vivienda_colectiva"
names(df_2017_2)[27] <- "Operativo_personas"
names(df_2017_2)[30] <- "Operativo_calle"
# Correlaciones

2.2 Correlaciones

2.2.1Pearson

El coeficiente de correlación de Pearson es probablemente la medida mĆ”s utilizada para las relaciones lineales entre dos variables distribuidas normales y, por lo tanto, a menudo se denomina simplemente ā€œcoeficiente de correlaciónā€. Por lo general, el coeficiente de Pearson se obtiene mediante un ajuste de mĆ­nimos cuadrados y un valor de 1 representa una relación positiva perfecta, -1 una relación negativa perfecta y 0 indica la ausencia de una relación entre las variables.

\[ \rho = \frac{\text{cov}(X,Y)}{\sigma_x \sigma_y} codigos <- d_t \] \[ r = \frac{{}\sum_{i=1}^{n} (x_i - \overline{x})(y_i - \overline{y})} {\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2(y_i - \overline{y})^2}} \]

III <- seq(3,ncol(df_2017_2),3)
my_data <- df_2017_2[, c(3,6,9,12,15,18,21,24,37)]
chart.Correlation(my_data, histogram=TRUE, method = c( "pearson"), pch=20)

2.2.2 Spearman

Relacionado con el coeficiente de correlación de Pearson, el coeficiente de correlación de Spearman (rho) mide la relación entre dos variables. La rho de Spearman puede entenderse como una versión basada en rangos del coeficiente de correlación de Pearson, que se puede utilizar para variables que no tienen una distribución normal y tienen una relación no lineal. AdemÔs, su uso no solo estÔ restringido a datos continuos, sino que también puede usarse en anÔlisis de atributos ordinales.

\[ \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}} \]

III <- seq(3,ncol(df_2017_2),3)
my_data <- df_2017_2[, c(3,6,9,12,15,18,21,24,37)]
chart.Correlation(my_data, histogram=TRUE, method = c( "spearman"), pch=20)

2.2.3 Kendall

Similar al coeficiente de correlación de Pearson, la tau de Kendall mide el grado de una relación monótona entre variables y, como la rho de Spearman, calcula la dependencia entre variables clasificadas, lo que hace que sea factible para datos distribuidos no normales. Kendall tau se puede calcular tanto para datos continuos como ordinales. En términos generales, la tau de Kendall se distingue de la rho de Spearman por una penalización mÔs fuerte de las dislocaciones no secuenciales (en el contexto de las variables clasificadas).

\[ \tau = \frac{c-d}{c+d} = \frac{S}{ \left( \begin{matrix} n \\ 2 \end{matrix} \right)} = \frac{2S}{n(n-1)} \]

\[\tau = \frac{S}{\sqrt{n(n-1)/2-T}\sqrt{n(n-1)/2-U}} \\ \\ T = \sum_t t(t-1)/2 \\ \\ U = \sum_u u(u-1)/2 \\\]

III <- seq(3,ncol(df_2017_2),3)
my_data <- df_2017_2[, c(3,6,9,12,15,18,21,24,37)]
chart.Correlation(my_data, histogram=TRUE, method = c( "kendall"), pch=20)

2.1 No se pueden establecer operaciones con Operativo calle y Operativo personas pues no tienen valores suficientes para que el algoritmo de correlación funcione.

abc <- cbind(data.frame(df_2017_2$Operativo_personas),data.frame(df_2017_2$Operativo_calle))
kbl(abc) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
df_2017_2.Operativo_personas df_2017_2.Operativo_calle
NA NA
NA NA
NA NA
NA NA
1 NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
1 NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
1 NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA
NA NA