Ingresos, educación y pobreza en la Casen
Estudio sobre la movilidad intergeneracional
Abstract
Construiremos tablas de contingencia relacionando los promedios de los cuatro ingresos fundamentales de la Casen con el nivel educativo alcanzado y su tipo, tanto para las personas como para sus padres. Analizaremos en torno a boxplots éstas distribuciones cruzando con nuestras categorías clásicas de comuna, sexo y alfabetismo, en forma separada para etnia e inmigración. Sobre los datos generados en tablas de contingencia entre el periodo 2006-2017, evaluaremos la posibilidad de implementar el índice de movilidad intergeneracional de los ingresos propuesto por Shorrocks (1978).
La movilidad intergeneracional se refiere a la relación que existe entre el nivel socioeconómico de padres e hijos, medido generalmente a través de su educación o de sus ingresos. Éste estudio, complementa las investigaciones sobre la desigualdad del ingreso que analiza la distribución desde un punto de vista estático. Por otra parte, comprender el grado de movilidad generacional es un primer paso para entender las consecuencias de la desigualdad de los ingresos.
Se ha afirmado que si existe suficiente movilidad del ingreso no es necesario preocuparse de cuán desigualmente estén distribuidos.
La idea es medir la correlación entre el estatus socioeconómico del padre, su nivel educativo, su tipo de ocupación y el nivel de ingresos con el de sus hijos y así determinar en algún grado la movilidad social.
El lento crecimiento de la educación promedio de la poblacion más pobre durante largos periodos permite esperar una escasa movilidad intergeneracional. En Chile, en las últimas décadas, el importante aumento de la matrícula universitaria en todas la clases sociales hace preveer una tendencia en contra.
Los resultados de los estudios cuantitativos sobre la transmisión intergeneracional se presentan en la tabla de movilidad, también llamadas matrices de transición.
Para interpretar el gran conjunto de datos que facilitan tales tablas se definen los términos técnicos utilizados.
El primero es el grado de movilidad ascendente o descendente. Los términos ascendente y "descendente’ implican un ordenamiento de las categorías a lo largo de algun eje delimitado cuantitativamente (años de escolaridad) o cualitativamente (niveles de educación). Cuando los estados o posiciones sociales se definen en función de los niveles de educación es más fácil establecer un ordenamiento que cuando se usan otras variables como el tipo de ocupación.
El Indice de movilidad adoptado es el que propone Shorrocks (1978):
\[ 1 - M = \frac{G(\bar{z})}{\sum_{i=1}^{K} \frac{G({z_t})}{K}} \]
donde:
\(G(.)\) puede ser el coeficiente de Gini o la varianza del log de los ingresos.
\(z_t\) es el vector de los ingresos en el periodo t y
\(\bar{z}\) el vector de los ingresos a largo plazo (el promedio entre los K periodos).
Ya tenemos el nombre de las variables fundamentales del ingreso por año en la Casen:
año | ||||
---|---|---|---|---|
2017 | ytotcor | yautcor | ytrabajocor | yoprcor |
2015 | ytotcor | yautcor | ytrabajocor | yoprcor |
2013 | ytotcor | yautcor | ytrabajocor | yoprcor |
2011 | ytotaj | yautaj | ytrabaj | yopraj |
2009 | ytotaj | yautaj | ytrabaj | yopraj |
2006 | ytotaj | yautaj | ytrabaj | yopraj |
Para la generación de las tablas de contingencia integraremos al código R cuatro nuevas variables referidas a las siguientes preguntas de la Casen 2017:
e6a: ¿Cuál fue el nivel educacional más alto alcanzado o el nivel educacional actual?
e6b: En ese nivel educacional, ¿cual fue el último curso que aprobó?
r12b: Nivel de educación más alto alcanzado por su padre
r13b: En ese nivel educacional, ¿cual fue el último curso que aprobó su padre?
Buscar el nombre ad-hoc de las variales en las Casen anteriores al 2017, en la aplicación shinyCasen y construir 8 tablas, 4 relacionadas a las etnias y cuatro a la población inmigrante relativas a las cuatro variables del ingreso fundamentales en la Casen.
Se deben construir boxplots que relacionen ingresos y nivel educacional, haciendo cruces con las diferentes categorías y vinculando la educación de los padres con la de los hijos.
Construir gráficos de análisis de componentes principales entre el decil del ingreso autónomo, los años y el tipo de educación de las personas en relación a la de los padres.
La generación de tablas es fácil, por favor, contactarse con nosotros para las instrucciones para construir boxplot y análisis de componentes principales.
# dataset <- readRDS(file = "casen_2017_c.rds")
ab_2017 <- readRDS(file = "casen_2017_c.rds")
## Excluimos los outliers:
ab_2017 <- ab_2017[!is.na(ab_2017$ytotcor),]
Q <- quantile(ab_2017$ytotcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$ytotcor)
eliminated <- subset(ab_2017, ab_2017$ytotcor > (Q[1] - 1.5*iqr) & ab_2017$ytotcor < (Q[2]+1.5*iqr))
## Generamos los promedios grupales
a <- eliminated$ytotcor
b <- eliminated$comuna
c <- eliminated$e1 # alfabetismo
d <- eliminated$r3 # etnia
e <- eliminated$sexo
f <- eliminated$e6a # nivel alcanzado
g <- eliminated$e6b # anos de estudio
h <- eliminated$r12b # nivel alcanzado por el padre
i <- eliminated$r13b # anos de estudio del padre
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f,g,h,i), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f,g,h,i), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f,g,h,i), FUN = gini , na.rm = TRUE)
# Calculamos la desviación standard y el Gini:
promedios_grupales$sd <- promedios_grupales_sd$sd.a
promedios_grupales$gini <- promedios_grupales_gini$gini.a
# Revisión de la tabla:
# head(promedios_grupales,5)
names(promedios_grupales)[1] <- "Comuna"
names(promedios_grupales)[2] <- "Alfabetismo"
names(promedios_grupales)[3] <- "Etnia"
names(promedios_grupales)[4] <- "Sexo"
names(promedios_grupales)[5] <- "Nivel alcanzado"
names(promedios_grupales)[6] <- "Años de estudio"
names(promedios_grupales)[7] <- "Nivel alcanzado por el padre"
names(promedios_grupales)[8] <- "Años de estudio del padre"
names(promedios_grupales)[9] <- "Promedio del ingreso"
names(promedios_grupales)[10] <- "ds del ingreso"
names(promedios_grupales)[11] <- "Gini del ingreso"
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2017 = merge( x = promedios_grupales, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
# head(df_2017,5)
head(promedios_grupales,5)
## Comuna Alfabetismo Etnia Sexo
## 1 Vallenar Sí, lee y escribe No pertenece a ningún pueblo indígena Mujer
## 2 San Bernardo Sí, lee y escribe No pertenece a ningún pueblo indígena Mujer
## 3 Puente Alto Sí, lee y escribe No pertenece a ningún pueblo indígena Hombre
## 4 Curicó Sí, lee y escribe No pertenece a ningún pueblo indígena Hombre
## 5 Temuco Sí, lee y escribe No pertenece a ningún pueblo indígena Mujer
## Nivel alcanzado Años de estudio
## 1 Educación Media Científico-Humanista 1
## 2 Educación Media Científico-Humanista 4
## 3 Primaria o Preparatoria (Sistema antiguo) 6
## 4 Técnico Nivel Superior Incompleto (Carreras 1 a 3 años) 1
## 5 Postgrado Completo 6
## Nivel alcanzado por el padre Años de estudio del padre
## 1 Primaria o Preparatoria (S. Antiguo) 0
## 2 Primaria o Preparatoria (S. Antiguo) 0
## 3 Primaria o Preparatoria (S. Antiguo) 0
## 4 Educación Básica 0
## 5 Educación Básica 0
## Promedio del ingreso ds del ingreso Gini del ingreso
## 1 133000 NA 0
## 2 306806 NA 0
## 3 148000 NA 0
## 4 746429 NA 0
## 5 890417 NA 0
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso total.
Pregunta: e6a, e6b, r12b, r13b
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso autónomo.
Pregunta: e6a, e6b, r12b, r13b
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso del trabajo.
Pregunta: e6a, e6b, r12b, r13b
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso de la ocupación principal.
Pregunta: e6a, e6b, r12b, r13b
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso total.
Pregunta: e6a, e6b, r12b, r13b
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso autónomo.
Pregunta: e6a, e6b, r12b, r13b
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso del trabajo.
Pregunta: e6a, e6b, r12b, r13b
Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso de la ocupación principal.
Pregunta: e6a, e6b, r12b, r13b