Ingresos, educación y pobreza en la Casen

Estudio sobre la movilidad intergeneracional

VE-MS-CC

DataIntelligence

22-02-2021

Abstract

Construiremos tablas de contingencia relacionando los promedios de los cuatro ingresos fundamentales de la Casen con el nivel educativo alcanzado y su tipo, tanto para las personas como para sus padres. Analizaremos en torno a boxplots éstas distribuciones cruzando con nuestras categorías clásicas de comuna, sexo y alfabetismo, en forma separada para etnia e inmigración. Sobre los datos generados en tablas de contingencia entre el periodo 2006-2017, evaluaremos la posibilidad de implementar el índice de movilidad intergeneracional de los ingresos propuesto por Shorrocks (1978).

Índice

Generación de tablas de contingencia

Movilidad social, educación e ingresos

La movilidad intergeneracional se refiere a la relación que existe entre el nivel socioeconómico de padres e hijos, medido generalmente a través de su educación o de sus ingresos. Éste estudio, complementa las investigaciones sobre la desigualdad del ingreso que analiza la distribución desde un punto de vista estático. Por otra parte, comprender el grado de movilidad generacional es un primer paso para entender las consecuencias de la desigualdad de los ingresos.

Se ha afirmado que si existe suficiente movilidad del ingreso no es necesario preocuparse de cuán desigualmente estén distribuidos.

La idea es medir la correlación entre el estatus socioeconómico del padre, su nivel educativo, su tipo de ocupación y el nivel de ingresos con el de sus hijos y así determinar en algún grado la movilidad social.

El lento crecimiento de la educación promedio de la poblacion más pobre durante largos periodos permite esperar una escasa movilidad intergeneracional. En Chile, en las últimas décadas, el importante aumento de la matrícula universitaria en todas la clases sociales hace preveer una tendencia en contra.

Los resultados de los estudios cuantitativos sobre la transmisión intergeneracional se presentan en la tabla de movilidad, también llamadas matrices de transición.

Para interpretar el gran conjunto de datos que facilitan tales tablas se definen los términos técnicos utilizados.

El primero es el grado de movilidad ascendente o descendente. Los términos ascendente y "descendente’ implican un ordenamiento de las categorías a lo largo de algun eje delimitado cuantitativamente (años de escolaridad) o cualitativamente (niveles de educación). Cuando los estados o posiciones sociales se definen en función de los niveles de educación es más fácil establecer un ordenamiento que cuando se usan otras variables como el tipo de ocupación.

El índice de movilidad de Shorrocks

El Indice de movilidad adoptado es el que propone Shorrocks (1978):

\[ 1 - M = \frac{G(\bar{z})}{\sum_{i=1}^{K} \frac{G({z_t})}{K}} \]

donde:

\(G(.)\) puede ser el coeficiente de Gini o la varianza del log de los ingresos.

\(z_t\) es el vector de los ingresos en el periodo t y

\(\bar{z}\) el vector de los ingresos a largo plazo (el promedio entre los K periodos).

Generación de tablas de contingencia, boxplots y ACP

Ya tenemos el nombre de las variables fundamentales del ingreso por año en la Casen:

año
2017	ytotcor	yautcor	ytrabajocor	yoprcor
2015	ytotcor	yautcor	ytrabajocor	yoprcor
2013	ytotcor	yautcor	ytrabajocor	yoprcor
2011	ytotaj	yautaj	ytrabaj	yopraj
2009	ytotaj	yautaj	ytrabaj	yopraj
2006	ytotaj	yautaj	ytrabaj	yopraj

Para la generación de las tablas de contingencia integraremos al código R cuatro nuevas variables referidas a las siguientes preguntas de la Casen 2017:

e6a: ¿Cuál fue el nivel educacional más alto alcanzado o el nivel educacional actual?

e6b: En ese nivel educacional, ¿cual fue el último curso que aprobó?

r12b: Nivel de educación más alto alcanzado por su padre

r13b: En ese nivel educacional, ¿cual fue el último curso que aprobó su padre?

Tarea:

Buscar el nombre ad-hoc de las variales en las Casen anteriores al 2017, en la aplicación shinyCasen y construir 8 tablas, 4 relacionadas a las etnias y cuatro a la población inmigrante relativas a las cuatro variables del ingreso fundamentales en la Casen.
Se deben construir boxplots que relacionen ingresos y nivel educacional, haciendo cruces con las diferentes categorías y vinculando la educación de los padres con la de los hijos.
Construir gráficos de análisis de componentes principales entre el decil del ingreso autónomo, los años y el tipo de educación de las personas en relación a la de los padres.

La generación de tablas es fácil, por favor, contactarse con nosotros para las instrucciones para construir boxplot y análisis de componentes principales.

Generación de la tabla de contingencia para el 2017. Código ejemplo.

# dataset <- readRDS(file = "casen_2017_c.rds")
ab_2017 <- readRDS(file = "casen_2017_c.rds")

## Excluimos los outliers: 

ab_2017 <- ab_2017[!is.na(ab_2017$ytotcor),]

Q <- quantile(ab_2017$ytotcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$ytotcor)

eliminated <- subset(ab_2017, ab_2017$ytotcor > (Q[1] - 1.5*iqr) & ab_2017$ytotcor < (Q[2]+1.5*iqr))

## Generamos los promedios grupales

a <- eliminated$ytotcor
b <- eliminated$comuna
c <- eliminated$e1 # alfabetismo
d <- eliminated$r3 # etnia
e <- eliminated$sexo
f <- eliminated$e6a # nivel alcanzado
g <- eliminated$e6b # anos de estudio
h <- eliminated$r12b # nivel alcanzado por el padre
i <- eliminated$r13b # anos de estudio del padre

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f,g,h,i), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f,g,h,i), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f,g,h,i), FUN = gini , na.rm = TRUE)

# Calculamos la desviación standard y el Gini:
promedios_grupales$sd <- promedios_grupales_sd$sd.a
promedios_grupales$gini <- promedios_grupales_gini$gini.a

# Revisión de la tabla:
# head(promedios_grupales,5)

names(promedios_grupales)[1] <- "Comuna"
names(promedios_grupales)[2] <- "Alfabetismo"
names(promedios_grupales)[3] <- "Etnia"
names(promedios_grupales)[4] <- "Sexo"
names(promedios_grupales)[5] <- "Nivel alcanzado"
names(promedios_grupales)[6] <- "Años de estudio"
names(promedios_grupales)[7] <- "Nivel alcanzado por el padre"
names(promedios_grupales)[8] <- "Años de estudio del padre"
names(promedios_grupales)[9] <- "Promedio del ingreso"
names(promedios_grupales)[10] <- "ds del ingreso"
names(promedios_grupales)[11] <- "Gini del ingreso"

codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2017 = merge( x = promedios_grupales, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
# head(df_2017,5)

head(promedios_grupales,5)

##         Comuna       Alfabetismo                                 Etnia   Sexo
## 1     Vallenar Sí, lee y escribe No pertenece a ningún pueblo indígena  Mujer
## 2 San Bernardo Sí, lee y escribe No pertenece a ningún pueblo indígena  Mujer
## 3  Puente Alto Sí, lee y escribe No pertenece a ningún pueblo indígena Hombre
## 4       Curicó Sí, lee y escribe No pertenece a ningún pueblo indígena Hombre
## 5       Temuco Sí, lee y escribe No pertenece a ningún pueblo indígena  Mujer
##                                           Nivel alcanzado Años de estudio
## 1                    Educación Media Científico-Humanista               1
## 2                    Educación Media Científico-Humanista               4
## 3               Primaria o Preparatoria (Sistema antiguo)               6
## 4 Técnico Nivel Superior Incompleto (Carreras 1 a 3 años)               1
## 5                                      Postgrado Completo               6
##           Nivel alcanzado por el padre Años de estudio del padre
## 1 Primaria o Preparatoria (S. Antiguo)                         0
## 2 Primaria o Preparatoria (S. Antiguo)                         0
## 3 Primaria o Preparatoria (S. Antiguo)                         0
## 4                     Educación Básica                         0
## 5                     Educación Básica                         0
##   Promedio del ingreso ds del ingreso Gini del ingreso
## 1               133000             NA                0
## 2               306806             NA                0
## 3               148000             NA                0
## 4               746429             NA                0
## 5               890417             NA                0

Primer Rmarkdown: Etnia

Tabla 1 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso total.
Pregunta: e6a, e6b, r12b, r13b

Tabla 2 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso autónomo.
Pregunta: e6a, e6b, r12b, r13b

Tabla 3 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso del trabajo.
Pregunta: e6a, e6b, r12b, r13b

Tabla 4 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y etnia
Variable de ingreso: ingreso de la ocupación principal.
Pregunta: e6a, e6b, r12b, r13b

Segundo Rmarkdown: Migración

Tabla 5 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso total.
Pregunta: e6a, e6b, r12b, r13b

Tabla 6 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso autónomo.
Pregunta: e6a, e6b, r12b, r13b

Tabla 7 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso del trabajo.
Pregunta: e6a, e6b, r12b, r13b

Tabla 8 (2006-2017)

Categorías básicas de la tablas de contingencia: comuna, sexo, alfabetismo y migra
Variable de ingreso: ingreso de la ocupación principal.
Pregunta: e6a, e6b, r12b, r13b

Ingresos, educación y pobreza en la Casen

Estudio sobre la movilidad intergeneracional

VE-MS-CC

22-02-2021

Índice

La teoría social: Movilidad social, educación e ingresos

El índice de movilidad de Shorrocks

Generación de tablas de contingencia

Movilidad social, educación e ingresos

El índice de movilidad de Shorrocks

Generación de tablas de contingencia, boxplots y ACP

Tarea:

Generación de la tabla de contingencia para el 2017. Código ejemplo.

Primer Rmarkdown: Etnia

Tabla 1 (2006-2017)

Tabla 2 (2006-2017)

Tabla 3 (2006-2017)

Tabla 4 (2006-2017)

Segundo Rmarkdown: Migración

Tabla 5 (2006-2017)

Tabla 6 (2006-2017)

Tabla 7 (2006-2017)

Tabla 8 (2006-2017)