Introducción.

Resulta relevante poder explicar el ingreso de las personas por medio de variables categóricas tales como el género, nivel educacional o región geográfica.

Podemos responder así a preguntas tales como:

1 ¿Existen diferencias significativas entre los ingresos medios recibidos entre comunas?

2 ¿Son mayores los sueldos que reciben los hombres del que perciben las mujeres?

3 ¿Perciben mayores ingresos los egresados de la universidad comparados a los egresados de institutos de formación técnica?, ¿cuáles son las profesiones que retribuyen el mayor ingreso económico?

4 ¿Existen diferencias significativas en ingresos por sexo y etnia?

Análisis para el año 2006

# carguemos nuestro dataframe:
dataset2006  <- readRDS("dataset2006.rds")
# Excluímos a las personas menores de 25 años]
dataset2006 <- dataset2006[which(dataset2006$edad > 25),]

Regresión lineal para el análisis de los Ingresos del trabajo y género.

Es fundamental considerar que al interpretar un modelo de regresión con variables explicativas categóricas (en éste caso, género), un nivel será la línea de base para la comparación (hombre) y todos los demás niveles lo serán relativos a ésta línea de base (proceso también conocido como “compensación”).

Ajustaremos el modelo de regresión lineal y luego generaremos una tabla de regresión.

# Ajustamos el modelo de regresión:
# YTRABAJ: Ingreso del Trabajo (ajustado) (pesos por mes)
# SEXO 
gender_work <- lm(ytrabaj ~ sexo, data = dataset2006)
# Obtenemos la tabla de regresión:
get_regression_table(gender_work)
## # A tibble: 2 x 7
##   term      estimate std_error statistic p_value lower_ci upper_ci
##   <chr>        <dbl>     <dbl>     <dbl>   <dbl>    <dbl>    <dbl>
## 1 intercept  321123.     2414.     133.        0  316391.  325856.
## 2 sexomujer -106111.     4080.     -26.0       0 -114107.  -98115.

Interpretación de la tabla de regresión

Podemos interpretar los resultados de la regresión como sigue:

Considerando a todos los habitantes de Chile mayores a 25 años, el sueldo promedio para los hombres de $321.123,3 .El sueldo promedio para las mujeres es de 321.123,3 + (-106.111.1) = $215.012,2 pesos.

Regresión lineal para el análisis de los Ingresos del trabajo y etnia.

dataset2006  <- readRDS("dataset2006.rds")
dataset2006 <- dataset2006[which(dataset2006$edad > 25),]

# cambiamos la línea de base a: 'no pertenece a ninguna etnia' manualmente
dataset2006 <- within(dataset2006, t4 <- relevel(t4, ref = 10))
ethnicity_work <- lm(ytrabaj ~ t4, data = dataset2006  )
get_regression_table(ethnicity_work)
## # A tibble: 11 x 7
##    term          estimate std_error statistic p_value lower_ci upper_ci
##    <chr>            <dbl>     <dbl>     <dbl>   <dbl>    <dbl>    <dbl>
##  1 "intercept"    293273.     2061.   142.      0      289234.  297312.
##  2 "t4aymara"     -84756.    16193.    -5.23    0     -116495.  -53017.
##  3 "t4rapa nui "  110423.   187734.     0.588   0.556 -257534.  478379.
##  4 "t4quechua "   -57283.    58247.    -0.983   0.325 -171446.   56880.
##  5 "t4mapuche "  -106246.     7163.   -14.8     0     -120286.  -92205.
##  6 "t4atacameño"  111943.    28279.     3.96    0       56516.  167370.
##  7 "t4coya"       -56956.   132756.    -0.429   0.668 -317157.  203244.
##  8 "t4kawaskar"   -71412.   136204.    -0.524   0.6   -338370.  195547.
##  9 "t4yagan"       25429.   171379.     0.148   0.882 -310472.  361330.
## 10 "t4diaguita"    73041.    59104.     1.24    0.217  -42804.  188885.
## 11 "t4sin dato"   -16906.    67682.    -0.25    0.803 -149562.  115750.

Interpretación de la tabla de regresión

El ingreso recibido por el trabajo para los chilenos que se declaran no pertenecer a ninguna etnia es de 293.272,88 pesos, lo que tiene sentido pues en un valor que se encuentra dentro de los rangos antes obtenidos para los ingresos de hombres ($321.123,3) y mujeres ($215.012,2).

La etnia que mejor se encuentra respecto a éste promedio son los Rapa Nui quienes obtienen 293.272,88 + 110.422,62 = $403.695,5 pesos.

Los que peor se encuentran son los Mapuches, quienes obtienen: 293.272,88 + (-106.245,57) = 187.027,31 pesos.