Resulta relevante poder explicar el ingreso de las personas por medio de variables categóricas tales como el género, nivel educacional o región geográfica.
Podemos responder así a preguntas tales como:
1 ¿Existen diferencias significativas entre los ingresos medios recibidos entre comunas?
2 ¿Son mayores los sueldos que reciben los hombres del que perciben las mujeres?
3 ¿Perciben mayores ingresos los egresados de la universidad comparados a los egresados de institutos de formación técnica?, ¿cuáles son las profesiones que retribuyen el mayor ingreso económico?
4 ¿Existen diferencias significativas en ingresos por sexo y etnia?
# carguemos nuestro dataframe:
dataset2006 <- readRDS("dataset2006.rds")
# Excluímos a las personas menores de 25 años]
dataset2006 <- dataset2006[which(dataset2006$edad > 25),]
Es fundamental considerar que al interpretar un modelo de regresión con variables explicativas categóricas (en éste caso, género), un nivel será la línea de base para la comparación (hombre) y todos los demás niveles lo serán relativos a ésta línea de base (proceso también conocido como “compensación”).
Ajustaremos el modelo de regresión lineal y luego generaremos una tabla de regresión.
# Ajustamos el modelo de regresión:
# YTRABAJ: Ingreso del Trabajo (ajustado) (pesos por mes)
# SEXO
gender_work <- lm(ytrabaj ~ sexo, data = dataset2006)
# Obtenemos la tabla de regresión:
get_regression_table(gender_work)
## # A tibble: 2 x 7
## term estimate std_error statistic p_value lower_ci upper_ci
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 intercept 321123. 2414. 133. 0 316391. 325856.
## 2 sexomujer -106111. 4080. -26.0 0 -114107. -98115.
Podemos interpretar los resultados de la regresión como sigue:
Considerando a todos los habitantes de Chile mayores a 25 años, el sueldo promedio para los hombres de $321.123,3 .El sueldo promedio para las mujeres es de 321.123,3 + (-106.111.1) = $215.012,2 pesos.
dataset2006 <- readRDS("dataset2006.rds")
dataset2006 <- dataset2006[which(dataset2006$edad > 25),]
# cambiamos la línea de base a: 'no pertenece a ninguna etnia' manualmente
dataset2006 <- within(dataset2006, t4 <- relevel(t4, ref = 10))
ethnicity_work <- lm(ytrabaj ~ t4, data = dataset2006 )
get_regression_table(ethnicity_work)
## # A tibble: 11 x 7
## term estimate std_error statistic p_value lower_ci upper_ci
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 "intercept" 293273. 2061. 142. 0 289234. 297312.
## 2 "t4aymara" -84756. 16193. -5.23 0 -116495. -53017.
## 3 "t4rapa nui " 110423. 187734. 0.588 0.556 -257534. 478379.
## 4 "t4quechua " -57283. 58247. -0.983 0.325 -171446. 56880.
## 5 "t4mapuche " -106246. 7163. -14.8 0 -120286. -92205.
## 6 "t4atacameño" 111943. 28279. 3.96 0 56516. 167370.
## 7 "t4coya" -56956. 132756. -0.429 0.668 -317157. 203244.
## 8 "t4kawaskar" -71412. 136204. -0.524 0.6 -338370. 195547.
## 9 "t4yagan" 25429. 171379. 0.148 0.882 -310472. 361330.
## 10 "t4diaguita" 73041. 59104. 1.24 0.217 -42804. 188885.
## 11 "t4sin dato" -16906. 67682. -0.25 0.803 -149562. 115750.
El ingreso recibido por el trabajo para los chilenos que se declaran no pertenecer a ninguna etnia es de 293.272,88 pesos, lo que tiene sentido pues en un valor que se encuentra dentro de los rangos antes obtenidos para los ingresos de hombres ($321.123,3) y mujeres ($215.012,2).
La etnia que mejor se encuentra respecto a éste promedio son los Rapa Nui quienes obtienen 293.272,88 + 110.422,62 = $403.695,5 pesos.
Los que peor se encuentran son los Mapuches, quienes obtienen: 293.272,88 + (-106.245,57) = 187.027,31 pesos.