El objetivo de este laboratorio es poder identificar si en una universidad de los Estados Unidos se presentan diferencias salariales entre los miembros masculinos y femeninos de la facultad.
1. Objetivo: Identificar si hay diferencias salariales entre hombres y mujeres, y si esas diferencias son atribuibles a otros factores.
2. Actividades a realizar:
| rank | discipline | yrs.since.phd | yrs.service | sex | salary | |
|---|---|---|---|---|---|---|
| Length:397 | Length:397 | Min. : 1.00 | Min. : 0.00 | Length:397 | Min. : 57800 | |
| Class :character | Class :character | 1st Qu.:12.00 | 1st Qu.: 7.00 | Class :character | 1st Qu.: 91000 | |
| Mode :character | Mode :character | Median :21.00 | Median :16.00 | Mode :character | Median :107300 | |
| NA | NA | Mean :22.31 | Mean :17.61 | NA | Mean :113706 | |
| NA | NA | 3rd Qu.:32.00 | 3rd Qu.:27.00 | NA | 3rd Qu.:134185 | |
| NA | NA | Max. :56.00 | Max. :60.00 | NA | Max. :231545 |
| rank | 0 |
| discipline | 0 |
| yrs.since.phd | 0 |
| yrs.service | 0 |
| sex | 0 |
| salary | 0 |
Con base en la tabla anterior, no se tienen datos faltantes en el dataset de salarios
Distribución de la variable salario
Con base en el gráfico y las medidas calculadas anteriores, se puede concluir que los salarios de la universidad tienen una asimetría positiva moderada. Por lo tanto, se utilizará la mediana como medida representativa.
Resumen estadístico y distribución de salarios por género
| Mujeres | Hombres | |
|---|---|---|
| Count | 39.00 | 358.00 |
| Mediana | 103750.00 | 108043.00 |
| D.E | 25952.13 | 30436.93 |
| C.V | 0.25 | 0.28 |
| Min | 62884.00 | 57800.00 |
| Max | 161101.00 | 231545.00 |
Si comparamos la mediana de los salarios de ambos géneros, parece haber una diferencia entre los salarios entre hombres y mujeres, concluyendo que los hombre ganan más que las mujeres. Para verificar lo anterior, se realizará una prueba de hipotesis para verificar el resultado. Primero, se hará el test Shapiro-Wilk para comprobar si los salarios de la población femenina y masculina se distribuyen de manera normal.
Test Shapiro-Wilk para el salarios de las mujeres
##
## Shapiro-Wilk normality test
##
## data: salarios_mujeres$salary
## W = 0.94665, p-value = 0.06339
Test Shapiro-Wilk para el salarios de las mujeres
##
## Shapiro-Wilk normality test
##
## data: salarios_hombres$salary
## W = 0.95877, p-value = 1.735e-08
Con base en los resultados del test Shapiro-Wilk, para el salario de la población femenina se distribuye normal (el p-value es mayor a 0.05). Sin embargo, el salario de la población masculina no se distribuye normalmente con base en el test, ya que su p-value es manor a 0.05. Por lo tanto, se aplicará la prueba no paramétrica Mann-Whitney U para comparar la mediana de ambos grupos y comprobar si hay diferencias significativas en el salario.
##
## Wilcoxon rank sum test with continuity correction
##
## data: salary by sex
## W = 5182.5, p-value = 0.008237
## alternative hypothesis: true location shift is not equal to 0
Teniendo en cuenta los resultados de la prueba Mann-Whitney U, se puede concluir que hay una diferencia significativa entre las medianas de los salarios entre hombres y mujeres (el p-value es menor a 0.05). Y con base en el gráfico de cajas y bigotes, el salario de la población masculina es mayor a la de la población femenina. Por lo tanto, se analizará las razones por la cuáles se pueden estar presentando estas diferencias
Con base en los gráficos anteriores, la población masculina tiene más años de servicio que la población femenina, sin embargo en el caso de los hombres no hay una asociación fuerte entre los años de servicio y su salario (el valor de la correlación es 0.31) mientras que en las mujeres esa asociación es un poco mayor (el coeficiente de correlación es 0.56). Además, en el caso de los hombres el salario tiende a disminuir después de 20 años de servicio. Por lo anterior, se puede concluir que los años de servicio no representa una causa importante en la diferencia de salarios entre la población masculina y femenina.
Para el caso de la experiencia académica, los resultados son muy similares comparados con los años de servicio: la población masculina tiene más experiencia académica que las mujeres. Así mismo, las asociaciones entre los salarios de cada género y la experiencia académica son similares a los de año de servicio. Por lo tanto, la experiencia académica no representa una causa importante en la diferencia de salarios entre la población masculina y femenina.
| sex | rank | salary.Mediana | salary.D.E | salary.C.V. | salary.Maximo | salary.Minimo |
|---|---|---|---|---|---|---|
| Femenino | AssocProf | 90556.50 | 17965.29 | 0.20 | 109650.00 | 62884.00 |
| Masculino | AssocProf | 95626.50 | 12890.82 | 0.13 | 126431.00 | 70000.00 |
| Femenino | AsstProf | 77000.00 | 9372.00 | 0.12 | 97032.00 | 63100.00 |
| Masculino | AsstProf | 80182.00 | 7901.34 | 0.10 | 95079.00 | 63900.00 |
| Femenino | Prof | 120257.50 | 19619.58 | 0.16 | 161101.00 | 90450.00 |
| Masculino | Prof | 123996.00 | 28213.81 | 0.23 | 231545.00 | 57800.00 |
En cuanto a los niveles, con base en el resumen y gráficos anteriores, hay una mayor proporción de población masculina que está en el nivel Prof, y estos, con base en el gráfico de cajas y bigotes, son los que ganan más. Adicionalmente, los niveles AssocProf y AsstProf parecen tener diferencias entre la población masculina y femenina, siendo los hombres los que ganan más entre esos niveles mencionados.
| sex | discipline | salary.Mediana | salary.D.E | salary.C.V. | salary.Maximo | salary.Minimo |
|---|---|---|---|---|---|---|
| Femenino | Teórico | 78000.00 | 21638.58 | 0.28 | 137000.00 | 62884.00 |
| Masculino | Teórico | 105260.00 | 30663.12 | 0.29 | 205500.00 | 57800.00 |
| Femenino | Aplicado | 105450.00 | 25367.24 | 0.24 | 161101.00 | 71065.00 |
| Masculino | Aplicado | 113600.00 | 29831.32 | 0.26 | 231545.00 | 67559.00 |
En cuanto a disciplina, las proporciones entre población masculina y femenina son iguales tanto para disciplina teórica y aplicada. Sin embargo, al ver las distribuciones del salario por disciplina y género, se evidencia diferencias significativas entre los salarios por género, especialmente en los profesores de disciplina teórica.
Con base en el análisis anterior, se puede decir que: