Discriminación salarial por genero – ¿Existe?

El salario acumulado en nueve meses de 2008-09 para profesores asistentes, profesores asociados y profesores en una universidad en los EE. UU. Los datos se recogieron como parte del esfuerzo continuo de la administración de la universidad para monitorear las diferencias salariales entre los miembros masculinos y femeninos de la facultad.

La hoja de datos Salaries.csv contiene la información de 397 profesores con el registro de 6 variables.

Variable Descripción
rank Factor ordinal con niveles AssocProf AsstProf Prof
discipline Factor con niveles A (“teórico”) o B (“aplicado”)
yrs.since.phd Años transcurrido desde la obtención del doctorado
yrs.service Años de servicio
sex Factor nominal con niveles Female (Femenino) o Male
(Masculino)
salary Salario de nueve meses, en dólares

En consistencia con el objetivo del estudio, se espera que usted construya un informe sintético, en el cual, a través de una visualización contundente de los datos y el contraste adecuado de indicadores resumen, contribuya a la institución a responder las siguientes dos preguntas de investigación.

  1. ¿Existe una diferencia salarial entre hombres y mujeres?

  2. Si la diferencia existe: ¿son atribuibles exclusivamente al género de los profesores ó existen otras características que pueden explicar la diferencia salarial?

Desarrollo

Como primer paso de este ejercicio se realizará un análisis exploratorio de los datos para arrojar las principales medidas de tendencia central de los salarios de los profesores, calculando la cantidad de registros por género.Por lo cual, se presenta a continuación una visualización del dataframe objeto del estudio:

Dataframe Salaries.csv

Una vez cargado el dataframe se arrojan algunas medidas de tendencia central y de dispersiòn para la variable cuantitativa salario y se cálcula la frecuencia de los registros por género:

##      salary      
##  Min.   : 57800  
##  1st Qu.: 91000  
##  Median :107300  
##  Mean   :113706  
##  3rd Qu.:134185  
##  Max.   :231545
## Desviación   Coef.Var 
##   30289.04       0.27
## [1] 397
## sexo
## Female   Male 
##     39    358
## sexo
## Female   Male 
##   9.82  90.18

Dado los datos anteriores, se tiene que de todo el set de datos, el 90.18% de los registros se categorizan por género masculino y el 9.82% restante por género femenino.

Bajo los porcentajes mencionados, como primer indicador se ve reflajado una desigualdad o disparidad fuerte de genero referente a la cantidad de hombres versus la mujeres que ejercen como profesores en sus diferentes rangos y disciplinas.

Conforme a esto, se realiza un análisis exploratorio de los datos contenidos en el dataset, para identificar ciertas variables en función del salario y también se crean otras variables como factores para segmentar los datos por el sexo, el rango y la disciplina. Los niveles de los factores corresponden a los requeridos por el ejercicio.

  • rank = Factor ordinal con niveles AssocProf AsstProf Prof
  • discipline = Factor con niveles A (“teórico”) o B (“aplicado”)

Otras variables se crean para calcular los promedios salariales por rango, disciplina y sexo.

El gráfico exploratorio inicial se basa en graficar los datos en un Histograma, Boxplot y un gráfico de dispersión de los salarios según el género (Femenino o Masculino):

1. Gráficos de Diferencia Salarial por Sexo (Femenino y Masculino)

Observaciones

Conforme a las representaciones gráficas anteriormente ilustradas se puede identificar lo siguiente:

  • El promedio del salario masculino de manera general es superior al femenino
  • La frecuencia de los datos salariales masculinos son menos dispersos (Datos homogéneos) que los del género femenino (Datos heterogéneos)
  • En el género masculino existen datos atípicos por encima del bigote superior del boxplot a diferencia del género femenino que no presenta datos con similar comportamiento.
  • Ambos grupos salariales presentan distribución asimétrica, sin embargo, en el género femenino la mayor frecuencia de los datos se sitúa por fuera del rango ITQ respecto al del género masculino, en donde la mayor frecuencia se encuentra entre el rango ITQ

Con todas estas observaciones se consolidad la hipótesis que daría respuesta a la primer pregunta planteada en el plan de análisis, conforme a que además de existe una desigualdad de género frente a la cantidad de hombres y mujeres que ejercen como profesores, también se presenta una diferencia muy marcada en terminos salariales. Sin embargo, es conveniente profundizar en el análisis de tal forma que se revise también, si existe una difrencia salarial desagregando esta variable en función de los Rangos y Disciplinas

Para esto, se construyen 2 boxplot con su respectivo gráfico de dispersión unidimensional de la siguiente manera:

  • Salarios por género y disciplina
  • Salarios por género y rango

2. Gráficos de Diferencia Salarial por género, disciplina y rango

Observaciones

Dado estos gráficos se evidencia lo siguiente:

Gráficos - Salary by Sex and Discipline
  • Se sigue presentando la tendencia, que el promedio de los salarios de los hombres, es superior al de las mujeres en ambas disciplinas (A y B)
  • Los salarios de las mujeres categorizados por disciplina, siguen siendo más dispersos en comparación de la dispersión de datos de los hombres.
  • Se presentan nuevamente salarios atípicos en el género masculino para ambas disciplinas, estando estos datos por encima de los bigotes superiores de cada caja
Gráficos - Salary by Sex and Rank
  • Al igual que los dos análisis anteriores, se repite nuevamente que los promedios salariales del género masculino son superiores al de las mujeres en sus respectivos rangos (Prof, AssocProf, AsstProf)
  • En el gráfico de salarios por sexo y rango se puede observar que los datos de los salarios de las mujeres se encuentran considerablemente dispersos (Heterogéneos) para para todos los rangos
  • En el rango de profesor asistente con género femenino presenta el rango ITQ mas pequeño de todos los boxplot en donde se presentan una serie de datos atípicos por debajo y por encima de los bigotes.Incluso, Este comportamiento de los datos permite plantear un nueva pregunta en el ejercicio relacionada directamente con una brecha salarial entre el mismo género femenino por rangos y disciplinas.

3. Gráficos de Diferencia Salarial Años de haberse graduado como Phd y años de Servicio

Observaciones

Se procede a calcular el coeficiente de correlación de Pearson (r) por cada par de variables [Años desde haberse graduado del Doctorado y Años de servicio] y el coeficiente de cada variable respecto al salario, determinando así, cuáles de estas presentan una relación directa (r igual o cercano a 1), cuales tienen una relación inversa (r igual o cercano a -1) o cuales no presentan una relación alguna (r igual o cercano a 0) observando de esta manera que:

  • El salario frente a las variables Años desde haberse graduado del Doctorado y Años de servicio presentan una correlación positiva débil con coeficientes de r=0.42 y r=0.33, respectivamente.
  • Las variables Años desde haberse graduado del Doctorado y Años de servicio presentan una correlación positiva fuerte con r=0.91,

Conclusiones

  1. Iniciando el análisis al set de datos se encuentra que, de 397 registros en total, 358 tienen categoría masculina y 39 restantes categoría femenina. En principio existe una frecuencia de datos por genero muy dispareja en donde por cada mujer con doctorado hay aproximadamente 9 hombres con el mismo título. Este tipo de comportamiento en los datos permite al analista suponer solo con datos exploratorios a nivel de tendencia y dispersión que existe una brecha salarial en el estudio.
  2. Conforme a los interrogantes estipulados en el plan de analisis se puede concluir dando respuesta a la primer pregunta, qué sí existe una diferencia salarial entre los homres y las mujeres, según la comparación de los promedios salariales de manera general, por clasificación del rango y por clasificación de disciplinas.
  3. La diferencia salarial puede atribuirse en gran parte al genero de los profesores, dado que al evaluar la correlación del salario con las variables Años desde haberse graduado del Doctorado y Años de servicio, se evidencia que aunque la correlación es directa, presenta un coeficiente positivo débil.