Vamos a analizar el salario acumulado en nueve meses de 2008-09 para profesores asistentes, profesores asociados y profesores en una universidad en los EE. UU. Los datos se recogieron como parte del esfuerzo continuo de la administración de la universidad para monitorear las diferencias salariales entre los miembros masculinos y femeninos de la facultad. La idea de este proceso, es poder determinar a partir del analisis exploratorio de los datos si existe discriminacion o no.
Se cargaron 397 registros de docentes, en donde se incluye la información del rango, disciplina, años despues del PhD, años de servicio, sexo y salario para cada uno de ellos.Confirmamos que se cargaran correctamente todos los registros y las 6 variables.
## [1] 397 6
Inicialmente, se validó la cantidad de hombres y mujeres contenidas en la muestra, encontrando un total de 358 Hombres y 39 Mujeres. Lo anterior podria constituir un problema ya que al no tener una cantidad similar de hombres y mujeres se generaria ruido y podrian generarse resultados erroneos.
Para responder a esta pregunta, se realizo el resumen de los datos para los salarios entre hombres y mujeres, encontrando que los hombres ganan un unos $15,000 más que las mujeres, lo cual podria indicar la presencia de discriminacion. Sin embargo, no es correcto afirmar lo anterior hasta no realizar un analisis mas detallado de las demas variables.
Resumen de datos para el salario de los hombres
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 57800 92000 108043 115090 134864 231545
Resumen de datos para el salario de las mujeres
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 62884 77250 103750 101002 117003 161101
En el siguiente boxplot se puede apreciar que el salario de los
hombres esta por encima del de las mujeres. Al tener una mayor cantidad
de muestras de salarios de hombres, se aprecia una mayor variabilidad.
Como dato adicional, podemos apreciar que el salario maximo de la
muestra le pertenece a un hombre, asi como tambien el minimo.
No, para comprobarlo es necesario realizar diversas validaciones con las demas variables presentes en los datos. Las cuales se realizan a continuación.
Si, el hecho de que no se tome una cantidad similar de muestras de hombres y mujeres, podria ser manejado como un factor de confusion y ocasionar una malinterpretacion de los datos obtenidos.
Universidad del Valle - Abril 27 de 2024