Contexto: Base de salarios por profesores

Tienes una base tipo “recursos humanos” de una universidad. Para cada profesor hay información del salario, su rango académico (por ejemplo assistant/associate/full), disciplina/departamento, sexo, y medidas de experiencia (años desde PhD, años de servicio). El decano quiere entender patrones generales antes de tomar decisiones (promociones, contratación, equidad salarial).

1. Calidad de datos

• ¿Qué variables tiene la base y de qué tipo son?

El conjunto de datos cuenta con 6 variables, 3 de ellas son variables numéricas y 3 son de tipo carácter. A continuación, mostramos en detalle:

Diccionario de Datos - Análisis de Salarios Académicos
Variable Descripcion Tipo_Variable
rank Rango académico (Profesor Titular, Asociado o Asistente). Categórica
discipline Tipo de disciplina académica (A: Teórica, B: Aplicada). Categórica
yrs.since.phd Años transcurridos desde que obtuvo su título de PhD. Numérica
yrs.service Años de servicio activo en la universidad. Numérica
sex Género del docente (Male / Female). Categórica
salary Salario anual en dólares (periodo de 9 meses). Numérica

• ¿Hay valores faltantes? ¿En qué variables?

Al analizar cada una de las variables con ayuda de la función viss_miss, se evidencia que no existen valores faltantes en las variables descritas anteriormente.

• ¿Hay valores “raros” (salarios muy bajos/altos, años negativos, etc.)?

En el summary se puede evidenciar para las variables numéricas que no existen valores negativos en los años o el salario (Min), además de evidenciar que los valores máximos no presentan números demasiado extraños. Para las variables de tipo carácter, se identificaron los valores únicos, observando que no existen valores “raros”.

Resumen Estadístico para Detección de Anomalías
Variable Mínimo Media Mediana Máximo Desv.Std
Años desde PhD 1 22.32 21 56 12.89
Años de Servicio 0 17.61 16 60 13.01
Salario 57800 113706.46 107300 231545 30289.04

Se analizó la distribución de años de servicio de los profesores, se evidencian algunos valores altos cercanos a 60 años de servicio.

2. Descripción general

• ¿Cuál es el salario promedio, mediano y la dispersión en toda la muestra?

El salario promedio es $113.706, el mediano es $107.300 (tal y como se mostró en el summary) y la desviación es $30289.04. La media es ligeramente superior a la mediana, lo que indica una leve asimetría positiva en la distribución (algunos salarios altos elevan el promedio). La desviación estándar cercana a 30.289 muestra una dispersión considerable, lo que evidencia variabilidad importante entre los salarios de los docentes en la muestra.

• ¿Cómo se ve la distribución del salario? (histograma/densidad)

El histograma muestra que la distribución del salario no es simétrica, sino que presenta una asimetría positiva (cola hacia la derecha). La mayor concentración de salarios se encuentra aproximadamente entre $90.000 y $120.000, donde se observa el pico de frecuencia más alto, lo que indica que la mayoría de los docentes se ubican en ese rango salarial.

A medida que el salario aumenta, la frecuencia disminuye progresivamente, evidenciando que existen menos personas con salarios muy altos (por encima de $170.000–$200.000). También se observan algunos valores extremos hacia la parte derecha del gráfico, lo que sugiere la presencia de salarios significativamente superiores al promedio.

3. Comparaciones por grupos

• ¿Cómo cambian salario promedio/mediano por rango?

Al agrupar la información por la variable rank (rango académico) y calcular la media y la mediana del salario, se observa un comportamiento claramente jerárquico en la estructura salarial.

En primer lugar, el rango AsstProf (Profesor Asistente) presenta los valores más bajos tanto en salario promedio como en salario mediano, lo cual es consistente con su condición de nivel inicial dentro de la carrera académica. En segundo lugar, el rango AssocProf (Profesor Asociado) muestra un incremento notable en ambas medidas de tendencia central, reflejando mayor experiencia, antigüedad y responsabilidades. Finalmente, el rango Prof (Profesor Titular) registra los valores más altos de salario promedio y mediano en toda la muestra, evidenciando la consolidación profesional y académica alcanzada en este nivel. Además, en este grupo suele observarse mayor dispersión salarial, la cual podría estar asociada a diferencias en trayectoria, productividad académica y negociaciones individuales.

En síntesis, los resultados confirman que el salario aumenta progresivamente con el rango académico, siguiendo la estructura: AsstProf < AssocProf < Prof. Las posibles diferencias entre media y mediana dentro de cada categoría sugieren una ligera asimetría en la distribución, particularmente en el rango de Profesor Titular, donde algunos salarios elevados influyen en el promedio.

• ¿Cómo cambian por disciplina?

Al agrupar los datos por la variable discipline y calcular la media y mediana del salario, se observa una diferencia clara entre las dos áreas académicas:

  • Disciplina A presenta, en promedio, salarios más altos tanto en la media como en la mediana.
  • Disciplina B muestra valores inferiores en ambas medidas.

Esto indica que, en términos generales, los profesores pertenecientes a la Disciplina A tienen una remuneración mayor que los de la Disciplina B. La diferencia entre media y mediana dentro de cada disciplina es pequeña, lo que sugiere que la distribución salarial no presenta una asimetría extrema, aunque pueden existir algunos valores altos que elevan ligeramente el promedio.

• ¿Dentro de cada rango, hay diferencias por sexo?

Al analizar el salario dentro de cada rango académico (AsstProf, AssocProf y Prof) diferenciando por sexo, se observan diferencias salariales en favor del grupo masculino en la mayoría de los rangos.

En el rango AsstProf, la diferencia suele ser menor, aunque el promedio masculino tiende a ubicarse ligeramente por encima. En AssocProf, la brecha se hace más visible, mostrando mayor salario promedio para hombres. Finalmente, en el rango Prof, la diferencia suele ser más marcada, evidenciando mayor dispersión y presencia de salarios altos en el grupo masculino, lo que incrementa la media.

En general, el gráfico de boxplot confirma que dentro de cada rango académico existen diferencias salariales por sexo, siendo más notorias en los rangos superiores. Esto sugiere que la brecha salarial no solo depende del rango académico, sino que también puede estar influenciada por el sexo dentro de cada categoría.

4. Relación experiencia–salario

• ¿Qué relación parece haber entre salario y años desde PhD?

• ¿Qué relación parece haber entre salario y años de servicio?

• ¿Se ve igual esa relación si separas por rango (facetas) o por disciplina?