NOTA PARA EL PROFESOR Y EL LECTOR

Se inhabilitó buena parte del código con el cual se construyó este informe, debido a que para poder publicar en RPubs se tuvo que editar en markdown desde la aplicación RStudio Cloud. La versión de escritorio no permitió crear un nuevo archivo markdown a pesar de distintos esfuerzos. En el proceso de migración, las librerias que más utilice como tidyverse y ggplot arrojaron conflictos, impidiendo mostrar correctamente las salidas estadísticas y gráficas. No obstante, se adjuntan tablas y gráficas generadas en RStudio de escritorio para demostrar que el ejercicio se realizó bajo los parametros solicitados.

Acceso al informe narrativo:

https://drive.google.com/file/d/181FJolpSu1KKzW-aBw32sb48jbLOVjDN/view?usp=sharing

Acceso al código completo:

https://drive.google.com/file/d/1XA0TlaiiMrvY2RPyh-l2MaXibwe0Ni02/view?usp=sharing

UNIVERSIDAD DEL VALLE

MAESTRÍA EN ANALÍTICA E INTELIGENCIA DE NEGOCIOS

ASIGNATURA DE MÉTODOS CUANTITATIVOS PARA EL ANÁLISIS DE INFORMACIÓN

DOCENTE: JAIME MOSQUERA RESTREPO PhD

ESTUDIANTE:JHOSEPH NICOLAI CASTAÑEDA QUIROGA - CÓDIGO 2500343 - 7727

1. PROBLEMÁTICA

Una universidad norteamericana recogió los datos de los salarios de su cuerpo docente durante un período de 9 meses, que se encuentra consignado en un dataset que hace parte del paquete de datos de la librería “cars” del software R. En este se han incorporado una serie de variables que están vinculadas al perfil y salario del docente: A) Rango jerárquico (Rank), B) Disciplina, C) Años transcurridos desde el doctorado (yrs.since.phd), D) Años en servicio en la universidad (yrs.service) y E) Sexo.

El esquema planteado por los datos genera la posibilidad de indagar preliminarmente si existe una relación estadística que sugiera que hombres o mujeres tienen diferencias en su asignación salarial, basadas justamente en su sexo. Para ello, no solo basta comparar el salario y el sexo, porque se podría inferir una relación espuria, o, en otros términos, que una variable no explique la otra directamente, que haya, por ejemplo, factores intermedios como la edad, la experiencia, los reconocimientos, la localización geográfica, el tipo de facultad, entre muchas otras. En esto consiste el reto de resolver la inquietud, y es aplicar un conjunto de procedimientos de análisis de datos que permitan abordar de forma sistemática el problema.

En este informe se discutirán dos preguntas de manera frontal: 1. ¿Se evidencia una diferencia salarial entre hombres y mujeres? 2. ¿Las diferencias salariales son atribuibles exclusivamente al género de los profesores? O ¿existen otras características – factores de confusión, que pueden explicar la diferencia salarial?

La estrategia que se pondrá en funcionamiento es la siguiente: Primero se plantearán dos hipótesis de qué significa la diferenciación salarial basada en el sexo. A esta primera cuestión en este informe se le referirá a partir de este punto como brecha salarial. Posteriormente, en vista de lo reducido del informe, se citarán dos papers académicos en los que vale la pena detenerse para retomar ciertos elementos de la discusión.

Una vez abonado el terreno de la indagación previa, se iniciará la exposición de los resultados del análisis de datos, cuyo contenido tiene tres componentes a saber: A) Tablas con estadísticas de tendencia central, B) Visualizaciones de datos y C) Una propuesta de indicador propio. El documento concluye con unas reflexiones finales sobre los hallazgos y limitaciones de los datos.

2. HIPOTESIS

En este informe hay dos hipótesis que serán planteadas para guiar el análisis de los datos, que llamaremos como “mundo sin brechas” y “mundo con brechas”. El mundo sin brechas es aquel donde hay una relativa igualdad salarial entre docentes mujeres y hombres, de manera tal que, al estudiar sus años de servicio, años transcurridos después del doctorado y rango, su asignación salarial debería ser muy similar para todos los docentes.

Hipotesis propuestas
Hipotesis propuestas

“A mayor cantidad de años de servicio, mayor cantidad de años de experiencia después del doctorado y un más alto rango, la asignación salarial será muy superior”. Si existiera una relación lineal, la sumatoria de todos los factores anteriores se verían reflejados en el comportamiento del salario, afectándolo incrementalmente. Los años de servicios y los años transcurridos desde el PhD pueden actuar directamente en el salario, o, quizás, también a través del rango jerárquico. Es posible que la universidad de estudio tenga una política de solo permitir ciertos salarios al tener un determinado rango, que su obtención depende de los años en servicio. En cualquier caso, el problema no lo específica.

La hipótesis del mundo con brechas sostendría entonces que existe una diferencia que afecta negativamente la asignación salarial y es la variable del sexo. Los hombres o las mujeres podrían tener mayor o menor remuneración de acuerdo con su biología al nacer, independientemente que su experiencia y rango sean equiparables. “A mayor cantidad de años de servicio, mayor cantidad de años de experiencia después del doctorado y un más alto rango, la asignación salarial tendrá variaciones negativas según el sexo”.

3. ESTADO DEL ARTE

Fox (1981) en un artículo académico que abordó un problema parecido sobre las diferencias salariales entre el cuerpo académico de varias universidades norteamericanas según el sexo, encontró que los factores que explicaban la asignación salarial eran los logros académicos (título dentro de la universidad, años en la institución, rango), la adscripción racial y de ciudadanía y las características de la ubicación de los empleos. Esto era cierto para los dos sexos, sin embargo, el retorno salarial de las mujeres es menor. La autora relaciona este fenómeno a estructuras de segregación del trabajo que se identificaron en las características de la ubicación del empleo .
Renzulli, Grant & Kathuria (2006) también identificaron una brecha en la remuneración de las mujeres frente a los hombres en instituciones académicas. Sin embargo, consideraron también el papel que tenía la raza, evaluando universidades predominantemente con cuerpos académicos afrodescendientes y, en contraste, predominantemente blancos. Encontraron que las brechas en los rangos jerárquicos más bajos tendían a disminuir para universidades afrodescendientes, pero, al elevarse el rango, las brechas eran cada vez más similares que en las universidades blancas. Ello añade una dimensión adicional para comprender el problema .

4. ANÁLISIS DE DATOS

El dataset analizado consta de 397 registros en 6 variables. Frente a la cuestión del sexo, el conjunto está desbalanceado, con 90,1% (358) de hombres y 9,9% (39) de mujeres. El hecho de que la línea base tenga dicha composición llama la atención, por cuanto permite entender que la universidad tiene un cuerpo académico predominantemente masculino, lo cual afecta la forma en la que se comportan los datos. Es más probable encontrar hombres en todas las categorías de rangos y disciplinas que mujeres.

#Salaries <- read.csv("Salaries.csv", stringsAsFactors = FALSE)

#install.packages("ggridges")
#install.packages("rmarkdown")

#Librerias#
#library(writexl)
#library(ggplot2)
#library(tidyverse)
#library(patchwork)
#library(dplyr)
#library(ggplot2)
#library(ggridges)
#library(markdown)
#library(commonmark)
#library(knitr)

# 4.1. TABLAS PARA ANÁLISIS DE LAS VARIABLES
#attach(Salaries)

# Resumen general del dataset
#resumen_general <- summary(Salaries)
#print(resumen_general)


# Resumen de medidas de tendencia central#
#summary(Salaries$salary)
#summary(Salaries$yrs.since.phd)
#summary(Salaries$yrs.service)

# Tabla para evidenciar diferencias en promedios por género

#tabla_resumen_promedios <- aggregate(
#cbind(salary, yrs.service, yrs.since.phd) ~ sex, # Para calcular los promedio de las tres #variables #agrupados por sexo
#data = Salaries,
#FUN = mean,                               
#na.rm = TRUE                                
#)
#names(tabla_resumen_promedios) <- c("Sexo", "Prom. salario", "Prom. años servicio", "Prom, años PhD")
#print("Tabla para evidenciar diferencias en promedios por género")
#print(tabla_resumen_promedios)

# Convertir los resumenes de tendencia central en un dataframe

#summary_salary <- summary(Salaries$salary)
#summary_phd <- summary(Salaries$yrs.since.phd)
#summary_service <- summary(Salaries$yrs.service)

#df_summary_salary <- data.frame(t(summary_salary))
#df_summary_phd <- data.frame(t(summary_phd))
#df_summary_service <- data.frame(t(summary_service))

#stats_numericas <- data.frame(
  #Variable = c("salary", "yrs.since.phd", "yrs.service"),
  #Min = c(summary_salary["Min."], summary_phd["Min."], summary_service["Min."]),
  #Q1 = c(summary_salary["1st Qu."], summary_phd["1st Qu."], summary_service["1st Qu."]#),
  #Median = c(summary_salary["Median"], summary_phd["Median"], summary_service["Median"]),
  #Mean = c(summary_salary["Mean"], summary_phd["Mean"], summary_service["Mean"]),
  #Q3 = c(summary_salary["3rd Qu."], summary_phd["3rd Qu."], summary_service["3rd Qu."]),
  #Max = c(summary_salary["Max."], summary_phd["Max."], summary_service["Max."])
#)

#colnames(stats_numericas) <- c("Variable", "Min", "Q1", "Mediana", "Media", "Q3", "Max")
#print(stats_numericas)

4.1. TABLAS Y ESTADÍSTICAS DESCRIPTIVAS

El promedio de salarios del conjunto de datos es de USD $113.706, con un mínimo de USD $57.800 y un máximo de $231.545. Lo anterior quiere decir que, en los nueve meses de observación de la base de datos, algunos académicos obtuvieron dos veces más salario que el promedio de sus colegas, y también hubo algunos de ellos que se situaron por debajo de la mitad de los ingresos promedio.

Tabla 1. - Estadísticas de tendencia central variables cuantitativas
Tabla 1. - Estadísticas de tendencia central variables cuantitativas

En relación con los años transcurridos desde el PhD, hay algunos docentes bastante experimentados con más de medio siglo desde su graduación, mientras otros apenas inician su vida investigativa formal con 1 año transcurrido. El promedio de esta variable oscila en los 22,3 años. Por otra parte, los años de servicio a la universidad tienen por promedio 17,6 años, con casos en los que hay hasta 60 años de servicio, y en algunos casos 0 años, es decir, al momento del corte de la base de datos no habían cumplido un año de trabajo.

Tabla 2. - Promedios de las variables diferenciadas por sexo
Tabla 2. - Promedios de las variables diferenciadas por sexo

Surgen patrones muy interesantes al llevar las estadísticas descriptivas al ámbito del sexo del cuerpo docente. Se evidencia que existe una diferencia en el ingreso promedio entre hombres y mujeres, existiendo una brecha de unos catorce mil ochenta y ocho dólares. Las mujeres ganan algo cercano al 12% menos que sus colegas hombres, al menos para el período observado. Teniendo en cuenta la investigación de Fox (1981), por si solo el dato no es muy revelador, en la medida que pueden tener mucho que ver los logros académicos como la experiencia, hay que sopesar con las otras variables.

Así como hay una brecha salarial, también es cierto que hay brechas en los años de servicio y experiencia luego de obtener el doctorado. En general, las mujeres en esta universidad tienen 6,71 años menos en servicio que sus compañeros hombres. Situación similar en cuanto tiempo transcurrido desde el recibimiento del PhD, con una brecha de 6,44 años entre los dos sexos. Ambos resultados son importantes, porque se podría especular que la universidad tuvo algunas políticas que desalentaban a las mujeres para ingresar a su fuerza laboral, o que, las mujeres tienen menor tasa de inserción y graduación en programas de posgrado.

4.2. VISUALIZACIÓN DE DATOS

La visualización con el gráfico de boxplot es una excelente herramienta para lograr evidenciar las asimetrías entre los docentes de la universidad según el sexo. En el Gráfico No. 1 se representan 3 variables: El promedio de salario durante el período de tiempo observado, el rango jerárquico y el sexo de los profesores. Entendiendo que los niveles jerárquicos son asistente, asociado y de planta, siendo que el siguiente tendría mejor remuneración que el anterior, el gráfico muestra la asignación salarial para hombres y mujeres en cada rango.

El promedio salarial para los tres rangos es superior en los profesores hombres. Para las profesoras asociadas y asistentes se puede ver que la distribución de los datos es asimétrica, estando sesgada en los datos por debajo del promedio. Si bien es cierto que en los hombres también ocurre el fenómeno, para las profesoras el tamaño de la caja en el sector inferior a la media es más grande que sus colegas. Ahora bien, al remitirnos a los profesores de planta, los hombres tienen un tamaño de caja mucho más grande por encima del promedio que las mujeres, señalando una brecha importante. Así mismo, los dos datos salariales más altos y extremos se hallan dentro del conjunto de los hombres. En contraste los valores extremos salariales más bajos están dentro del grupo de las mujeres.

Grafica No. 1 - Boxplot del promedio del salario según rango jerárquico y sexo
Grafica No. 1 - Boxplot del promedio del salario según rango jerárquico y sexo
Gráfica No. 2 – Gráfica de líneas del salario promedio diferenciado por sexo, rango y disciplina
Gráfica No. 2 – Gráfica de líneas del salario promedio diferenciado por sexo, rango y disciplina
#### 2.1. VISUALIZACIÓN NO. 1: LA BRECHA DE GÉNERO ENTRE SCHOLARS HOMBRES Y MUJERES POR RANGO JERÁRQUICO ####

## Mediante un boxplot se desea conocer cómo el promedio salarial de los últimos meses tiene diferencias entre hombres y mujeres
## para ello se quiere apreciar visualmente cómo esto se reproduce a nivel de las distintas jerárquias de vinculación laboral con la universidad

#windows(height = 10, width = 10)
#ggplot(Salaries, aes(x = rank, y = salary, fill = sex)) +
#geom_boxplot(position = position_dodge(width = 0.8)) +
#scale_fill_manual(values = c("Femenino" = "purple", "Masculino" = "lightblue")) +
#labs(
#title = "Asignación salarial promedio diferenciada entre hombres y mujeres según rango jerárquico",
#x = "Rango jerárquico",
#y = "Salario promedio (9 meses)"
#) +
#theme_minimal()
#print(ggplot)

#### 2.2. VISUALIZACIÓN NO. 2: LA BRECHA DE GÉNERO ENTRE SCHOLARS HOMBRES Y MUJERES POR RANGO JERÁRQUICO Y DISCIPLINA ####
  
## Mediante un gráfico de líneas se desea conocer la forma en la que se comporta la brecha salarial cuando no sólo se contempla
## la jerárquia sino también la disciplina. Lo anterior con fundamento en que la diferencias podrían estar asociadas con la concentración
# mujeres en la disciplina "Teóricas" o viceversa. No obstante, se observa que la brecha continua al analizar esta variable


#windows(height = 10, width = 10)

# Aquí se aplican colores para mantener la línea cromática con gráfica anterior. En general las mujeres serán representadas con tonos morados y los hombres con azules
#colores_lineas <- c(
#"Masculino - Teórica"   = "darkblue",  
#"Masculino - Aplicada"  = "lightblue", 
#"Femenino - Teórica" = "purple",    
#"Femenino - Aplicada"= "plum"
#)
  
# Así como en Excel, conviene colocar los marcadores con determinada configuración
# En este caso, las disciplinas teóricas con círculo (abstractas) y las aplicadas con triángulo (orientada a resultados)
#formas_puntos <- c(
#"Masculino - Teórica"   = 16, 
#"Masculino - Aplicada"  = 15, 
#"Femenino - Teórica" = 16, 
#"Femenino - Aplicada"= 15 
#)
  
  
# Generación del gráfico de líneas
#grafico_salarios_lineas <- ggplot(
#data = Salaries,
#aes(
#x = rank,                 
#y = salary,               
#group = sexo_disciplina,  # Agrupamos por sexo y disciplina
#color = sexo_disciplina,  # Basado en la agrupación se aplica el color
#shape = sexo_disciplina   # Basado en la agrupación varia el marcados
#)
#)+
  

# Aquí se calcula el promedio para la creación de las líneas
#stat_summary(
#fun = "mean",          # Esta línea le aplica el promedio a cada variable
#geom = "line",         
#linetype = "dashed",   
#size = 1               
#) +
  
# Aquí se calcula el promedio para la creación de los puntos
#stat_summary(
#fun = "mean",          
#geom = "point",        
#size = 3               
#) +
  
# Basado en los colores de la línea cromática del informe se aplican a la gráfica
#scale_color_manual(
#name = "Sexo y Disciplina",
#values = colores_lineas
#) +
  
# Aplicar las formas personalizadas definidas antes
#scale_shape_manual(
#name = "Sexo y Disciplina",
#values = formas_puntos
#) +


# Crear los títulos y etiquetas
#labs(
#title = "Asignación salarial promedio diferenciada entre hombres y mujeres por rango jerárquico y #disciplina",
#x = "Rango jerárquico",
#y = "Salario Promedio en Dólares (9 meses)"
#) +

#theme_bw() +
  
#theme(
#legend.position = "bottom",
#legend.title = element_text(face = "bold"), 
#plot.title = element_text(hjust = 0.5, face="bold"),
#plot.caption = element_text(hjust = 0, face = "italic") 
#)
  
#print(grafico_salarios_lineas)

Se podría argumentar que algunas diferencias estén explicadas por una dedicación de hombres o mujeres a ciertas disciplinas. En la Gráfica No. 2 vemos representados con líneas las diferencias salariales entre sexos por disciplina (teórica/aplicada) y rango jerárquico. Nuevamente se reproduce la situación de brecha, siendo más amplia para los académicos de las áreas teóricas, en las que las docentes asociadas y de planta obtienen un salario mucho menor que su colegas hombres. Si bien es cierto que, en el caso de las disciplinas aplicadas hay una mayor paridad, para los tres rangos siguen están a la cabeza salarial los docentes hombres. Aunque, vale destacar que en el rango de profesor asistente es donde se acercan más los datos salariales para los dos sexos. Podría especularse que en los docentes recién ingresados hay políticas e incentivos que mantienen una mejor paridad salarial.

Como se indicó atrás, la aparente brecha que se observa en anteriores plots puede ser solamente una faceta de la historia de logros académicos, representados en la forma de la experiencia en años de servicio a la universidad o años de experiencia investigativa después del PhD. Por tal motivo, se decidió evaluar mediante una gráfica de áreas superpuestas el efecto de la brecha de género considerando la experiencia. En la Gráfica No. 3 se puede observar cómo se comporta el salario en función de la experiencia entendida como años de servicio. El área azul muestra que salvo algunos rangos de experiencia entre los 20 y 30 años de servicio, son los hombres quienes tienen picos salariales más altos.

El área morada, que representa la relación salario/experiencia en años de servicio de las mujeres, queda casi totalmente traslapada y cubierta por la de los hombres, revelando que ellas incluso con la misma cantidad de experiencia tienen sueldos menores que sus colegas. En el mundo sin brechas, a misma cantidad de años de experiencia, sería lógico esperar una asignación salarial paritaria entre ambos sexos, pero en este gráfico vemos que las dos áreas se comportan diferente. Hay un aspecto sobresaliente, y es que no hay registros de mujeres con más de 40 años de servicio a la universidad. Por lo que, se podría mencionar que las políticas de reclutamiento de profesoras es algo relativamente novedoso en esta institución educativa.

Gráfico No. 3 - Brecha salarial de género respecto de la experiencia en años de servicio
Gráfico No. 3 - Brecha salarial de género respecto de la experiencia en años de servicio
Gráfica No. 4 - Brecha salarial de género respecto de la experiencia posterior a doctorarse
Gráfica No. 4 - Brecha salarial de género respecto de la experiencia posterior a doctorarse

Al aplicar el mismo procedimiento con los datos salariales en relación con los años transcurridos después de obtener el doctorado, se pueden ver algunos resultados similares. En la experiencia entre los 0 a 40 años después del PhD son los hombres quienes tienen mayor asignación salarial, salvo por un pequeño grupo de registros sobre los 25 años de trayectoria, en los que las mujeres muestran un mejor desempeño salarial. Otro pequeño grupo sobresale llegando al pico de los 40 años de experiencia investigativa. Como en la anterior gráfica, no hay mujeres con una trayectoria académica superior a 40 años, como sí lo hay en sus colegas hombres.

#### 2.3. VISUALIZACIÓN NO. 3: LA BRECHA DE GÉNERO ENTRE SCHOLARS DESDE LA PERSPECTIVA DE LA EXPERIENCIA Y AÑOS EN EJERCICIO ####

### Se aplicará un gráfico de áreas para ver la superposición entre las experiencias
### en años de servicio y años después del PhD para los profesores de ambos sexos


# Definición de la paleta de colores para la visualización

#colores_sexo <- c("Femenino" = "purple", "Masculino" = "deepskyblue")

# Generación del primer gráfico de área: Promedio del salario Vs. Experiencia en años de servicio

#plot_servicio <- ggplot(Salaries, aes(x = yrs.service, y = salary, fill = sex)) +
#stat_summary(
#fun = "mean",      # La variable objetivo que genera el área es el promedio del salario
#geom = "area",     
#position = "identity",
#alpha = 0.9 # Con la transparencia se permite ver de mejor manera las diferencias entre el promedio de #salario por género
#) +
  
#scale_fill_manual(
#name = "Sexo", # La leyenda lleva las etiquetas de esta variable
#values = colores_sexo # Aquí se aplica la paleta de colores definidos para la visualización
#) +

# Creación de los rotulos para los ejes y el título
#labs(
#title = "Brecha salarial de género 
#respecto de la experiencia en años de servicio",
#x = "Años de experiencia en años de servicio",
#y = "Salario Promedio en Dólares (9 meses)"
#) +
#theme_bw() +
#theme(plot.title = element_text(face = "bold", size = 16), legend.position = "bottom")

#print(plot_servicio)


# Generación del segundo gráfico de área: Promedio del salario Vs. Experiencia obtenida desde el PhD
#windows(height = 10, width = 10)
#plot_phd <- ggplot(Salaries, aes(x = yrs.since.phd, y = salary, fill = sex)) +
#stat_summary(
#fun = "mean",  # La variable objetivo que genera el área es el promedio del salario
#geom = "area",
#position = "identity",
#alpha = 0.9
#) +
#scale_fill_manual(
#name = "Sexo",
#values = colores_sexo
#) +

# Creación de los rotulos para los ejes y el título 

#labs(
#title = "Brecha salarial de género 
#respecto de la experiencia posterior a doctorarse",
#x = "Años transcurridos luego de alcanzar el PhD",
#y = "Salario Promedio en Dólares (9 meses)"
#) +
#theme_bw() +
#theme(plot.title = element_text(face = "bold", size = 16), legend.position = "bottom") # Leyenda abajo

#print(plot_phd)

# Combinar gráficos en un mismo panel

#combinados_area_plots_titulo <- combined_area_plots +
#plot_annotation(title = 'Gráficos de áreas superpuestas para analizar brecha entre salario y experiencia por #género',
#theme = theme(plot.title = element_text(face="bold", size=16, hjust = 0.5)))
#print(combinados_area_plots_titulo)

4.3. CORRELACIONES

Para poder tener una mejor aproximación cuantitativa de la brecha que se ha podido notar hasta el momento, se empleó una última visualización a partir de la correlación de Pearson. Se generó un gráfico en el que se correlacionan entre sí el salario, los años de servicio y los años después del PhD. Este análisis se evidencia en el Gráfico No.5, presentado a continuación. Como era de esperarse, basado en las anotaciones de la literatura y las vistas con otras gráficas, entre mayor cantidad de logros académicas basados en la experiencia en el servicio y en la investigación, mayor la remuneración salarial en ambos casos. No obstante, la pendiente de la recta es mayor para las mujeres, esto significa que linealmente cuesta más años de dedicación alcanzar una unidad adicional de remuneración. En el caso de los hombres está más cercana a los 45 grados, siendo una relación más proporcional entre años de experiencia adquiridos y remuneración. En términos númerico, la correlación salario/ años de servicio para los hombres es más alta, con 0,91, mientras que para las mujeres es 0,85.

Tabla No. 3 - Correlaciones para el salario, años de servicio y años después del PhD diferenciadas por sexo
Tabla No. 3 - Correlaciones para el salario, años de servicio y años después del PhD diferenciadas por sexo
Gráfica No. 5 - Correlaciones para el salario, años de servicio y años después del PhD diferenciadas por sexo
Gráfica No. 5 - Correlaciones para el salario, años de servicio y años después del PhD diferenciadas por sexo
#### 2.4. VISUALIZACIÓN NO. 4: LA BRECHA DE GÉNERO EN LA CORRELACIÓN DEL SALARIO Y LA EXPERIENCIA ####

## Mediante un gráfico de correlación de múltiples variables se desea entender cómo la experiencia en el servicio
## y la experiencia después de obtener el doctorados se asocian con el salario, y al mismo tiempo,
## comprender la diferenciación de esta relación por género


#windows(height = 20, width = 20)

# Me interesa generar una línea de corte basada en el promedio
## que muestre en cada caja los datos por encima y debajo de esta métrica

#overall_mean_salary <- mean(Salaries$salary, na.rm = TRUE)

## Retomo la paleta cromática del ejercicio

#colores_sexo <- c("Femenino" = "purple", "Masculino" = "deepskyblue")

# Generación de gráficos por pares de variables diferenciando por sexo

# Gráfico 4.1: Salario vs. Años en servicio

#plot_sal_serv <- ggplot(Salaries, aes(x = yrs.service, y = salary, color = sex)) +
#geom_point(alpha = 0.6) + 
#geom_smooth(method = "lm", se = FALSE, color = "black") + # Línea de tendencia lineal
#geom_hline(yintercept = overall_mean_salary, linetype = "dashed", color = "red") + # Línea de corte
#scale_color_manual(values = colores_sexo) +
#facet_wrap(~ sex) +
#labs(
#title = "Correlación entre el Salario 
#y los años de Servicio",
#x = "Años en servicio",
#y = "Salario Promedio en Dólares (9 meses)"
#) +
#theme_bw() +
#theme(legend.position = "bottom") 

# Gráfico 4.2: Salario vs. Años desde el doctorado

#plot_sal_phd <- ggplot(Salaries, aes(x = yrs.since.phd, y = salary, color = sex)) +
#geom_point(alpha = 0.6) +
#geom_smooth(method = "lm", se = FALSE, color = "black") +
#geom_hline(yintercept = overall_mean_salary, linetype = "dashed", color = "red") +
#scale_color_manual(values = colores_sexo) +
#facet_wrap(~ sex) +
#labs(
#title = "Correlación entre el Salario 
#y años desde el PhD",
#x = "Años transcurridos desde el PhD",
#y = "Salario Promedio en Dólares (9 meses)"
#) +
#theme_bw() +
#theme(legend.position = "none")

# Gráfico 4.3: Salario vs. Años desde el doctorado

#plot_serv_phd <- ggplot(Salaries, aes(x = yrs.since.phd, y = yrs.service, color = sex)) +
#geom_point(alpha = 0.6) +
#geom_smooth(method = "lm", se = FALSE, color = "black") +
#scale_color_manual(values = colores_sexo) +
#facet_wrap(~ sex) +
#labs(
#title = "Correlación años servicio 
#y años desde el PhD",
#x = "Años transcurridos desde el PhD",
#y = "Años en servicio"
#) +
#theme_bw() +
#theme(legend.position = "none")

# Combinar los tres gráficos de correlación en un mismo panel

#combined_plots <- plot_sal_serv + plot_sal_phd + plot_serv_phd +
#plot_layout(ncol = 3)

# Añadir un título general al panel combinado

#combinados_plots_titulo_correla <- combined_plots +
#plot_annotation(title = 'Matriz de correlación de múltiples variables diferenciadas por sexo')
#print(combinados_plots_titulo_correla)


# Generar correlación de Pearson a las tres variables cuantitativas

#variables_numericas <- c("salary", "yrs.service", "yrs.since.phd")

# Segmentar el dataframe para que cada variable se correlacione con el sexo

#lista_por_sexo <- split(Salaries[, c("sex", variables_numericas)], Salaries$sex)

# Aplicar la función de cálculo de la correlacion a cada par de datos del conjunto

#matrices_cor_lista <- lapply(lista_por_sexo, function(subset_df) {
  #datos_num <- subset_df[, variables_numericas]
  #cor(datos_num, method = "pearson", use = "pairwise.complete.obs")
#})

#print(matrices_cor_lista)

4.4. INDICADORES PROPIOS

Para poder comprender la situación se confeccionó un indicador para evaluar la ganancia que obtendría adicional cada profesor por los años adquiridos de servicio, para ello se operó un cociente entre el salario promedio por sexo / años de servicio por sexo. El indicador sugiere que por cada año adicional de servicio, una mujer ganaría USD $14.290 más, mientras que un hombre apenas ganaría USD $13.463. Este fenómeno es curioso y podría tener que ver con la vinculación de profesoras jóvenes al ejercicio dentro de esta universidad, quienes han podido mejorar sus ingresos en menor tiempo que sus colegas hombres. Por ahora no se tiene una explicación clara.

##### 3.1. INDICADORES PROPIOS ####

### PLANTEO DOS INDICADORES: 
## A) PROMEDIO SALARIAL POR GÉNERO / (AÑOS DE SERVICIO - AÑOS DESPUÉS DEL PHD)
## B) PROMEDIO SALARIAL POR GÉNERO / AÑOS DE SERVICIO

## El objetivo del primer indicador es intentar conocer una relación lineal entre 
## el incremento en años de servicio y el redito salarial resultante

## El objetivo del segundo indicador es intentar conocer una relación lineal entre 
## el incremento en años de servicio y el redito salarial resultante, 
## intentando aislar el efecto del tiempo posterior al PhD

## Identifique una desventaja muy grande: El segundo indicador genera valores en cero o negativos
## de modo que altera la división. Ello puede pasar porque al restar los años de servicio
## de los años posteriores al PhD, hay personas con dos situaciones extremas: 
## A) Obtuvieron hace mucho el PhD pero llevan pocos años de servicio (Genera resta negativa)
## B) Hace poco se graduaron y su vida de servicio en la universidad 
## empezo al mismo tiempo (Genera valores cercanos a cero)




#Salaries_con_indicadores <- Salaries %>%
#mutate(
  
# Cálculo para Indicador 1
#indicador_1 = if_else(yrs.service > 0, salary / yrs.service, NA_real_) # Se coloca condición que la división se efectue si la variable de años de servicio es positiva
#)

# Aquí se agrupan por sexo los indicadores y después se les aplica el promedio
#tabla_indicadores <- Salaries_con_indicadores %>%
#group_by(sex) %>%
#summarise(
# Promedio indicador 2 (Salario / (Servicio - PhD))
#Promedio_Indicador_1 = mean(indicador_1, na.rm = TRUE), # na.rm=TRUE ignora los NAs generados
#) %>%
#ungroup()


#print("Tabla de indicadores propios para analizar brechas salariales")
#print(tabla_indicadores)

5. CONCLUSIONES Y RECOMENDACIONES

Existen brechas salariales entre mujeres y hombres dentro del cuerpo profesoral de esta universidad. Las causas de dichas brechas no pueden ser explicadas causalmente porque el dataset es muy limitado, sin embargo, la evidencia muestra que la brecha permanece al controlar por rango jerárquico y disciplina del profesorado, así como también por años de servicio y de experiencia posterior al PhD. En futuros análisis se necesitarán tener mejores elementos del perfil del profesorado, incluyendo datos sociodemográficos, de cada facultad y de las políticas de la universidad, para llegar a conclusiones robustas, porque el presente análisis es de orden exploratorio.