Paola Andrea León Acosta
La siguiente base de datos resulta de la medición de rotación de empleados de una empresa que esta interesada en identificar las varibles que inciden en la renuncia, cabe aclarar que la rotación no se debe a causa de despido, sino como decisión de los empleados. La variable de interés es “Rotación” que toma valores de “sí” o “no”, y en este ejercicio se realizará un análisis descriptivo para identificar los posibles factores que esten relacionados con esta decisión.
Cargue de la base de datos:
library(readxl)
datos = read_excel("C:/Users/paolaleon12/Documents/Maestria Ciencia de datos/Semestre I/Metodos y simulacion estadistica/Unidad 1/Datos_Rotacion.xlsx")
names(datos)
## [1] "Rotación" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfación_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Años_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Años_ultima_promoción" "Años_acargo_con_mismo_jefe"
1. Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación.
Variables categóricas:
A. Satisfacción laboral: Se espera que la satisfacción laboral esté relacionada con la rotación, ya que, si hay un nivel de satisfacción bajo, la persona buscará un nuevo trabajo, ocasionando la renuncia.
B. Educación: Se espera que la educación esté relacionada con la rotación, ya que, entre un nivel educativo más alto, la persona tendrá más ofertas laborales y cambiaría de trabajo, ocasionando la renuncia.
C. Equilibrio trabajo vida: Se espera que la variable equilibrio de trabajo y vida este relacionada con la rotación ya que entre más bajo sea este equilibrio, habrían más renuncias ya que los empleados buscarían un nuevo trabajo donde puedan compartir más con su familia.
Variables cuantitativas
D. Ingreso mensual: Se espera que haya una relación indirecta entre el ingreso y la rotacón, de esta forma, se espera mayor rotación en las personas con ingresos mensuales más bajos.
E. Edad: Se espera que la edad esté relacionada con la rotación, ya que las personas más jóvenes tienen menos obligaciones, y son más abiertos a cambios. Por lo cual, se presentaría mas rotación en los empleados más jovenes.
F. Porcentaje aumento salarial: Se espera que haya una mayor rotación en las personas que tuvieron un porcentaje de aumento salarial menor, ya que no ven una mejora en la compensación.
2. Realizar un análisis univariado (caracterización).
Análisis univariado variables categóricas
En la gráfica B se evidencia que la mayoría de empleados tienen una carrera universitaria de pregrado que corresponde al 39% de los empleados, seguido por profesionales con maestría que representan el 27%, y solamente el 3% de los empleados tienen doctorado. En la gráfica C se identifica que hay una alta concentración de empleados que consideran que el equilibrio entre el trabajo y la vida personal es muy bueno, ya que corresponde aproximadamente al 60% de los empleados, y el 23.4% consideran que este equilibrio es bueno, cabe destacar que solamente el 5% consideran que el nivel de equilibrio entre trabajo y vida es bajo. En cuanto a la satisfacción laboral se puede observar que más del 61% de los empleados consideran que su satisfacción está en las categorías de alto y muy alto, y que el 19.7% piensan que su satisfacción laboral es baja.
En las gráficas y tablas podemos realizar una revisión preliminar de las variables categóricas que pueden estar relacionadas con la rotación, de esta forma, se puede inferir que posiblemente la satisfacción laboral y el equilibro entre el trabajo y vida pueden incidir en la decisión de los empleados. En primer lugar, se observa una diferencia alta en el porcentaje de trabajadores que renunciaron y los que no renunciaron en las categorías de satisfacción laboral baja (renunciaron=27.8% - no renunciaron=18.1%) y muy alta (renunciaron=21.9% - no renunciaron=33%); y en segundo lugar, también se identifica una diferencia significativa de este porcentaje de renuncias en las categorías de bajo (renunciaron=10.5% - no renunciaron=4.5%) y muy bueno (renunciaron=53.6% - no renunciaron=62.1%) para la variable equilibrio trabajo y vida.
require(ggplot2)
## Loading required package: ggplot2
require(ggpubr)
## Loading required package: ggpubr
g4=ggplot(datos,aes(x=Satisfación_Laboral, fill=Rotación))+geom_bar()+theme_bw()
g5=ggplot(datos,aes(x=Educación, fill=Rotación))+geom_bar()+theme_bw()
g6=ggplot(datos,aes(x=Equilibrio_Trabajo_Vida, fill=Rotación))+geom_bar()+theme_bw()
ggarrange(g4, g5, g6, labels = c("A", "B", "c"),ncol = 2, nrow = 2)
y <- table1::table1(~ factor(Satisfación_Laboral)+factor(Educación)+factor(Equilibrio_Trabajo_Vida) | Rotación, data = datos)
y
| No (N=1233) |
Si (N=237) |
Overall (N=1470) |
|
|---|---|---|---|
| factor(Satisfación_Laboral) | |||
| 1 | 223 (18.1%) | 66 (27.8%) | 289 (19.7%) |
| 2 | 234 (19.0%) | 46 (19.4%) | 280 (19.0%) |
| 3 | 369 (29.9%) | 73 (30.8%) | 442 (30.1%) |
| 4 | 407 (33.0%) | 52 (21.9%) | 459 (31.2%) |
| factor(Educación) | |||
| 1 | 139 (11.3%) | 31 (13.1%) | 170 (11.6%) |
| 2 | 238 (19.3%) | 44 (18.6%) | 282 (19.2%) |
| 3 | 473 (38.4%) | 99 (41.8%) | 572 (38.9%) |
| 4 | 340 (27.6%) | 58 (24.5%) | 398 (27.1%) |
| 5 | 43 (3.5%) | 5 (2.1%) | 48 (3.3%) |
| factor(Equilibrio_Trabajo_Vida) | |||
| 1 | 55 (4.5%) | 25 (10.5%) | 80 (5.4%) |
| 2 | 286 (23.2%) | 58 (24.5%) | 344 (23.4%) |
| 3 | 766 (62.1%) | 127 (53.6%) | 893 (60.7%) |
| 4 | 126 (10.2%) | 27 (11.4%) | 153 (10.4%) |
Análisis univariado variables cuantitativas
En la gráfica D se evidencia que la mayoría de empleados tienen un ingreso mensual entre COP 1 millón y COP 6 millones, el sesgo positivo en esta grafica indica que hay muy pocos empleados que tiene salarios superiores a los COP 10 millones. En la gráfica F se observa que para la mayoría de empleados el último incremento salarial fue inferior al 15%, y este histograma también tiene una asimetría positiva con la que podemos inferir que muy pocos empleados tuvieron un aumento salarial superior al 15%. Adicionalmente, en la gráfica E se evidencia que la variable edad presenta una concentración en el rango de 25 a 45 años, lo que indica que la mayoria de los empleados de esta empresa estan en ese rango de edad.
En base a las gráficas y tablas podemos realizar una revisión preliminar de las variables cuantitativas que pueden estar relacionadas con la rotación, de esta forma, podemos inferir que la edad y el ingreso mensual podrían incidir en la decisión de los empleados. Se evidencia una diferencia significativa en las medias entre el grupo de empleados que renunciaron y los que no renunciaron para estas dos variables; sin embargo, se debe considerar la desviación estándar que para ambas variables es muy alta y que hace que las medias calculadas sean menos confiables.
g1=ggplot(datos,aes(x=Edad, fill=Rotación))+geom_histogram(bins=30)+theme_bw()
g2=ggplot(datos,aes(x=Ingreso_Mensual, fill=Rotación))+geom_histogram(bins=30)+theme_bw()
g3=ggplot(datos,aes(x=Porcentaje_aumento_salarial, fill=Rotación))+geom_histogram(bins=30)+theme_bw()
ggarrange(g2, g1, g3, labels = c("D", "E", "F"),ncol = 2, nrow = 2)
y <- table1::table1(~Edad+Ingreso_Mensual+Porcentaje_aumento_salarial|Rotación, data = datos)
y
| No (N=1233) |
Si (N=237) |
Overall (N=1470) |
|
|---|---|---|---|
| Edad | |||
| Mean (SD) | 37.6 (8.89) | 33.6 (9.69) | 36.9 (9.14) |
| Median [Min, Max] | 36.0 [18.0, 60.0] | 32.0 [18.0, 58.0] | 36.0 [18.0, 60.0] |
| Ingreso_Mensual | |||
| Mean (SD) | 6830 (4820) | 4790 (3640) | 6500 (4710) |
| Median [Min, Max] | 5200 [1050, 20000] | 3200 [1010, 19900] | 4920 [1010, 20000] |
| Porcentaje_aumento_salarial | |||
| Mean (SD) | 15.2 (3.64) | 15.1 (3.77) | 15.2 (3.66) |
| Median [Min, Max] | 14.0 [11.0, 25.0] | 14.0 [11.0, 25.0] | 14.0 [11.0, 25.0] |
3. Realizar un análisis de bivariado en donde la variable respuesta sea la rotación, con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar. Compare estos resultados con la hipótesis planteada en el punto 1.
Análisis bivariado variables categóricas
A. Satisfacción laboral: Se observa que hay una diferencia significativa en la proporción de empleados que si rotaron para las categorías de satisfacción laboral baja y muy alta, una rotación de 23% versus una rotación de 11%, respectivamente. Esto también se puede confirmar en la prueba de hipótesis chi cuadrada, ya que con un nivel de confianza del 95%, se rechaza la hipótesis nula y podemos sostener que en esta empresa la rotación si depende del nivel de satisfacción laboral, es decir, se presentan más renuncias cuando el nivel de satisfacción laboral es mas bajo.
require(CGPfunctions)
## Loading required package: CGPfunctions
PlotXTabs2(data = datos,x = Satisfación_Laboral,y = Rotación)
B. Educación: No se identifican diferencias significativas en la proporción de rotación para las categorías de educación. Adicionalmente, no se rechaza la hipótesis nula con un nivel de confianza del 95%, por lo tanto, podemos concluir que la variable educación no es significativa para explicar la rotación.
PlotXTabs2(data = datos,x = Educación,y = Rotación)
C. Equilibrio trabajo y vida: Se evidencia que hay una diferencia significativa en la proporción de empleados que si rotaron para las categorías de la variable equilibrio laboral y vida, por ejemplo, la rotación en la categoría mala fue de 31% frente a un 14% de rotación en la categoría buena. También se rechaza la hipótesis nula con un nivel de confianza del 95%, por lo cual, podemos afirmar que en esta empresa la rotación si depende de la variable equilibrio trabajo y vida, es decir, que a un menor equilibrio entre el trabajo y la vida personal, se presentan más renuncias.
PlotXTabs2(data = datos,x = Equilibrio_Trabajo_Vida,y = Rotación)
Análisis bivariado variables cuantitativas
D. Ingreso mensual: En el boxplot se puede identificar una diferencia significativa en la distribución de ingresos frente a la variable rotación, ya que se puede ver que los que si rotaron tienen ingresos inferiores y la mediana de los ingresos es inferior en este grupo; esto también se puede confirmar con la prueba de hipótesis T student, ya que con un nivel de confianza del 95%, se rechaza la hipótesis nula y podemos sostener que en esta empresa la rotación si depende de los ingresos mensuales, es decir, se presenta más rotación cuando el ingreso mensual es más bajo.
t.test(datos$Ingreso_Mensual~datos$Rotación)
##
## Welch Two Sample t-test
##
## data: datos$Ingreso_Mensual by datos$Rotación
## t = 7.4826, df = 412.74, p-value = 4.434e-13
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 1508.244 2583.050
## sample estimates:
## mean in group No mean in group Si
## 6832.740 4787.093
ggplot(datos,aes(Rotación, Ingreso_Mensual,fill= Rotación))+geom_boxplot(width=0.5)
E. Edad: De acuerdo con el boxplot y la prueba de hipótesis, se puede concluir que la edad si es una variable significativa para explicar la rotación, ya que se rechaza la hipótesis nula con un nivel de confianza del 95%, lo cual indica que si se presenta una mayor rotación en los empleados más jóvenes como se evidencia en el boxplot, ya que la mediana de edad de los empleados que renunciaron es menor que la mediana de los empleados que no rotaron.
t.test(datos$Edad~datos$Rotación)
##
## Welch Two Sample t-test
##
## data: datos$Edad by datos$Rotación
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si
## 37.56123 33.60759
ggplot(datos, aes(Rotación, Edad, fill = Rotación))+geom_boxplot(width=0.5)
F. Porcentaje aumento salarial: En base al boxplot y a la prueba de hipótesis, se puede concluir que la rotación no depende del porcentaje de incremento salarial, ya que no se identifica una diferencia significativa en la distribución ni en la mediana del porcentaje del incremento salarial entre ambos grupos, y además no se rechaza la hipótesis nula con un nivel de confianza del 95%.
t.test(datos$Porcentaje_aumento_salarial~datos$Rotación)
##
## Welch Two Sample t-test
##
## data: datos$Porcentaje_aumento_salarial by datos$Rotación
## t = 0.50424, df = 326.11, p-value = 0.6144
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## -0.3890709 0.6572652
## sample estimates:
## mean in group No mean in group Si
## 15.23114 15.09705
ggplot(datos, aes(Rotación,Porcentaje_aumento_salarial, fill = Rotación))+geom_boxplot(width=0.5)
4. En las conclusiones se discute sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).
Se puede concluir que las variables cualitativas que pueden explicar la rotación de los empleados de esta empresa son la satisfacción laboral y el equilibrio entre el trabajo y la vida personal, de igual forma, las variables cuantitativas que tienen relación con esta decisición son la edad y el ingreso mensual; con base a estas variables, se pueden implementar las siguientes estrategias para disminuir la rotación:
Para mejorar la satisfacción laboral, en primer lugar, se puede desarrollar una cultura donde se reconoce un trabajo bien hecho para hacer que los empleados se sientan más valorados y crear un ambiente más positivo y, en segundo lugar, crear oportunidades de crecimiento en donde los empleados se enfrenten a nuevos desafíos y responsabilidades, de esta forma se puedan sentir más comprometidos con la empresa y también se demuestra que valoran sus habilidades.
En cuanto al equilibrio entre el trabajo y la vida personal, primero se debe hacer un estudio de carga laboral e identificar esas tareas operativas que se pueden automatizar para disminuir el tiempo de ejecución, además realizar una distribución de funciones más equilibrada, realizar capacitaciones de gestión de tiempo y actividades, y también implementar una cultura en donde se respeten los horarios.
Con repecto al ingreso mensual, la empresa podría hacer un estudio de mercado, en donde se evalué los salarios en base a las funciones, experiencia y sector, de esta forma implementar salarios que sean más competitivos en el mercado laboral; otra propuesta es entregar beneficios diferentes al salario, como lo son el trabajo remoto, horarios flexibles, y auxilios de estudio y de salud.
Para retener el talento joven se pueden implementar estrategias como la flexibilidad en los horarios de trabajo, trabajo remoto, oportunidades de crecimiento y desarrollo, también salarios competitivos y justos, además de garantizar una cultura organizacional que apueste por la diversidad e inclusión, y planes de aprendizaje y capacitaciones.