Introducción

Introducción

La rotación de empleados es un desafío clave para las empresas, ya que impacta en costos y estabilidad organizacional. Este trabajo tiene como objetivo desarrollar un modelo de regresión logística para predecir la probabilidad de rotación de los empleados, basándose en variables como antigüedad, satisfacción laboral, salario y edad. Al identificar los factores más influyentes, se busca proporcionar a la gerencia herramientas para tomar decisiones estratégicas que permitan reducir la rotación, mejorar las condiciones laborales y retener talento clave, creando un ambiente de trabajo más estable y comprometido.

Análisis descriptivo

Variables

Acontinuación se describira las variables y su naturaleza.

  1. Rotación: Categórica. Indica si un empleado ha dejado o no la empresa (sí/no o 0/1).

  2. Edad: Cuantitativa. Representa la edad del empleado en años.

  3. Viaje de Negocios: Categórica. Indica si el empleado viaja por trabajo (“Frecuentemente”, “Raramente”, “No viaja”).

  4. Departamento: Categórica. Indica el departamento en el que trabaja el empleado (por ejemplo, “Recursos Humanos”, “Investigación y desarrollo”, “Ventas”).

  5. Distancia_Casa: Cuantitativa. Representa la distancia entre la casa y el lugar de trabajo en unidades como kilómetros.

  6. Educación: Cuantitativa ordinal. Donde según el nivel de educación se considera que uno es superior al otro (por ejemplo, Primaria < Secundaria).

  7. Campo_Educación: Categórica. Indica el área de estudio (por ejemplo, “Mercadeo”, “Ciencias”).

  8. Satisfacción_Ambiental: Cuantitativa ordinal. Se mide en una escala (por ejemplo, 1 a 5), reflejando el nivel de satisfacción.

  9. Género: Categórica. Indica el género del empleado (por ejemplo, “Masculino”, “Femenino”).

  10. Cargo: Categórica. Especifica el nivel o tipo de puesto (por ejemplo, “Director de investigación”, “}Gerente”).

  11. Satisfacción_Laboral: Cuantitativa ordinal. Similar a la satisfacción ambiental, esta en una escala de 1 a 5.

  12. Estado_Civil: Categórica. Indica el estado civil del empleado (por ejemplo, “Soltero”, “Casado”, “Divorciado”).

  13. Ingreso_Mensual: Cuantitativa. Representa el ingreso mensual del empleado en pesos colombianos.

  14. Trabajos_Anteriores: Cuantitativa. Representa el número de empleos que el empleado ha tenido antes del actual.

  15. Horas_Extra: Categórica. Indica si el empleado realiza horas extra (sí/no).

  16. Porcentaje_aumento_salarial: Cuantitativa. Representa el aumento salarial en porcentaje respecto al salario base.

  17. Rendimiento_Laboral: Cuantitativa ordinal. Se mide en una escala (por ejemplo, 1 a 5).

  18. Años_Experiencia: Cuantitativa. Representa la cantidad de años de experiencia laboral acumulada.

  19. Capacitaciones: Cuantitativa. Indica el número de capacitaciones realizadas por el empleado.

  20. Equilibrio_Trabajo_Vida: Cuantitativa ordinal. Se mide en una escala de satisfacción (por ejemplo, 1 a 5).

  21. Antigüedad: Cuantitativa. Representa los años que el empleado lleva en la empresa.

  22. Antigüedad_Cargo: Cuantitativa. Representa los años que el empleado lleva en su cargo actual.

  23. Años_ultima_promoción: Cuantitativa. Representa los años transcurridos desde la última promoción del empleado.

  24. Años_acargo_con_mismo_jefe: Cuantitativa. Representa los años que el empleado ha trabajado bajo el mismo jefe.

Análisis univariado

##   promedio desviación
## 1 6502.931   4707.957

Se observa que las ingreso del personal es de aproximadamente 6.5 millones de pesos con una desviación estándar de 4.7 millones, indicado que los ingresos en general varían de manera significativa, esto se puede explicar en gran proporción por el tipo de cargo del empleado.

g1=ggplot(data = base,mapping = aes(x=Ingreso_Mensual))+geom_histogram(fill="skyblue")+theme_bw()
ggplotly(g1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Se observa que la gran parte de los empleados se encuentra en el área de investigación de desarrollo, mientras que el departamento de ventas en aproximadamente la mitad del anterior y el departamento de recursos humanos es significativamente más pequeño.

Asimismo, los empleados son es más hombres que mujeres.

Finalmente, se encuentra que la distribución de la edad de los empleados tiene una forma normal con un ligero sesgo positivo.

Análisis bivariado

Se observa por otro lado una relación positiva (directa) entre los años de experiencia y los ingresos mensuales, esta relación tiene una fuerza alta ya que el coeficiente de correlación es de casi 0.8.

## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'
## [1] 0.7728932

Se observa por otro lado una relación positiva (directa) entre los años de antigüedad en la empresa y los ingresos mensuales, esta relación tiene una fuerza media ya que el coeficiente de correlación es de aproximadamente 0.5.

## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'
## [1] 0.5142848

Se observa que la distribución de ingresos según el género es bastante similar. Incluso las mujeres cuentan con una media superior y menos datos atípicos.

Modelos

Modelo 1

Este modelo de regresión logística utiliza características personales de los empleados (como Edad, Educación, Género, y Estado Civil) para predecir si un empleado dejará o no la organización (variable objetivo: Rotación). Se encuentra que el modelo1 tiene un desempeño mderado en su ROC y una pecisión de 83,95%. Asimismo, las variables Edad y Estado Civil (Soltero) son significativas y tienen un impacto importante en la probabilidad de rotación:

La edad reduce la probabilidad de rotación.

Los empleados solteros son más propensos a rotar en comparación con los casados.

## Generalized Linear Model 
## 
## 1177 samples
##    4 predictor
##    2 classes: 'No', 'Si' 
## 
## No pre-processing
## Resampling: Cross-Validated (2 fold) 
## Summary of sample sizes: 588, 589 
## Resampling results:
## 
##   ROC        Sens  Spec
##   0.6701297  1     0
## 
## Call:
## NULL
## 
## Coefficients:
##                        Estimate Std. Error z value Pr(>|z|)    
## (Intercept)            -0.42354    0.40973  -1.034    0.301    
## Edad                   -0.04558    0.01019  -4.471 7.77e-06 ***
## Educación              -0.01285    0.08212  -0.156    0.876    
## GeneroM                 0.23107    0.16943   1.364    0.173    
## Estado_CivilDivorciado -0.26265    0.24929  -1.054    0.292    
## Estado_CivilSoltero     0.84460    0.17928   4.711 2.46e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1040.54  on 1176  degrees of freedom
## Residual deviance:  974.55  on 1171  degrees of freedom
## AIC: 986.55
## 
## Number of Fisher Scoring iterations: 5
##           Real
## Prediccion  No  Si
##         No 246  47
## [1] "Precisión del modelo: 0.839590443686007"

Modelo 2

El modelo 2 tiene como objetivo predecir la rotación de empleados (Rotación) utilizando características relacionadas con el trabajo y el entorno laboral, tomado como variables predictoras las horas extras, años de expereincia, la satisfacción laboral, el equilibrio trabajo/vida y el procentage de aumento salarial. Este modelo tiene un mejor desempeño con respecto al anterior y es tiene una precisión un poco superior de 84,3%. Por otro lado, Horas Extras, Años de Experiencia, Satisfacción Laboral, y Equilibrio Trabajo-Vida tienen efectos significativos en la probabilidad de rotación:

Realizar horas extras aumenta la probabilidad de rotación.

A mayor experiencia, menor probabilidad de rotación.

Mejorar la satisfacción laboral y el equilibrio trabajo-vida reduce la probabilidad de rotación.

## Generalized Linear Model 
## 
## 1177 samples
##    5 predictor
##    2 classes: 'No', 'Si' 
## 
## No pre-processing
## Resampling: Cross-Validated (2 fold) 
## Summary of sample sizes: 588, 589 
## Resampling results:
## 
##   ROC        Sens       Spec      
##   0.7380522  0.9817526  0.08421053
## 
## Call:
## NULL
## 
## Coefficients:
##                             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                  0.68964    0.55234   1.249   0.2118    
## Horas_ExtraSi                1.42890    0.17232   8.292  < 2e-16 ***
## Años_Experiencia            -0.09120    0.01452  -6.280 3.38e-10 ***
## Satisfación_Laboral         -0.34471    0.07663  -4.498 6.85e-06 ***
## Equilibrio_Trabajo_Vida     -0.28977    0.11631  -2.491   0.0127 *  
## Porcentaje_aumento_salarial -0.02026    0.02329  -0.870   0.3842    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1040.5  on 1176  degrees of freedom
## Residual deviance:  904.3  on 1171  degrees of freedom
## AIC: 916.3
## 
## Number of Fisher Scoring iterations: 5
##           Real
## Prediccion  No  Si
##         No 243  43
##         Si   3   4
## [1] "Precisión del modelo: 0.843003412969283"

Discusión

A partir de los modelos propuestos surgen las siguientes estrategias para disminuir la rotación en la empresa. Especificamente los resultados del análisis del Modelo 2, indican que las siguientes variables fueron identificadas como significativas en su relación con la probabilidad de rotación de los empleados:

Horas Extra

Limitar las horas extra podría ser clave para reducir la rotación. Esto podría lograrse a través de la contratación adicional de personal para equilibrar la carga laboral.

Años de Experiencia

Implementar políticas de retención dirigidas a empleados más experimentados. Esto incluye reconocimiento y valorización de la experiencia laboral a través de planes de carrera o promociones internas. Beneficios exclusivos para empleados con mayor antigüedad, como días adicionales de vacaciones o bonos por años de servicio.

Satisfacción Laboral

Incrementar la satisfacción laboral mediante encuestas periódicas de satisfacción para identificar áreas de mejora y la creación de un ambiente de trabajo más inclusivo, colaborativo y orientado al bienestar del empleado.

Equilibrio Trabajo-Vida

Promover un equilibrio adecuado entre trabajo y vida personal con la implementación de políticas de trabajo flexible, como horarios adaptables o modalidad híbrida. Asimismo , se propone ofrecer servicios de apoyo, como acceso a programas de salud mental, gimnasio en la empresa o actividades recreativas.