1. Selección de variables

Selección de variables categóricas

  • Satisfacción laboral: Se espera que los empleados con menor satisfacción laboral tengan mayor probabilidad de cambiar de cargo. Esto debido a que a menor satisfacción laboral, mayor probabilidad de rotación.
  • Educación: El nivel educativo podría influir en la rotación, ya que empleados con mayor educación podrían buscar roles más altos y aumentar la probabilidad de rotación.
  • Horas extra: Los empleados que trabajan horas extras podrían cansarse más rápido y querer cambiar de cargo, aumentando la probabilidad de rotación.

Selección de variables cuantitativas

  • Antigüedad en el cargo: Los empleados con mayor antigüedad podrían sentirse más cómodos en su cargo y ser menos propensos a cambiar. Por lo cual, a mayor antigüedad en el cargo, menor probabilidad de rotación.
  • Ingreso mensual: Los empleados con salarios más bajos podrían tender a buscar nuevos cargos. Esto debido a que entre menor salario, mayor sería la probabilidad de rotación.
  • Distancia de la casa al trabajo: Se espera que empleados que viven lejos de su trabajo puedan estar más propensos a cambiar de cargo o empresa para mejorar su calidad de vida. Esto puesto que a mayor distancia, mayor probabilidad de rotación.

2. Análisis univariado (caracterización)

En este paso, se observa cómo se distribuyen los datos de cada variable seleccionada.

##  Satisfación_Laboral   Educación     Horas_Extra        Antigüedad_Cargo
##  Min.   :1.000       Min.   :1.000   Length:1470        Min.   : 0.000  
##  1st Qu.:2.000       1st Qu.:2.000   Class :character   1st Qu.: 2.000  
##  Median :3.000       Median :3.000   Mode  :character   Median : 3.000  
##  Mean   :2.729       Mean   :2.913                      Mean   : 4.229  
##  3rd Qu.:4.000       3rd Qu.:4.000                      3rd Qu.: 7.000  
##  Max.   :4.000       Max.   :5.000                      Max.   :18.000  
##  Ingreso_Mensual Distancia_Casa  
##  Min.   : 1009   Min.   : 1.000  
##  1st Qu.: 2911   1st Qu.: 2.000  
##  Median : 4919   Median : 7.000  
##  Mean   : 6503   Mean   : 9.193  
##  3rd Qu.: 8379   3rd Qu.:14.000  
##  Max.   :19999   Max.   :29.000

Observaciones:

3. Análisis bivariado

Se realiza una regresión logística para ver cómo las variables seleccionadas (satisfacción laboral, educación, horas extra, antigüedad, ingreso y distancia) afectan la probabilidad de que un empleado cambie de cargo (rotación).

## 
## Call:
## glm(formula = Rotación ~ Satisfación_Laboral + Educación + 
##     Horas_Extra + Antigüedad_Cargo + Ingreso_Mensual + Distancia_Casa, 
##     family = binomial, data = rotacion)
## 
## Coefficients:
##                       Estimate Std. Error z value Pr(>|z|)    
## (Intercept)         -6.044e-01  3.157e-01  -1.915  0.05553 .  
## Satisfación_Laboral -2.988e-01  6.812e-02  -4.387 1.15e-05 ***
## Educación           -2.127e-02  7.413e-02  -0.287  0.77411    
## Horas_ExtraSi        1.426e+00  1.544e-01   9.235  < 2e-16 ***
## Antigüedad_Cargo    -1.105e-01  2.652e-02  -4.167 3.08e-05 ***
## Ingreso_Mensual     -1.097e-04  2.324e-05  -4.722 2.33e-06 ***
## Distancia_Casa       2.898e-02  9.115e-03   3.180  0.00147 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1120.3  on 1463  degrees of freedom
## AIC: 1134.3
## 
## Number of Fisher Scoring iterations: 5

Los resultados indican lo siguiente:

4. Partición de los datos y estimación del modelo

El conjunto de datos se divide en dos partes: el 70% para entrenar el modelo y el 30% para probarlo. Luego, se ajusta nuevamente un modelo de regresión logística para predecir la rotación.

## 
## Call:
## glm(formula = Rotación ~ Satisfación_Laboral + Educación + 
##     Horas_Extra + Antigüedad_Cargo + Ingreso_Mensual + Distancia_Casa, 
##     family = binomial, data = train)
## 
## Coefficients:
##                       Estimate Std. Error z value Pr(>|z|)    
## (Intercept)         -4.430e-01  3.901e-01  -1.136 0.256021    
## Satisfación_Laboral -2.820e-01  8.164e-02  -3.454 0.000552 ***
## Educación           -1.838e-02  8.932e-02  -0.206 0.836934    
## Horas_ExtraSi        1.314e+00  1.863e-01   7.052 1.77e-12 ***
## Antigüedad_Cargo    -9.934e-02  3.159e-02  -3.145 0.001663 ** 
## Ingreso_Mensual     -1.366e-04  2.966e-05  -4.605 4.13e-06 ***
## Distancia_Casa       2.275e-02  1.110e-02   2.049 0.040424 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 896.03  on 1028  degrees of freedom
## Residual deviance: 772.87  on 1022  degrees of freedom
## AIC: 786.87
## 
## Number of Fisher Scoring iterations: 5

Observaciones: A pesar de que haya una variación en el p-value los resultados son similares a los del análisis anterior, donde la satisfacción laboral y las horas extra son factores importantes en la rotación.

5. Evaluación del modelo (curva ROC y AUC)

La curva ROC muestra cómo de bien el modelo distingue entre los empleados que van a cambiar de cargo y los que no.

## Type 'citation("pROC")' for a citation.
## 
## Attaching package: 'pROC'
## The following objects are masked from 'package:stats':
## 
##     cov, smooth, var
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases

## Area under the curve: 0.7473

El AUC (Área bajo la curva) es de 0.7473, lo que significa que el modelo tiene un poder predictivo moderado, no perfecto pero bastante útil para ayudar a la empresa a prever la rotación.

6. Conclusiones

  1. Satisfacción laboral: La satisfacción laboral es clave. Los empleados que están menos satisfechos con su trabajo tienen más probabilidades de cambiar de puesto. Esto confirma la idea inicial de que si no están contentos, es más probable que busquen otro cargo.

  2. Educación: El nivel de educación de los empleados no parece influir mucho en si cambian de cargo o no. Se cree que las personas con más estudios podrían buscar puestos más altos, pero los datos no muestran que esto sea significativo para este caso.

  3. Horas extra: Los empleados que hacen horas extra tienen más posibilidades de cambiar de puesto. Esto sugiere que el agotamiento por trabajar más tiempo puede hacer que quieran cambiar de cargo.

  4. Antigüedad en el cargo: Aquellos que llevan más tiempo en su cargo son menos propensos a cambiar. Esto también tiene sentido, ya que las personas con más antigüedad tienden a estar más cómodas y a buscar menos cambios.

  5. Salario: Los empleados con salarios más altos son menos propensos a cambiar de cargo. Esto confirma nuestra suposición de que las personas que ganan menos son las que probablemente buscan otro puesto para mejorar su situación económica.

  6. Distancia al trabajo: Vivir lejos del trabajo aumenta las posibilidades de que alguien quiera cambiar de puesto. Esto también es lógico, ya que desplazarse largas distancias puede ser incómodo, y es probable que busquen un cambio para mejorar su calidad de vida.

  7. Poder del modelo para predecir: El modelo que creamos para predecir quién va a cambiar de cargo funciona de forma razonable, con un nivel de precisión moderado. No es perfecto, pero sí es útil para distinguir entre los empleados que probablemente cambiarán de cargo y los que no.

Estrategias para reducir la rotación:

Para que los empleados no cambien tanto de puesto, la empresa debería enfocarse en mejorar la satisfacción laboral, ya que es uno de los factores más importantes. Mejorar el ambiente de trabajo, dar más oportunidades de crecimiento y evitar que trabajen demasiadas horas extra pueden ayudar. Además, aumentar los salarios y facilitar el transporte o permitir trabajo desde casa a los que viven más lejos podría ayudar a que los empleados se queden más tiempo en sus cargos.