En este paso, se observa cómo se distribuyen los datos de cada variable seleccionada.
## Satisfación_Laboral Educación Horas_Extra Antigüedad_Cargo
## Min. :1.000 Min. :1.000 Length:1470 Min. : 0.000
## 1st Qu.:2.000 1st Qu.:2.000 Class :character 1st Qu.: 2.000
## Median :3.000 Median :3.000 Mode :character Median : 3.000
## Mean :2.729 Mean :2.913 Mean : 4.229
## 3rd Qu.:4.000 3rd Qu.:4.000 3rd Qu.: 7.000
## Max. :4.000 Max. :5.000 Max. :18.000
## Ingreso_Mensual Distancia_Casa
## Min. : 1009 Min. : 1.000
## 1st Qu.: 2911 1st Qu.: 2.000
## Median : 4919 Median : 7.000
## Mean : 6503 Mean : 9.193
## 3rd Qu.: 8379 3rd Qu.:14.000
## Max. :19999 Max. :29.000
Observaciones:
Se realiza una regresión logística para ver cómo las variables seleccionadas (satisfacción laboral, educación, horas extra, antigüedad, ingreso y distancia) afectan la probabilidad de que un empleado cambie de cargo (rotación).
##
## Call:
## glm(formula = Rotación ~ Satisfación_Laboral + Educación +
## Horas_Extra + Antigüedad_Cargo + Ingreso_Mensual + Distancia_Casa,
## family = binomial, data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -6.044e-01 3.157e-01 -1.915 0.05553 .
## Satisfación_Laboral -2.988e-01 6.812e-02 -4.387 1.15e-05 ***
## Educación -2.127e-02 7.413e-02 -0.287 0.77411
## Horas_ExtraSi 1.426e+00 1.544e-01 9.235 < 2e-16 ***
## Antigüedad_Cargo -1.105e-01 2.652e-02 -4.167 3.08e-05 ***
## Ingreso_Mensual -1.097e-04 2.324e-05 -4.722 2.33e-06 ***
## Distancia_Casa 2.898e-02 9.115e-03 3.180 0.00147 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1120.3 on 1463 degrees of freedom
## AIC: 1134.3
##
## Number of Fisher Scoring iterations: 5
Los resultados indican lo siguiente:
El conjunto de datos se divide en dos partes: el 70% para entrenar el modelo y el 30% para probarlo. Luego, se ajusta nuevamente un modelo de regresión logística para predecir la rotación.
##
## Call:
## glm(formula = Rotación ~ Satisfación_Laboral + Educación +
## Horas_Extra + Antigüedad_Cargo + Ingreso_Mensual + Distancia_Casa,
## family = binomial, data = train)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.430e-01 3.901e-01 -1.136 0.256021
## Satisfación_Laboral -2.820e-01 8.164e-02 -3.454 0.000552 ***
## Educación -1.838e-02 8.932e-02 -0.206 0.836934
## Horas_ExtraSi 1.314e+00 1.863e-01 7.052 1.77e-12 ***
## Antigüedad_Cargo -9.934e-02 3.159e-02 -3.145 0.001663 **
## Ingreso_Mensual -1.366e-04 2.966e-05 -4.605 4.13e-06 ***
## Distancia_Casa 2.275e-02 1.110e-02 2.049 0.040424 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 896.03 on 1028 degrees of freedom
## Residual deviance: 772.87 on 1022 degrees of freedom
## AIC: 786.87
##
## Number of Fisher Scoring iterations: 5
Observaciones: A pesar de que haya una variación en el p-value los resultados son similares a los del análisis anterior, donde la satisfacción laboral y las horas extra son factores importantes en la rotación.
La curva ROC muestra cómo de bien el modelo distingue entre los empleados que van a cambiar de cargo y los que no.
## Type 'citation("pROC")' for a citation.
##
## Attaching package: 'pROC'
## The following objects are masked from 'package:stats':
##
## cov, smooth, var
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
## Area under the curve: 0.7473
El AUC (Área bajo la curva) es de 0.7473, lo que significa que el modelo tiene un poder predictivo moderado, no perfecto pero bastante útil para ayudar a la empresa a prever la rotación.
Satisfacción laboral: La satisfacción laboral es clave. Los empleados que están menos satisfechos con su trabajo tienen más probabilidades de cambiar de puesto. Esto confirma la idea inicial de que si no están contentos, es más probable que busquen otro cargo.
Educación: El nivel de educación de los empleados no parece influir mucho en si cambian de cargo o no. Se cree que las personas con más estudios podrían buscar puestos más altos, pero los datos no muestran que esto sea significativo para este caso.
Horas extra: Los empleados que hacen horas extra tienen más posibilidades de cambiar de puesto. Esto sugiere que el agotamiento por trabajar más tiempo puede hacer que quieran cambiar de cargo.
Antigüedad en el cargo: Aquellos que llevan más tiempo en su cargo son menos propensos a cambiar. Esto también tiene sentido, ya que las personas con más antigüedad tienden a estar más cómodas y a buscar menos cambios.
Salario: Los empleados con salarios más altos son menos propensos a cambiar de cargo. Esto confirma nuestra suposición de que las personas que ganan menos son las que probablemente buscan otro puesto para mejorar su situación económica.
Distancia al trabajo: Vivir lejos del trabajo aumenta las posibilidades de que alguien quiera cambiar de puesto. Esto también es lógico, ya que desplazarse largas distancias puede ser incómodo, y es probable que busquen un cambio para mejorar su calidad de vida.
Poder del modelo para predecir: El modelo que creamos para predecir quién va a cambiar de cargo funciona de forma razonable, con un nivel de precisión moderado. No es perfecto, pero sí es útil para distinguir entre los empleados que probablemente cambiarán de cargo y los que no.
Para que los empleados no cambien tanto de puesto, la empresa debería enfocarse en mejorar la satisfacción laboral, ya que es uno de los factores más importantes. Mejorar el ambiente de trabajo, dar más oportunidades de crecimiento y evitar que trabajen demasiadas horas extra pueden ayudar. Además, aumentar los salarios y facilitar el transporte o permitir trabajo desde casa a los que viven más lejos podría ayudar a que los empleados se queden más tiempo en sus cargos.