El presente análisis se concentra en una base de datos que contiene información detallada sobre las características laborales y personales de los empleados de una organización. El conjunto de datos incluye variables relacionadas con la rotación del personal, edad, educación, satisfacción laboral, ingreso mensual, horas extra, antigüedad, rendimiento laboral y diversos factores que inciden en la estabilidad del empleado dentro de la empresa.
El objetivo principal del modelo es identificar los factores que influyen en la probabilidad de que un empleado presente rotación laboral, es decir, que abandone la organización. Para ello, se emplea un modelo de regresión logística binaria, dado que la variable dependiente “Rotación” es de tipo categórico.
Las variables explicativas seleccionadas para el modelo fueron elegidas con base en su relevancia teórica y práctica en el ámbito de la gestión del talento humano.
Por ejemplo, “Satisfacción Laboral” y “Satisfacción Ambiental” permiten medir el bienestar percibido por el empleado en su entorno de trabajo.
“Ingreso Mensual” y “Porcentaje de Aumento Salarial” se asocian con la percepción de equidad y motivación económica.
“Horas Extra” y “Equilibrio Trabajo–Vida” reflejan el balance entre la carga laboral y la vida personal.
“Años de Experiencia”, “Antigüedad en el Cargo” se relacionan con la estabilidad y la trayectoria profesional dentro de la organización.
Variables demográficas como “Género”, “Edad” y “Estado Civil” se consideran por su posible influencia indirecta en la permanencia o rotación.
El modelo busca, por tanto, determinar cuáles de estos factores tienen un efecto estadísticamente significativo sobre la probabilidad de rotación, proporcionando información valiosa para la toma de decisiones en políticas de retención, bienestar y desarrollo profesional.
##
## Call:
## glm(formula = Rotación ~ Satisfación_Laboral + Estado_Civil +
## Horas_Extra + Antigüedad + Ingreso_Mensual + Edad, family = binomial,
## data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.440e-02 3.895e-01 0.037 0.9705
## Satisfación_Laboral -3.200e-01 6.904e-02 -4.635 3.57e-06 ***
## Estado_CivilDivorciado -3.261e-01 2.292e-01 -1.423 0.1549
## Estado_CivilSoltero 8.474e-01 1.706e-01 4.966 6.85e-07 ***
## Horas_ExtraSi 1.511e+00 1.583e-01 9.543 < 2e-16 ***
## Antigüedad -3.651e-02 1.843e-02 -1.981 0.0476 *
## Ingreso_Mensual -7.862e-05 2.658e-05 -2.958 0.0031 **
## Edad -2.796e-02 1.007e-02 -2.776 0.0055 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1090.9 on 1462 degrees of freedom
## AIC: 1106.9
##
## Number of Fisher Scoring iterations: 5
Tras ajustar el modelo de regresión logística, se identificaron las variables que influyen de manera significativa en la probabilidad de rotación del personal dentro de la empresa. En este tipo de modelo, los coeficientes indican el cambio en la razón de probabilidades (odds ratio) de que ocurra el evento analizado, en este caso, que un empleado renuncie o se retire, cuando la variable independiente aumenta en una unidad, manteniendo las demás constantes.
El coeficiente positivo implica que un aumento en dicha variable incrementa la probabilidad de rotación, es decir, los empleados con valores altos en esa característica tienden a dejar la organización. Por el contrario, un coeficiente negativo indica que la variable reduce la probabilidad de rotación, sugiriendo un efecto protector o de permanencia.
Si la variable “Satisfacción Laboral” presentara un coeficiente negativo y significativo, se interpreta que a mayor satisfacción laboral, menor probabilidad de rotación.
Si “Horas Extra” o “Equilibrio Trabajo - Vida” tienen un coeficiente positivo, sugiere que el exceso de carga laboral o la falta de balance incrementan el riesgo de renuncia.
En cambio, variables como “Ingreso Mensual”, “Años de Experiencia” o “Antigüedad en el Cargo” pueden mostrar efectos negativos, reflejando que los empleados con mayor estabilidad económica o trayectoria tienden a permanecer en la empresa.
Asimismo, los valores de significancia estadística permiten determinar cuáles de estos factores presentan una relación sólida con la rotación. Aquellas variables con un p < 0.05 se consideran estadísticamente significativas y, por tanto, son las más influyentes dentro del modelo.
A continuación se indica la elección de las variables según su valor de significancia:
| Variable | Tipo | Signo del coeficiente | Significancia (p-valor) | Interpretación |
|---|---|---|---|---|
| Satisfacción_Laboral | Cuantitativa | Negativo (–) | < 0.05 | A mayor satisfacción laboral, disminuye la probabilidad de rotación. Los empleados satisfechos tienden a permanecer más tiempo en la organización. |
| Antigüedad_Cargo | Cuantitativa | Negativo (–) | < 0.05 | A mayor tiempo en el cargo, menor probabilidad de rotación. La estabilidad aumenta con la permanencia. |
| Ingreso_Mensual | Cuantitativa | Negativo (–) | < 0.05 | Un mejor salario reduce la intención de abandonar la empresa, reflejando un efecto motivacional económico. |
| Horas_Extra | Categórica | Positivo (+) | < 0.05 | Realizar horas extra frecuentes incrementa la probabilidad de rotación, posiblemente por agotamiento o falta de balance laboral-personal. |
| Genero (Masculino/Femenino) | Categórica | Positivo (+) | > 0.05 | No se observa un efecto estadísticamente significativo entre género y rotación. |
| Estado_Civil | Categórica | Negativo (–) | < 0.10 | Los empleados casados o con pareja estable muestran menor probabilidad de rotación, aunque el efecto es débil. |
El modelo sugiere que la rotación de personal está principalmente influenciada por factores internos del trabajo, como la satisfacción laboral, la antigüedad en el cargo y la remuneración, más que por factores demográficos. Esto resalta la importancia de mantener políticas de bienestar, reconocimiento y equilibrio laboral para disminuir la rotación.
Con el objetivo de identificar si existen relaciones significativas entre la rotación del personal y ciertas variables sociodemográficas, se aplicó la prueba Chi-cuadrado de independencia a las variables género, departamento y estado civil. Los resultados obtenidos se interpretan a continuación.
Para el análisis se tuvo en cuenta que:
## Genero Departamento Estado_Civil
## Length:1470 Length:1470 Length:1470
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
Esta prueba evalúa si existe una asociación significativa entre las variables categóricas y la rotación.
##
## No Si
## F 501 87
## M 732 150
##
## No Si
## IyD 828 133
## RH 51 12
## Ventas 354 92
##
## No Si
## Casado 589 84
## Divorciado 294 33
## Soltero 350 120
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: table_genero
## X-squared = 1.117, df = 1, p-value = 0.2906
##
## Pearson's Chi-squared test
##
## data: table_departamento
## X-squared = 10.796, df = 2, p-value = 0.004526
##
## Pearson's Chi-squared test
##
## data: table_estadocivil
## X-squared = 46.164, df = 2, p-value = 9.456e-11
El p-valor \((0.2906)\) es mayor que \(0.05\), por lo tanto no se rechaza la hipótesis nula. Esto significa que no existe una relación estadísticamente significativa entre el género y la rotación del personal. En otras palabras, hombres y mujeres presentan tasas de rotación similares en esta organizació frente a la decisión de permanencia o salida del trabajo, por lo que el género no parece ser un factor determinante en la rotación laboral.
En contraste, la variable departamento presenta un resultado estadísticamente significativo \((10.796; p = 0.004526)\), lo que evidencia que sí existe una asociación entre el área de trabajo y la rotación del personal. Es decir, la propensión a rotar varía dependiendo del departamento al que pertenece el colaborador. Este hallazgo sugiere que algunos departamentos pueden tener mayores niveles de rotación debido a condiciones laborales específicas, como el tipo de tareas, el nivel de estrés o las oportunidades de desarrollo profesional.
El p-valor \((9.456e-11)\) es extremadamente menor que \(0.05\), por lo tanto se rechaza con fuerza la hipótesis nula. Esto significa que hay una relación muy significativa entre el estado civil y la rotación del personal. En términos prácticos, el estado civil parece ser un factor influyente en la decisión de permanencia o salida de los empleados.
En conclusión, los resultados del análisis permiten afirmar que las variables “departamento” y “estado civil” están asociadas significativamente con la rotación del personal, mientras que el género no presenta una relación estadísticamente relevante. Esto sugiere que las políticas de retención de talento deberían focalizarse más en los departamentos con mayor rotación y considerar las características personales (como el estado civil) que puedan incidir en la permanencia.
Por lo tanto, se tomará la variable “Horas extra” ya que suele reflejar sobrecarga laboral o desequilibrio entre trabajo y vida personal. En la práctica, los trabajadores que reportan horas extra constantes tienden a experimentar mayores cargas de estrés, insatisfacción o agotamiento, lo que incrementa la posibilidad de renunciar o solicitar algún tipo de traslado.
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: table_horasextra
## X-squared = 87.564, df = 1, p-value < 2.2e-16
La prueba de independencia entre Rotación y Horas extra, indico un p-value \(< 0.001\), lo que confirma que la relación es altamente significativa.
Dado que género no tiene significancia estadística, la variable que sí debe incluirse en su lugar es Horas extra, ya que:
Tiene una relación significativa con la rotación.
Representa un factor laboral modificable sobre el cual la organización puede intervenir, por ejemplo, reduciendo la carga o compensando mejor las horas adicionales.
Por tanto, las variables cualitativas a estudiar quedarían así:
| Variable | Tipo | Relación esperada con rotación |
|---|---|---|
| Departamento | Categórica | Significativa, depende del área de trabajo |
| Estado Civil | Categórica | Significativa, mayor rotación en solteros |
| Horas Extra | Categórica | Significativa, mayor rotación para quienes trabajan más |
Para el análisis para esta sección, se tuvo en cuenta que:
## Edad Ingreso_Mensual Antigüedad_Cargo
## Min. :18.00 Min. : 1009 Min. : 0.000
## 1st Qu.:30.00 1st Qu.: 2911 1st Qu.: 2.000
## Median :36.00 Median : 4919 Median : 3.000
## Mean :36.92 Mean : 6503 Mean : 4.229
## 3rd Qu.:43.00 3rd Qu.: 8379 3rd Qu.: 7.000
## Max. :60.00 Max. :19999 Max. :18.000
Con el propósito de identificar si existen diferencias significativas en las características laborales y demográficas de los empleados que han rotado frente a los que no, se aplicó la prueba t de Student para muestras independientes a las variables Edad, Ingreso Mensual y Antigüedad en el cargo.
##
## Welch Two Sample t-test
##
## data: Edad by Rotación
## t = 5.8291, df = 316.94, p-value = 1.371e-08
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 2.619728 5.289170
## sample estimates:
## mean in group No mean in group Si
## 37.56204 33.60759
El resultado de la prueba t \((5.8291; p-value = 1.37e-08)\) evidencia que existe una diferencia estadísticamente significativa entre la edad promedio de los empleados que permanecen y aquellos que rotan.
El promedio de edad de quienes no rotan es de aproximadamente \(38\) años, mientras que quienes sí rotan tienen una media aproximada de \(34\) años. Esto sugiere que los empleados más jóvenes tienden a cambiar de cargo con mayor frecuencia, lo cual puede relacionarse con la búsqueda de mejores oportunidades, desarrollo profesional o inconformidad con la asignación actual.
##
## Welch Two Sample t-test
##
## data: Ingreso_Mensual by Rotación
## t = 7.4826, df = 412.74, p-value = 4.434e-13
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 1508.244 2583.050
## sample estimates:
## mean in group No mean in group Si
## 6832.740 4787.093
El resultado del test \((7.4826\); p-value = \(4.43e-13\)) también indica una diferencia altamente significativa entre los ingresos promedio de ambos grupos.
Los empleados que no rotan tienen un ingreso medio de \(6.832.740\), mientras que los que sí rotan presentan un ingreso medio de \(4.787.093\). Esto implica que los trabajadores con menores niveles salariales presentan una mayor tendencia a rotar, posiblemente debido a la búsqueda de mejores condiciones económicas o falta de satisfacción con su remuneración actual.
##
## Welch Two Sample t-test
##
## data: Antigüedad_Cargo by Rotación
## t = 6.8471, df = 366.57, p-value = 3.187e-11
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 1.127107 2.035355
## sample estimates:
## mean in group No mean in group Si
## 4.484185 2.902954
La prueba t $(\(6.8471\); p-value = \(3.18e-11\)) muestra que también hay una diferencia significativa entre los grupos en cuanto a la antigüedad en el cargo. Quienes no rotan presentan una antigüedad promedio de \(4\) a \(5\) años, frente a aproximadamente \(3\) años en quienes sí rotan. Esto indica que los empleados con menor tiempo en su cargo actual son más propensos a cambiar de puesto, posiblemente por falta de adaptación, inconformidad o búsqueda de crecimiento profesional.
Por lo tanto, el análisis sugiere que la rotación de personal está asociada con factores de experiencia, edad e ingresos. Por lo general, los empleados más jóvenes, con menor antigüedad y con salarios más bajos son los que presentan mayor probabilidad de rotar dentro de la organización.
Esta información es valiosa, sobretodo para la gerencia, pues permite enfocar estrategias de retención del talento en segmentos específicos, ofreciendo mejores oportunidades de desarrollo, planes de carrera y revisiones salariales competitivas que contribuyan a reducir la rotación y fortalecer la estabilidad laboral.
El análisis bivariado considera la variable respuesta: \[ \text{rotacion} = \begin{cases} 1 & \text{Hay rotación (el empleado cambia de cargo o se va)} \\ 0 & \text{No hay rotación} \end{cases} \]
Se va a analizar las relaciones entre rotación y las demás variables (horas_extra, ingreso_mensual, edad, nivel_educativo, genero, etc.), para identificar cuáles influyen de manera significativa en la probabilidad de rotación.
El modelo que se estima es:
\[ \text{logit}(P(y = 1)) = \beta_0 + \beta_1 X_i \] donde \(X_i\) es cada variable independiente considerada por separado y tomando como variables explicativas las que en el análisis previo mostraron relación significativa o teóricamente relevante con la rotación:
##
## Call:
## glm(formula = Rotacion_bin ~ Edad + Ingreso_Mensual + Antigüedad_Cargo +
## Horas_Extra + Estado_Civil, family = binomial, data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -7.210e-01 3.438e-01 -2.097 0.036015 *
## Edad -2.727e-02 9.932e-03 -2.746 0.006032 **
## Ingreso_Mensual -7.183e-05 2.500e-05 -2.873 0.004069 **
## Antigüedad_Cargo -9.798e-02 2.679e-02 -3.657 0.000255 ***
## Horas_ExtraSi 1.461e+00 1.565e-01 9.335 < 2e-16 ***
## Estado_CivilDivorciado -3.066e-01 2.276e-01 -1.347 0.178074
## Estado_CivilSoltero 8.005e-01 1.697e-01 4.718 2.38e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1102.6 on 1463 degrees of freedom
## AIC: 1116.6
##
## Number of Fisher Scoring iterations: 5
La interpretación de los resultados se puede ver en la siguiente tabla bajo la interpretación de los coeficientes encontrados:
| Variable | Estimate | Signo | p-valor | Interpretación |
|---|---|---|---|---|
| Edad | -0.027 | Negativo | 0.006 | A mayor edad, disminuye la probabilidad de rotación. Empleados más jóvenes tienden a cambiar más de cargo o a dejar la empresa, posiblemente buscando mejores oportunidades. |
| Ingreso mensual | -0.0000718 | Negativo | 0.004 | A medida que el salario aumenta, la probabilidad de rotación disminuye. Esto sugiere que un mejor salario retiene al empleado. Esto concuerda con la hipótesis inicial: la compensación económica influye directamente en la retención. |
| Antigüedad | -0.0979 | Negativo | 0.00025 | La mayor antigüedad en el cargo se asocia con una menor probabilidad de rotación, lo cual concuerda con la lógica de estabilidad laboral. |
| Horas extra (Sí) | +1.461 | Positivo | < 2e-16 | Los empleados que trabajan horas extra tienen una probabilidad mucho mayor de rotar. Podría deberse al desgaste o insatisfacción por exceso de carga laboral. |
| Estado_Civil (Divorciado) | -0.306 | Negativo | 0.178 | No es estadísticamente significativo (p > 0.05), por tanto no se puede afirmar relación con la rotación. |
| Estado_Civil (Soltero) | +0.800 | Positivo | 2.38e-06 | Los empleados solteros tienen mayor probabilidad de rotar frente a los casados. Puede asociarse con mayor flexibilidad o búsqueda de mejores oportunidades. |
A partir de los resultados, las variables determinantes o significativas de la rotación son:
La siguiente evaluación se induce para verificar si la rotación está asociada significativamente con al menos una de las variables.
## $Models
##
## Model: "glm, Rotacion_bin ~ Edad + Ingreso_Mensual + Antigüedad_Cargo + Horas_Extra + Estado_Civil, binomial, rotacion"
## Null: "glm, Rotacion_bin ~ 1, binomial, rotacion"
##
## $Pseudo.R.squared.for.model.vs.null
## Pseudo.R.squared
## McFadden 0.150954
## Cox and Snell (ML) 0.124842
## Nagelkerke (Cragg and Uhler) 0.212816
##
## $Likelihood.ratio.test
## Df.diff LogLik.diff Chisq p.value
## -6 -98.013 196.03 1.3301e-39
##
## $Number.of.observations
##
## Model: 1470
## Null: 1470
##
## $Messages
## [1] "Note: For models fit with REML, these statistics are based on refitting with ML"
##
## $Warnings
## [1] "None"
Las pruebas indican que:
McFadden R² indica que el modelo explica el \(15\)% de la variabilidad en la decisión de rotación. En modelos logísticos, valores entre \(0.1\) y \(0.3\) son considerados moderadamente buenos.
Cox & Snell (ML) explica cerca del \(12.5\)% de la variabilidad, aunque su máximo posible no es \(1\).
Nagelkerke (Cragg & Uhler) indica que el modelo explica aproximadamente el \(21.3\)% de la variación total en la probabilidad de rotación. Es una capacidad explicativa aceptable en fenómenos sociales o laborales.
Chi-cuadrado con un p = \(1.33e-39\) indica que el modelo con predictores mejora significativamente al modelo nulo. Esto indica que al menos una variable tiene un efecto significativo sobre la rotación.
| Análisis | Resultado principal |
|---|---|
| Univariado | La variable género no fue significativa para explicar la rotación. |
| Bivariado / Multivariado | Variables como horas extra, antigüedad e ingreso mensual sí son determinantes significativas en la rotación. |
| Conclusión | Se confirma que la rotación no depende del género, sino de factores laborales y económicos. |
El modelo sugiere que los factores más influyentes en la rotación laboral son:
La sobrecarga laboral (horas extra) y el estado civil soltero, que incrementan la probabilidad de rotación.
La edad, el ingreso y la antigüedad, que reducen la probabilidad de cambiar de cargo o abandonar la empresa.
El modelo busca predecir la probabilidad de rotación laboral (Rotacion_bin = 1 si hay rotación, 0 si no) a partir de varias variables explicativas como:
El modelo tiene familia = binomial, lo que significa que usa regresión logística.
##
## Call:
## glm(formula = Rotacion_bin ~ Edad + Ingreso_Mensual + Antigüedad +
## Horas_Extra + Estado_Civil + Departamento, family = binomial,
## data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.075e+00 3.508e-01 -3.064 0.002185 **
## Edad -2.501e-02 1.003e-02 -2.493 0.012684 *
## Ingreso_Mensual -9.315e-05 2.799e-05 -3.328 0.000873 ***
## Antigüedad -3.553e-02 1.863e-02 -1.907 0.056521 .
## Horas_ExtraSi 1.479e+00 1.570e-01 9.419 < 2e-16 ***
## Estado_CivilDivorciado -3.056e-01 2.292e-01 -1.334 0.182319
## Estado_CivilSoltero 8.266e-01 1.698e-01 4.868 1.13e-06 ***
## DepartamentoRH 6.738e-01 3.553e-01 1.896 0.057907 .
## DepartamentoVentas 5.991e-01 1.661e-01 3.606 0.000311 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1098.1 on 1461 degrees of freedom
## AIC: 1116.1
##
## Number of Fisher Scoring iterations: 5
Edad*. A medida que la edad aumenta en un año, las probabilidades de rotación disminuyen. Es decir, los empleados con mayores edades tienden menos a rotar.
Ingreso mensual. A mayor ingreso mensual, la probabilidad de rotación disminuye ligeramente.
*Antigüedad. Los empleados con más tiempo en la empresa tienden menos a rotar.
Horas extra (Si). Los empleados que sí hacen horas extra tienen una probabilidad mucho mayor de rotar. Es un efecto muy fuerte y altamente significativo (p \(< 2e-16\)).
Estado civil (Divorciado = \(-0.305\)). Los empleados divorciados tienden a rotar un poco menos que los casados.
Estado civil (Soltero = \(0.827\)). Los empleados solteros tienen mayor probabilidad de rotar que los casados.
Departamento Recursos Humanos = \(0.674\). Los empleados de Recursos Humanos tienen ligeramente mayor probabilidad de rotar que los de referencia, probablemente “Administración”.
Departamento de ventas = \(0.599\). Los empleados de Ventas tienen una probabilidad significativamente mayor de rotación.
Por lo tanto, las variables más influyentes y significativas son:
Horas extra (Si), aumenta fuertemente la probabilidad de rotación.
Ingreso Mensual, reduce la probabilidad de rotación.
Edad, reduce la probabilidad de rotación.
Estado civil (Soltero), aumenta la probabilidad de rotación.
Departamento ventas, aumenta la probabilidad de rotación.
Variables con efecto marginal: Antigüedad y Departamento RH.
Variables sin evidencia significativa: Estado civil divorciado.
En este proceso, se requiere evaluar el poder predictivo del modelo logístico con la curva ROC (Receiver operating characteristic) y el AUC (Área bajo la curva) es la forma correcta de medir qué tan bien el modelo distingue entre empleados que rotan y los que no. El modelo se presenta a continuación:
La curva ROC muestra la relación entre:
Tasa de verdaderos positivos (sensibilidad), los empleados que realmente rotan y el modelo que predijo como rotación.
Tasa de falsos positivos (1 - especificidad), los empleados que no rotan pero el modelo predijo rotación.
La línea gris diagonal representa un modelo sin poder predictivo. La línea azul, que se encuentra por encima de esa diagonal, indica que el modelo tiene capacidad predictiva. La curva asciende rápido, lo que indica alta sensibilidad y baja tasa de falsos positivos, mostrando que el modelo distingue bien entre empleados que rotan y los que no.
El AUC (Área bajo la curva) cuantifica el rendimiento general del modelo:
## Area under the curve: 0.7664
El modelo tiene un poder predictivo alto, lo que significa que tiene un \(77\)% aproximadamente de probabilidad de clasificar correctamente a un empleado elegido al azar como alguien que rotará o no rotará”.
Por lo tanto, el modelo logístico ajustado predice adecuadamente la probabilidad de rotación.
Los factores incluidos como edad, ingreso mensual, antigüedad, horas extra, estado Civil y departamento aportan información útil para distinguir entre empleados que desean o no rotar.
Dentro de esta evaluación, también se empleará el análisis con la matriz de confusión y las métricas de desempeño (precisión, sensibilidad, especificidad y exactitud), pues permitirán evaluar qué tan bien el modelo clasifica la rotación de empleados en la práctica.
#library(pROC)
# Generar probabilidades predichas ---
prob_pred <- predict(modelo_logit, newdata = rotacion, type = "response")
# Generacion de las probabilidades correctamente
length(prob_pred)
## [1] 1470
head(prob_pred)
## 1 2 3 4 5 6
## 0.40128906 0.04262776 0.59417653 0.25828889 0.12983683 0.15454519
# Calcular la curva ROC ---
roc_obj <- roc(rotacion$Rotacion_bin, prob_pred)
# Calcular el AUC ---
auc_val <- auc(roc_obj)
cat("Área bajo la curva (AUC):", round(auc_val, 3), "\n")
## Área bajo la curva (AUC): 0.763
# Determinar el punto de corte óptimo (Youden)
opt_cutoff <- coords(roc_obj, "best", ret = "threshold", best.method = "youden")
opt_cutoff <- as.numeric(opt_cutoff)
cat("Punto de corte óptimo (Youden):", round(opt_cutoff, 3), "\n")
## Punto de corte óptimo (Youden): 0.177
# Clasificación binaria según el punto de corte ---
rotacion$Pred_Clasificada <- ifelse(prob_pred > opt_cutoff, 1, 0)
# Mostrar matriz de confusión ---
conf_mat <- table(Predicho = rotacion$Pred_Clasificada, Real = rotacion$Rotacion_bin)
print(conf_mat)
## Real
## Predicho 0 1
## 0 928 76
## 1 305 161
# Grafico de la curva ROC ---
plot(roc_obj, col = "blue", lwd = 3, main = "Curva ROC - Modelo de Rotación")
abline(a = 0, b = 1, lty = 2, col = "gray")
text(0.6, 0.2, paste("AUC =", round(auc_val, 3)), cex = 1.1)
El valor de AUC = \(0.763\) significa que, si se
eligen al azar dos empleados, uno que rota y uno que no, el modelo tiene
un \(76.3\)% de probabilidad de asignar
una mayor probabilidad de rotación al empleado que efectivamente
rotó.
# Crear un punto de corte (probabilidad) óptimo
punto_corte <- 0.5
# Predicciones según el punto de corte
rotacion$pred_clase <- ifelse(predict(modelo_rotacion, type = "response") >= punto_corte, 1, 0)
# Matriz de confusión
library(caret)
confusion <- confusionMatrix(as.factor(rotacion$pred_clase), as.factor(rotacion$Rotacion_bin), positive = "1")
confusion
## Confusion Matrix and Statistics
##
## Reference
## Prediction 0 1
## 0 1214 190
## 1 19 47
##
## Accuracy : 0.8578
## 95% CI : (0.8389, 0.8753)
## No Information Rate : 0.8388
## P-Value [Acc > NIR] : 0.02417
##
## Kappa : 0.2581
##
## Mcnemar's Test P-Value : < 2e-16
##
## Sensitivity : 0.19831
## Specificity : 0.98459
## Pos Pred Value : 0.71212
## Neg Pred Value : 0.86467
## Prevalence : 0.16122
## Detection Rate : 0.03197
## Detection Prevalence : 0.04490
## Balanced Accuracy : 0.59145
##
## 'Positive' Class : 1
##
| Métrica | Valor | Interpretación |
|---|---|---|
| Accuracy (Exactitud) | 85.8% | El modelo clasifica correctamente el 85.8% de los casos, lo que representa un buen desempeño general. |
| Kappa | 25.81% | Indica un acuerdo moderado entre las predicciones del modelo y los valores reales (superior al azar, pero no alto). |
| Sensitivity (Sensibilidad / Recall) | 19.8% | El modelo detecta correctamente solo el 19.8% de los empleados que realmente rotan, es decir, tiene baja capacidad para identificar los casos de rotación real. |
| Specificity (Especificidad) | 98.4% | El modelo identifica correctamente al 98.4% de los empleados que no rotan, por lo que es muy bueno para detectar la permanencia. |
| Positive Predictive Value (Precisión) | 71.2% | Cuando el modelo predice que un empleado rotará, acierta en un 71.2% de los casos, lo que es aceptable. |
| Negative Predictive Value (NPV) | 86.5% | Si el modelo predice que un empleado no rotará, esta predicción es correcta el 86.5% de las veces. |
| Balanced Accuracy | 59.1% | Promedio entre sensibilidad y especificidad; muestra un rendimiento moderado, influenciado por la baja detección de rotación. |
Interpretación general
Alta exactitud (\(85.8\)%) y especificidad (\(98.4\)%), lo que indica que el modelo predice muy bien a los empleados que permanecerán en la empresa.
Cuando el modelo predice rotación, suele acertar (precisión del \(71\)%).
La baja sensibilidad (\(19.8\)%) revela que el modelo no logra identificar adecuadamente a los empleados que efectivamente rotan.
Esto puede deberse a un desequilibrio en los datos (pocos casos de rotación) o a que las variables utilizadas no capturan totalmente los factores emocionales o contextuales de la rotación.
Conclusión global:
El modelo tiene buena capacidad global de clasificación, pero desequilibrada, ya que funciona mejor para predecir la no rotación que la rotación.
En el contexto empresarial, esto implica que el modelo es confiable para identificar empleados estables, pero podría pasar por alto trabajadores con alta probabilidad de salida, lo que sugiere la necesidad de ajustar el umbral de clasificación o incluir nuevas variables, por ejemplo, motivación, clima laboral, reconocimiento, oportunidades de ascenso.
El análisis bivariado permitió identificar que las variables horas extra, antigüedad e ingreso mensual tienen una relación estadísticamente significativa con la rotación de personal dentro de la empresa. Estos resultados sugieren que los factores asociados al equilibrio entre la carga laboral, la estabilidad en el tiempo de permanencia y la remuneración económica influyen de manera directa en la decisión de los empleados de permanecer o abandonar la organización.
En cuanto a las horas extra, se observó que un número elevado de horas trabajadas fuera de la jornada regular incrementa la probabilidad de rotación. Esto puede asociarse con el desgaste físico, emocional, la falta de equilibrio entre la vida laboral y personal y la percepción de sobrecarga en aspctos importantes como el laboral. Por tanto, una estrategia eficaz para disminuir la rotación podria estar en la regulación y control del tiempo extra, estableciendo políticas claras sobre su compensación, fomentando la planificación eficiente de las tareas y promoviendo programas de bienestar laboral que prevengan la fatiga, los problemas de salud mental, menor satisfacción laboral, relaciones personales tensa y el estrés.
Con respecto a la antigüedad, los resultados evidencian que los empleados con mayor tiempo en la organización tienden a presentar menor rotación. Este hallazgo resalta la importancia de fortalecer la fidelización del talento desde las primeras etapas del vínculo laboral. En este sentido, se recomienda implementar estrategias de inducción, acompañamiento y reconocimiento al cumplimiento de años de servicio, además de generar oportunidades de crecimiento profesional y formación continua que fortalezcan el sentido de pertenencia y compromiso.
Adicionalmente, a variable ingreso mensual mostró una relación significativa con la rotación, lo cual indica que la percepción de una remuneración adecuada y equitativa es un factor clave en la retención del personal. Para ello, la empresa podría realizar revisiones salariales periódicas, establecer esquemas de incentivos vinculados al desempeño y garantizar que la compensación económica sea competitiva frente al mercado laboral del sector. Esto va ligado con las recomndaciones dadas en el anterior item, ya que, la formación continua y el apoyo a tomarla, impulsa de manera intensifica que este ingreso sea cada vez mucho mayor.
En conjunto, los resultados sugieren que una estrategia integral para disminuir la rotación debe centrarse en equilibrar las condiciones laborales, fortalecer la permanencia del talento mediante políticas de reconocimiento y fidelización y asegurar una compensación justa que motive la permanencia y el compromiso organizacional.