En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.
Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.
| Variable | Tipo | N° registros | N° faltantes | Visualización preliminar |
|---|---|---|---|---|
| Rotación | character | 1470 | 0 | Si, No, Si, No, No |
| Edad | numeric | 1470 | 0 | 41.000, 49.000, 37.000, 33.000, 27.000 |
| Viaje de Negocios | character | 1470 | 0 | Raramente, Frecuentemente, Raramente, Frecuentemente, Raramente |
| Departamento | character | 1470 | 0 | Ventas, IyD, IyD, IyD, IyD |
| Distancia_Casa | numeric | 1470 | 0 | 1.000, 8.000, 2.000, 3.000, 2.000 |
| Educación | factor | 1470 | 0 | Secundaria, Primaria, Secundaria, Pregrado, Primaria |
| Campo_Educación | character | 1470 | 0 | Ciencias, Ciencias, Otra, Ciencias, Salud |
| Satisfacción_Ambiental | factor | 1470 | 0 | Insatisfecho, Satisfecho, Muy Satisfecho, Muy Satisfecho, Muy Insatisfecho |
| Genero | character | 1470 | 0 | F, M, M, F, M |
| Cargo | character | 1470 | 0 | Ejecutivo_Ventas, Investigador_Cientifico, Tecnico_Laboratorio, Investigador_Cientifico, Tecnico_Laboratorio |
| Satisfación_Laboral | factor | 1470 | 0 | Muy Satisfecho, Insatisfecho, Satisfecho, Satisfecho, Insatisfecho |
| Estado_Civil | character | 1470 | 0 | Soltero, Casado, Soltero, Casado, Casado |
| Ingreso_Mensual | numeric | 1470 | 0 | 5993.000, 5130.000, 2090.000, 2909.000, 3468.000 |
| Trabajos_Anteriores | numeric | 1470 | 0 | 8.000, 1.000, 6.000, 1.000, 9.000 |
| Horas_Extra | character | 1470 | 0 | Si, No, Si, Si, No |
| Porcentaje_aumento_salarial | numeric | 1470 | 0 | 11.000, 23.000, 15.000, 11.000, 12.000 |
| Rendimiento_Laboral | factor | 1470 | 0 | Alto, Muy Alto, Alto, Alto, Alto |
| Años_Experiencia | numeric | 1470 | 0 | 8.000, 10.000, 7.000, 8.000, 6.000 |
| Capacitaciones | numeric | 1470 | 0 | 0.000, 3.000, 3.000, 3.000, 3.000 |
| Equilibrio_Trabajo_Vida | factor | 1470 | 0 | Muy Bajo, Medio, Medio, Medio, Medio |
| Antigüedad | numeric | 1470 | 0 | 6.000, 10.000, 0.000, 8.000, 2.000 |
| Antigüedad_Cargo | numeric | 1470 | 0 | 4.000, 7.000, 0.000, 7.000, 2.000 |
| Años_ultima_promoción | numeric | 1470 | 0 | 0.000, 1.000, 0.000, 3.000, 2.000 |
| Años_acargo_con_mismo_jefe | numeric | 1470 | 0 | 5.000, 7.000, 0.000, 0.000, 2.000 |
La rotación de personal representa un desafío constante para las organizaciones, ya que implica costos operativos, pérdida de conocimiento, disminución de la productividad y posibles afectaciones en el clima laboral. Comprender los factores que pueden estar asociados a este fenómeno permite a las empresas implementar estrategias de retención más efectivas y crear entornos laborales más estables y satisfactorios para sus colaboradores.
En este contexto, se han identificado seis variables que, por su naturaleza y vínculo con el entorno organizacional y personal de los empleados, se consideran potencialmente relacionadas con la decisión de abandonar o permanecer en la empresa. Estas variables abarcan dimensiones como las condiciones de trabajo, el bienestar personal, la estabilidad económica y la experiencia dentro de la organización.
A continuación, se plantea una hipótesis para cada una de estas variables, con el fin de explorar la forma en que podrían influir en la rotación del personal.
Variables Categóricas
Horas_Extra Se espera que las horas extra se relacionen con la rotación, ya que las personas podrían desgastarse más al trabajar fuera del horario habitual y descuidar aspectos personales o familiares. Hipótesis: Las personas que trabajan horas extra tienen mayor posibilidad de rotar que las que no trabajan horas extra.
Estado_Civil El estado civil puede influir en la estabilidad laboral. Personas solteras, por ejemplo, podrían tener mayor disposición a asumir nuevos desafíos o cambiar de ciudad. En contraste, quienes están casados o tienen compromisos familiares pueden preferir estabilidad laboral. Hipótesis: Las personas solteras tienen una mayor probabilidad de rotación que las personas casadas o divorciadas.
Satisfación_Laboral La satisfacción laboral está directamente relacionada con la permanencia en un empleo. Un bajo nivel de satisfacción puede llevar al desinterés, disminución del compromiso y eventualmente a la renuncia. Hipótesis: Las personas con menor satisfacción laboral tienen mayor probabilidad de rotar que aquellas con mayor satisfacción.
Cargo El cargo ocupado dentro de la empresa puede estar asociado a distintos niveles de presión, reconocimiento y oportunidades de desarrollo. Cargos operativos o de menor jerarquía podrían estar expuestos a condiciones laborales más exigentes o menos atractivas, lo cual podría aumentar la rotación. Hipótesis: Las personas en cargos operativos tienen mayor probabilidad de rotar que aquellas en cargos directivos o especializados.
Equilibrio_Trabajo_Vida El equilibrio entre la vida laboral y personal influye de forma importante en el bienestar del empleado. Un bajo equilibrio puede generar estrés y agotamiento, aumentando la intención de renuncia. Hipótesis: Las personas con menor equilibrio trabajo-vida tienen mayor probabilidad de rotar que aquellas que perciben un buen equilibrio.
Género Aunque el género no debería influir directamente en la rotación, podrían existir diferencias contextuales, sociales o familiares que condicionen la permanencia laboral. Por ejemplo, algunas responsabilidades no laborales pueden recaer desproporcionadamente sobre uno de los géneros. Hipótesis: El género puede influir en la rotación dependiendo del contexto, pero no se espera una diferencia sistemática entre hombres y mujeres.
Educación El nivel educativo puede influir en las oportunidades disponibles para un empleado. Personas con mayor formación podrían tener más opciones laborales externas, mientras que también podrían estar en cargos más estables. Hipótesis: Las personas con mayor nivel educativo podrían tener una mayor probabilidad de rotar, al contar con más oportunidades fuera de la organización.
Variables Cuantitativas
Antigüedad La antigüedad en la empresa puede reflejar un mayor nivel de compromiso o adaptación. Se espera que las personas con menor tiempo en la organización tengan más incertidumbre o estén aún en proceso de exploración de otras oportunidades. Hipótesis: Las personas con menor antigüedad tienen mayor posibilidad de rotar que aquellas con mayor antigüedad en la empresa.
Ingreso_Mensual Los ingresos mensuales influyen en la percepción de recompensa y estabilidad económica. Se espera que las personas con salarios más bajos busquen activamente mejores oportunidades laborales. Hipótesis: Las personas con menores ingresos tienen mayor probabilidad de rotar que aquellas con ingresos más altos.
Distancia_Casa Una mayor distancia entre el lugar de residencia y el trabajo puede generar incomodidad, mayores costos de transporte y menor calidad de vida. Esto podría motivar a los empleados a buscar empleos más cercanos. Hipótesis: Las personas que viven más lejos del lugar de trabajo tienen mayor probabilidad de rotar que aquellas que viven cerca.
Antigüedad:
La variable Antigüedad refleja el tiempo (en años) que los empleados llevan en la empresa. La distribución de densidad muestra una concentración en los primeros años, especialmente entre 0 y 10 años. La mediana es 5 años y la media es 7.01, lo cual indica una ligera asimetría a la derecha. El boxplot muestra varios valores atípicos por encima de 20 años, lo cual sugiere que existe un pequeño grupo de empleados con permanencias prolongadas. En general, la mayoría de empleados tiene una permanencia corta o intermedia.
Ingreso Mensual:
El Ingreso Mensual tiene una distribución asimétrica hacia la derecha, con una media de $6,502.93 y una mediana de $4,919, lo que indica que la mayoría gana menos que la media debido a valores extremos altos. El boxplot confirma la presencia de outliers considerables por encima de los $15,000. Esto sugiere una estructura salarial desigual, con una mayoría de empleados concentrados en rangos bajos a medios, y pocos con salarios elevados.
Distancia a Casa:
La variable Distancia_Casa muestra que la mayoría de empleados vive relativamente cerca del lugar de trabajo: la mediana es 7 km y la media es 9.19 km. La distribución tiene una ligera cola a la derecha, y aunque se observan empleados que viven a 20 o más kilómetros, no hay presencia destacada de valores atípicos. Esto sugiere que la proximidad al lugar de trabajo podría ser un factor importante en la decisión de permanecer o rotar.
Horas Extra:
Un 28.3% de los empleados realiza horas extra, mientras que el 71.7% no lo hace. Esto sugiere que aunque la mayoría trabaja dentro del horario regular, hay un grupo significativo que asume una carga laboral adicional. Dado que el trabajo extra puede generar estrés o afectar el equilibrio personal, esta variable es relevante al analizar la rotación.
Estado Civil:
Los empleados están distribuidos en su mayoría entre casados (45.8%), solteros (32%) y divorciados (22.2%). Esta variable podría influir en la rotación debido a diferencias en responsabilidades personales, movilidad o necesidad de estabilidad laboral. Por ejemplo, los empleados solteros pueden tener mayor flexibilidad para cambiar de empleo.
Satisfacción Laboral:
Esta variable presenta una distribución equilibrada entre los niveles de satisfacción. La categoría más frecuente es “Muy Satisfecho” (31.2%), seguida de “Satisfecho” (30.1%), mientras que los niveles de insatisfacción (entre “Insatisfecho” y “Muy Insatisfecho”) suman aproximadamente el 38.7%. Esto revela que una proporción considerable de empleados no está conforme con su trabajo, lo que puede estar fuertemente asociado con su decisión de rotar.
Cargo:
La variable Cargo muestra una distribución diversa entre los distintos roles dentro de la organización. Los cargos con mayor frecuencia son Ejecutivo_Ventas, Investigador_Científico y Técnico_Laboratorio, lo cual sugiere que estos representan áreas operativas clave en la empresa. En contraste, cargos como Director_Investigación, Recursos_Humanos y Representante_Salud son menos frecuentes, posiblemente por su naturaleza estratégica o de soporte. Esta variabilidad en la distribución es relevante para el análisis de rotación, ya que ciertos cargos podrían implicar mayores niveles de presión, exigencia o movilidad, factores que pueden incidir en la decisión de permanecer o abandonar la empresa.
Equilibrio Trabajo-Vida:
El Equilibrio Trabajo-Vida refleja cómo los empleados perciben la armonía entre sus responsabilidades laborales y su vida personal. La mayor parte del personal se ubica en un nivel Medio (60.7%), seguido por un 23.4% que lo califica como Bajo, lo que indica que cerca de una cuarta parte de los empleados podría estar enfrentando dificultades para equilibrar ambas esferas. Solo un 10.4% considera tener un equilibrio Alto, mientras que un 5.4% lo percibe como Muy Bajo. Estos resultados evidencian que, aunque la mayoría no reporta un desbalance extremo, hay un porcentaje importante de empleados que podría estar en riesgo de desgaste, lo cual hace de esta variable un factor potencialmente relevante en la comprensión de la rotación laboral.
Genero:
La distribución por género muestra una ligera mayoría de empleados hombres, quienes representan el 60% del total, frente al 40% correspondiente a mujeres. Esta proporción indica que existe una mayor participación masculina dentro de la organización, lo cual podría estar vinculado al tipo de cargos disponibles o a la cultura organizacional predominante. Aunque la variable por sí sola no fue significativa en el modelo de rotación, es importante monitorear si existen diferencias en otros aspectos (como satisfacción laboral, equilibrio trabajo-vida o acceso a oportunidades) que puedan estar correlacionados con el género. Identificar posibles sesgos o necesidades específicas por grupo puede ayudar a diseñar estrategias más inclusivas de retención de talento.
Educación:
En cuanto al nivel educativo, se observa que la mayoría de los empleados cuenta con formación técnica o tecnológica (38.9%), seguido por quienes tienen estudios de pregrado (27.1%) y secundaria (19.2%). Solo un pequeño porcentaje tiene estudios de posgrado (3.3%) o únicamente educación primaria (11.6%). Esta distribución sugiere que gran parte del personal desempeña funciones operativas o técnicas, lo cual podría influir en las expectativas de crecimiento y en la percepción de estabilidad laboral. En este contexto, es relevante analizar si los niveles educativos más bajos o más altos presentan mayores tasas de rotación, ya sea por falta de oportunidades de desarrollo o por subutilización de competencias, respectivamente.
Rotación:
La variable Rotación indica si un empleado ha dejado la empresa (Sí) o no (No). La distribución muestra que un 83.9% de los empleados se mantiene en la organización, mientras que un 16.1% ha rotado. Este desbalance sugiere que, aunque la mayoría permanece, existe un grupo no menor de empleados que abandona la empresa, lo cual justifica analizar las posibles causas de esta rotación.
Con el objetivo de identificar cuáles de estos factores están asociados a la rotación de personal, se realizaron pruebas estadísticas sobre cada una de las variables seleccionadas del conjunto de datos. Dependiendo del tipo de variable, se aplicaron pruebas t de Student para las variables cuantitativas y pruebas de chi-cuadrado o Fisher para las variables categóricas.
| Variable | Prueba | P_Value | |
|---|---|---|---|
| Horas_Extra | Horas_Extra | chi-cuadrado | 8.2e-21 |
| Ingreso_Mensual | Ingreso_Mensual | t-test | 4.4e-13 |
| Estado_Civil | Estado_Civil | chi-cuadrado | 9.5e-11 |
| Antigüedad | Antigüedad | t-test | 2.3e-07 |
| Cargo | Cargo | fisher | 1e-04 |
| Satisfación_Laboral | Satisfación_Laboral | chi-cuadrado | 5.6e-04 |
| Equilibrio_Trabajo_Vida | Equilibrio_Trabajo_Vida | chi-cuadrado | 9.7e-04 |
| Distancia_Casa | Distancia_Casa | t-test | 0.00414 |
| Genero | Genero | chi-cuadrado | 0.29057 |
| Educación | Educación | chi-cuadrado | 0.54553 |
Con base en las hipótesis teóricas formuladas previamente, se compararon los resultados obtenidos en las pruebas estadísticas para determinar si existe evidencia empírica que respalde dichas suposiciones. A continuación, se presenta el análisis para cada variable:
En primer lugar, la variable Horas_Extra mostró un valor p extremadamente bajo (8.2e-21), lo cual indica una relación estadísticamente significativa con la rotación. Esto respalda fuertemente la hipótesis planteada: las personas que realizan horas extra tienen una mayor probabilidad de rotar, posiblemente debido al desgaste físico y emocional asociado al exceso de trabajo.
Para Ingreso_Mensual, el resultado también fue significativo (p = 4.4e-13), lo que confirma la hipótesis de que las personas con salarios más bajos tienen una mayor tendencia a buscar nuevas oportunidades laborales, lo cual se refleja en una mayor rotación.
En cuanto al Estado_Civil, el valor p fue de 9.5e-11, mostrando una relación significativa con la rotación. Esto respalda la hipótesis de que las personas solteras podrían rotar con mayor frecuencia que las casadas o divorciadas, posiblemente por una mayor flexibilidad o menor necesidad de estabilidad.
La variable Antigüedad presentó también una fuerte relación con la rotación (p = 2.3e-07), respaldando la hipótesis de que las personas con menos tiempo en la empresa tienen mayor probabilidad de rotar, lo cual puede estar asociado a un menor nivel de compromiso o adaptación organizacional.
Respecto a Cargo, el resultado obtenido (p = 1e-04, mediante prueba de Fisher simulada) sugiere una asociación significativa con la rotación. Esto valida la hipótesis de que los cargos operativos podrían presentar mayores niveles de rotación que los cargos directivos o especializados.
La Satisfación_Laboral mostró también evidencia estadística significativa (p = 5.6e-04), confirmando que los niveles bajos de satisfacción laboral están relacionados con una mayor rotación, como se anticipaba teóricamente.
De forma similar, Equilibrio_Trabajo_Vida evidenció una relación significativa (p = 9.7e-04), respaldando la idea de que un desequilibrio entre la vida personal y laboral puede motivar a los empleados a abandonar la organización.
La variable Distancia_Casa obtuvo un valor p de 0.00414, lo cual indica una relación estadísticamente significativa con la rotación. Esto apoya la hipótesis de que las personas que viven más lejos del lugar de trabajo presentan una mayor intención de rotar, posiblemente debido al tiempo y costos asociados al desplazamiento.
En contraste, para la variable Género, no se encontró una relación significativa (p = 0.29057), lo cual está alineado con la hipótesis planteada, que no anticipaba diferencias sistemáticas en la rotación entre hombres y mujeres. Esto sugiere que, en este contexto particular, el género no es un factor determinante en la decisión de permanecer o abandonar la empresa.
Por último, Educación presentó un valor p de 0.54553, indicando la ausencia de una relación estadísticamente significativa con la rotación. En este caso, aunque se planteaba la posibilidad de que un mayor nivel educativo se asociara con una mayor rotación por disponibilidad de oportunidades externas, los datos no respaldan dicha hipótesis.
Call:
glm(formula = y ~ Antigüedad + Ingreso_Mensual + Distancia_Casa +
Horas_Extra + Estado_Civil + Satisfación_Laboral + Cargo +
Equilibrio_Trabajo_Vida, family = binomial, data = rotacion)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.922e+00 1.054e+00 -2.774 0.005542 **
Antigüedad -4.119e-02 1.878e-02 -2.193 0.028278 *
Ingreso_Mensual 4.586e-07 4.635e-05 0.010 0.992106
Distancia_Casa 3.292e-02 9.650e-03 3.412 0.000646 ***
Horas_ExtraSi 1.643e+00 1.689e-01 9.729 < 2e-16 ***
Estado_CivilDivorciado -3.297e-01 2.385e-01 -1.382 0.166832
Estado_CivilSoltero 9.558e-01 1.777e-01 5.379 7.50e-08 ***
Satisfación_LaboralInsatisfecho -4.832e-01 2.429e-01 -1.989 0.046688 *
Satisfación_LaboralSatisfecho -4.800e-01 2.138e-01 -2.245 0.024783 *
Satisfación_LaboralMuy Satisfecho -1.153e+00 2.310e-01 -4.992 5.99e-07 ***
CargoDirector_Manofactura 8.756e-01 8.973e-01 0.976 0.329174
CargoEjecutivo_Ventas 2.049e+00 8.563e-01 2.392 0.016735 *
CargoGerente 8.617e-01 8.745e-01 0.985 0.324440
CargoInvestigador_Cientifico 1.692e+00 9.449e-01 1.790 0.073396 .
CargoRecursos_Humanos 2.597e+00 9.642e-01 2.693 0.007076 **
CargoRepresentante_Salud 9.263e-01 9.035e-01 1.025 0.305226
CargoRepresentante_Ventas 3.193e+00 9.737e-01 3.279 0.001041 **
CargoTecnico_Laboratorio 2.434e+00 9.409e-01 2.587 0.009692 **
Equilibrio_Trabajo_VidaBajo -9.419e-01 3.286e-01 -2.867 0.004149 **
Equilibrio_Trabajo_VidaMedio -1.334e+00 3.064e-01 -4.353 1.34e-05 ***
Equilibrio_Trabajo_VidaAlto -8.171e-01 3.711e-01 -2.202 0.027675 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1298.6 on 1469 degrees of freedom
Residual deviance: 1018.9 on 1449 degrees of freedom
AIC: 1060.9
Number of Fisher Scoring iterations: 6
Resumen del modelo
El modelo utiliza como variable respuesta binaria la rotación (y = 1 si hubo rotación, y = 0 si no). Se incluyeron como predictores: antigüedad, ingreso mensual, distancia a casa, horas extra, estado civil, satisfacción laboral, cargo y equilibrio trabajo-vida.
El AIC del modelo es 1060.9 y la residual deviance es 1018.9, lo cual muestra una mejora respecto al modelo nulo (null deviance: 1298.6).
Interpretación de los coeficientes significativos
Los coeficientes indican el efecto de cada variable sobre el logaritmo del odds de rotar. A continuación, se interpreta cada uno de los efectos estadísticamente significativos (p < 0.05):
Variables Cuantitativas
Antigüedad: coef. = -0.0412, p = 0.028
A mayor antigüedad, menor probabilidad de rotación. Cada año adicional reduce el log-odds de rotar, respaldando la hipótesis de que empleados nuevos rotan más.
A mayor distancia entre la casa y el trabajo, mayor probabilidad de rotación. El efecto es positivo y significativo.
No es significativo. No hay evidencia estadística de que el ingreso mensual esté relacionado con la rotación en este modelo.
Variables Cualitativas
Horas_Extra
Horas_Extra (Sí): coef. = +1.643, p < 2e-16
Las personas que hacen horas extra tienen una probabilidad significativamente mayor de rotar. El efecto es muy fuerte y altamente significativo.
Soltero: coef. = +0.956, p < 0.001
Las personas solteras tienen una probabilidad más alta de rotar que las casadas (categoría de referencia).
Divorciado: coef. = -0.330, p = 0.167
No significativo. No se puede afirmar que las personas divorciadas rotan más o menos que las casadas.
(Categoría de referencia: Muy Insatisfecho)
Insatisfecho: coef. = -0.483, p = 0.047 Satisfecho: coef. = -0.480, p = 0.025 Muy Satisfecho: coef. = -1.153, p < 0.001
A mayor satisfacción laboral, menor probabilidad de rotación. El efecto es especialmente fuerte para quienes están muy satisfechos.
(Categoría de referencia: Director_Investigación)
Ejecutivo_Ventas: coef. = +2.05, p = 0.017 Recursos_Humanos: coef. = +2.60, p = 0.007 Representante_Ventas: coef. = +3.19, p = 0.001 Técnico_Laboratorio: coef. = +2.43, p = 0.009
Comparado con cargos de dirección, estos puestos operativos presentan una probabilidad significativamente mayor de rotación. Otros cargos como Gerente, Representante_Salud o Científico no son significativos (p > 0.05), aunque algunos muestran tendencias.
(Categoría de referencia: Muy Bajo)
Bajo: coef. = -0.942, p = 0.004 Medio: coef. = -1.334, p < 0.001 Alto: coef. = -0.817, p = 0.027
A medida que mejora el equilibrio trabajo-vida, disminuye significativamente la probabilidad de rotación. El mayor efecto lo tiene el nivel “Medio”.
Ingreso_Mensual Estado_Civil: Divorciado Cargo: Gerente, Representante_Salud, Científico, Director_Manofactura
Estas variables no muestran un efecto estadísticamente significativo en la rotación bajo este modelo. Sus coeficientes deben interpretarse con cuidado.
El modelo confirma múltiples hipótesis planteadas: los empleados que trabajan horas extra, que están solteros, tienen menor antigüedad, viven más lejos o están menos satisfechos son significativamente más propensos a rotar. Además, ciertos cargos como Ejecutivo de Ventas y Técnico de Laboratorio tienen una mayor probabilidad de rotación frente a posiciones directivas.
Como parte de la validación del modelo de regresión logística para predecir la probabilidad de rotación de personal, se utilizó la curva ROC (Receiver Operating Characteristic) como métrica de desempeño. Esta curva permite evaluar la capacidad discriminativa del modelo a través de todos los posibles umbrales de clasificación, contrastando la tasa de verdaderos positivos (sensibilidad) frente a la tasa de falsos positivos (1 - especificidad).
El modelo presenta un AUC = 0.8143, lo cual se interpreta como la probabilidad de que el modelo asigne una probabilidad mayor a un empleado que rota respecto a uno que no rota, en una pareja tomada al azar. En términos prácticos, el modelo tiene un 81.43% de capacidad para distinguir correctamente entre casos positivos y negativos, lo cual lo posiciona como un modelo con buen poder de discriminación.
Desde una perspectiva técnica:
Un AUC > 0.80 es indicativo de un modelo robusto, útil para apoyar decisiones en contextos reales. La forma de la curva ROC (ascendente y cercana a la esquina superior izquierda) sugiere que el modelo logra un buen equilibrio entre sensibilidad y especificidad a lo largo de distintos umbrales.
Ahora se realizará la predicción usando dos casos, uno real tomado del conjunto de datos y uno nuevo que tendrá datos hipotéticos como se muestra en la siguiente tabla:
| Caso | Requiere_Intervención | Antigüedad | Ingreso_Mensual | Distancia_Casa | Horas_Extra | Estado_Civil | Satisfación_Laboral | Cargo | Equilibrio_Trabajo_Vida |
|---|---|---|---|---|---|---|---|---|---|
| Empleado real | No | 8 | 5130 | 8 | No | Casado | Satisfecho | Investigador_Científico | Medio |
| Empleado nuevo | Sí | 2 | 4000 | 10 | Si | Soltero | Insatisfecho | Ejecutivo_Ventas | Bajo |
Como estamos usando el modelo para predecir rotación y prevenir pérdida de talento, el objetivo es minimizar los falsos negativos (no identificar a alguien en riesgo). Por tanto, es posible usar sensibilidad alta (recall), optimizar el F1-score o usar la curva ROC y determinar el mejor punto. Para ello, generamos predicciones de probabilidad con el modelo creado, y probamos una secuenca de posibles umbrales (0.01 y 0.99) evaluando cada una de las métricas:
Finalmente, seleccionamos los umbrales óptimos, uno que maximiza el F1-score (balance entre precisión y sensibilidad) y el otro que maximiza la suma de sensibilidad + especificidad (punto óptimo en la curva ROC).
| Criterio | umbral | sensibilidad | especificidad | precision | f1 | |
|---|---|---|---|---|---|---|
| 35 | Máximo F1-score | 0.35 | 0.4768 | 0.9392 | 0.6011 | 0.5318 |
| 14 | Máximo Sensib. + Espec. | 0.14 | 0.8143 | 0.6805 | 0.3288 | 0.4684 |
Comparación de umbrales óptimos para clasificación de rotación
Se evaluaron múltiples umbrales de decisión sobre las probabilidades generadas por el modelo logístico, con el objetivo de definir el punto de corte más adecuado para clasificar empleados con alto riesgo de rotación. A continuación se destacan los dos umbrales más relevantes:
Umbral óptimo: 0.35 Sensibilidad: 47.68% Especificidad: 93.92% Precisión: 60.11% F1-score: 0.5318
Este umbral ofrece un buen equilibrio entre precisión y sensibilidad, penalizando relativamente poco los falsos positivos. Es adecuado si se busca intervenir solo cuando hay mayor seguridad de rotación, es decir, priorizando eficiencia de recursos.
Umbral óptimo: 0.14 Sensibilidad: 81.43% Especificidad: 68.05% Precisión: 32.88% F1-score: 0.4684
Este umbral está orientado a capturar la mayoría de los casos de rotación, con una sensibilidad mucho mayor (81%). Es ideal cuando el objetivo organizacional es detectar oportunamente a casi todos los empleados en riesgo, incluso si esto conlleva más intervenciones (falsos positivos).
Dado que la estratégia empresarial normalmente implca recursos limitados se buscará intervenir a los empleados teniendo un alto nivel de certeza de su riesgo de rotación. Por tanto se establecerá n umbral de 0.35.
A continuación se presentan los resultados de realizar la predicción aplicando los casos al modelo con este nuevo umbral.
| Caso | Probabilidad_Rotación | Requiere_Intervención |
|---|---|---|
| Empleado real | 0.0565 | No |
| Empleado nuevo | 0.6340 | Sí |
Recomendaciones estratégicas
Se sugiere que los perfiles puedan ser marcados como de riesgo alto o bajo de rotación, por lo que se podrían implementar las siguientes estrategias de retención:
El análisis realizado permitió identificar un conjunto de variables que están significativamente asociadas con la rotación de personal dentro de la organización. Entre ellas se destacan: Antigüedad, Ingreso Mensual, Distancia al lugar de trabajo, Horas Extra, Estado Civil, Satisfacción Laboral, Cargo y Equilibrio Trabajo-Vida. Estas variables no solo influyen en la decisión de un empleado de permanecer o no en la empresa, sino que también ofrecen puntos de intervención estratégicos desde la gestión del talento humano.
En la predicción y elección del umbral óptimo para la predicción de rotación obtuvimos que un umbral más alto de 0.35 refleja una priorización de la certeza en la predicción, minimizando los falsos positivos y optimizando el uso de recursos limitados para intervenciones y si se aceptará perder algunos casos reales de rotación a cambio de tener mayor confianza en que aquellos identificados realmente requieren intervención. Finalmente, hay que considerar también que la elección del umbral óptimo para la predicción de rotación debe alinearse con los objetivos estratégicos y la disponibilidad de recursos de la organización.
Estratégias para reducir la rotación
Dado que los niveles bajos de satisfacción laboral se asocian significativamente con una mayor probabilidad de rotación, es clave implementar acciones que promuevan el bienestar del empleado. Esto puede incluir:
Los empleados que trabajan horas extra tienen una probabilidad significativamente mayor de rotar. Esto sugiere que una mejor distribución de la carga laboral es fundamental. Algunas medidas serían:
Se evidenció que el cargo influye significativamente en la rotación. Es probable que ciertos roles presenten más desgaste, menores oportunidades o mayor movilidad. Por ello:
Los empleados que perciben un bajo equilibrio entre su vida personal y laboral tienen mayor intención de abandonar la organización. Se recomienda:
Variables como la antigüedad y el estado civil muestran que existen perfiles con mayor propensión a rotar. Por ejemplo, empleados más nuevos o solteros podrían ser más sensibles a cambios. Esto abre la puerta a:
El ingreso mensual también se relaciona con la rotación. Aunque no se recomienda competir exclusivamente por salario, sí es importante:
Estas estrategias pueden implementarse como parte de un plan integral de retención y monitorearse periódicamente a través de modelos predictivos y análisis de datos. A medida que se apliquen, es recomendable actualizar los modelos y ajustar los focos de intervención.