Introducción

Se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos en la empresa. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuáles factores influyen en mayor proporción a estos cambios. Con esta información, la empresa podrá tomar medidas preventivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales. A continuación, se presenta un informe detallado que sigue los pasos solicitados para desarrollar y evaluar el modelo de regresión logística.

Selección de variables

Se seleccionaron 3 variables caulitativas y 3 variables cuantitativas, basadas en su potencial relación con la rotación, según la literatura y la lógica organizacional:
Hipótesis
 Horas extra: Según los estudios las horas extra son un factor clave del burnout debido a los conflictos entre el trabajo y la vida personal de los empleados, el aumento de las horas extras debería aumentar la probabilidad de rotación de los empleados respecto a los que no hacen horas extras. (Greenhaus & Beutell, 1985, #)
 Estado civil: El estado civil puede afectar la rotación porque refleja las prioridades y responsabilidades personales de los empleados. Por ejemplo, los empleados solteros o divorciados suelen ser más independientes que los casados, quienes podrían priorizar la estabilidad por sus responsabilidades familiares. Los empleados que sean solteros o divorciados deberían tener una rotación mayor que los empleados que son casados. (Cohen, & Freund,, 2005, 329-351)
 Viajes de negocios: Los viajes de negocios frecuentes pueden generar fatiga, estrés y desequilibrio entre la vida laboral y personal, lo que aumenta el burnout. Los empleados que viajan raramente o no viajan suelen estar más satisfechos y estables. Los empleados que viajan frecuentemente deberían rotar más que los no viajan. (Deery, 2008, 792-806 )
 Años de experiencia: Los empleados con menos años de experiencia tienden a rotar más debido a la búsqueda de oportunidades de crecimiento o ajustes en su carrera, mientras que aquellos con más experiencia pueden estar más establecidos y comprometidos con la organización. Entre menos años de experiencia tenga el empleado mayor debería ser la probabilidad de rotación mientras que en los empleados de mayor experiencia la rotación debe ser menor. (Ng & Feldman, 2010, 677-718)
 Ingreso mensual: El ingreso mensual es un factor crucial en la rotación, ya que los empleados con ingresos bajos o poco competitivos suelen estar más motivados a buscar empleos mejor remunerados, mientras que aquellos con ingresos altos tienden a permanecer por la estabilidad económica. (Griffeth et al., 2000, 463-488)
 Antigüedad: La antigüedad dentro de la organización está inversamente relacionada con la rotación. Los empleados con poca antigüedad tienden a rotar más, ya que están evaluando si la organización cumple con sus expectativas, mientras que los de mayor antigüedad suelen estar más comprometidos o tienen menos incentivos para cambiar. (Griffeth et al., 2000, 463-488)

Análisis univariado

Primero se revisa la significancia de los atributos cualitativos según la prueba de chi-cuadrado:

Resultados de Pruebas Chi-cuadrado
Atributo P_valor
Viaje de Negocios Viaje de Negocios 5.609e-06
Departamento Departamento 4.526e-03
Educación Educación 5.455e-01
Campo_Educación Campo_Educación 6.774e-03
Satisfacción_Ambiental Satisfacción_Ambiental 5.123e-05
Estado_Civil Estado_Civil 9.456e-11
Horas_Extra Horas_Extra 8.158e-21
Rendimiento_Laboral Rendimiento_Laboral 9.901e-01
Equilibrio_Trabajo_Vida Equilibrio_Trabajo_Vida 9.726e-04

Los tres atributos más significativos son horas extra, estado civil, viaje de negocios.
Se hizo la prueba de normalidad a todos los atributos cuantitativos y ninguno cumplió. Debido a esto se va a calcular sup-value usando la prueba wilcox.

Resultados de Pruebas Wilcox
Atributo P_valor
Edad Edad 5.281e-11
Distancia_Casa Distancia_Casa 2.387e-03
Ingreso_Mensual Ingreso_Mensual 2.951e-14
Trabajos_Anteriores Trabajos_Anteriores 2.424e-01
Porcentaje_aumento_salarial Porcentaje_aumento_salarial 3.655e-01
Años_Experiencia Años_Experiencia 2.400e-14
Capacitaciones Capacitaciones 4.730e-02
Antigüedad Antigüedad 2.916e-13
Años_ultima_promoción Años_ultima_promoción 4.118e-02
Años_acargo_con_mismo_jefe Años_acargo_con_mismo_jefe 1.807e-11

Los tres atributos más significativos son edad, ingreso mensual y antigüedad.

Min. 1st Qu. Median Mean 3rd Qu. Max. 0.00 6.00 10.00 11.28 15.00 40.00 [1] 7.780782 Min. 1st Qu. Median Mean 3rd Qu. Max. 1009 2911 4919 6503 8379 19999 [1] 4707.957 Min. 1st Qu. Median Mean 3rd Qu. Max. 0.000 3.000 5.000 7.008 9.000 40.000 [1] 6.126525

Análisis bivariado

Resultados analisis bivariado
Variable Coeficiente P_valor
4 Campo_Educación 0.70958 1.18e-01
10 Horas_Extra 1.32741 1.349e-19
12 Equilibrio_Trabajo_Vida -0.23956 1.447e-02
21 Antigüedad_Cargo -0.14628 1.606e-09
18 Años_Experiencia -0.07773 1.69e-10
7 Cargo 1.06087 1.78e-01
13 Edad -0.05225 1.898e-09
22 Años_ultima_promoción -0.02979 2.065e-01
19 Capacitaciones -0.12995 2.285e-02
3 Educación -0.08273 2.293e-01
2 Departamento 0.38175 2.533e-01
6 Genero 0.16555 2.591e-01
9 Estado_Civil -0.23946 2.709e-01
14 Distancia_Casa 0.02471 2.952e-03
20 Antigüedad -0.08076 4.029e-07
15 Ingreso_Mensual -0.00013 4.119e-09
23 Años_acargo_con_mismo_jefe -0.14138 4.261e-09
1 Viaje_de_Negocios -1.33892 5.364e-05
17 Porcentaje_aumento_salarial -0.01012 6.054e-01
8 Satisfación_Laboral -0.25098 8.158e-05
5 Satisfacción_Ambiental -0.25312 8.298e-05
11 Rendimiento_Laboral 0.02167 9.118e-01
16 Trabajos_Anteriores 0.04565 9.596e-02

Los atributos significativos resultantes de análisis bivariado fueron:
Cualitativas significativas
Horas Extra: (Coeficiente = 1.3274061919, p-value = \(1.349094e^{-19}\)):
Coeficiente: Positivo, lo que indica que trabajar horas extra aumenta la probabilidad de rotación.
Odds Ratio: \(e^{1.3274061919}\) ≈3.77
Interpretación: Convirtiendo el valor del coeficiente al odds ratio, la regresión nos indica que los empleados que trabajan horas extra (“Sí”) tienen aproximadamente 3.77 veces más probabilidades de rotar que los que no trabajan horas extra (“No”), manteniendo otras condiciones constantes.
Satisfacción Laboral (Coeficiente = -0.2509761299, p-valor = \(8.157859e^{-05}\)):
Coeficiente: Negativo, lo que indica que a mayor satisfacción laboral, menor es la probabilidad de rotación.
Odds Ratio: \(e^{-0.2509761299}\) ≈ 0.78.
Interpretación: Por cada aumento de nivel en la satisfacción laboral (de 1 a 4), las probabilidades de rotación se reducen en un factor de 0.78 (o 22% menos). Esto significa que los empleados más satisfechos (e.j., “Muy satisfecho” = 4) tienen menor probabilidad de rotar.
Satisfacción Ambiental (Coeficiente = -0.2531151949, p-valor = \(8.298118e^{-05}\)):
Coeficiente: Negativo, lo que indica que a mayor satisfacción ambiental, menor es la probabilidad de rotación.
Odds Ratio: \(e^{-0.2531151949}\) ≈ 0.78.
Interpretación: Por cada unidad de aumento en la satisfacción ambiental, las probabilidades de rotación se reducen en un factor de 0.78 (o 22% menos). Esto sugiere que un entorno laboral más satisfactorio reduce la rotación.
Viaje de negocios (Coeficiente = -1.3389154603, p-valor = \(5.363748e^{-05}\)):
Coeficiente: Negativo, lo que indica que, en general, viajar por negocios reduce la probabilidad de rotación. Sin embargo, este valor es para una de los valores del atributo (probablemente “No_Viaja”). Es necesario hacer otra regresión para saber los coeficientes de las otras categorías (“Raramente”, “Frecuentemente”).

Interpretación de los coeficientes
 Intercepto (Estimate = -1.1034, p-value = \(1.98e^{-15}\))
Significado: El intercepto representa el log-odds de rotación cuando Viaje_de_Negocios = Frecuentemente.
Odds Ratio: \(e^{-1.1034}\) ≈ 0.332.
Interpretación:Como estamos analizando el intercepto el valor negativo no implica una reducción en la probabilidad de rotación, sólo se está buscando cuál es la probabilidad base de rotación para los empleados que viajan frecuentemente. Los empleados que viajan frecuentemente tienen una probabilidad de rotación de aproximadamente 0.332 veces la probabilidad de no rotar (odds = 0.332), lo que equivale a una probabilidad de rotación de aproximadamente 24.9%. Esto sugiere que viajar frecuentemente tiene una probabilidad moderada de rotación.
 Viaje de Negocios No Viaja (Estimate = -1.3389, p-valor = \(5.36e^{-05}\))
Significado: Este coeficiente compara el log-odds de rotación para los empleados que no viajan con los que viajan frecuentemente. Un valor de -1.3389 indica que los que no viajan tienen un log-odds de rotación menor que los que viajan frecuentemente.
Odds Ratio: \(e^{-1.3389}\) ≈ 0.262.
Interpretación: Los empleados que no viajan tienen aproximadamente 0.262 veces las probabilidades de rotar en comparación con los que viajan frecuentemente. Esto significa que la probabilidad de rotación para los que no viajan es significativamente menor que para los que viajan frecuentemente. Específicamente, la probabilidad de rotación para No Viaja sería 20.8%, respecto a frecuentemente.
 Viaje de Negocios Raramente (Estimate = -0.6346, p-valor = 0.000107)
Significado: Este coeficiente compara el log-odds de rotación para los empleados que viajan raramente con los que viajan frecuentemente. Un valor de -0.6346 indica que los que viajan raramente tienen un log-odds de rotación menor que los que viajan frecuentemente.
Odds Ratio: \(e^{-0.6346}\) ≈ 0.530.
Interpretación: Los empleados que viajan raramente tienen aproximadamente 0.530 veces las probabilidades de rotar en comparación con los que viajan frecuentemente. Esto equivale a una reducción en la probabilidad de rotación, con una probabilidad aproximada de 34.6% para Raramente, respecto a frecuentemente.

Probabilidades ajustadas
Para estimar las probabilidades reales de rotación por categoría, se suma el intercepto con los coeficientes correspondientes y aplicamos la función inversa del logit: \[p=\dfrac{e^{logit(p)}}{1+e^{logit(p)}}\]
Frecuentemente: \(logit(p) = -1.1034\),\(p=\dfrac{e^{-1.1034}}{1+e^{-1.1034}}≈ 0.249\)(24.9%)
No_Viaja: \(logit(p) = -1.1034-1.3389=-2.4423\),\(p=\dfrac{e^{-2.4423}}{1+e^{-2.4423}}≈ 0.080\)(8%)
Raramente: \(logit(p) = -1.1034-0.6346=-1.7380\),\(p=\dfrac{e^{-1.7380}}{1+e^{-1.7380}}≈ 0.151\)(15.1%)

Interpretación: La probabilidad de rotación es mayor para los que viajan frecuentemente (24.9%), seguida por los que viajan raramente (15.1%), y significativamente menor para los que no viajan (8.0%). Esto indica que viajar frecuentemente está asociado con un mayor riesgo de rotación, lo cual es consistente con la hipótesis inicial.
Cuantitativas significativas:
 Años de experiencia (Coeficiente = -0.0777306685, p-valor = \(1.689970e^{-10}\)):
Coeficiente: Negativo, lo que indica que a mayor experiencia, menor es la probabilidad de rotación.
Odds Ratio: \(e^{-0.0777306685}\) ≈ 0.93.
Interpretación: Por cada año adicional de experiencia, las probabilidades de rotación se reducen en un factor de 0.93 (o 7% menos). Esto es consistente con la idea de que los empleados más experimentados buscan estabilidad.
 Ingreso mensual (Coeficiente = -0.0001271042, p-valor = \(4.119147e^{-09}\)):
Coeficiente: Negativo, lo que indica que a mayor ingreso, menor es la probabilidad de rotación.
Odds Ratio: \(e^{-0.0001271042}\) ≈ 0.99987.
Interpretación: Por cada unidad de dinero adicional, las probabilidades de rotación se reducen en un factor de 0.99987 (aproximadamente un 0.013% menos). Aunque el efecto por unidad es pequeño, como el rango es amplio (1009 a 19999), el impacto acumulado es significativo.
 Antigüedad (Coeficiente = -0.0807589171, p-valor = \(4.028505e^{-07}\)):
Coeficiente: Negativo, lo que indica que a mayor antigüedad, menor es la probabilidad de rotación.
Odds Ratio: \(e^{-0.0807589171}\) ≈ 0.92.
Interpretación: Por cada año adicional de antigüedad, las probabilidades de rotación se reducen en un factor de 0.92 (aproximadamente un 8% menos). Esto refleja el compromiso de los empleados con más tiempo en la organización.
 Antigüedad Cargo (Coeficiente = -0.1462777327): Odds Ratio ≈ 0.86 (8% menos por año), menor rotación con más tiempo en el cargo.
 Edad (Coeficiente = -0.0522543631): Odds Ratio ≈ 0.95 (5% menos por año), mayor edad reduce la rotación.
 Años a cargo con mismo jefe (Coeficiente = -0.1413766519): Odds Ratio ≈ 0.87 (13% menos por año), estabilidad con el mismo jefe reduce la rotación.
 Distancia casa (Coeficiente = 0.0247100740): Odds Ratio ≈ 1.025 (2.5% más por km), mayor distancia aumenta la rotación.

Hipótesis cumplidas:
 Horas extra
 Años de experiencia
 Ingreso mensual
 Antigüedad
 Viaje de negocios
Hipótesis no cumplidas:
 Estado civil

Estimación del modelo

Resumen del Modelo de Regresión Logística
Dependent variable:
y
Horas_ExtraSi 1.4346***
(0.1552)
Satisfación_Laboral -0.3193***
(0.0685)
Viaje_de_NegociosNo_Viaja -1.3793***
(0.3483)
Viaje_de_NegociosRaramente -0.7107***
(0.1777)
Años_Experiencia -0.0518***
(0.0200)
Ingreso_Mensual -0.0001*
(0.00003)
Antigüedad -0.0244
(0.0211)
Constant 0.2313
(0.2772)
Observations 1,470
Log Likelihood -556.0710
Akaike Inf. Crit. 1,128.1420
Note: p<0.1; p<0.05; p<0.01

Coeficientes
Intercepto (Coeficiente = 0.2313, p-valor = 0.40413)
Interpretación: Representa el log-odds de rotación cuando todas las covariables son cero o toman su valor de referencia para los atributos cualitativos:
 Horas_Extra = No (categoría de referencia).
 Satisfacción_Laboral = 0 (aunque es ordinal de 1 a 4, el intercepto lo interpreta como el valor base).
 Viaje_de_Negocios = Frecuentemente (categoría de referencia).
 Años_Experiencia = 0.
 Ingreso_Mensual = 0.
 Antigüedad = 0.
Este escenario base tiene una probabilidad de rotación de 55.7%. Sin embargo, el p-valor (0.40413) indica que el intercepto no es estadísticamente significativo,esto no es relevante ya que el intercepto no suele ser el foco principal de interpretación práctica porque representa un escenario que no es realista, ya que Satisfacción_Laboral, Años_Experiencia, e Ingreso_Mensual no pueden ser 0.
Odds Ratio: \(e^{0.2313} \approx 1.260\).
Probabilidad: \(\frac{1.260}{1 + 1.260} \approx 0.557\) (55.7%).
Horas Extra Sí (Coeficiente = 1.435, p-valor < \(2e^{-16}\))
Interpretación: Compara el log-odds de rotación para los empleados que trabajan horas extra (Horas_Extra = Sí) frente a los que no (Horas_Extra = No), ajustando por las otras variables.
Los empleados que trabajan horas extra tienen 4.202 veces más probabilidades de rotar que los que no trabajan horas extra, manteniendo las otras variables constantes. Este efecto es altamente significativo (p-valor < 0.001), lo que confirma que las horas extra son un predictor clave de la rotación.
Odds Ratio: \(e^{1.435} \approx 4.202\).
Satisfacción Laboral (Coeficiente = -0.3193, p-valor = \(3.18e^{-06}\))
Interpretación: Indica el cambio en el log-odds de rotación por cada unidad de aumento en la satisfacción laboral (escala de 1 a 4), ajustando por las otras variables.Por cada unidad de aumento en la satisfacción laboral ( de “Insatisfecho” = 2 a “Satisfecho” = 3), las probabilidades de rotación se reducen en un factor de 0.727 (27.3% menos). Esto significa que los empleados más satisfechos con su trabajo tienen menor probabilidad de rotar.
Odds Ratio: \(e^{-0.3193} \approx 0.727\).
Viaje de Negocios No Viaja (Coeficiente = -1.379, p-valor = \(7.48e^{-05}\))
Interpretación: Compara el log-odds de rotación para los empleados que no viajan frente a los que viajan frecuentemente, ajustando por las otras variables. Los empleados que no viajan tienen 0.252 veces las probabilidades de rotar que los que viajan frecuentemente (un 74.8% menos), manteniendo las otras variables constantes. Esto sugiere que no viajar reduce significativamente la probabilidad de rotación, y el efecto es significativo (p-valor < 0.001).
Odds Ratio: \(e^{-1.379} \approx 0.252\).
Viaje de Negocios Raramente (Coeficiente = -0.7107, p-valor = \(6.35e^{-05}\))
Interpretación: Compara el log-odds de rotación para los empleados que viajan raramente frente a los que viajan frecuentemente. Los empleados que viajan raramente tienen 0.491 veces las probabilidades de rotar que los que viajan frecuentemente (un 50.9% menos). Esto indica que viajar raramente también reduce la rotación, aunque menos que no viajar, y el efecto es significativo (p-valor < 0.001).
Odds Ratio: \(e^{-0.7107} \approx 0.491\).
Años Experiencia (Coeficiente = -0.05183, p-valor = 0.00954)
Interpretación: Indica el cambio en el log-odds de rotación por cada año adicional de experiencia, ajustando por las otras variables. Por cada año adicional de experiencia, las probabilidades de rotación se reducen en un factor de 0.950 (aproximadamente un 5.0% menos). Esto sugiere que los empleados con más experiencia tienen menor probabilidad de rotar, lo cual es consistente con la idea de que buscan estabilidad.
Odds Ratio: \(e^{-0.05183} \approx 0.950\).
Ingreso Mensual (Coeficiente = -0.00005737, p-valor = 0.06641)
Interpretación: Indica el cambio en el log-odds de rotación por cada unidad de moneda adicional. Por cada unidad adicional de ingreso mensual, las probabilidades de rotación se reducen en un factor de 0.99994 (aproximadamente un 0.006% menos por unidad). Aunque el efecto por unidad es pequeño, el rango de Ingreso Mensual (1009 a 19999) implica que valores grandes al acumularse tienen un impacto significativo. Por ejemplo, un aumento de 10,000 unidades reduce las probabilidades en un factor de \(e^{-0.00005737 \times 10000} = e^{-0.5737} \approx 0.563\), o un 43.7% menos. Sin embargo, el p-valor (0.06641) indica que este efecto no es estadísticamente significativo comparado al análisis bivariado (coeficiente = -0.000127, p-valor = 4.119e-09), el efecto se debilita en el modelo multivariable, probablemente porque otras variables como Antigüedad o Años Experiencia explican parte de la variación de Ingreso Mensual.
Odds Ratio: \(e^{-0.00005737} \approx 0.99994\).
Antigüedad (Coeficiente = -0.02439, p-valor = 0.24824)
Interpretación: Indica el cambio en el log-odds de rotación por cada año adicional de antigüedad, ajustando por las otras variables. Por cada año adicional de antigüedad, las probabilidades de rotación se reducen en un factor de 0.976 (cerca de 2.4% menos). Esto sugiere que los empleados con más tiempo en la organización tienen menor probabilidad de rotar, esto implica un aumento de compromiso del empleado con la empresa. Sin embargo, el p-value (0.24824) indica que este efecto no es estadísticamente significativo (p > 0.05). Comparado con el análisis bivariado (coeficiente = -0.0808, p-valor = 4.029e-07), el efecto se debilita considerablemente, probablemente porque otras variables como Años Experiencia capturan parte de la variación relacionada con el tiempo.
Odds Ratio: \(e^{-0.02439} \approx 0.976\).
Significancia de los parámetros
Intercepto (p-valor = 0.40413): No es significativo (p > 0.05), esto no afecta el análisis del modelo porque el intercepto representa un escenario no realista.
Horas Extra (p-valor < 2e-16): Altamente significativo (p < 0.001). Trabajar horas extra es un predictor clave de la rotación.
Satisfacción Laboral (p-valor = 3.18e-06): Altamente significativo (p < 0.001). La satisfacción laboral tiene un impacto claro en la rotación.
Viaje de Negocios No Viaja (p-valor = 7.48e-05): Altamente significativo (p < 0.001). No viajar reduce la rotación en comparación con viajar frecuentemente.
Viaje de Negocios Raramente (p-valor = 6.35e-05): Altamente significativo (p < 0.001). Viajar raramente también reduce la rotación.
Años Experiencia (p-valor = 0.00954): Significativo (p < 0.01). La experiencia tiene un efecto beneficioso en la rotación.
Ingreso Mensual (p-valor = 0.06641): No es significativo al nivel de 0.05 (p > 0.05), pero está cerca (p < 0.1). Su efecto es marginal en este modelo multivariable.
Antigüedad (p-valor = 0.24824): No es significativo (p > 0.05). Su efecto no es estadísticamente relevante en este modelo.

Poder predictivo del modelo

Resultados obtenidos
AUC (Área Bajo la Curva): 0.7370856
Curva ROC: La gráfica muestra una curva ROC con un AUC de 0.737, donde:
 El eje X representa 1 - Especificidad (tasa de falsos positivos).
 El eje Y representa Sensibilidad (tasa de verdaderos positivos).
 La curva se encuentra por encima de la diagonal (línea gris), lo que indica que el modelo tiene poder predictivo.

AUC:
El AUC mide la capacidad del modelo para discriminar entre las dos clases: empleados que rotan (y = 1) y los que no rotan (y = 0). Con un AUC de 0.737, el modelo tiene una capacidad de predicción dentro del rango aceptable. Esto significa que el modelo es capaz de distinguir razonablemente bien entre los empleados que rotan y los que no, pero no es excepcionalmente preciso. Hay margen de mejora si se desea un mejor desempeño predictivo.
Interpretación de la curva ROC
La curva ROC muestra cómo varía la sensibilidad (tasa de verdaderos positivos) frente a 1 - especificidad (tasa de falsos positivos) para diferentes umbrales de clasificación.
La curva se encuentra consistentemente por encima de la diagonal, lo que indica que el modelo tiene poder predictivo. Si la curva estuviera más cerca de la diagonal, el modelo sería menos eficaz en su predicción. Teniendo en cuenta los resultados el modelo logra un buen equilibrio entre sensibilidad y especificidad, pero no es perfecto. Por ejemplo, puede identificar correctamente a muchos empleados que rotan (alta sensibilidad), pero también puede clasificar erróneamente a algunos que no rotan como si lo hicieran (falsos positivos).

Predicción

Se crea un empleado hipotético con las siguientes características:
 Horas Extra: “Sí”.
 Satisfacción Laboral: 2 (“Insatisfecho”).
 Viaje de Negocios: “Frecuentemente”.
 Años Experiencia: 5 años.
 Ingreso Mensual: 5000.
 Antigüedad: 2 años.
Las características de este empleado deben generar una probabilidad de rotación alta al tener horas extra, viajes frecuentes y falta de satisfacción laboral, mientras los atributos que reducen la rotación tienen valores moderados.
Probabilidad de rotación del individuo hipotético: 0.6064644
La predicción del modelo dio una probabilidad de rotación del 60.64%, indica que este individuo tiene una probabilidad moderada de rotar. Este valor tiene sentido dado que el individuo trabaja horas extra, viaja frecuentemente, tiene baja satisfacción laboral, poca experiencia y poca antigüedad, todos factores asociados con mayor riesgo de rotación.
Para decidir el umbral de corte se puede usar el valor por defecto de la regresión logística 0.5, pero es posible encontrar una mejor solución usando la curva ROC para maximizar la sensibilidad (aumentar los verdaderos positivos) que es el objetivo del estudio.
Usando la función coords del paquete pROC para encontrar el umbral óptimo
threshold sensitivity specificity 1 0.2144274 0.6 0.8114754

Resultados analisis umbral
threshold sensitivity specificity
0.21443 0.6 0.81148

En este caso threshold representa el umbral óptimo, con un valor de 0.2144 cualquier predicción mayor a este valor clasifica al individuo como “en riesgo de rotar” (y = 1). Este umbral es mucho más bajo que el valor por defecto de 0.5, lo que indica que el modelo prioriza la sensibilidad para detectar más casos de rotación, aunque esto podría aumentar los falsos positivos. Este umbral es adecuado dado que el objetivo es capturar más casos de rotación, incluso a costa de clasificar erróneamente a algunos empleados que no rotarán. Dado que la intervención propuesta es para “motivar al empleado”, este umbral es razonable, ya que es mejor intervenir en más empleados que podrían rotar que perder casos por no intervenir.
Sensibilidad: 0.6 significa que el modelo identifica correctamente al 60% de los empleados que realmente rotan.
Especificidad: 0.8115 significa que el modelo identifica correctamente al 81.15% de los empleados que no rotan, esto implica una tasa de falsos positivos del 18.85%.
Dado que el individuo tiene una probabilidad de rotación del 62% (0.62), que es significativamente mayor al umbral de 0.2144, se debe intervenir para reducir su probabilidad de rotar.
Estrategias de intervención
Según las covariables y coeficientes del modelo, las estrategias para reducir los factores de riesgo clave son:
Factores de riesgo del modelo:
 Coeficientes y odds-ratio por covariable:
 Horas_ExtraSí: 1.435 (odds ratio = 4.202)
 Satisfacción_Laboral: -0.3193 (odds ratio = 0.727 por unidad)
 Viaje_de_NegociosNo_Viaja: -1.379 (odds ratio = 0.252)
 Viaje_de_NegociosRaramente: -0.7107 (odds ratio = 0.491)
 Años_Experiencia: -0.05183 (odds ratio = 0.950)
 Ingreso_Mensual: -0.00005737 (odds ratio ≈ 0.99994, no significativo)
 Antigüedad: -0.02439 (odds ratio = 0.976, no significativo)
Factores de riesgo del empleado:
Horas_Extra = Sí: Trabaja horas extra, lo que aumenta significativamente su probabilidad de rotar (odds ratio = 4.202).
Satisfacción_Laboral = 2: Tiene una satisfacción laboral baja (“Insatisfecho”), lo que contribuye a su probabilidad de rotación.
Viaje_de_Negocios = Frecuentemente: Viaja frecuentemente, lo que aumenta el riesgo.
Años_Experiencia = 5: Poca experiencia, esto no ayuda a reducir el riesgo significativamente.
Ingreso_Mensual = 5000 : Los ingresos ayudan a reducir la probabilidad.
Antigüedad = 2: Poca antigüedad, esto no ayuda a reducir el riesgo significativamente.
Estrategias de intervención
Dado que las variables más significativas son Horas_Extra, Satisfacción_Laboral, y Viaje_de_Negocios, se recomienda trabajar en estas:
 Reducir las horas extra:
Horas_Extra tiene el mayor efecto (coeficiente = 1.435, odds ratio = 4.202). Eliminar las horas extra o compensarlas con beneficios como días libres adicionales o bonos, reduciría el log-odds de rotación en 1.435, lo que equivale a una reducción en las probabilidades de rotación en un factor de \(e^{-1.435} \approx 0.238\).
 Mejorar la satisfacción laboral:
La satisfacción laboral tiene un coeficiente de -0.3193 (odds ratio = 0.727 por unidad). Aumentar de Insatisfecho a Satisfecho reduciría el log-odds en \(-0.3193 \times (3 - 2) = -0.3193\), lo que equivale a una reducción en las probabilidades de rotación en un factor de 0.727.
Se pueden realizar encuestas para identificar las causas de insatisfacción para implementar cambios que mejoren la percepción del empleado.
 Reducir los viajes frecuentes:
Cambiar a “Raramente” reduciría el log-odds en 0.7107 (odds ratio = 0.491); cambiar a “No_Viaja” lo reduciría en 1.379 (odds ratio = 0.252). Usar videoconferencias en lugar de viajes es una buena estrategia para reducir los viajes, en caso que no sea posible proporcionar días de descanso después del viaje también puede ayudar.

Si ejecutamos las estrategias para eliminar horas extra, mejorar la satisfacción laboral al nivel 3 y reducir los viajes a raramente el modelo predice que la probabilidad de rotación se reduce de 0.62 a 0.1148 que es menor que el umbral de 0.2144 y el empleado ya no se clasifica como en riesgo de rotación.
Probabilidad de rotación después de la intervención: 0.1148255

Conclusiones