Rotación de cargo

En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.

Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.

A continuación se describen los pasos que la gerencia ha propuesto para el análisis:

1. Selección de variables

Paso 1: Cargue del dataset.

## Rows: 1,470
## Columns: 24
## $ Rotación                    <chr> "Si", "No", "Si", "No", "No", "No", "No", …
## $ Edad                        <dbl> 41, 49, 37, 33, 27, 32, 59, 30, 38, 36, 35…
## $ `Viaje de Negocios`         <chr> "Raramente", "Frecuentemente", "Raramente"…
## $ Departamento                <chr> "Ventas", "IyD", "IyD", "IyD", "IyD", "IyD…
## $ Distancia_Casa              <dbl> 1, 8, 2, 3, 2, 2, 3, 24, 23, 27, 16, 15, 2…
## $ Educación                   <dbl> 2, 1, 2, 4, 1, 2, 3, 1, 3, 3, 3, 2, 1, 2, …
## $ Campo_Educación             <chr> "Ciencias", "Ciencias", "Otra", "Ciencias"…
## $ Satisfacción_Ambiental      <dbl> 2, 3, 4, 4, 1, 4, 3, 4, 4, 3, 1, 4, 1, 2, …
## $ Genero                      <chr> "F", "M", "M", "F", "M", "M", "F", "M", "M…
## $ Cargo                       <chr> "Ejecutivo_Ventas", "Investigador_Cientifi…
## $ Satisfación_Laboral         <dbl> 4, 2, 3, 3, 2, 4, 1, 3, 3, 3, 2, 3, 3, 4, …
## $ Estado_Civil                <chr> "Soltero", "Casado", "Soltero", "Casado", …
## $ Ingreso_Mensual             <dbl> 5993, 5130, 2090, 2909, 3468, 3068, 2670, …
## $ Trabajos_Anteriores         <dbl> 8, 1, 6, 1, 9, 0, 4, 1, 0, 6, 0, 0, 1, 0, …
## $ Horas_Extra                 <chr> "Si", "No", "Si", "Si", "No", "No", "Si", …
## $ Porcentaje_aumento_salarial <dbl> 11, 23, 15, 11, 12, 13, 20, 22, 21, 13, 13…
## $ Rendimiento_Laboral         <dbl> 3, 4, 3, 3, 3, 3, 4, 4, 4, 3, 3, 3, 3, 3, …
## $ Años_Experiencia            <dbl> 8, 10, 7, 8, 6, 8, 12, 1, 10, 17, 6, 10, 5…
## $ Capacitaciones              <dbl> 0, 3, 3, 3, 3, 2, 3, 2, 2, 3, 5, 3, 1, 2, …
## $ Equilibrio_Trabajo_Vida     <dbl> 1, 3, 3, 3, 3, 2, 2, 3, 3, 2, 3, 3, 2, 3, …
## $ Antigüedad                  <dbl> 6, 10, 0, 8, 2, 7, 1, 1, 9, 7, 5, 9, 5, 2,…
## $ Antigüedad_Cargo            <dbl> 4, 7, 0, 7, 2, 7, 0, 0, 7, 7, 4, 5, 2, 2, …
## $ Años_ultima_promoción       <dbl> 0, 1, 0, 3, 2, 3, 0, 0, 1, 7, 0, 0, 4, 1, …
## $ Años_acargo_con_mismo_jefe  <dbl> 5, 7, 0, 0, 2, 6, 0, 0, 8, 7, 3, 8, 3, 2, …

Paso 2: Variables categóricas

• Género: Se espera que el género influya en la rotación, ya que factores como sesgos en oportunidades de crecimiento, balance entre vida y trabajo, y expectativas laborales pueden diferir entre hombres y mujeres.

Hipótesis: La rotación es mayor en un género específico debido a diferencias en condiciones laborales o expectativas profesionales.

• Estado Civil Se espera que el estado civil tenga un impacto en la rotación, ya que empleados casados pueden buscar estabilidad mientras que los solteros pueden estar más abiertos a cambiar de cargo o empresa.

Hipótesis: Los empleados solteros tienen mayor probabilidad de rotar en comparación con los casados debido a una menor necesidad de estabilidad laboral.

• Cargo Se espera que ciertos cargos tengan mayores tasas de rotación debido a factores como nivel de estrés, carga laboral y oportunidades de crecimiento.

Hipótesis: Los empleados en cargos de menor nivel jerárquico o con mayor carga laboral tienen una mayor probabilidad de rotación en comparación con cargos más altos o administrativos

Paso 3: Variables cuantitativas

• Distancia de la casa: Se espera que los empleados que viven más lejos de la empresa enfrenten mayores dificultades de desplazamiento, lo que puede aumentar su propensión a cambiar de empleo para reducir el tiempo y costo de transporte.

Hipótesis: A mayor distancia de la casa al lugar de trabajo, mayor será la probabilidad de rotación, ya que los empleados pueden buscar opciones laborales más cercanas a su domicilio.

• Trabajos anteriores: Se espera que los empleados con mayor cantidad de trabajos previos tengan una mayor tendencia a cambiar de empleo, ya sea por una menor estabilidad laboral o por una mayor disposición a buscar nuevas oportunidades.

Hipótesis: Los empleados con más trabajos anteriores tienen una mayor probabilidad de rotación, ya que están más acostumbrados a cambiar de empleo en busca de mejores condiciones.

• Edad: Se espera que los empleados más jóvenes tengan una mayor movilidad laboral en busca de mejores oportunidades o crecimiento profesional, mientras que los empleados mayores puedan preferir estabilidad.

Hipótesis: Los empleados más jóvenes tienen una mayor probabilidad de rotación en comparación con los empleados mayores, debido a la búsqueda de desarrollo profesional y nuevas experiencias laborales.

2. Análisis univariado:

Paso 1: Revisión de datos faltantes

##                    Rotación                        Edad 
##                           0                           0 
##           Viaje de Negocios                Departamento 
##                           0                           0 
##              Distancia_Casa                   Educación 
##                           0                           0 
##             Campo_Educación      Satisfacción_Ambiental 
##                           0                           0 
##                      Genero                       Cargo 
##                           0                           0 
##         Satisfación_Laboral                Estado_Civil 
##                           0                           0 
##             Ingreso_Mensual         Trabajos_Anteriores 
##                           0                           0 
##                 Horas_Extra Porcentaje_aumento_salarial 
##                           0                           0 
##         Rendimiento_Laboral            Años_Experiencia 
##                           0                           0 
##              Capacitaciones     Equilibrio_Trabajo_Vida 
##                           0                           0 
##                  Antigüedad            Antigüedad_Cargo 
##                           0                           0 
##       Años_ultima_promoción  Años_acargo_con_mismo_jefe 
##                           0                           0

Se evidencia que no hay datos faltantes en el dataset.

Paso 2: Análisis de la variable rotación

De acuerdo con el gráfico anterior, se observa una alta estabilidad laboral en la organización (84%). Sin embargo, aunque la rotación es baja (16%), es importante evaluar las causas que lo anteceden.

Paso 3: Frecuencias de las variables categóricas
Género Frecuencia
F 588
M 882
Estado civil Frecuencia
Casado 673
Divorciado 327
Soltero 470
Cargo Frecuencia
Director_Investigación 80
Director_Manofactura 145
Ejecutivo_Ventas 326
Gerente 102
Investigador_Cientifico 292
Recursos_Humanos 52
Representante_Salud 131
Representante_Ventas 83
Tecnico_Laboratorio 259

El análisis de las frecuencias muestra una mayor representación masculina en la compañía. En cuanto al estado civil, la mayoría está casada (673), seguida de personas solteras (470) y divorciadas (327). En los cargos ocupados, destacan roles estratégicos como Ejecutivo de Ventas (326) e Investigador Científico (292), así como una presencia significativa de Técnicos de Laboratorio (259). En contraste, áreas como Recursos Humanos (52) y Representante de Ventas (83) tienen menor participación.

Paso 4: Frecuencias de las variables cuantitativas

Distancia (km) Frecuencia
1 a 5 632
6 a 10 394
11 a 15 115
16 a 20 125
21 a 24 92
25+ 112
Trabajos anteriores (#) Frecuencia
0 197
1 a 3 826
4 a 6 272
7+ 175
Edad Frecuencia
18 a 24 97
25 a 29 229
30 a 34 325
35 a 39 297
40 a 44 207
45 a 49 142
50+ 173

El análisis de las frecuencias muestra que la mayoría de los empleados vive a menos de 10 km del trabajo, aunque 112 residen a más de 25 km, lo que podría influir en la rotación. En cuanto a la experiencia, la mayoría ha tenido entre 1 y 3 trabajos previos (826), mientras que 197 no tenían experiencia. En términos de edad, los grupos más representativos son de 30 a 39 años, aunque los mayores de 50 también tienen una presencia significativa (173). Estos datos pueden ayudar a entender patrones de permanencia y rotación en la empresa.

3. Análisis bivariado:

Realiza un análisis de bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera:
\(y = 1\) es si rotación, \(y = 0\) es no rotación. Con base en estos resultados identifique cuáles son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipótesis planteada en el punto 2.

Paso 1: Análisis bivariado de las variables categóricas

• Rotación según género:

• Rotación según estado civil:

• Rotación según cargo:

De acuerdo con los gráficos anteirores, la rotación es mayor en hombres (17%) que en mujeres (15%). Los solteros (26%) rotan más que los casados (12%) y divorciados (10%), indicando mayor estabilidad en estos últimos. Por cargo, la rotación es más alta en Representantes de Ventas (40%), Recursos Humanos (23%) y Técnicos de Laboratorio (24%), mientras que es mínima en Directores de Investigación (2%) y Gerentes (5%), reflejando mayor estabilidad en cargos estratégicos.

Paso 2: Análisis bivariado de las variables cuantitativas

• Rotación según la distancia de la casa:

• Rotación según el número de trabajos anteriores:

• Rotación según la edad:

Los boxplots muestran que los empleados con mayor rotación tienden a vivir más lejos, haber tenido más empleos previos y ser más jóvenes. Esto indica que la distancia al trabajo, la experiencia laboral previa y la edad pueden influir en la movilidad laboral, con empleados más jóvenes y con historial de cambios laborales siendo más propensos a la rotación.

4. Estimación del modelo

\(y = 1\) es si rotación, \(y = 0\) es no rotación. Con base en estos resultados identifique cuáles son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipótesis planteada en el punto 2.

Antes de analizar el modelo, es importante hacer la conversión de las variables categóricas a factor para poder ser utilizadas en el modelo. Así mismo, la variable de respuesta (rotación). Posteriormente, se realiza la separación de la base de datos en conjuntos de entrenamiento y prueba, con un 70% y 30%, respectivamente.

## 
## Call:
## glm(formula = Rotación ~ Distancia_Casa + Trabajos_Anteriores + 
##     Edad + Genero + Estado_Civil + Cargo, family = binomial, 
##     data = train)
## 
## Coefficients:
##                              Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                  -2.89607    1.15827  -2.500  0.01241 *  
## Distancia_Casa                0.03110    0.01118   2.782  0.00540 ** 
## Trabajos_Anteriores           0.10701    0.03755   2.850  0.00437 ** 
## Edad                         -0.04840    0.01244  -3.892 9.94e-05 ***
## GeneroM                      -0.01689    0.19184  -0.088  0.92984    
## Estado_CivilDivorciado       -0.31035    0.28245  -1.099  0.27187    
## Estado_CivilSoltero           0.84854    0.20201   4.200 2.66e-05 ***
## CargoDirector_Manofactura     1.43602    1.07622   1.334  0.18210    
## CargoEjecutivo_Ventas         2.05291    1.03674   1.980  0.04769 *  
## CargoGerente                  1.08694    1.17516   0.925  0.35500    
## CargoInvestigador_Cientifico  1.94501    1.04120   1.868  0.06175 .  
## CargoRecursos_Humanos         2.84493    1.09790   2.591  0.00956 ** 
## CargoRepresentante_Salud      1.39010    1.09184   1.273  0.20296    
## CargoRepresentante_Ventas     3.24133    1.06488   3.044  0.00234 ** 
## CargoTecnico_Laboratorio      2.48702    1.03753   2.397  0.01653 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 896.03  on 1028  degrees of freedom
## Residual deviance: 770.54  on 1014  degrees of freedom
## AIC: 800.54
## 
## Number of Fisher Scoring iterations: 6

El análisis de regresión logística muestra que la distancia al trabajo influye significativamente, donde los empleados que viven más lejos tienen mayor probabilidad de rotar. Además, aquellos con más trabajos anteriores también presentan una mayor tendencia a cambiar de empleo. La edad es otro factor clave, ya que a medida que aumenta, la probabilidad de rotación disminuye. En cuanto al estado civil, los empleados solteros tienen una mayor propensión a la rotación en comparación con los casados o divorciados. Por último, el cargo también impacta la rotación, siendo más alta en roles como representantes de ventas, recursos humanos, investigadores científicos y técnicos de laboratorio.

De acuerdo con las hipótesis planteadas, el Género no es significativo para la rotación laboral. Por consiguiente, se elimina del modelo.

## 
## Call:
## glm(formula = Rotación ~ Distancia_Casa + Trabajos_Anteriores + 
##     Edad + Estado_Civil + Cargo, family = binomial, data = train)
## 
## Coefficients:
##                              Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                  -2.90589    1.15286  -2.521  0.01172 *  
## Distancia_Casa                0.03108    0.01118   2.781  0.00542 ** 
## Trabajos_Anteriores           0.10726    0.03744   2.865  0.00417 ** 
## Edad                         -0.04841    0.01244  -3.893 9.90e-05 ***
## Estado_CivilDivorciado       -0.31050    0.28245  -1.099  0.27163    
## Estado_CivilSoltero           0.84934    0.20180   4.209 2.57e-05 ***
## CargoDirector_Manofactura     1.43698    1.07612   1.335  0.18177    
## CargoEjecutivo_Ventas         2.05196    1.03666   1.979  0.04777 *  
## CargoGerente                  1.08773    1.17510   0.926  0.35463    
## CargoInvestigador_Cientifico  1.94415    1.04111   1.867  0.06185 .  
## CargoRecursos_Humanos         2.84345    1.09771   2.590  0.00959 ** 
## CargoRepresentante_Salud      1.38895    1.09174   1.272  0.20329    
## CargoRepresentante_Ventas     3.24260    1.06474   3.045  0.00232 ** 
## CargoTecnico_Laboratorio      2.48459    1.03714   2.396  0.01659 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 896.03  on 1028  degrees of freedom
## Residual deviance: 770.55  on 1015  degrees of freedom
## AIC: 798.55
## 
## Number of Fisher Scoring iterations: 6

Teniendo en cuenta una significancia del 0.05, la ecuación de la regresión logística estimada es:

\[ \log\left(\frac{P(\text{Rotación} = 1)}{1 - P(\text{Rotación} = 1)}\right) = -2.9 + 0.03 \cdot \text{Distancia Casa} + 0.11 \cdot \text{Trabajos Anteriores} - 0.05 \cdot \text{Edad} \]

\[ + 0.85 \cdot \text{Estado Civil Soltero} + 2.05 \cdot \text{Cargo Ejecutivo Ventas} + 2.84 \cdot \text{Cargo Recursos Humanos} \]

\[ + 3.24 \cdot \text{Cargo Representante Ventas} + 2.48 \cdot \text{Cargo Técnico Laboratorio} \]

Interpretación:

  • Coeficientes positivos: La variable aumenta la probabilidad de rotación.

  • Coeficientes negativos: La variable reduce la probabilidad de rotación.

5. Evaluación

Para la obtención de la curva ROC y el valor AUC, se realizan los pronósticos del modelo de regresión logística sobre el conjunto de prueba de la base de datos.

Se puede observar que la curva se aleja de la diagonal, lo que indica que el modelo tiene capacidad de predicción. Sin embargo, no es una curva muy pronunciada hacia la esquina superior izquierda, lo que da a entender que el modelo tiene una capacidad de discriminación moderada, lo cual también se ve reflejado en el valor AUC, que indica que se tiene un 69.13% de probabilidad de clasificar correctamente los valores positivos.

6. Predicciones

La idea es realizar una predicción de la probabilidad de que un individuo (hipotético) rote y definir un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado). Se escoge entonces un empleado de ejemplo del conjunto de test de la base de datos. Se muestran las variables del empleado de ejemplo que son de interés para la predicción del modelo:

## # A tibble: 1 × 6
##   Rotación Distancia_Casa Trabajos_Anteriores  Edad Estado_Civil Cargo          
##   <fct>             <dbl>               <dbl> <dbl> <fct>        <fct>          
## 1 No                   28                   4    43 Soltero      Investigador_C…

Fijando el umbral para determinar el corte de rotación en 0.5, se tiene la siguiente predicción del modelo de regresión logística para el empleado seleccionado:

##         1 
## 0.2901038

Se observa que a pesar de que el empleado cuenta con características que pueden aumentar su probabilidad de rotación, como son una alta distancia desde la casa, número de trabajos anteriores y estado civil soltero, la predicción arroja un valor bajo del 29.01%, lo cual es acertado con el parámetro de rotación para el empleado en la base de datos.

Con este empleado ejemplo se tiene entonces que para su caso hay otros factores que reducen su probabilidad de rotación. A pesar de que el cargo de Investigar Científico presenta un coeficiente positivo en el modelo, no es tan fuerte como para otros cargos. Se tiene también que la edad alta impacta fuertemente en la probabilidad de rotación, ya que al tener 43 años disminuye significativamente dicho valor.

Para respaldar las conclusiones anteriores, se modifican las variables de cargo y edad para el empleado seleccionado, observando el nuevo comportamiento en la probabilidad de rotación. Se cambia inicialmente el cargo a Representante Ventas:

## # A tibble: 1 × 5
##   Distancia_Casa Trabajos_Anteriores  Edad Estado_Civil Cargo               
##            <dbl>               <dbl> <dbl> <fct>        <chr>               
## 1             28                   4    43 Soltero      Representante_Ventas

Al ingresar este nuevo perfil al modelo obtenido, se tiene la siguiente predicción:

##         1 
## 0.5995462

El cargo Representate Ventas, según el modelo obtenido, tiene uno de los coeficientes más altos y significativos, lo que sugiere que los empleados en esta posición son notablemente más propensos a rotar. Esto puede estar asociado a factores como alta presión comercial, menor estabilidad o metas agresivas.

Posteriormente, se cambia también la edad de este nuevo empleado simulado:

## # A tibble: 1 × 5
##   Distancia_Casa Trabajos_Anteriores  Edad Estado_Civil Cargo               
##            <dbl>               <dbl> <dbl> <fct>        <chr>               
## 1             28                   4    25 Soltero      Representante_Ventas

Obteniendo una nueva probabilidad de rotación arrojada por el modelo:

##         1 
## 0.7815927

Reducir la edad acentúa aún más la tendencia a rotar, lo cual refuerza lo aprendido del modelo. Entre la edad sea más baja se tiene una mayor probabilidad de rotación, esto puede estár relacionado con menor compromiso, búsqueda de nuevas oportunidades o menor estabilidad profesional.

Con todo lo anterior, se concluye entonces que aunque el empleado seleccionado inicialmente tiene algunas características que se han asociado a mayor rotación, el efecto protector de la edad y posiblemente su experiencia previa compensan los factores de riesgo. Con un 29% de probabilidad, el modelo sugiere que no es necesario intervenir en este caso, aunque sí podría monitorearse si aparecen otros factores como desmotivación, bajo rendimiento o quejas.

Si se quisiera plantear una estrategia de motivación para este perfil, se podría considerar otorgar una flexibilidad horaria o trabajo híbrido, dado que vive lejos, o un reconocimiento profesional u oportunidades de crecimiento para mantener su compromiso.

7. Conclusiones

A partir del análisis realizado mediante un modelo de regresión logística, fue posible identificar los principales factores asociados a la probabilidad de rotación de los empleados en la organización. El modelo incluyó variables tanto numéricas como categóricas, y demostró un comportamiento coherente con la realidad organizacional: a mayor edad, menor es la probabilidad de rotación, mientras que cargos como Representante de Ventas y estados civiles como Soltero tienden a incrementar dicha probabilidad. Además, se comprobó que mayores distancias entre el hogar y el lugar de trabajo también elevan el riesgo de rotación.

Se realizaron simulaciones de escenarios hipotéticos que permitieron observar cómo ciertos cambios individuales (por ejemplo, reducir la edad o cambiar a un cargo con alta rotación) aumentan considerablemente la probabilidad estimada de que un empleado decida dejar la empresa. Un caso específico mostró que un cambio de cargo y edad puede elevar la probabilidad de rotación de 29% a más del 78%, lo cual refuerza la importancia de analizar perfiles individuales con base en estos factores.

El modelo logró clasificar correctamente un caso real del conjunto de datos y presenta un valor de AUC aceptable (0.69), indicando una capacidad razonable para discriminar entre empleados con y sin tendencia a rotar. Esto respalda su utilidad como herramienta preventiva para la toma de decisiones en gestión del talento humano.

Con base en los resultados obtenidos, se proponen las siguientes estrategias enfocadas en los perfiles con mayor riesgo de rotación:

  • Flexibilidad laboral y teletrabajo parcial para empleados con grandes distancias entre casa y trabajo, lo que podría disminuir el impacto negativo de los largos desplazamientos.

  • Planes de desarrollo profesional, mentorías y reconocimiento para cargos con alta rotación (como Representantes de Ventas), que suelen estar más expuestos al estrés comercial o metas exigentes.

  • Programas de fidelización para empleados jóvenes y solteros, quienes mostraron una mayor propensión a rotar. Esto puede incluir actividades de integración, beneficios personalizados o acompañamiento en crecimiento profesional.

  • Uso preventivo del modelo de predicción para identificar de manera anticipada los perfiles en riesgo y permitir a RRHH tomar decisiones oportunas.

En resumen, la combinación de herramientas analíticas con estrategias centradas en el bienestar y desarrollo del talento puede ser clave para reducir la rotación y fortalecer la retención en la empresa.