Problema: Rotación de cargo

En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.

Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.

1. Selección de variables

Se seleccionaran 3 varibles cuantitativas y 3 variables categóricas para se consideran estan relacionadas con la rotación.

Variables Categóricas:

  • Departamento: Diferentes departamentos pueden tener tasas de rotación distintas debido a factores como el ambiente de trabajo o la carga laboral.

    Hipótesis: Los departamentos con mayores cargas laborales o menor flexibilidad pueden tener mayor rotación.

  • Satisfacción Laboral: Una variable categórica que mida qué tan satisfecho está un empleado con su trabajo.

    Hipótesis: Se espera que empleados con niveles bajos de satisfacción tengan una mayor probabilidad de cambiar de cargo.

  • Equilibrio Trabajo Vida: Un mal equilibrio entre el tiempo que percibe el trabajador que invierte en el trabajo y su vida personal podría influir en que busque otras oportunidades que ofrezcan esete beneficio.

    Hipótesis: Los emppleados con un desequilibrio en su vida laboral y personal, buscan un cambio de cargo que ofrezca ese equilibrio.

Variables Cuantitativas:

  • Edad: Podría influir en la disposición al cambio de cargo.

    Hipótesis: Empleados más jóvenes podrían tener una mayor propensión a cambiar de cargo en busca de crecimiento profesional.

  • Antigüedad en el Cargo: El tiempo que un empleado lleva en su posición actual.

    Hipótesis: A mayor antigüedad, menor probabilidad de rotación, ya que el empleado está más adaptado al cargo.

  • Salario Actual: Puede influir en la decisión de permanecer o buscar otro cargo.

    Hipótesis: Los empleados con salarios más bajos pueden tener mayor tendencia a buscar otro cargo con mejor remuneración.

1. Análisis Univariado

Variables Categóricas

Desbalance en la cantidad de empleados:

El departamento de I+D (Investigación y Desarrollo) es el más grande, representando el 65.4% del total de empleados. Ventas es el segundo, con 30.3%. Recursos Humanos (RH) tiene la menor cantidad, solo 4.3%.

  • Posibles implicaciones en la rotación:

    I+D tiene la mayoría de empleados, por lo que es probable que también tenga la mayor cantidad de casos de rotación en términos absolutos.

    RH, al ser el departamento más pequeño, podría no tener suficiente información para detectar patrones significativos de rotación.

Ventas podría ser clave en el análisis si tiene una alta tasa de rotación relativa. La mayoría está satisfecha o muy satisfecha

Satisfacción Laboral:

Los niveles 3 (Satisfecho) y 4 (Muy satisfecho) son los más frecuentes. Menos empleados reportan estar insatisfechos (2) o muy insatisfechos (1).

  • Posible impacto en la rotación

    Si hay alta rotación en niveles 3 y 4, podría indicar que la satisfacción laboral no es el único factor determinante en la rotación.

    Si la rotación es mayor en niveles 1 y 2, entonces la insatisfacción sí es un factor clave en el cambio de cargo.

Equilibrio Laboral:

Mayoría de empleados con equilibrio moderado (Nivel 3). Hay menos empleados en los extremos (1 = Muy malo y 4 = Muy bueno).

  • Posibles implicaciones en la rotación

    Si la rotación es alta en niveles 1 y 2, podría indicar que un mal equilibrio impulsa a los empleados a cambiar de cargo.

    Si la rotación también es alta en nivel 3 o 4, habría que investigar otros factores que influyen en la decisión de cambiar de puesto.

Variables Cuantitativas

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   30.00   36.00   36.92   43.00   60.00

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.000   3.000   4.229   7.000  18.000

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1009    2911    4919    6503    8379   19999

Edad:

Distribución:

Tiene una forma ligeramente asimétrica hacia la derecha (sesgo positivo), aunque bastante cercana a una distribución normal.

La mayor densidad de empleados se concentra entre los 30 y 40 años. A partir de los 45 años, la frecuencia disminuye considerablemente.

Como la hipótesis plantea, los empleados más jóvenes podrían tener mayor movilidad laboral, buscando desarrollo y nuevas oportunidades.

El grueso de la población se encuentra en una edad “media laboral”, lo que permite analizar si la rotación varía de forma significativa según la edad.

Antiguedad en el Cargo:

Hay una concentración muy alta de empleados con menos de 5 años en el cargo, especialmente entre 0 y 2 años.

La frecuencia cae bruscamente después del año 5 y sigue disminuyendo de forma progresiva. Pocos empleados tienen más de 10 años en su cargo actual.

Es probable que muchas personas estén en cargos relativamente nuevos, lo cual podría estar asociado a procesos de rotación frecuentes, crecimiento o reestructuración interna.

La gráfica refuerza la hipótesis de que menor antigüedad podría estar asociada a mayor rotación, ya sea porque:

  • Aún están en etapa de ajuste.

  • Están explorando nuevas posiciones internas.

  • No se han fidelizado con el cargo.

Salario:

La distribución está claramente sesgada hacia la derecha (positivamente asimétrica).

La mayor concentración de empleados gana entre 2,000 y 6,000, lo cual representa el grueso de la población.

A partir de los 10,000, la frecuencia cae drásticamente, aunque aún hay una cantidad notable de empleados con salarios altos (hasta 20,000).

2. Análisis Bivariado

Analizar la relación entre la variable respuesta rotacion (codificada como y = 1 para “Si” y y = 0 para “No”) y cada una de las variables seleccionadas.

  • Pruebas estadísticas para determinar significancia.

  • Visualizaciones para patrones.

  • Coeficientes crudos (odds ratios) para dirección de la relación.

##         
##           No  Si
##   IyD    828 133
##   RH      51  12
##   Ventas 354  92

## 
##  Pearson's Chi-squared test
## 
## data:  rotacion$Departamento and rotacion$rotacion_num
## X-squared = 10.796, df = 2, p-value = 0.004526

Con base en el valor P 0.004526 < 0.05, el departamento influye en la rotación.Departamento de ventas tiene una rotación levenmente mayor a la de los demás.

## 
##  Pearson's Chi-squared test
## 
## data:  rotacion$Satisfación_Laboral and rotacion$rotacion_num
## X-squared = 17.505, df = 3, p-value = 0.0005563

A medida que aumenta el nivel de satisfacción (de 1 a 4), la proporción de empleados que rotan disminuye.

Nivel 1 (Muy insatisfecho): mayor proporción de rotación.

Nivel 4 (Muy satisfecho): menor proporción de rotación.

Esto confirma visualmente la hipótesis de que la insatisfacción está asociada a mayor probabilidad de cambio de cargo.

El p-valor es menor a 0.05, por lo que existe una asociación significativa entre satisfacción laboral y rotación. Esto valida que esta variable tiene un impacto real en el cambio de cargo.

El nivel 1 (peor equilibrio) presenta la mayor proporción de rotación, lo que confirma la hipótesis: un mal equilibrio entre vida personal y trabajo puede impulsar el deseo de cambiar de cargo.

En los niveles 2, 3 y 4, la proporción de rotación se mantiene relativamente constante y más baja que en el nivel 1. El nivel 4 (muy buen equilibrio) no muestra una gran diferencia frente a los niveles intermedios (2 y 3).

El nivel más bajo de equilibrio sí está asociado con mayor rotación, lo que refuerza que esta variable puede ser un predictor útil. Sin embargo, la diferencia entre los niveles 2, 3 y 4 es menos clara.

## 
## Call:
## glm(formula = rotacion_num ~ Edad, family = "binomial", data = rotacion)
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  0.20637    0.30597   0.674      0.5    
## Edad        -0.05225    0.00870  -6.006  1.9e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1259.1  on 1468  degrees of freedom
## AIC: 1263.1
## 
## Number of Fisher Scoring iterations: 4

Los empleados que han rotado tienden a ser más jóvenes, con una mediana de edad menor (aprox. 32 años).

Los empleados que no han rotado tienen una mediana de edad cercana a los 37 años.

También se observa que:

El grupo de rotación presenta más variabilidad en edades, incluyendo algunos outliers mayores. El grupo que no rota está más concentrado en edades entre 30 y 45 años.

Estimación: -0.05225

p-valor: 1.9e-09 → altamente significativo

Esto indica que por cada año adicional de edad, la probabilidad de rotación disminuye significativamente. Por cada año más de edad, las chances de rotar disminuyen en aproximadamente un 5.1%.

## 
## Call:
## glm(formula = rotacion_num ~ Antigüedad_Cargo, family = "binomial", 
##     data = rotacion)
## 
## Coefficients:
##                  Estimate Std. Error z value Pr(>|z|)    
## (Intercept)      -1.11841    0.10380 -10.775  < 2e-16 ***
## Antigüedad_Cargo -0.14628    0.02424  -6.033 1.61e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1255.9  on 1468  degrees of freedom
## AIC: 1259.9
## 
## Number of Fisher Scoring iterations: 5

Los empleados que han rotado tienen, en promedio, menos antigüedad que aquellos que no lo han hecho.

Hay más variabilidad (rango intercuartílico) en quienes no rotan. Se observan outliers en ambos grupos, pero no invalida la tendencia general.

Este boxplot confirma que a menor antigüedad, mayor probabilidad de rotación.Los empleados nuevos están más propensos a buscar otros cargos por ajuste, insatisfacción inicial o búsqueda de crecimiento rápido.

## 
## Call:
## glm(formula = rotacion_num ~ Ingreso_Mensual, family = "binomial", 
##     data = rotacion)
## 
## Coefficients:
##                   Estimate Std. Error z value Pr(>|z|)    
## (Intercept)     -9.291e-01  1.292e-01  -7.191 6.43e-13 ***
## Ingreso_Mensual -1.271e-04  2.162e-05  -5.879 4.12e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1253.1  on 1468  degrees of freedom
## AIC: 1257.1
## 
## Number of Fisher Scoring iterations: 5

Los empleados que han rotado tienden a tener salarios más bajos que los que no han rotado.

Mediana del grupo que rotó: aprox. 3,000

Mediana del grupo que no rotó: aprox. 5,000–6,000

También se observa:

Mayor dispersión en el grupo que no rotó (incluye salarios muy altos). Muchos outliers en ambos grupos, pero especialmente en el grupo que no rotó (personas con salarios > $15,000).

3. Estimación del Modelo

## 
## Call:
## glm(formula = rotacion_num ~ Departamento + Satisfación_Laboral + 
##     Equilibrio_Trabajo_Vida + Edad + Antigüedad_Cargo + Ingreso_Mensual, 
##     family = binomial(link = "logit"), data = rotacion)
## 
## Coefficients:
##                           Estimate Std. Error z value Pr(>|z|)    
## (Intercept)              1.433e+00  4.628e-01   3.097  0.00196 ** 
## DepartamentoRH           4.204e-01  3.480e-01   1.208  0.22694    
## DepartamentoVentas       6.526e-01  1.599e-01   4.082 4.46e-05 ***
## Satisfación_Laboral     -2.744e-01  6.626e-02  -4.142 3.44e-05 ***
## Equilibrio_Trabajo_Vida -2.824e-01  1.023e-01  -2.761  0.00576 ** 
## Edad                    -2.808e-02  9.664e-03  -2.905  0.00367 ** 
## Antigüedad_Cargo        -1.070e-01  2.651e-02  -4.037 5.41e-05 ***
## Ingreso_Mensual         -7.966e-05  2.543e-05  -3.133  0.00173 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1184.0  on 1462  degrees of freedom
## AIC: 1200
## 
## Number of Fisher Scoring iterations: 5
##             (Intercept)          DepartamentoRH      DepartamentoVentas 
##               4.1914548               1.5226381               1.9206087 
##     Satisfación_Laboral Equilibrio_Trabajo_Vida                    Edad 
##               0.7600064               0.7539776               0.9723145 
##        Antigüedad_Cargo         Ingreso_Mensual 
##               0.8985202               0.9999203
## Waiting for profiling to be done...
##                                 2.5 %        97.5 %
## (Intercept)              0.5282199239  2.344058e+00
## DepartamentoRH          -0.3013574168  1.073717e+00
## DepartamentoVentas       0.3383962267  9.657935e-01
## Satisfación_Laboral     -0.4047752775 -1.448205e-01
## Equilibrio_Trabajo_Vida -0.4825361247 -8.121971e-02
## Edad                    -0.0473476524 -9.428720e-03
## Antigüedad_Cargo        -0.1600255831 -5.601132e-02
## Ingreso_Mensual         -0.0001313911 -3.147759e-05
## Analysis of Deviance Table
## 
## Model: binomial, link: logit
## 
## Response: rotacion_num
## 
## Terms added sequentially (first to last)
## 
## 
##                         Df Deviance Resid. Df Resid. Dev  Pr(>Chi)    
## NULL                                     1469     1298.6              
## Departamento             2   10.490      1467     1288.1 0.0052729 ** 
## Satisfación_Laboral      1   15.785      1466     1272.3 7.098e-05 ***
## Equilibrio_Trabajo_Vida  1    7.656      1465     1264.7 0.0056586 ** 
## Edad                     1   40.673      1464     1224.0 1.800e-10 ***
## Antigüedad_Cargo         1   28.995      1463     1195.0 7.255e-08 ***
## Ingreso_Mensual          1   10.949      1462     1184.0 0.0009363 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

4. Evaluación del Modelo

## Setting levels: control = 0, case = 1
## Setting direction: controls < cases

## El área bajo la curva ROC (AUC) es: 0.7165673
##   threshold
## 1 0.2032001
## [1] "Matriz de Confusión:"
##     Predicho
## Real    0    1
##    0 1232    1
##    1  232    5
## 
## Métricas de Desempeño: 
## Accuracy: 0.8414966 
## Sensibilidad (Recall): 0.02109705 
## Especificidad: 0.999189
## ResourceSelection 0.3-6   2023-06-27
## 
##  Hosmer and Lemeshow goodness of fit (GOF) test
## 
## data:  rotacion$rotacion_num, fitted(modelo_logistico)
## X-squared = 15.871, df = 8, p-value = 0.04426

AUC (Área Bajo la Curva) = 0.717 Interpretación: El AUC de 0.717 indica que el modelo tiene una buena capacidad de discriminación. Un valor de AUC cercano a 1 sugiere que el modelo es muy eficaz para distinguir entre las clases (rotación sí/no).

AUC entre 0.7 y 0.8 se considera un buen modelo, pero no perfecto.

AUC > 0.8 sería excelente.

Curva ROC: La curva ROC muestra que el modelo tiene una buena capacidad para predecir la rotación, ya que el área debajo de la curva es bastante grande.

El modelo mejora considerablemente en comparación con una predicción aleatoria (la línea diagonal), que tendría un AUC de 0.5.

5. Predicciones

# Asegúrate de que nuevo_empleado tenga todas las variables que usa el modelo
nuevo_empleado <- rotacion[1, ]

# Modificar valores (usando los nombres EXACTOS que aparecen en el modelo)
nuevo_empleado$Edad <- 26
nuevo_empleado$Antigüedad_Cargo <- 1
nuevo_empleado$Ingreso_Mensual <- 2909
nuevo_empleado$Satisfación_Laboral <- 2  # Asegúrate que este es el nombre exacto usado en el modelo
nuevo_empleado$Equilibrio_Trabajo_Vida <- 3

# Es crucial que Departamento sea un factor con los mismos niveles que en el modelo original
nuevo_empleado$Departamento <- factor("Ventas", levels = levels(rotacion$departamento))

# También debes asegurarte de incluir la variable respuesta recodificada
nuevo_empleado$rotacion_num <- NA  # No la necesitamos para predecir, pero sí para la estructura

# Predecir probabilidad
prob_rotacion <- predict(modelo_logistico, newdata = nuevo_empleado, type = "response")
paste0("Probabilidad de rotación: ", round(prob_rotacion * 100, 2), "%")
## [1] "Probabilidad de rotación: 40.64%"

6. Conclusiones

Con base en el análisis realizado, el modelo de regresión logística permitió identificar las variables que tienen mayor influencia en la rotación de empleados dentro de la empresa. Entre las variables más significativas se encuentran:

Edad: los empleados más jóvenes tienen mayor probabilidad de rotar.

Antigüedad en el cargo: a menor tiempo en el puesto, mayor es la rotación.

Salario actual: los empleados con ingresos más bajos muestran mayor propensión a cambiar de cargo.

Satisfacción laboral: niveles bajos de satisfacción están asociados a mayores tasas de rotación.

Equilibrio trabajo-vida: los empleados con bajo equilibrio también presentan mayor intención de rotar.

Recomendaciones:

  1. Mejorar la Satisfacción Laboral Implementar encuestas de clima laboral para identificar causas específicas de insatisfacción.

Programas de reconocimiento: Bonos por desempeño, ascensos internos o beneficios no monetarios (ej., días libres adicionales).

Capacitación continua: Cursos de desarrollo profesional para aumentar el engagement.

  1. Equilibrio Trabajo-Vida Flexibilidad horaria: Opciones de teletrabajo o horarios comprimidos.

Políticas de desconexión: Limitar horas extras y comunicaciones fuera del horario laboral.

Beneficios familiares: Guarderías subsidiadas o apoyo en cuidados de adultos mayores.

  1. Retención en Departamentos Críticos (ej. Ventas) Rediseñar metas realistas: Evitar objetivos imposibles que generen estrés.

Mentorías: Asignar mentores a nuevos empleados para facilitar su adaptación.

Bonos por permanencia: Incentivos económicos tras X años en la empresa.

  1. Enfoque en Empleados Jóvenes Planes de carrera claros: Mostrar trayectorias de crecimiento dentro de la organización.

Rotación interna: Oportunidades para cambiar de departamento sin salir de la empresa.

  1. Ajustes Salariales Competitivos Benchmarking salarial: Comparar con el mercado para asegurar equidad.

Aumentos periódicos: Vinculados a desempeño o antigüedad.