En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuáles factores indicen en mayor proporción a estos cambios.
Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.
A continuación se describen los pasos que la gerencia ha propuesto para el análisis:
Visualizacion del listado de variables y tipo de datos
## Variable Tipo
## Rotación Rotación character
## Edad Edad numeric
## Viaje de Negocios Viaje de Negocios character
## Departamento Departamento character
## Distancia_Casa Distancia_Casa numeric
## Educación Educación numeric
## Campo_Educación Campo_Educación character
## Satisfacción_Ambiental Satisfacción_Ambiental numeric
## Genero Genero character
## Cargo Cargo character
## Satisfación_Laboral Satisfación_Laboral numeric
## Estado_Civil Estado_Civil character
## Ingreso_Mensual Ingreso_Mensual numeric
## Trabajos_Anteriores Trabajos_Anteriores numeric
## Horas_Extra Horas_Extra character
## Porcentaje_aumento_salarial Porcentaje_aumento_salarial numeric
## Rendimiento_Laboral Rendimiento_Laboral numeric
## Años_Experiencia Años_Experiencia numeric
## Capacitaciones Capacitaciones numeric
## Equilibrio_Trabajo_Vida Equilibrio_Trabajo_Vida numeric
## Antigüedad Antigüedad numeric
## Antigüedad_Cargo Antigüedad_Cargo numeric
## Años_ultima_promoción Años_ultima_promoción numeric
## Años_acargo_con_mismo_jefe Años_acargo_con_mismo_jefe numeric
Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.
Horas Extra:
Relación esperada: Los empleados que trabajan horas extra de forma frecuente podrían estar más insatisfechos con su carga laboral, lo que podría llevar a un cambio de cargo. Dado que el trabajo adicional puede causar insatisfacción, se espera una relación positiva con la rotación.
Hipótesis: Aquellos empleados que realizan más horas extra tienen una mayor probabilidad de cambiar de cargo debido al agotamiento y la falta de equilibrio entre trabajo y vida personal.
Viaje de Negocios:
Relación esperada: Los empleados que viajan frecuentemente pueden estar estresados o tener una carga familiar más pesada, lo que los hace más propensos a elegir un puesto sin viajes. Así, se espera una relación positiva entre el viaje de negocios y la rotación.
Hipótesis: Los empleados que viajan más por motivos laborales son más propensos a cambiar de cargo y buscar un recorte en la cantidad de viajes, ya que estarán buscando un puesto de trabajo desafiante y al mismo tiempo para un empleador atento.
Departamento:
Relación esperada: Los empleados de ciertos departamentos (por ejemplo, ventas o atención al cliente) podrían enfrentar mayor carga laboral o menor estabilidad, lo que puede llevar a una mayor rotación. Se espera que los empleados en departamentos con mayor presión tengan mayor probabilidad de rotación.
Hipótesis: El departamento en el que trabaja un empleado influye en su decisión de cambiar de cargo. Algunos departamentos con mayor carga laboral podrían tener tasas más altas de rotación.
Antigüedad en el Cargo:
Relación esperada: Los empleados que han laborado en el mismo cargo durante mucho tiempo pueden estar más propensos a buscar un cambio, ya sea por falta de crecimiento profesional o monotonía. Se espera una relación negativa, donde los empleados con menos tiempo en su cargo actual tienen una menor probabilidad de rotación.
Hipótesis: A mayor antigüedad en el cargo, mayor será la probabilidad de que el empleado busque un cambio de rol para mejorar su desarrollo profesional.
Ingreso Mensual:
Relación esperada: Los empleados con ingresos más bajos pueden estar más motivados a cambiar de cargo buscando mejores oportunidades salariales. Se espera una relación negativa entre ingreso mensual y rotación.
Hipótesis: Los empleados con menores ingresos tienen una mayor probabilidad de buscar un cambio de cargo en busca de mejores oportunidades salariales.
Satisfacción Laboral:
Relación esperada: La satisfacción laboral es un indicador directo del bienestar del empleado en su cargo. A menor satisfacción laboral, es más probable que busquen cambiar de puesto. Se espera una relación negativa entre satisfacción laboral y la rotación.
Hipótesis: A menor satisfacción laboral, mayor es la probabilidad de rotación del empleado.
## # A tibble: 6 × 7
## Rotación Horas_Extra `Viaje de Negocios` Departamento Antigüedad_Cargo
## <chr> <chr> <chr> <chr> <dbl>
## 1 Si Si Raramente Ventas 4
## 2 No No Frecuentemente IyD 7
## 3 Si Si Raramente IyD 0
## 4 No Si Frecuentemente IyD 7
## 5 No No Raramente IyD 2
## 6 No No Frecuentemente IyD 7
## # ℹ 2 more variables: Ingreso_Mensual <dbl>, Satisfación_Laboral <dbl>
Calcular la correlación entre las variables numéricas
## Antigüedad_Cargo Ingreso_Mensual Satisfación_Laboral
## Antigüedad_Cargo 1.000000000 0.363817667 -0.002304785
## Ingreso_Mensual 0.363817667 1.000000000 -0.007156742
## Satisfación_Laboral -0.002304785 -0.007156742 1.000000000
Se tiene que, la única correlación significativa es entre la antigüedad en el cargo y el ingreso mensual, lo que indica que, a medida que los empleados permanecen más tiempo en la empresa, sus salarios tienden a aumentar. Sin embargo, ni la antigüedad ni el ingreso parecen estar relacionados de manera efectiva con la satisfacción laboral. Con esto se hace necesario explorar más a fondo qué otros factores realmente influyen en la satisfacción de los empleados.
Identificacion de datos faltantes
## # A tibble: 1 × 7
## Rotación Horas_Extra `Viaje de Negocios` Departamento Antigüedad_Cargo
## <int> <int> <int> <int> <int>
## 1 0 0 0 0 0
## # ℹ 2 more variables: Ingreso_Mensual <int>, Satisfación_Laboral <int>
No se evidencian datos faltantes en el set de datos.
Análisis Univariado de Variables Categóricas
##
## Frecuentemente No_Viaja Raramente
## 277 150 1043
La variable Viaje de Negocios muestra que:
La mayoría de los empleados viaja por negocios de manera poco recurrente o no viaja en absoluto. Un pequeño porcentaje viaja con frecuencia. Esto sugiere que los viajes frecuentes no son la politica de la empresa, pero es importante evaluar si los empleados que viajan más están más propensos a cambiar de cargo, ya que los viajes frecuentes pueden generar cansancio o afectar el equilibrio entre la vida personal y laboral, influyendo en la rotación.
##
## IyD RH Ventas
## 961 63 446
La variable Departamento muestra que:
El área de Investigación y Desarrollo es el departamento más grande de la empresa, concentrando a la mayoría de los empleados. Las áreas de Ventas y Recursos Humanos representan una menor proporción. Una opcion a analizar es si la rotación de empleados varía según el departamento, ya que ciertas áreas, como Ventas, pueden tener una rotación más alta debido a la naturaleza del trabajo o las presiones inherentes, mientras que en RH y IyD, el cambio de cargo podría ser menos frecuente.
##
## No Si
## 1054 416
La variable Horas Extra muestra que:
En su mayoría los colaboradores no registran horas extra, lo que podría indicar que el balance entre la vida laboral y la personal es favorable. Sin embargo, es importante analizar si aquellos que sí realizan horas extra tienen una mayor probabilidad de rotación, ya que el trabajo adicional podría generar insatisfacción o estrés, lo que afectaría su decisión de cambiar de cargo.
##
## No Si
## 1233 237
Análisis Univariado de Variables Numéricas
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 30.00 36.00 36.92 43.00 60.00
Edad: Esta variable puede ser relevante para las decisiones de gestión de talento humano y desarrollo de programas de retención, ya que entender la edad de los empleados puede ayudar a diseñar estrategias específicas que aborden las necesidades y expectativas de los diferentes rangos de edades en los que se encuentran los colaboradores.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1009 2911 4919 6503 8379 19999
Ingreso_Mensual: Los salarios no estan equilibrados. Se tiene un grupo pequeño de empleados que recibe sueldos muy altos, mientras que la mayoría está en niveles salariales más bajos o intermedios.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 3.000 5.000 7.008 9.000 40.000
Antigüedad_Cargo: La mayoría de los empleados tiene una antigüedad relativamente baja en su cargo actual, pero existe un grupo pequeño con una permanencia prolongada en la compañia.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 3.000 2.729 4.000 4.000
Satisfacción Laboral: Aunque la mayoría de los empleados se encuentra moderadamente satisfecha, hay un segmento significativo con niveles de satisfacción bajos. Esto podría ser un factor relevante a explorar en relación con la rotación.
Los empleados presentan una antigüedad baja en su cargo, con salarios muy variados, y niveles de satisfacción laboral moderados. Estos factores pueden estar influyendo en la rotación de empleados, ya que una baja satisfacción o antigüedad podría aumentar la probabilidad de cambio de cargo, mientras que los ingresos pueden tener un impacto diferenciador en la retención o búsqueda de nuevas oportunidades.
Realiza un análisis de bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.
One Hot Encoding de las Variables Categóricas
Ajustar el Modelo de Regresión Logística
##
## Call:
## glm(formula = Rotación ~ ., family = binomial(), data = variables_modelo)
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.5252588 0.3026229 5.040 4.65e-07 ***
## Antigüedad_Cargo -0.1149938 0.0271758 -4.231 2.32e-05 ***
## Ingreso_Mensual -0.0001194 0.0000243 -4.914 8.93e-07 ***
## Satisfación_Laboral -0.3211793 0.0692201 -4.640 3.48e-06 ***
## Horas_ExtraNo -1.4522435 0.1572914 -9.233 < 2e-16 ***
## Horas_ExtraSi NA NA NA NA
## Viaje_de_NegociosNo_Viaja -1.3465296 0.3491758 -3.856 0.000115 ***
## Viaje_de_NegociosRaramente -0.7201357 0.1795511 -4.011 6.05e-05 ***
## DepartamentoRH 0.4156806 0.3672442 1.132 0.257680
## DepartamentoVentas 0.7253179 0.1659624 4.370 1.24e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1088.5 on 1461 degrees of freedom
## AIC: 1106.5
##
## Number of Fisher Scoring iterations: 5
Interpretacion de Resultados
En resumen
Coeficientes en Términos de Razones de Probabilidad
## (Intercept) Antigüedad_Cargo
## 4.5963331 0.8913717
## Ingreso_Mensual Satisfación_Laboral
## 0.9998806 0.7252932
## Horas_ExtraNo Horas_ExtraSi
## 0.2340446 NA
## Viaje_de_NegociosNo_Viaja Viaje_de_NegociosRaramente
## 0.2601415 0.4866862
## DepartamentoRH DepartamentoVentas
## 1.5154018 2.0653876
Interpretación
(Intercept) (4.60): Sin considerar otras variables, la probabilidad base de rotación de empleados tiene un odds ratio (probabilidad de que ocurra un evento frente a la probabilidad de que no ocurra) de 4.6.
Antigüedad_Cargo (0.89): Cada año adicional ocupando el cargo se reduce la oportunidad de rotación en un 11%. Esto respalda la idea de que la antigüedad contribuye a la estabilidad laboral.
Ingreso_Mensual (0.9999): Un aumento en el salario está asociado con una ligera disminución en la oportunidad de rotación, aunque el efecto es muy pequeño (prácticamente cercano a 1).
Satisfación_Laboral (0.73): Mayores niveles de satisfacción laboral reducen la oportunidad de rotación en un 27%, concluyendo que la satisfacción es un factor clave para retener empleados.
Horas_ExtraNo (0.23): Los empleados que no realizan horas extra tienen un 77% menos de oportunidad de rotación en comparación con aquellos que sí las realizan.
Viaje de Negocios (No_Viaja: 0.26, Raramente: 0.49): Los empleados que no realizan viajes tienen un 74% menos de oportunidad de rotación, y aquellos que viajan raramente tienen un 51% menos de probabilidad de rotación, en comparación con los que lo hacen frecuentemente.
Departamento (RH: 1.52, Ventas: 2.07): Los empleados en el departamento de Ventas tienen el doble de oportunidad de rotación en comparación con los de Investigación y Desarrollo, mientras que los empleados de Recursos Humanos tienen un 52% más de oportunidad de rotación. Esto indica una alta vulnerabilidad en ciertos departamentos, especialmente en Ventas.
Realice una partición en los datos de forma aleatoria donde 70% sea un set para entrenar el modelo y 30% para prueba. Estime un modelo logístico con la muestra del 70%. Muestre los resultados.
## Loading required package: lattice
##
## Attaching package: 'lattice'
## The following object is masked from 'package:boot':
##
## melanoma
##
## Call:
## glm(formula = Rotación ~ ., family = binomial, data = train_set)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 8.526e-03 1.999e+00 0.004 0.996596
## Edad -5.936e-02 1.804e-02 -3.290 0.001000 **
## Viaje_de_NegociosNo_Viaja -1.482e+00 4.752e-01 -3.120 0.001811 **
## Viaje_de_NegociosRaramente -8.204e-01 2.468e-01 -3.324 0.000889 ***
## DepartamentoRH -1.327e+01 6.614e+02 -0.020 0.983995
## DepartamentoVentas 1.203e+00 1.338e+00 0.900 0.368318
## Distancia_Casa 3.838e-02 1.286e-02 2.985 0.002840 **
## Educación 5.586e-02 1.058e-01 0.528 0.597533
## Campo_EducaciónHumanidades 1.485e+00 9.916e-01 1.497 0.134378
## Campo_EducaciónMercadeo 6.772e-01 4.012e-01 1.688 0.091438 .
## Campo_EducaciónOtra 1.511e-01 4.627e-01 0.326 0.744065
## Campo_EducaciónSalud -1.084e-01 2.591e-01 -0.418 0.675771
## Campo_EducaciónTecnicos 9.406e-01 3.522e-01 2.671 0.007562 **
## Satisfacción_Ambiental -4.070e-01 9.716e-02 -4.189 2.80e-05 ***
## GeneroM 3.420e-02 2.184e-01 0.157 0.875553
## CargoDirector_Manofactura 1.771e+00 1.279e+00 1.385 0.166030
## CargoEjecutivo_Ventas 8.977e-01 1.845e+00 0.487 0.626548
## CargoGerente 8.279e-01 1.547e+00 0.535 0.592578
## CargoInvestigador_Cientifico 1.716e+00 1.357e+00 1.265 0.205909
## CargoRecursos_Humanos 1.546e+01 6.614e+02 0.023 0.981349
## CargoRepresentante_Salud 1.294e+00 1.284e+00 1.008 0.313289
## CargoRepresentante_Ventas 2.022e+00 1.950e+00 1.037 0.299588
## CargoTecnico_Laboratorio 2.598e+00 1.351e+00 1.923 0.054504 .
## Satisfación_Laboral -3.885e-01 9.550e-02 -4.068 4.75e-05 ***
## Estado_CivilDivorciado -5.701e-01 3.169e-01 -1.799 0.072057 .
## Estado_CivilSoltero 1.011e+00 2.326e-01 4.346 1.38e-05 ***
## Ingreso_Mensual -4.772e-05 7.354e-05 -0.649 0.516369
## Trabajos_Anteriores 1.266e-01 4.625e-02 2.738 0.006186 **
## Horas_ExtraSi 1.717e+00 2.242e-01 7.657 1.91e-14 ***
## Porcentaje_aumento_salarial -5.919e-02 4.708e-02 -1.257 0.208659
## Rendimiento_Laboral 6.624e-01 4.762e-01 1.391 0.164179
## Años_Experiencia -2.225e-02 3.564e-02 -0.624 0.532463
## Capacitaciones -1.948e-01 8.530e-02 -2.283 0.022415 *
## Equilibrio_Trabajo_Vida -3.682e-01 1.428e-01 -2.577 0.009957 **
## Antigüedad 9.668e-02 4.491e-02 2.153 0.031318 *
## Antigüedad_Cargo -1.561e-01 5.191e-02 -3.007 0.002642 **
## Años_ultima_promoción 1.475e-01 4.815e-02 3.063 0.002191 **
## Años_acargo_con_mismo_jefe -1.211e-01 5.583e-02 -2.169 0.030111 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 896.03 on 1028 degrees of freedom
## Residual deviance: 616.74 on 991 degrees of freedom
## AIC: 692.74
##
## Number of Fisher Scoring iterations: 15
Edad: -0.05936
La disminución en los log-odds de rotación es significativa, sugiriendo
que a mayor edad, menor es la oportunidad de rotación. Esto se
corresponde con la idea de que empleados mayores tienden a ser más
estables en sus trabajos.
Viaje de Negocios:
Distancia a Casa: 0.03838 (significativo)
Un aumento en la distancia al hogar incrementa la oportunidad de
rotación. Los empleados que viven más lejos deben asumir mayores
inconvenientes en temas de transporte ,tiempos de recorridos y costos
adicionales.
Satisfacción Ambiental: -0.407
(significativo)
Un aumento en la satisfacción ambiental reduce la oportunidad de
rotación. Este hallazgo apoya la hipótesis de que un ambiente laboral en
el que se fortalezca el tema ambiental fomenta la retención.
Satisfacción Laboral: -0.3885
(significativo)
Un aumento en la satisfacción laboral también reduce la oportunidad de
rotación.
Horas Extra (Sí): 1.717 (significativo)
Trabajar horas extra aumenta significativamente la oportunidad de
rotación, lo que sugiere que los empleados que trabajan más horas
podrían sentirse abrumados o insatisfechos.
Capacitaciones: -0.1948 (significativo)
Un aumento en las oportunidades de formacion del empleado está asociado
a una disminución en la oportunidad de rotación.
Antigüedad: 0.09668 (significativo)
A mayor antigüedad, hay un incremento en la oportunidad de rotación, lo
cual puede sorprender, y sugiere que empleados más antiguos en la
empresa podrían buscar nuevas oportunidades.
Años con el mismo jefe: -0.1211
(significativo)
A mayor duración con el mismo jefe, menor es la oportunidad de rotación.
Una relación estable con los referentes sueriores y de supervision puede
fomentar la lealtad con el puesto de trabajo.
Años de la última promoción: 0.1475
(significativo)
Aumentar el tiempo desde la última promoción incrementa la oportunidad
de rotación, lo que sugiere que los empleados insatisfechos con su
progreso pueden buscar otras oportunidades.
Algunas variables no son significativas, como: - Departamento RH y Ventas: Los coeficientes son altos pero no significativos, lo que indica que el departamento en el que se trabaja no tiene un efecto claro en la rotación. - Educación y Género: Estas variables no tienen un efecto significativo en la rotación.
Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC en el set de datos de prueba.
## Type 'citation("pROC")' for a citation.
##
## Attaching package: 'pROC'
## The following objects are masked from 'package:stats':
##
## cov, smooth, var
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
## [1] "AUC: 0.832459016393443"
Con un AUC de 0.832, el modelo logístico es bueno para predecir la oportunidad de rotación. Esta probabilidad AUC indica que el modelo es bueno para discernir las clases, ya que cuando se tienen clases, el modelo detecta qué tan posible es que se logre cada clase. Así, hay una probabilidad del 83,2% de que el modelo distinga o asigne positivamente un caso de rotación a la asignación negativa.
En las conclusiones adicione una discución sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).
La empresa podría optar por la implentacion de las siguientes estrategias para mitigar el riesgo de la rotacion de sus colaboradores.