##
## Attaching package: 'dplyr'
## The following object is masked from 'package:gridExtra':
##
## combine
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.
Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.
Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.
Nota: Debes justificar porque estas variables están relacionadas y que tipo de relación se espera entre ellas (Hipótesis).
Hipótesis 1: Se espera que las personas que realicen HORAS EXTRAS , tienen mayor posibilidad de rotar.
## Loading required package: CGPfunctions
Análisis de la relación entre horas extras y rotación: Con un total de 416 personas que si rotan se evidencia que el hecho de que el 31% de las personas que realizan horas extras también estén rotando sugiere una posible relación entre estas dos variables. Podríamos querer investigar más a fondo esta relación para comprender si las horas extras están relacionadas de alguna manera con la rotación del personal.
Hipótesis 2 : Se plantea que el genero masculino rote más.
Las mujeres que en total son 588, es decir el 40% del total de empleados de la empresa, solo rotan un 15% de ellas rota, respecto al 17% de rotacion de hombres.
Hipótesis 3 : Se espera que las personas con estado civil soltero, roten más
La tabla muestra que 673 personas, lo que representa el 45.8% del total, están casadas. Además, hay 327 personas divorciadas, lo que equivale al 22.2%, y el 32% son solteras. Dentro de este último grupo, el 26% de las personas rotan.
Hipótesis 4 : Se espera que a mayor ingreso salarial es menor la rotación.
Se observa que a medida que el salario disminuye, la tasa de rotación tiende a aumentar.
Hipótesis 5 : Se espera que a mayor edad, menor rotación.
La población de menor edad tiende a presentar un mayor porcentaje de rotación.
Hipótesis 6 : Se espera que a mayor años de experiencia, menor rotación.
Se muestra una medida armónica en la rotación respecto a la experiencia, siendo los puntos de inflezión las personas de mayor y menor experiencia, teniendo encuenta el contexto de la rotación se evidencia con mayor estabilidad los trabajadores que tienen una experiencia de 25 a 30 años.
Realiza un análisis univariado (caracterización) de la información contenida en la base de datos rotacion.
##
## Call:
## glm(formula = Rotación ~ Horas_Extra + Genero + Estado_Civil +
## Ingreso_rango + Edad_rango + Años_Experiencia_rango, family = "binomial",
## data = Datos_Rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.11267 0.52988 -2.100 0.03574 *
## Horas_ExtraSi 1.47221 0.15893 9.263 < 2e-16 ***
## GeneroM 0.25414 0.16156 1.573 0.11572
## Estado_CivilDivorciado -0.30211 0.22787 -1.326 0.18491
## Estado_CivilSoltero 0.81795 0.17374 4.708 2.5e-06 ***
## Ingreso_rango(5,10] -0.53463 0.21097 -2.534 0.01127 *
## Ingreso_rango(10,15] -0.07875 0.37698 -0.209 0.83453
## Ingreso_rango(15,20] -1.47623 0.66429 -2.222 0.02627 *
## Edad_rango(20,40] -0.82496 0.51912 -1.589 0.11202
## Edad_rango(40,60] -0.94472 0.55533 -1.701 0.08891 .
## Años_Experiencia_rango(5,10] -0.53603 0.20699 -2.590 0.00961 **
## Años_Experiencia_rango(10,15] -0.50208 0.30416 -1.651 0.09879 .
## Años_Experiencia_rango(15,20] -1.03701 0.35323 -2.936 0.00333 **
## Años_Experiencia_rango(20,25] -0.72444 0.56659 -1.279 0.20104
## Años_Experiencia_rango(25,30] -1.27088 0.87407 -1.454 0.14595
## Años_Experiencia_rango(30,35] -0.63035 0.79550 -0.792 0.42813
## Años_Experiencia_rango(35,40] 0.33407 0.96524 0.346 0.72927
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1278.2 on 1458 degrees of freedom
## Residual deviance: 1088.8 on 1442 degrees of freedom
## (11 observations deleted due to missingness)
## AIC: 1122.8
##
## Number of Fisher Scoring iterations: 6
El análisis revela varias relaciones significativas entre las variables predictoras y la variable respuesta de rotación en el modelo.
Hipótesis Cualitativas:
Hipótesis 1: Se confirma que las personas que realizan horas extras tienen una mayor propensión a rotar. Esto sugiere que la carga de trabajo adicional puede estar relacionada con la decisión de abandonar la empresa.
Hipótesis 2: Aunque se esperaba que el género masculino estuviera asociado con una mayor rotación, el análisis indica que el género no tiene un impacto significativo en el modelo. Esto sugiere que otros factores pueden estar influyendo más en la decisión de rotación que el género.
Hipótesis 3: Se confirma que las personas solteras tienen una tendencia a rotar más. Esta relación podría estar relacionada con la menor estabilidad personal o familiar de las personas solteras en comparación con aquellas que están casadas o en una relación.
Hipótesis Cuantitativas:
Hipótesis 4: La hipótesis de que a mayor salario menor rotación se confirma, especialmente en los grupos salariales de (5,10] y (15,20] millones. Esto sugiere que el nivel de compensación puede ser un factor importante para retener empleados, especialmente en ciertos rangos salariales.
Hipótesis 5: Aunque se esperaba que la edad estuviera inversamente relacionada con la rotación, el análisis indica que la edad no es significativa en el modelo. Esto sugiere que la edad por sí sola no determina la probabilidad de rotación y que otros factores pueden estar influyendo más en esta decisión.
Hipótesis 6: Se confirma que a mayor años de experiencia menor rotación, especialmente en los rangos de (5,10] y (15,20]. Esto sugiere que la experiencia laboral puede estar asociada con una mayor lealtad o compromiso con la empresa, especialmente en ciertos intervalos de experiencia.
## (Intercept) Horas_ExtraSi
## 0.3286794 4.3588787
## GeneroM Estado_CivilDivorciado
## 1.2893475 0.7392597
## Estado_CivilSoltero Ingreso_rango(5,10]
## 2.2658405 0.5858860
## Ingreso_rango(10,15] Ingreso_rango(15,20]
## 0.9242702 0.2284967
## Edad_rango(20,40] Edad_rango(40,60]
## 0.4382522 0.3887886
## Años_Experiencia_rango(5,10] Años_Experiencia_rango(10,15]
## 0.5850661 0.6052688
## Años_Experiencia_rango(15,20] Años_Experiencia_rango(20,25]
## 0.3545122 0.4845980
## Años_Experiencia_rango(25,30] Años_Experiencia_rango(30,35]
## 0.2805844 0.5324059
## Años_Experiencia_rango(35,40]
## 1.3966361
Horas Extras: El coeficiente positivo para las horas extras indica que los empleados que realizan horas extras tienen una mayor probabilidad de rotar. Específicamente, cada unidad adicional de horas extras se asocia con un aumento del 4.6% en la probabilidad de rotación. Esto sugiere que la carga de trabajo adicional puede estar contribuyendo significativamente a la decisión de los empleados de dejar la empresa.
Estado Civil (Soltero): El coeficiente positivo para el estado civil soltero indica que los empleados solteros tienen una probabilidad más alta de rotar en comparación con aquellos que no están solteros. Específicamente, los empleados solteros tienen una probabilidad de rotación aumentada en un 2.2%. Esto podría deberse a una variedad de factores, como la menor estabilidad personal o familiar asociada con el estado civil soltero.
Experiencia Laboral (Rango 35-40 años vs. 5-10 años): El coeficiente positivo para el rango de experiencia de 35-40 años sugiere que los empleados en este grupo tienen una probabilidad más alta de rotar en comparación con aquellos con una experiencia laboral de 5-10 años. Específicamente, estos empleados tienen una probabilidad aumentada en un 1.39%. Esta relación podría indicar una posible insatisfacción laboral o búsqueda de nuevas oportunidades entre los empleados con más experiencia en la empresa.
En conjunto, estos hallazgos resaltan la importancia de abordar las horas extras, el estado civil y la experiencia laboral como factores que influyen en la rotación del personal. Al comprender mejor estas relaciones, la empresa puede tomar medidas proactivas para gestionar estos aspectos y mejorar la retención de empleados.
Realiza un análisis de bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.
## [1] 0 0 0 0 0 0
## Levels: 0
1. La evidencia muestra que hay una mayor rotación en
el cargo de representantes de ventas. Esto confirma la hipótesis de que
los cargos de menor rango tienen una mayor probabilidad de rotación en
comparación con los cargos de rango medio.
2. La investigación confirma la validez de la hipótesis de que las personas que realizan horas extras tienen una mayor probabilidad de rotar en comparación con aquellas que no lo hacen. Este hallazgo resalta la relación entre la carga de trabajo adicional y la tendencia a abandonar la empresa. Específicamente, se observa que los empleados que asumen horas extras tienen una probabilidad significativamente mayor de rotación, lo que sugiere que la presión adicional en el trabajo puede estar contribuyendo a una mayor insatisfacción laboral o a un desgaste del empleado, lo que a su vez influye en la decisión de abandonar la empresa. Este descubrimiento subraya la importancia de gestionar adecuadamente la carga de trabajo y promover un equilibrio saludable entre la vida laboral y personal para mejorar la retención de empleados y la satisfacción en el trabajo.
3. La evidencia respalda la validez de la hipótesis que sugiere que las personas menos satisfechas tienen una mayor probabilidad de considerar la rotación hacia otro empleo más satisfactorio. Este hallazgo refleja la importancia de la satisfacción laboral como factor determinante en las decisiones de los empleados de permanecer en su trabajo actual o buscar oportunidades en otro lugar. Cuando los empleados no están satisfechos con su trabajo, es más probable que exploren otras opciones que les ofrezcan un ambiente laboral más gratificante. Por lo tanto, este descubrimiento destaca la necesidad de las organizaciones de priorizar la satisfacción de los empleados y abordar las preocupaciones relacionadas con el trabajo para retener talentos clave y mantener un ambiente laboral positivo y productivo.
1. Se confirma la hipótesis de que existe una relación entre el nivel de ingresos y la rotación, respaldando la premisa de que a menor salario, mayor probabilidad de rotación entre los empleados.
2. La evidencia sugiere que la relación entre el porcentaje de aumento salarial y la rotación no es significativa, lo que implica que el aumento salarial no tiene un impacto significativo en la decisión de rotación de los empleados. Por lo tanto, no se encuentra evidencia que respalde la hipótesis propuesta.
3. Se corrobora la hipótesis de que los empleados más jóvenes tienen una probabilidad mayor de rotar en comparación con los empleados más adultos, según la relación entre la variable edad y la rotación observada en los datos.
Realiza la estimación de un modelo de regresión logístico en el cual la variable respuesta es rotacion (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas en el punto 1. Interprete los coeficientes del modelo y la significancia de los parámetros.
##
## Call:
## glm(formula = Rotación ~ Ingreso_Mensual + Porcentaje_aumento_salarial +
## Edad + Cargo + Horas_Extra + Satisfación_Laboral, family = binomial(link = "logit"),
## data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.373e+00 1.067e+00 -2.225 0.026065 *
## Ingreso_Mensual 1.152e-05 4.468e-05 0.258 0.796564
## Porcentaje_aumento_salarial -7.393e-03 2.143e-02 -0.345 0.730100
## Edad -3.586e-02 1.036e-02 -3.462 0.000536 ***
## CargoDirector_Manofactura 1.006e+00 8.760e-01 1.148 0.251029
## CargoEjecutivo_Ventas 2.083e+00 8.291e-01 2.513 0.011984 *
## CargoGerente 8.379e-01 8.643e-01 0.969 0.332318
## CargoInvestigador_Cientifico 1.818e+00 9.135e-01 1.990 0.046641 *
## CargoRecursos_Humanos 2.490e+00 9.425e-01 2.642 0.008249 **
## CargoRepresentante_Salud 1.030e+00 8.800e-01 1.171 0.241736
## CargoRepresentante_Ventas 3.193e+00 9.431e-01 3.385 0.000711 ***
## CargoTecnico_Laboratorio 2.531e+00 9.110e-01 2.778 0.005463 **
## Horas_ExtraSi 1.547e+00 1.603e-01 9.651 < 2e-16 ***
## Satisfación_Laboral2 -4.721e-01 2.351e-01 -2.008 0.044632 *
## Satisfación_Laboral3 -4.534e-01 2.078e-01 -2.182 0.029139 *
## Satisfación_Laboral4 -1.037e+00 2.210e-01 -4.693 2.69e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1084.3 on 1454 degrees of freedom
## AIC: 1116.3
##
## Number of Fisher Scoring iterations: 6
Las variables edad, cargo, horas extras y satisfacción laboral muestran ser significativas para el modelo, ofreciendo una explicación significativa de la variable de respuesta, rotación. Por otro lado, las variables ingreso y porcentaje de aumento salarial no aportan valor al modelo, no mostrando significancia estadística en la explicación de la rotación del personal.
## (Intercept) Ingreso_Mensual
## 0.0931681 1.0000115
## Porcentaje_aumento_salarial Edad
## 0.9926347 0.9647747
## CargoDirector_Manofactura CargoEjecutivo_Ventas
## 2.7334008 8.0301085
## CargoGerente CargoInvestigador_Cientifico
## 2.3115790 6.1564604
## CargoRecursos_Humanos CargoRepresentante_Salud
## 12.0587539 2.8015359
## CargoRepresentante_Ventas CargoTecnico_Laboratorio
## 24.3496170 12.5664959
## Horas_ExtraSi Satisfación_Laboral2
## 4.6959034 0.6237189
## Satisfación_Laboral3 Satisfación_Laboral4
## 0.6354541 0.3544668
Cada año adicional que suma un empleado aumenta la probabilidad de rotación del personal. Es notable que los cargos en ventas, laboratorio y recursos humanos presentan una mayor tendencia a la rotación. Asimismo, aquellos que recurren a horas extras muestran una probabilidad incrementada de rotación, con un aumento del 4.6%. Por último, se destaca que los empleados con un nivel de satisfacción laboral de 4 tienen una probabilidad menor de rotación en comparación con aquellos con niveles de satisfacción laboral de 3 y 2.
##5. Evaluación
Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.
## Type 'citation("pROC")' for a citation.
##
## Attaching package: 'pROC'
## The following objects are masked from 'package:stats':
##
## cov, smooth, var
##
## Call:
## glm(formula = Rotación ~ Edad + Cargo + Horas_Extra + Satisfación_Laboral,
## family = binomial(link = "logit"), data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.33247 0.84720 -2.753 0.005903 **
## Edad -0.03519 0.00979 -3.594 0.000326 ***
## CargoDirector_Manofactura 0.90546 0.80036 1.131 0.257917
## CargoEjecutivo_Ventas 1.98636 0.74355 2.671 0.007553 **
## CargoGerente 0.84938 0.86313 0.984 0.325083
## CargoInvestigador_Cientifico 1.67652 0.74975 2.236 0.025345 *
## CargoRecursos_Humanos 2.36389 0.80964 2.920 0.003504 **
## CargoRepresentante_Salud 0.93771 0.80805 1.160 0.245860
## CargoRepresentante_Ventas 3.04408 0.77467 3.930 8.51e-05 ***
## CargoTecnico_Laboratorio 2.39351 0.74723 3.203 0.001359 **
## Horas_ExtraSi 1.54767 0.16020 9.661 < 2e-16 ***
## Satisfación_Laboral2 -0.47166 0.23494 -2.008 0.044691 *
## Satisfación_Laboral3 -0.45080 0.20735 -2.174 0.029697 *
## Satisfación_Laboral4 -1.03812 0.22091 -4.699 2.61e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1084.5 on 1456 degrees of freedom
## AIC: 1112.5
##
## Number of Fisher Scoring iterations: 6
## Setting levels: control = No, case = Si
## Setting direction: controls < cases
##
## Call:
## roc.formula(formula = rotacion$Rotación ~ prediccion, percent = T, ci = T)
##
## Data: prediccion in 1233 controls (rotacion$Rotación No) < 237 cases (rotacion$Rotación Si).
## Area under the curve: 78.01%
## 95% CI: 74.62%-81.41% (DeLong)
La inferencia principal que se puede extraer es que el modelo exhibe un buen poder discriminatorio. Esto se evidencia por el hecho de que la curva ROC está cerca de la línea horizontal, lo que indica que el modelo es capaz de distinguir entre las clases positivas y negativas con precisión. Además, el área bajo la curva (AUROC), que mide la capacidad predictiva del modelo, es de 0.78. Un AUROC cercano a 1 indica un excelente rendimiento del modelo en términos de discriminación entre las clases, lo que sugiere que el modelo tiene una buena capacidad para predecir correctamente la variable de interés.
Realiza una predicción la probabilidad de que un individuo (hipotético) rote y defina un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado).
Se plantea la predición de un funcionario con las siguientes caracteristicas:
27 años, Ejecutivo_Ventas, con horas extras y con satisfación laboral 2
## 1
## 0.4451919
Un Funcionario con las características descritas anteriormente tiene una probabilidad estimada del 44% de no rotar, según el modelo.
En las conclusiones adicione una discución sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).
1. Se sugiere que la empresa implemente programas de desarrollo profesional y oportunidades de ascenso específicamente dirigidos a los empleados jóvenes. Esto ayudará a fomentar su compromiso y lealtad hacia la empresa, contribuyendo así a la estabilidad organizacional.
2. Se recomienda establecer políticas de incentivos salariales que reconozcan y recompensen adecuadamente las actividades que generan un mayor valor añadido para la empresa. Estos incentivos pueden reflejarse en los ingresos mensuales de los empleados, lo que a su vez puede aumentar su motivación y compromiso laboral.
3. Es esencial realizar una revisión y validación exhaustiva de las metas y objetivos establecidos para los empleados del área de ventas. Esto garantizará que las expectativas sean realistas y alcanzables, lo que puede contribuir a reducir la frustración y el descontento entre el personal de ventas, y en última instancia, a mejorar su retención.
4. Se sugiere implementar iniciativas que promuevan un mejor equilibrio entre el trabajo y la vida personal de los empleados. Esto puede incluir la organización de eventos, la creación de espacios de descanso y entretenimiento en el lugar de trabajo, así como la oferta de incentivos adicionales que mejoren la calidad de vida de los empleados. Al mejorar el nivel de satisfacción laboral, la empresa puede reducir la rotación y aumentar la retención de talento.
5. Se recomienda revisar y mejorar la política de pago de horas extras para garantizar que sea justa y equitativa para todos los empleados. Esto puede ayudar a evitar que el cumplimiento de criterios relacionados con las horas extras se convierta en un factor contribuyente a la rotación de personal. Una política transparente y equitativa puede mejorar la percepción del personal sobre la empresa y fortalecer su compromiso organizacional.