Problema: Rotación de cargo
En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.
Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.
## Loading required package: boot
## Loading required package: broom
## Loading required package: GGally
## Warning: package 'GGally' was built under R version 4.3.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.3
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
## Loading required package: gridExtra
## Loading required package: knitr
## Loading required package: summarytools
## Warning: package 'ggpubr' was built under R version 4.3.3
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:gridExtra':
##
## combine
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Warning: package 'pROC' was built under R version 4.3.3
## Type 'citation("pROC")' for a citation.
##
## Attaching package: 'pROC'
## The following objects are masked from 'package:stats':
##
## cov, smooth, var
## Rows: 1,470
## Columns: 24
## $ Rotación <chr> "Si", "No", "Si", "No", "No", "No", "No", …
## $ Edad <dbl> 41, 49, 37, 33, 27, 32, 59, 30, 38, 36, 35…
## $ `Viaje de Negocios` <chr> "Raramente", "Frecuentemente", "Raramente"…
## $ Departamento <chr> "Ventas", "IyD", "IyD", "IyD", "IyD", "IyD…
## $ Distancia_Casa <dbl> 1, 8, 2, 3, 2, 2, 3, 24, 23, 27, 16, 15, 2…
## $ Educación <dbl> 2, 1, 2, 4, 1, 2, 3, 1, 3, 3, 3, 2, 1, 2, …
## $ Campo_Educación <chr> "Ciencias", "Ciencias", "Otra", "Ciencias"…
## $ Satisfacción_Ambiental <dbl> 2, 3, 4, 4, 1, 4, 3, 4, 4, 3, 1, 4, 1, 2, …
## $ Genero <chr> "F", "M", "M", "F", "M", "M", "F", "M", "M…
## $ Cargo <chr> "Ejecutivo_Ventas", "Investigador_Cientifi…
## $ Satisfación_Laboral <dbl> 4, 2, 3, 3, 2, 4, 1, 3, 3, 3, 2, 3, 3, 4, …
## $ Estado_Civil <chr> "Soltero", "Casado", "Soltero", "Casado", …
## $ Ingreso_Mensual <dbl> 5993, 5130, 2090, 2909, 3468, 3068, 2670, …
## $ Trabajos_Anteriores <dbl> 8, 1, 6, 1, 9, 0, 4, 1, 0, 6, 0, 0, 1, 0, …
## $ Horas_Extra <chr> "Si", "No", "Si", "Si", "No", "No", "Si", …
## $ Porcentaje_aumento_salarial <dbl> 11, 23, 15, 11, 12, 13, 20, 22, 21, 13, 13…
## $ Rendimiento_Laboral <dbl> 3, 4, 3, 3, 3, 3, 4, 4, 4, 3, 3, 3, 3, 3, …
## $ Años_Experiencia <dbl> 8, 10, 7, 8, 6, 8, 12, 1, 10, 17, 6, 10, 5…
## $ Capacitaciones <dbl> 0, 3, 3, 3, 3, 2, 3, 2, 2, 3, 5, 3, 1, 2, …
## $ Equilibrio_Trabajo_Vida <dbl> 1, 3, 3, 3, 3, 2, 2, 3, 3, 2, 3, 3, 2, 3, …
## $ Antigüedad <dbl> 6, 10, 0, 8, 2, 7, 1, 1, 9, 7, 5, 9, 5, 2,…
## $ Antigüedad_Cargo <dbl> 4, 7, 0, 7, 2, 7, 0, 0, 7, 7, 4, 5, 2, 2, …
## $ Años_ultima_promoción <dbl> 0, 1, 0, 3, 2, 3, 0, 0, 1, 7, 0, 0, 4, 1, …
## $ Años_acargo_con_mismo_jefe <dbl> 5, 7, 0, 0, 2, 6, 0, 0, 8, 7, 3, 8, 3, 2, …
Se realiza la evaluación de las variables seleccionando las siguientes:
Edad: Esta variable puede estar relacionada con el problema planteado, puesto que un empleado con mayor edad puede tener mas experiencia y puede ocupar cargos de mayor jerarquía, sin embargo, los empleados con mayor edad se quedan en una zona de confort, evitando cambios. Hipótesis: Los empleados con menor edad y menor experiencia, presentan menos dificultades a rotar de puesto, buscando mejores oportunidades con respecto a los empleados mayores.
Antigüedad_Cargo: Los empleados que permanecen en el mismo cargo por mucho tiempo, tienden a sentirse estancados, por lo cual el cambio de actividad se convierte en una opción. Hipótesis : Para los empleados que han permanecido en el mismo cargo por mas tiempo, se pueden cansar y buscar el cambio, para mejor salario y oportunidad de crecer en la empresa.
Porcentaje_aumento_salarial: Es un factor importante para la estabilidad de un empleado, al cual se le retribuye un aumento adecuado según su desempeño, garantiza su continuidad en el puesto Hipótesis: Para los empleados que no reciben un aumento a través del tiempo laboral, o consideran que es un aumento bajo, tienden a buscar mejor oportunidades laborales en empresas que si valoren su trabajo
Genero: En algunas organizaciones este es un factor importante de asenso y diferencias salariales. Hipótesis: En la actualidad el género no representa diferencia en la calidad del trabajo, sin embargo en algunas organizaciones prefieren un género en especial, debido a diferencias que ellos consideran importante para su adecuado desempeño en organización, y esto se ve reflejado en el salario y posibles asensos.
Departamento: Una empresa puede contar con varios departamentos, contando con diverso tipo de personas y ambientes laborales los cual para un empleado puede resultar interesante el cambio. Hipótesis: Es importante tener en cuenta que los empleados que se encuentran de departamentos de lato estrés y mayor carga laboral, pueden solicitar cambio dentro de la misma empresa, donde el ambiente sea más realojado y con mejores beneficios.
Cargo: Los cargos inferiores tienden a buscar la oportunidad de ascender y buscar mejor posición laboral y mejor salario Hipótesis: Los cargos bajos son los que menor salario y las actividades pueden llegar a ser monótonas, en cambio los cargos altos pueden tener mejor salario y actividades con mayor responsabilidad y mayor dinámicas, sin embargo estos cargos son pocos, por lo cual el cambio de organización es muy común y cargos inferiores
Se evidencia un mayor porcentaje de genero masculino (60%), que el
genero femenino (40%)
Se evidencia que la mayor cantidad de trabajadores estan concentrados
entre los 30 y 40 años de edad
Se evdencian 3 departamentos en la compañia LyD, RH y Venta, podemos
observar que la myor cantidad de empleados se encuentran en el
departamento LyD
Se raliazar un análisis univariado (caracterización) de la información contenida en la base de datos rotacion.
Analisis descriptiv para la varibales cuantitativas:
## Edad Distancia_Casa Ingreso_Mensual Trabajos_Anteriores
## Min. :18.00 Min. : 1.000 Min. : 1009 Min. :0.000
## 1st Qu.:30.00 1st Qu.: 2.000 1st Qu.: 2911 1st Qu.:1.000
## Median :36.00 Median : 7.000 Median : 4919 Median :2.000
## Mean :36.92 Mean : 9.193 Mean : 6503 Mean :2.693
## 3rd Qu.:43.00 3rd Qu.:14.000 3rd Qu.: 8379 3rd Qu.:4.000
## Max. :60.00 Max. :29.000 Max. :19999 Max. :9.000
## Porcentaje_aumento_salarial Años_Experiencia Capacitaciones Antigüedad
## Min. :11.00 Min. : 0.00 Min. :0.000 Min. : 0.000
## 1st Qu.:12.00 1st Qu.: 6.00 1st Qu.:2.000 1st Qu.: 3.000
## Median :14.00 Median :10.00 Median :3.000 Median : 5.000
## Mean :15.21 Mean :11.28 Mean :2.799 Mean : 7.008
## 3rd Qu.:18.00 3rd Qu.:15.00 3rd Qu.:3.000 3rd Qu.: 9.000
## Max. :25.00 Max. :40.00 Max. :6.000 Max. :40.000
## Antigüedad_Cargo Años_ultima_promoción Años_acargo_con_mismo_jefe
## Min. : 0.000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 2.000 1st Qu.: 0.000 1st Qu.: 2.000
## Median : 3.000 Median : 1.000 Median : 3.000
## Mean : 4.229 Mean : 2.188 Mean : 4.123
## 3rd Qu.: 7.000 3rd Qu.: 3.000 3rd Qu.: 7.000
## Max. :18.000 Max. :15.000 Max. :17.000
Edad: La mínima edad es de 18 año, la máxima es de 60 año, el promedio de edad es de 36 año y la distribución de las edades en su mayoría está entre 30 y 43 años.
Distancia_Casa: La distancia de las viviendas a la empresa de los empleados en kilómetros mínima es de 1 Km, la máxima es de 29 Km, el promedio de la distancia es de 7 Km y la distribución de en Km que viven la mayoría de los empelados está en los rangos de 2 a 14 Km de distancia.
Ingreso_Mensual: El ingreso mensual mínimo en la compañía en millones es de $1.009.000 el máximo es de $19.999.000, el promedio de salarios está en $6.503.000 y un mediana de $4.919.000, la mayoría de salarios se encuentran en los rangos de $2.911.000 y $8.379.000 millones mensuales
Trabajos_Anteriores: La organización cuenta con empleados que no cuentan con experiencia laboral previa y otros empleados que han trabajado máximo en 9 empresas previamente a la actual. en promedio los empleados han tenido 2 trabajos anteriores.
Porcentaje_aumento_salarial: El mínimo porcentaje de aumento es del 11% y el máximo es del 25%, y en promedio a aumentado en la compañía 15%
Años_Experiencia: Podemos evidenciar que se tienen empleados con 0 años de experiencia hasta 40 año, y en promedio los empleados tiene 11 años de experiencia estando la mayoría entre 6 y 15 años de experiencia laboral.
Capacitaciones: Vemos que algunos empelados no cuentan con ninguna capacitación y el máximo de capacitaciones reactividades es de 6, y en promedio se tiene 3 capacitaciones para los empelados
Antigüedad: Hay empleados que son nuevos en la empresa con 0 años de antigüedad y el máximo es de 40 años en la empresa, el promedio de antigüedad es de 7 año y la mediana es de 5, los empleados están en su mayoría entre los 3 y 9 años de antigüedad en la empresa.
Antigüedad_Cargo: Se evidencian empleados con 0 años de antigüedad en el cargo actual y una máxima de 18 años, el promedio es de 4 años y la media está en 3 años, finalmente la mayoría se encuentran entre los 2 y 7 años de antigüedad.
Años_ultima_promoción: Se evidencia empleados que no ha sido ascendidos y empleados que fueron promocionados hace 15 años, en promedio a los empleados los ascienden cada 2 años, con una mediana de 1 año.
Años_acargo_con_mismo_jefe: Se evidencia que hay empleados, que no han tenido experiencia con el jefe actual, y otros empleados con 17 años con el mismo jefe, en promedio los empleados han estado con el mismo jefe por 4 años.
summary(rotacion$Edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 30.00 36.00 36.92 43.00 60.00
La edad promedio de la base de rotación es de 36 año, evidenciando que
la distribución de la población se encuentra concentrada entre los 29 y
38 años de edad
Podemos identificar que la moayor atiguiedad en el cargo es de 2 años y le sigue 7 años, evienciando que muy pocos empleados han estado mas de 14 años en el mismo cargo
Se evidencia que el aumento que el porcentaje en el aumento del salario
se encuentra en los ragos de 11% a 14%
Realiza un análisis bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.
Se realizarn los 6 modelos con las variables seleccionadas
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.21 0.31 0.67 0.5
## Edad -0.05 0.01 -6.01 0.0
El estimado (-0.05) disminuye cuando la edad aumenta, es nos indica que la probablidad de poder rotar de cargo disminuyo al aumentar la edad.
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.12 0.10 -10.77 0
## Antigüedad_Cargo -0.15 0.02 -6.03 0
La antiguedad es un factor de rotacion de puesto, que la antiguedad aumenta disminuye el estimado la posiblidad de rotacion disminuye
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.50 0.30 -4.91 0.00
## Porcentaje_aumento_salarial -0.01 0.02 -0.52 0.61
El porcentaje de aumento salarial, al estar cerca a 0 no es una varibale significativa para la rotacion de cargo
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.75 0.12 -15.07 0.00
## GeneroM 0.17 0.15 1.13 0.26
El genero no es varibale relevante
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.83 0.09 -19.58 0.00
## DepartamentoRH 0.38 0.33 1.14 0.25
## DepartamentoVentas 0.48 0.15 3.21 0.00
El tipo de departamento influye en la rotacion del personal sin embargo no es significativo, puesto que recursos humanos tiene un estimado de 0.38 y ventas de 0.48, por lo cual es mas probabale que los empleados que se encuentran en el departamento de ventas tengan la problidad de rotar mas que las otras areas.
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -3.66 0.72 -5.12 0.00
## CargoDirector_Manofactura 1.06 0.79 1.35 0.18
## CargoEjecutivo_Ventas 2.11 0.73 2.89 0.00
## CargoGerente 0.70 0.85 0.82 0.41
## CargoInvestigador_Cientifico 2.01 0.73 2.74 0.01
## CargoRecursos_Humanos 2.46 0.79 3.12 0.00
## CargoRepresentante_Salud 1.06 0.80 1.33 0.18
## CargoRepresentante_Ventas 3.25 0.75 4.33 0.00
## CargoTecnico_Laboratorio 2.51 0.73 3.43 0.00
Algunos cargos tiene la posiblidad de tener una mayor rotacion que otros, como Ejecutivo_Ventas (2.11), Investigador_Cientifico (2.01), Recursos_Humanos (2.46) y significativamente Representante_Ventas (3.25), evidenciando que el area y cargo son factores de rotacion importante.
Realiza la estimación de un modelo de regresión logístico en el cual la variable respuesta es rotacion (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas en el punto 1. Interprete los coeficientes del modelo y la significancia de los parámetros.
Defincion del modelo
Definimos el modelo con las seis varibales seleccionadas
##
## Call:
## glm(formula = r ~ Edad + Antigüedad_Cargo + Porcentaje_aumento_salarial +
## Genero + Departamento + Cargo, family = binomial, data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.034589 0.882028 -2.307 0.021071 *
## Edad -0.023520 0.009289 -2.532 0.011340 *
## Antigüedad_Cargo -0.099929 0.026038 -3.838 0.000124 ***
## Porcentaje_aumento_salarial -0.008837 0.020716 -0.427 0.669693
## GeneroM 0.103712 0.153706 0.675 0.499838
## DepartamentoRH -12.697463 436.980517 -0.029 0.976819
## DepartamentoVentas 0.033950 0.944602 0.036 0.971329
## CargoDirector_Manofactura 0.847085 0.792125 1.069 0.284897
## CargoEjecutivo_Ventas 1.817544 1.198350 1.517 0.129341
## CargoGerente 0.904757 0.933903 0.969 0.332649
## CargoInvestigador_Cientifico 1.541570 0.742581 2.076 0.037898 *
## CargoRecursos_Humanos 14.702222 436.981248 0.034 0.973160
## CargoRepresentante_Salud 0.840544 0.798866 1.052 0.292721
## CargoRepresentante_Ventas 2.565488 1.217405 2.107 0.035088 *
## CargoTecnico_Laboratorio 2.023064 0.739639 2.735 0.006234 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1182.1 on 1455 degrees of freedom
## AIC: 1212.1
##
## Number of Fisher Scoring iterations: 14
Ajustamos el modelo eliminado la variable género y porcentaje de aumento salarial, las cuales evidenciamos que no son significativas
##
## Call:
## glm(formula = r ~ Edad + Antigüedad_Cargo + Departamento + Cargo,
## family = binomial, data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.089790 0.823116 -2.539 0.011121 *
## Edad -0.023824 0.009273 -2.569 0.010191 *
## Antigüedad_Cargo -0.099954 0.026031 -3.840 0.000123 ***
## DepartamentoRH -12.685308 436.779496 -0.029 0.976830
## DepartamentoVentas 0.027839 0.944521 0.029 0.976486
## CargoDirector_Manofactura 0.828762 0.791688 1.047 0.295178
## CargoEjecutivo_Ventas 1.822307 1.198212 1.521 0.128296
## CargoGerente 0.898182 0.933904 0.962 0.336175
## CargoInvestigador_Cientifico 1.534174 0.742344 2.067 0.038766 *
## CargoRecursos_Humanos 14.696266 436.780227 0.034 0.973159
## CargoRepresentante_Salud 0.839106 0.798688 1.051 0.293439
## CargoRepresentante_Ventas 2.554208 1.217130 2.099 0.035857 *
## CargoTecnico_Laboratorio 2.026283 0.739423 2.740 0.006137 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1182.7 on 1457 degrees of freedom
## AIC: 1208.7
##
## Number of Fisher Scoring iterations: 14
Si comparamos el AIC con las seis (6) variables seleccionadas, el primero AIC: 1212.1 y el segundo AIC: 1208.7, podemos evidenciar que el segundo mejora el rendimiento del modelo, por esta razon se selecciona el segundo modelo
Si analizamos los coeficientes estimados, el interecpt es de -2.089790, significando que la rotacion es negativa cuando todos los valores de las variables selecciondas estan en 0, por lo cual los estimadores con valores cercanos al Intercept tiene la posiblidad de tener una mayor rotacion siendo la edad (-0.023824), Antiguedad en el cargo (-0.099954), departamento de ventas (0.027839).
Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.
## Setting levels: control = No, case = Si
## Setting direction: controls < cases
## Area under the curve: 0.7119
El área bajo la curva (ROC) y la diagonal (Area under the curve: 0.7119), nos muestra un ajuste adecuado del modelo, entre mas cercano el valor AUC a 1 mejor es el modelo, por esta razon concluimos que la predicccion de los resultados son aceptables.
En las conclusiones adicione una discución sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).
Teniendo en cuenta los resultados obtenidos, podemos concluir que para evitar la rotación de cargos del personal, se deben tener en cuenta los siguientes factores:
La empresa tiene que tener en cuenta que la rotación de personal genera una nueva curva de aprendizaje y podría aumentar el error en el lapso de tiempo que el empleado se capacita y aprende la labor, adicionalmente los procesos con mayor rotación de personal deberán ser evaluados ya que esto indica, que la labor, no es cómoda y presenta retos, que se podrían mejorar al análisis las causas, disminuyendo la rotación del personal, mejorando productividad y calidad, lo cual podría verse reflejado en mayores ingresos para la empresa, mejores salarios para los empleados y una adecuada estabilidad en los cargos