Problema: Rotación de cargo

En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.

Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.

## Loading required package: boot
## Loading required package: broom
## Loading required package: GGally
## Warning: package 'GGally' was built under R version 4.3.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.3
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
## Loading required package: gridExtra
## Loading required package: knitr
## Loading required package: summarytools
## Warning: package 'ggpubr' was built under R version 4.3.3
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:gridExtra':
## 
##     combine
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Warning: package 'pROC' was built under R version 4.3.3
## Type 'citation("pROC")' for a citation.
## 
## Attaching package: 'pROC'
## The following objects are masked from 'package:stats':
## 
##     cov, smooth, var
## Rows: 1,470
## Columns: 24
## $ Rotación                    <chr> "Si", "No", "Si", "No", "No", "No", "No", …
## $ Edad                        <dbl> 41, 49, 37, 33, 27, 32, 59, 30, 38, 36, 35…
## $ `Viaje de Negocios`         <chr> "Raramente", "Frecuentemente", "Raramente"…
## $ Departamento                <chr> "Ventas", "IyD", "IyD", "IyD", "IyD", "IyD…
## $ Distancia_Casa              <dbl> 1, 8, 2, 3, 2, 2, 3, 24, 23, 27, 16, 15, 2…
## $ Educación                   <dbl> 2, 1, 2, 4, 1, 2, 3, 1, 3, 3, 3, 2, 1, 2, …
## $ Campo_Educación             <chr> "Ciencias", "Ciencias", "Otra", "Ciencias"…
## $ Satisfacción_Ambiental      <dbl> 2, 3, 4, 4, 1, 4, 3, 4, 4, 3, 1, 4, 1, 2, …
## $ Genero                      <chr> "F", "M", "M", "F", "M", "M", "F", "M", "M…
## $ Cargo                       <chr> "Ejecutivo_Ventas", "Investigador_Cientifi…
## $ Satisfación_Laboral         <dbl> 4, 2, 3, 3, 2, 4, 1, 3, 3, 3, 2, 3, 3, 4, …
## $ Estado_Civil                <chr> "Soltero", "Casado", "Soltero", "Casado", …
## $ Ingreso_Mensual             <dbl> 5993, 5130, 2090, 2909, 3468, 3068, 2670, …
## $ Trabajos_Anteriores         <dbl> 8, 1, 6, 1, 9, 0, 4, 1, 0, 6, 0, 0, 1, 0, …
## $ Horas_Extra                 <chr> "Si", "No", "Si", "Si", "No", "No", "Si", …
## $ Porcentaje_aumento_salarial <dbl> 11, 23, 15, 11, 12, 13, 20, 22, 21, 13, 13…
## $ Rendimiento_Laboral         <dbl> 3, 4, 3, 3, 3, 3, 4, 4, 4, 3, 3, 3, 3, 3, …
## $ Años_Experiencia            <dbl> 8, 10, 7, 8, 6, 8, 12, 1, 10, 17, 6, 10, 5…
## $ Capacitaciones              <dbl> 0, 3, 3, 3, 3, 2, 3, 2, 2, 3, 5, 3, 1, 2, …
## $ Equilibrio_Trabajo_Vida     <dbl> 1, 3, 3, 3, 3, 2, 2, 3, 3, 2, 3, 3, 2, 3, …
## $ Antigüedad                  <dbl> 6, 10, 0, 8, 2, 7, 1, 1, 9, 7, 5, 9, 5, 2,…
## $ Antigüedad_Cargo            <dbl> 4, 7, 0, 7, 2, 7, 0, 0, 7, 7, 4, 5, 2, 2, …
## $ Años_ultima_promoción       <dbl> 0, 1, 0, 3, 2, 3, 0, 0, 1, 7, 0, 0, 4, 1, …
## $ Años_acargo_con_mismo_jefe  <dbl> 5, 7, 0, 0, 2, 6, 0, 0, 8, 7, 3, 8, 3, 2, …

1. Selección de variables

Se realiza la evaluación de las variables seleccionando las siguientes:

Numéricas:

Edad: Esta variable puede estar relacionada con el problema planteado, puesto que un empleado con mayor edad puede tener mas experiencia y puede ocupar cargos de mayor jerarquía, sin embargo, los empleados con mayor edad se quedan en una zona de confort, evitando cambios. Hipótesis: Los empleados con menor edad y menor experiencia, presentan menos dificultades a rotar de puesto, buscando mejores oportunidades con respecto a los empleados mayores.

Antigüedad_Cargo: Los empleados que permanecen en el mismo cargo por mucho tiempo, tienden a sentirse estancados, por lo cual el cambio de actividad se convierte en una opción. Hipótesis : Para los empleados que han permanecido en el mismo cargo por mas tiempo, se pueden cansar y buscar el cambio, para mejor salario y oportunidad de crecer en la empresa.

Porcentaje_aumento_salarial: Es un factor importante para la estabilidad de un empleado, al cual se le retribuye un aumento adecuado según su desempeño, garantiza su continuidad en el puesto Hipótesis: Para los empleados que no reciben un aumento a través del tiempo laboral, o consideran que es un aumento bajo, tienden a buscar mejor oportunidades laborales en empresas que si valoren su trabajo

Categóricas

Genero: En algunas organizaciones este es un factor importante de asenso y diferencias salariales. Hipótesis: En la actualidad el género no representa diferencia en la calidad del trabajo, sin embargo en algunas organizaciones prefieren un género en especial, debido a diferencias que ellos consideran importante para su adecuado desempeño en organización, y esto se ve reflejado en el salario y posibles asensos.

Departamento: Una empresa puede contar con varios departamentos, contando con diverso tipo de personas y ambientes laborales los cual para un empleado puede resultar interesante el cambio. Hipótesis: Es importante tener en cuenta que los empleados que se encuentran de departamentos de lato estrés y mayor carga laboral, pueden solicitar cambio dentro de la misma empresa, donde el ambiente sea más realojado y con mejores beneficios.

Cargo: Los cargos inferiores tienden a buscar la oportunidad de ascender y buscar mejor posición laboral y mejor salario Hipótesis: Los cargos bajos son los que menor salario y las actividades pueden llegar a ser monótonas, en cambio los cargos altos pueden tener mejor salario y actividades con mayor responsabilidad y mayor dinámicas, sin embargo estos cargos son pocos, por lo cual el cambio de organización es muy común y cargos inferiores

Se evidencia un mayor porcentaje de genero masculino (60%), que el genero femenino (40%)

Se evidencia que la mayor cantidad de trabajadores estan concentrados entre los 30 y 40 años de edad

Se evdencian 3 departamentos en la compañia LyD, RH y Venta, podemos observar que la myor cantidad de empleados se encuentran en el departamento LyD

2. Análisis univariado

Se raliazar un análisis univariado (caracterización) de la información contenida en la base de datos rotacion.

Analisis descriptiv para la varibales cuantitativas:

##       Edad       Distancia_Casa   Ingreso_Mensual Trabajos_Anteriores
##  Min.   :18.00   Min.   : 1.000   Min.   : 1009   Min.   :0.000      
##  1st Qu.:30.00   1st Qu.: 2.000   1st Qu.: 2911   1st Qu.:1.000      
##  Median :36.00   Median : 7.000   Median : 4919   Median :2.000      
##  Mean   :36.92   Mean   : 9.193   Mean   : 6503   Mean   :2.693      
##  3rd Qu.:43.00   3rd Qu.:14.000   3rd Qu.: 8379   3rd Qu.:4.000      
##  Max.   :60.00   Max.   :29.000   Max.   :19999   Max.   :9.000      
##  Porcentaje_aumento_salarial Años_Experiencia Capacitaciones    Antigüedad    
##  Min.   :11.00               Min.   : 0.00    Min.   :0.000   Min.   : 0.000  
##  1st Qu.:12.00               1st Qu.: 6.00    1st Qu.:2.000   1st Qu.: 3.000  
##  Median :14.00               Median :10.00    Median :3.000   Median : 5.000  
##  Mean   :15.21               Mean   :11.28    Mean   :2.799   Mean   : 7.008  
##  3rd Qu.:18.00               3rd Qu.:15.00    3rd Qu.:3.000   3rd Qu.: 9.000  
##  Max.   :25.00               Max.   :40.00    Max.   :6.000   Max.   :40.000  
##  Antigüedad_Cargo Años_ultima_promoción Años_acargo_con_mismo_jefe
##  Min.   : 0.000   Min.   : 0.000        Min.   : 0.000            
##  1st Qu.: 2.000   1st Qu.: 0.000        1st Qu.: 2.000            
##  Median : 3.000   Median : 1.000        Median : 3.000            
##  Mean   : 4.229   Mean   : 2.188        Mean   : 4.123            
##  3rd Qu.: 7.000   3rd Qu.: 3.000        3rd Qu.: 7.000            
##  Max.   :18.000   Max.   :15.000        Max.   :17.000

Edad: La mínima edad es de 18 año, la máxima es de 60 año, el promedio de edad es de 36 año y la distribución de las edades en su mayoría está entre 30 y 43 años.

Distancia_Casa: La distancia de las viviendas a la empresa de los empleados en kilómetros mínima es de 1 Km, la máxima es de 29 Km, el promedio de la distancia es de 7 Km y la distribución de en Km que viven la mayoría de los empelados está en los rangos de 2 a 14 Km de distancia.

Ingreso_Mensual: El ingreso mensual mínimo en la compañía en millones es de $1.009.000 el máximo es de $19.999.000, el promedio de salarios está en $6.503.000 y un mediana de $4.919.000, la mayoría de salarios se encuentran en los rangos de $2.911.000 y $8.379.000 millones mensuales

Trabajos_Anteriores: La organización cuenta con empleados que no cuentan con experiencia laboral previa y otros empleados que han trabajado máximo en 9 empresas previamente a la actual. en promedio los empleados han tenido 2 trabajos anteriores.

Porcentaje_aumento_salarial: El mínimo porcentaje de aumento es del 11% y el máximo es del 25%, y en promedio a aumentado en la compañía 15%

Años_Experiencia: Podemos evidenciar que se tienen empleados con 0 años de experiencia hasta 40 año, y en promedio los empleados tiene 11 años de experiencia estando la mayoría entre 6 y 15 años de experiencia laboral.

Capacitaciones: Vemos que algunos empelados no cuentan con ninguna capacitación y el máximo de capacitaciones reactividades es de 6, y en promedio se tiene 3 capacitaciones para los empelados

Antigüedad: Hay empleados que son nuevos en la empresa con 0 años de antigüedad y el máximo es de 40 años en la empresa, el promedio de antigüedad es de 7 año y la mediana es de 5, los empleados están en su mayoría entre los 3 y 9 años de antigüedad en la empresa.

Antigüedad_Cargo: Se evidencian empleados con 0 años de antigüedad en el cargo actual y una máxima de 18 años, el promedio es de 4 años y la media está en 3 años, finalmente la mayoría se encuentran entre los 2 y 7 años de antigüedad.

Años_ultima_promoción: Se evidencia empleados que no ha sido ascendidos y empleados que fueron promocionados hace 15 años, en promedio a los empleados los ascienden cada 2 años, con una mediana de 1 año.

Años_acargo_con_mismo_jefe: Se evidencia que hay empleados, que no han tenido experiencia con el jefe actual, y otros empleados con 17 años con el mismo jefe, en promedio los empleados han estado con el mismo jefe por 4 años.

Analisis de Edades

summary(rotacion$Edad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   30.00   36.00   36.92   43.00   60.00

La edad promedio de la base de rotación es de 36 año, evidenciando que la distribución de la población se encuentra concentrada entre los 29 y 38 años de edad

Analisis en la Antiguedad en el Cargo

Podemos identificar que la moayor atiguiedad en el cargo es de 2 años y le sigue 7 años, evienciando que muy pocos empleados han estado mas de 14 años en el mismo cargo

Analisis en Porcentaje en el Aumento Salarial

Se evidencia que el aumento que el porcentaje en el aumento del salario se encuentra en los ragos de 11% a 14%

3. Análisis bivariado

Realiza un análisis bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.

Modelo Logistico

Se realizarn los 6 modelos con las variables seleccionadas

Edad

##             Estimate Std. Error z value Pr(>|z|)
## (Intercept)     0.21       0.31    0.67      0.5
## Edad           -0.05       0.01   -6.01      0.0

El estimado (-0.05) disminuye cuando la edad aumenta, es nos indica que la probablidad de poder rotar de cargo disminuyo al aumentar la edad.

Antiguedad en el Cargo

##                  Estimate Std. Error z value Pr(>|z|)
## (Intercept)         -1.12       0.10  -10.77        0
## Antigüedad_Cargo    -0.15       0.02   -6.03        0

La antiguedad es un factor de rotacion de puesto, que la antiguedad aumenta disminuye el estimado la posiblidad de rotacion disminuye

Aumento Salarial

##                             Estimate Std. Error z value Pr(>|z|)
## (Intercept)                    -1.50       0.30   -4.91     0.00
## Porcentaje_aumento_salarial    -0.01       0.02   -0.52     0.61

El porcentaje de aumento salarial, al estar cerca a 0 no es una varibale significativa para la rotacion de cargo

Genero

##             Estimate Std. Error z value Pr(>|z|)
## (Intercept)    -1.75       0.12  -15.07     0.00
## GeneroM         0.17       0.15    1.13     0.26

El genero no es varibale relevante

Departamento

##                    Estimate Std. Error z value Pr(>|z|)
## (Intercept)           -1.83       0.09  -19.58     0.00
## DepartamentoRH         0.38       0.33    1.14     0.25
## DepartamentoVentas     0.48       0.15    3.21     0.00

El tipo de departamento influye en la rotacion del personal sin embargo no es significativo, puesto que recursos humanos tiene un estimado de 0.38 y ventas de 0.48, por lo cual es mas probabale que los empleados que se encuentran en el departamento de ventas tengan la problidad de rotar mas que las otras areas.

Cargo

##                              Estimate Std. Error z value Pr(>|z|)
## (Intercept)                     -3.66       0.72   -5.12     0.00
## CargoDirector_Manofactura        1.06       0.79    1.35     0.18
## CargoEjecutivo_Ventas            2.11       0.73    2.89     0.00
## CargoGerente                     0.70       0.85    0.82     0.41
## CargoInvestigador_Cientifico     2.01       0.73    2.74     0.01
## CargoRecursos_Humanos            2.46       0.79    3.12     0.00
## CargoRepresentante_Salud         1.06       0.80    1.33     0.18
## CargoRepresentante_Ventas        3.25       0.75    4.33     0.00
## CargoTecnico_Laboratorio         2.51       0.73    3.43     0.00

Algunos cargos tiene la posiblidad de tener una mayor rotacion que otros, como Ejecutivo_Ventas (2.11), Investigador_Cientifico (2.01), Recursos_Humanos (2.46) y significativamente Representante_Ventas (3.25), evidenciando que el area y cargo son factores de rotacion importante.

4. Estimación del modelo

Realiza la estimación de un modelo de regresión logístico en el cual la variable respuesta es rotacion (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas en el punto 1. Interprete los coeficientes del modelo y la significancia de los parámetros.

Defincion del modelo

Definimos el modelo con las seis varibales seleccionadas

## 
## Call:
## glm(formula = r ~ Edad + Antigüedad_Cargo + Porcentaje_aumento_salarial + 
##     Genero + Departamento + Cargo, family = binomial, data = rotacion)
## 
## Coefficients:
##                                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                   -2.034589   0.882028  -2.307 0.021071 *  
## Edad                          -0.023520   0.009289  -2.532 0.011340 *  
## Antigüedad_Cargo              -0.099929   0.026038  -3.838 0.000124 ***
## Porcentaje_aumento_salarial   -0.008837   0.020716  -0.427 0.669693    
## GeneroM                        0.103712   0.153706   0.675 0.499838    
## DepartamentoRH               -12.697463 436.980517  -0.029 0.976819    
## DepartamentoVentas             0.033950   0.944602   0.036 0.971329    
## CargoDirector_Manofactura      0.847085   0.792125   1.069 0.284897    
## CargoEjecutivo_Ventas          1.817544   1.198350   1.517 0.129341    
## CargoGerente                   0.904757   0.933903   0.969 0.332649    
## CargoInvestigador_Cientifico   1.541570   0.742581   2.076 0.037898 *  
## CargoRecursos_Humanos         14.702222 436.981248   0.034 0.973160    
## CargoRepresentante_Salud       0.840544   0.798866   1.052 0.292721    
## CargoRepresentante_Ventas      2.565488   1.217405   2.107 0.035088 *  
## CargoTecnico_Laboratorio       2.023064   0.739639   2.735 0.006234 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1182.1  on 1455  degrees of freedom
## AIC: 1212.1
## 
## Number of Fisher Scoring iterations: 14

Ajustamos el modelo eliminado la variable género y porcentaje de aumento salarial, las cuales evidenciamos que no son significativas

## 
## Call:
## glm(formula = r ~ Edad + Antigüedad_Cargo + Departamento + Cargo, 
##     family = binomial, data = rotacion)
## 
## Coefficients:
##                                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                   -2.089790   0.823116  -2.539 0.011121 *  
## Edad                          -0.023824   0.009273  -2.569 0.010191 *  
## Antigüedad_Cargo              -0.099954   0.026031  -3.840 0.000123 ***
## DepartamentoRH               -12.685308 436.779496  -0.029 0.976830    
## DepartamentoVentas             0.027839   0.944521   0.029 0.976486    
## CargoDirector_Manofactura      0.828762   0.791688   1.047 0.295178    
## CargoEjecutivo_Ventas          1.822307   1.198212   1.521 0.128296    
## CargoGerente                   0.898182   0.933904   0.962 0.336175    
## CargoInvestigador_Cientifico   1.534174   0.742344   2.067 0.038766 *  
## CargoRecursos_Humanos         14.696266 436.780227   0.034 0.973159    
## CargoRepresentante_Salud       0.839106   0.798688   1.051 0.293439    
## CargoRepresentante_Ventas      2.554208   1.217130   2.099 0.035857 *  
## CargoTecnico_Laboratorio       2.026283   0.739423   2.740 0.006137 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1182.7  on 1457  degrees of freedom
## AIC: 1208.7
## 
## Number of Fisher Scoring iterations: 14

Si comparamos el AIC con las seis (6) variables seleccionadas, el primero AIC: 1212.1 y el segundo AIC: 1208.7, podemos evidenciar que el segundo mejora el rendimiento del modelo, por esta razon se selecciona el segundo modelo

Si analizamos los coeficientes estimados, el interecpt es de -2.089790, significando que la rotacion es negativa cuando todos los valores de las variables selecciondas estan en 0, por lo cual los estimadores con valores cercanos al Intercept tiene la posiblidad de tener una mayor rotacion siendo la edad (-0.023824), Antiguedad en el cargo (-0.099954), departamento de ventas (0.027839).

5. Evaluación

Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.

## Setting levels: control = No, case = Si
## Setting direction: controls < cases

## Area under the curve: 0.7119

El área bajo la curva (ROC) y la diagonal (Area under the curve: 0.7119), nos muestra un ajuste adecuado del modelo, entre mas cercano el valor AUC a 1 mejor es el modelo, por esta razon concluimos que la predicccion de los resultados son aceptables.

7. Conclusiones

En las conclusiones adicione una discución sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).

Teniendo en cuenta los resultados obtenidos, podemos concluir que para evitar la rotación de cargos del personal, se deben tener en cuenta los siguientes factores:

  1. El sueldo deberá ser acorde a la carga laboral, especialmente en el área de ventas, los cargos de mayor estrés son los que tiene mayor rotación.
  2. Poder identificar en cada departamento, las sobrecargas de trabajo, puesto que existe la probabilidad, que algunos departamentos esten con mayor carga laboral que otros.
  3. Brindar capacitaciones contantes a los empleados especializándolos en cada una de las áreas donde laboran, e incentivando aumentos de salario a medida que su desempeño laboral sea el mejor, especialmente a los empleados con menores ingresos
  4. Evaluar y reconocer los logros en todos los niveles de la empresa, a los empleados con iniciativas e ideas que puedan mejorar la productividad de la compañía esto genera la apropiación del cargo disminuyendo errores y aumentada productividad

La empresa tiene que tener en cuenta que la rotación de personal genera una nueva curva de aprendizaje y podría aumentar el error en el lapso de tiempo que el empleado se capacita y aprende la labor, adicionalmente los procesos con mayor rotación de personal deberán ser evaluados ya que esto indica, que la labor, no es cómoda y presenta retos, que se podrían mejorar al análisis las causas, disminuyendo la rotación del personal, mejorando productividad y calidad, lo cual podría verse reflejado en mayores ingresos para la empresa, mejores salarios para los empleados y una adecuada estabilidad en los cargos