Problema: Rotación de cargo

  1. Selección de variables Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.
##    Rotación              Edad       Viaje de Negocios  Departamento      
##  Length:1470        Min.   :18.00   Length:1470        Length:1470       
##  Class :character   1st Qu.:30.00   Class :character   Class :character  
##  Mode  :character   Median :36.00   Mode  :character   Mode  :character  
##                     Mean   :36.92                                        
##                     3rd Qu.:43.00                                        
##                     Max.   :60.00                                        
##  Distancia_Casa     Educación     Campo_Educación    Satisfacción_Ambiental
##  Min.   : 1.000   Min.   :1.000   Length:1470        Min.   :1.000         
##  1st Qu.: 2.000   1st Qu.:2.000   Class :character   1st Qu.:2.000         
##  Median : 7.000   Median :3.000   Mode  :character   Median :3.000         
##  Mean   : 9.193   Mean   :2.913                      Mean   :2.722         
##  3rd Qu.:14.000   3rd Qu.:4.000                      3rd Qu.:4.000         
##  Max.   :29.000   Max.   :5.000                      Max.   :4.000         
##     Genero             Cargo           Satisfación_Laboral Estado_Civil      
##  Length:1470        Length:1470        Min.   :1.000       Length:1470       
##  Class :character   Class :character   1st Qu.:2.000       Class :character  
##  Mode  :character   Mode  :character   Median :3.000       Mode  :character  
##                                        Mean   :2.729                         
##                                        3rd Qu.:4.000                         
##                                        Max.   :4.000                         
##  Ingreso_Mensual Trabajos_Anteriores Horas_Extra       
##  Min.   : 1009   Min.   :0.000       Length:1470       
##  1st Qu.: 2911   1st Qu.:1.000       Class :character  
##  Median : 4919   Median :2.000       Mode  :character  
##  Mean   : 6503   Mean   :2.693                         
##  3rd Qu.: 8379   3rd Qu.:4.000                         
##  Max.   :19999   Max.   :9.000                         
##  Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia
##  Min.   :11.00               Min.   :3.000       Min.   : 0.00   
##  1st Qu.:12.00               1st Qu.:3.000       1st Qu.: 6.00   
##  Median :14.00               Median :3.000       Median :10.00   
##  Mean   :15.21               Mean   :3.154       Mean   :11.28   
##  3rd Qu.:18.00               3rd Qu.:3.000       3rd Qu.:15.00   
##  Max.   :25.00               Max.   :4.000       Max.   :40.00   
##  Capacitaciones  Equilibrio_Trabajo_Vida   Antigüedad     Antigüedad_Cargo
##  Min.   :0.000   Min.   :1.000           Min.   : 0.000   Min.   : 0.000  
##  1st Qu.:2.000   1st Qu.:2.000           1st Qu.: 3.000   1st Qu.: 2.000  
##  Median :3.000   Median :3.000           Median : 5.000   Median : 3.000  
##  Mean   :2.799   Mean   :2.761           Mean   : 7.008   Mean   : 4.229  
##  3rd Qu.:3.000   3rd Qu.:3.000           3rd Qu.: 9.000   3rd Qu.: 7.000  
##  Max.   :6.000   Max.   :4.000           Max.   :40.000   Max.   :18.000  
##  Años_ultima_promoción Años_acargo_con_mismo_jefe
##  Min.   : 0.000        Min.   : 0.000            
##  1st Qu.: 0.000        1st Qu.: 2.000            
##  Median : 1.000        Median : 3.000            
##  Mean   : 2.188        Mean   : 4.123            
##  3rd Qu.: 3.000        3rd Qu.: 7.000            
##  Max.   :15.000        Max.   :17.000

Cargo (Cargo): Se espera que el cargo esté relacionado con la rotación de empleados. La hipótesis podría ser que los empleados insatisfechos con su cargo son más propensos a dejar la organización que aquellos que poseen un cargo que posiblemente tenga más oportunidad de crecimiento o aquellos donde existe liderazgo de personal.

Departamento (Departamento): Se podría hipotetizar que ciertos departamentos dentro de la organización pueden tener tasas de rotación más altas que otros. Por ejemplo, departamentos con altas cargas de trabajo podrían tener una mayor rotación.

Estado Civil (Estado_Civil): Se podría hipotetizar que el estado civil de un empleado podría influir en su decisión de cambiar de puesto. Por ejemplo, los empleados solteros podrían ser más propensos a la rotación debido a una mayor flexibilidad en su vida personal y laboral.

Antigüedad en el Cargo Actual (Antigüedad_Cargo): Se espera que la antigüedad en el cargo actual esté inversamente relacionada con la rotación. La hipótesis podría ser que los empleados que han estado en sus cargos actuales durante más tiempo son menos propensos a cambiar.

Edad (Edad): Se podría hipotetizar que la edad de un empleado está relacionada con la rotación. Por ejemplo, los empleados más jóvenes podrían ser más propensos a buscar oportunidades de crecimiento fuera de la organización.

Ingreso Mensual (Ingreso_Mensual): La hipótesis podría ser que el ingreso mensual influye en la probabilidad de rotación. Los empleados que consideran que su ingreso mensual es bajo en comparación con el mercado podrían ser más propensos a buscar empleo en otro lugar.

Estas variables proporcionan una base sólida para comenzar a explorar la relación entre diferentes factores y la rotación de empleados en la organización utilizando un modelo.

Punto 2

  1. Realiza un análisis univariado (caracterización) de la información contenida en la base de datos rotacion.

De acuerdo con la gráfica anterior, podemos deducir que los cargos de Ejecutivo de ventas, Investigador científico y Técnico de laboratorio cuentan con la mayor cantidad de representantes con un total de 877 empleados equivalente al 59.7% del personal de la compañía.

No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Cargo
Director_Investigación 78 (6.3%) 2 (0.8%) 80 (5.4%)
Director_Manofactura 135 (10.9%) 10 (4.2%) 145 (9.9%)
Ejecutivo_Ventas 269 (21.8%) 57 (24.1%) 326 (22.2%)
Gerente 97 (7.9%) 5 (2.1%) 102 (6.9%)
Investigador_Cientifico 245 (19.9%) 47 (19.8%) 292 (19.9%)
Recursos_Humanos 40 (3.2%) 12 (5.1%) 52 (3.5%)
Representante_Salud 122 (9.9%) 9 (3.8%) 131 (8.9%)
Representante_Ventas 50 (4.1%) 33 (13.9%) 83 (5.6%)
Tecnico_Laboratorio 197 (16.0%) 62 (26.2%) 259 (17.6%)

De esta forma se puede identificar que los cargos con mayor demanda son los que cuentan a su vez con mayor rotación de personal.

De lo anterior, podemos ver que la población de la empresa se distribuye mayoritariamente en personas casadas siendo un 45.8%, seguidos por los solteros con un 32% y por ultimo los divorciados con 22.2%.

No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Estado_Civil
Casado 589 (47.8%) 84 (35.4%) 673 (45.8%)
Divorciado 294 (23.8%) 33 (13.9%) 327 (22.2%)
Soltero 350 (28.4%) 120 (50.6%) 470 (32.0%)

El grupo que tiene mayor rotación es el de solteros con 120 personas, representando un 50.6% de las personas que han abandonado la compañía.

De la visual anterior, podemos decir que sólo el 18.8% del total de empleados se cataloga como un usuario frecuente de viaje de negocios.

No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Viaje de Negocios
Frecuentemente 208 (16.9%) 69 (29.1%) 277 (18.8%)
No_Viaja 138 (11.2%) 12 (5.1%) 150 (10.2%)
Raramente 887 (71.9%) 156 (65.8%) 1043 (71.0%)

El 94.9% del personal que ha rotado realizan viajes dentro de sus labores.

No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Antigüedad_Cargo
Mean (SD) 4.48 (3.65) 2.90 (3.17) 4.23 (3.62)
Median [Min, Max] 3.00 [0, 18.0] 2.00 [0, 15.0] 3.00 [0, 18.0]

La mayoría de empleados posee muy poco tiempo de antigüedad en su cargo. Podemos deducir que las personas con menos años de antigüedad tienden a rotar con mayor frecuencia.

Punto 3

Realiza un análisis de bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.

## # A tibble: 6 × 25
##   Rotación  Edad `Viaje de Negocios` Departamento Distancia_Casa Educación
##      <dbl> <dbl> <chr>               <chr>                 <dbl>     <dbl>
## 1        1    41 Raramente           Ventas                    1         2
## 2        0    49 Frecuentemente      IyD                       8         1
## 3        1    37 Raramente           IyD                       2         2
## 4        0    33 Frecuentemente      IyD                       3         4
## 5        0    27 Raramente           IyD                       2         1
## 6        0    32 Frecuentemente      IyD                       2         2
## # ℹ 19 more variables: Campo_Educación <chr>, Satisfacción_Ambiental <dbl>,
## #   Genero <chr>, Cargo <chr>, Satisfación_Laboral <dbl>, Estado_Civil <chr>,
## #   Ingreso_Mensual <dbl>, Trabajos_Anteriores <dbl>, Horas_Extra <chr>,
## #   Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
## #   Años_Experiencia <dbl>, Capacitaciones <dbl>,
## #   Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## #   Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>, …

Visual Cargo vs. Rotación

Representante de ventas que tiene una rotación del 40% y el personal de Recursos humanos y técnicos de laboratorio que tienen rotaciones significativamente altas en comparación con los demás cargos. Esto comprueba la hipótesis donde se plantea la menor rotación en los cargos de liderazgo o gerenciales.

Visual Departamento vs. Rotación

En esta visual queda demostrado que el departamento de ventas es el que más rotación posee.

Visual Estado Civil vs. Rotación

De acuerdo con la visual anterior, el personal con estado civil soltero tiende a realizar rotación de empleo.

Visual Antigüedad en el Cargo vs. Rotación

Se puede observar con claridad que los empleados con mayor tiempo en el cargo que emplean, tienden a rotar menos.

Visual Edad vs. Rotación

De lo anterior, podemos deducir que el grupo menor a 30 años tiende a realizar rotación de empleo en mayor proporción en comparación con aquellos mayores a 30 incluso casi doblando el porcentaje de rotación.

Visual Ingreso Mensual vs. Rotación

En resumen, el grupo que posee mayor ingreso tiende a realizar rotaciones en mucha menor medida si lo comparamos con aquellos cuyo ingreso mensual está ubicado entre la media que es 4919.

Punto 4

Realiza la estimación de un modelo de regresión logístico en el cual la variable respuesta es rotacion (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas en el punto 1. Interprete los coeficientes del modelo y la significancia de los parámetros.

## 
## Call:
## glm(formula = Rotación ~ Cargo + Estado_Civil + Departamento + 
##     Edad + Antigüedad_Cargo + Ingreso_Mensual, family = binomial(link = "logit"), 
##     data = rotacion)
## 
## Coefficients:
##                                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                  -3.286e+00  1.016e+00  -3.233 0.001225 ** 
## CargoDirector_Manofactura     1.323e+00  8.777e-01   1.507 0.131814    
## CargoEjecutivo_Ventas         2.357e+00  1.265e+00   1.863 0.062492 .  
## CargoGerente                  8.159e-01  9.401e-01   0.868 0.385435    
## CargoInvestigador_Cientifico  2.214e+00  9.214e-01   2.403 0.016240 *  
## CargoRecursos_Humanos         1.561e+01  4.288e+02   0.036 0.970966    
## CargoRepresentante_Salud      1.340e+00  8.828e-01   1.518 0.129078    
## CargoRepresentante_Ventas     3.260e+00  1.342e+00   2.429 0.015145 *  
## CargoTecnico_Laboratorio      2.752e+00  9.188e-01   2.995 0.002742 ** 
## Estado_CivilDivorciado       -2.225e-01  2.236e-01  -0.995 0.319879    
## Estado_CivilSoltero           7.563e-01  1.654e-01   4.573  4.8e-06 ***
## DepartamentoRH               -1.279e+01  4.288e+02  -0.030 0.976205    
## DepartamentoVentas           -5.390e-03  9.520e-01  -0.006 0.995483    
## Edad                         -2.305e-02  9.776e-03  -2.357 0.018402 *  
## Antigüedad_Cargo             -1.029e-01  2.697e-02  -3.816 0.000136 ***
## Ingreso_Mensual               6.241e-05  4.454e-05   1.401 0.161216    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1150.4  on 1454  degrees of freedom
## AIC: 1182.4
## 
## Number of Fisher Scoring iterations: 14

Algunas variables predictoras son significativas a un nivel de confianza del 95% (p < 0.05), como “CargoInvestigador_Cientifico,” “CargoTecnico_Laboratorio,” “Edad,” y “Antigüedad_Cargo”. Esto sugiere que estas variables tienen un impacto significativo en la probabilidad de rotación.

Este modelo de regresión logística sugiere que variables como “CargoInvestigador_Cientifico,” “CargoTecnico_Laboratorio,” “Edad,” y “Antigüedad_Cargo” son significativas para predecir la rotación de los empleados, mientras que otras variables como “CargoRecursos_Humanos,” “DepartamentoRH,” y “DepartamentoVentas” no parecen ser relevantes para la predicción.

El valor de AIC proporciona una medida de la calidad del ajuste del modelo, teniendo en cuenta la complejidad del modelo. En general, se prefiere un valor de AIC más bajo, lo que indica un mejor ajuste del modelo. En este caso, el AIC es 1182.4. Un AIC de 1182.4 sugiere que el modelo tiene cierta calidad, pero su evaluación completa depende de la comparación con otros modelos y del contexto específico del análisis. El número de iteraciones de Fisher de 14 indica la cantidad de iteraciones necesarias para que el modelo convergiera, lo cual es común en modelos logísticos, y no es necesariamente un problema a menos que sea excesivamente alto.

##                  (Intercept)    CargoDirector_Manofactura 
##                 3.606311e-02                 7.896202e-01 
##        CargoEjecutivo_Ventas                 CargoGerente 
##                 9.134943e-01                 6.933681e-01 
## CargoInvestigador_Cientifico        CargoRecursos_Humanos 
##                 9.015440e-01                 9.999998e-01 
##     CargoRepresentante_Salud    CargoRepresentante_Ventas 
##                 7.924658e-01                 9.630309e-01 
##     CargoTecnico_Laboratorio       Estado_CivilDivorciado 
##                 9.400339e-01                 4.446153e-01 
##          Estado_CivilSoltero               DepartamentoRH 
##                 6.805577e-01                 2.788994e-06 
##           DepartamentoVentas                         Edad 
##                 4.986526e-01                 4.942388e-01 
##             Antigüedad_Cargo              Ingreso_Mensual 
##                 4.742954e-01                 5.000156e-01

Todos los coeficientes tienen p-values mayores a 0.05, lo que indica que no hay evidencia estadística suficiente para afirmar que alguna de las variables predictoras tenga un impacto significativo en la variable dependiente (Rotación) en el modelo actual.

La falta de significancia estadística no significa necesariamente que las variables predictoras no tengan un efecto en la variable dependiente, pero en el contexto de este modelo y con el conjunto de datos específico, no se puede concluir que haya una relación estadísticamente significativa.

La significancia estadística es importante para identificar las variables más influyentes en un modelo y para tomar decisiones basadas en la relación entre las variables predictoras y la variable dependiente. En este caso, parece que ninguna de las variables predictoras en el modelo tiene un impacto significativo en la probabilidad de Rotación.

Punto 5

Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.

La curva ROC muestra que el modelo construido tiene un AUC de 73.38%. Esto sugiere que el modelo tiene cierta capacidad para distinguir entre casos positivos (Rotación 1) y casos negativos (Rotación 0). Un AUC de 0.5 sería equivalente al azar, por lo que un AUC del 73.38% indica un rendimiento mejor que el azar, pero la interpretación específica de la calidad del modelo dependerá del contexto y de los objetivos específicos del análisis. El intervalo de confianza del 95% proporciona información sobre la precisión de esta estimación del AUC.

## 
## Call:
## roc.formula(formula = rotacion$Rotación ~ prediccion1, percent = T,     ci = T)
## 
## Data: prediccion1 in 1233 controls (rotacion$Rotación 0) < 237 cases (rotacion$Rotación 1).
## Area under the curve: 73.38%
## 95% CI: 69.92%-76.84% (DeLong)

Punto 6

Realiza una predicción la probabilidad de que un individuo (hipotético) rote y defina un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado).

(predict(modelo1,list(Cargo="Ejecutivo_Ventas", Estado_Civil= "Soltero", Departamento = "Ventas", Edad = 51, Antigüedad_Cargo = 4, Ingreso_Mensual = 5993 ),type = "response"))*100
##        1 
## 19.92929

Un empleado con las características anteriores tiene la probabilidad de rotar un 19.92%. Se deben ofrecer mejoras en compesaciones como aumento de ingreso mensual para que este porcentaje disminuya.

Punto 7

Conclusiones: Luego del análisis realizado, podemos concluir que el cargo, la edad, la antiguedad en el cargo, pueden influir directamente en la rotación. Al analizar los resultados obtenidos con la variable Estado Civil, se puede observar una mayor tendencia de rotación en las personas solteras. Una manera de retener al personal joven y soltero en el cargo, puede ser definir el tipo de contrato a termino indefinido por sus beneficios frente a crecimiento profesional y algo de estabilidad.