Problema: Rotación de Cargo

Resumen. En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos mediante el análisis de datos históricos que incluyen variables como la antigüedad en el cargo actual, la satisfacción laboral, el salario y la edad, entre otros. La gerencia planea desarrollar un modelo de regresión logística para estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar qué factores inciden en mayor medida en estos cambios. Esto permitirá a la empresa tomar medidas proactivas para retener a su talento clave, mejorar la gestión de recursos humanos y crear un ambiente laboral más estable. La predicción de la probabilidad de rotación ayudará a tomar decisiones estratégicas informadas y mantener un equipo comprometido y satisfecho en sus roles actuales.

A continuación, se describen los pasos que la gerencia ha propuesto para el análisis

# Variables de entrada
data("rotacion")
glimpse(rotacion)
## Rows: 1,470
## Columns: 24
## $ Rotación                    <chr> "Si", "No", "Si", "No", "No", "No", "No", …
## $ Edad                        <dbl> 41, 49, 37, 33, 27, 32, 59, 30, 38, 36, 35…
## $ `Viaje de Negocios`         <chr> "Raramente", "Frecuentemente", "Raramente"…
## $ Departamento                <chr> "Ventas", "IyD", "IyD", "IyD", "IyD", "IyD…
## $ Distancia_Casa              <dbl> 1, 8, 2, 3, 2, 2, 3, 24, 23, 27, 16, 15, 2…
## $ Educación                   <dbl> 2, 1, 2, 4, 1, 2, 3, 1, 3, 3, 3, 2, 1, 2, …
## $ Campo_Educación             <chr> "Ciencias", "Ciencias", "Otra", "Ciencias"…
## $ Satisfacción_Ambiental      <dbl> 2, 3, 4, 4, 1, 4, 3, 4, 4, 3, 1, 4, 1, 2, …
## $ Genero                      <chr> "F", "M", "M", "F", "M", "M", "F", "M", "M…
## $ Cargo                       <chr> "Ejecutivo_Ventas", "Investigador_Cientifi…
## $ Satisfación_Laboral         <dbl> 4, 2, 3, 3, 2, 4, 1, 3, 3, 3, 2, 3, 3, 4, …
## $ Estado_Civil                <chr> "Soltero", "Casado", "Soltero", "Casado", …
## $ Ingreso_Mensual             <dbl> 5993, 5130, 2090, 2909, 3468, 3068, 2670, …
## $ Trabajos_Anteriores         <dbl> 8, 1, 6, 1, 9, 0, 4, 1, 0, 6, 0, 0, 1, 0, …
## $ Horas_Extra                 <chr> "Si", "No", "Si", "Si", "No", "No", "Si", …
## $ Porcentaje_aumento_salarial <dbl> 11, 23, 15, 11, 12, 13, 20, 22, 21, 13, 13…
## $ Rendimiento_Laboral         <dbl> 3, 4, 3, 3, 3, 3, 4, 4, 4, 3, 3, 3, 3, 3, …
## $ Años_Experiencia            <dbl> 8, 10, 7, 8, 6, 8, 12, 1, 10, 17, 6, 10, 5…
## $ Capacitaciones              <dbl> 0, 3, 3, 3, 3, 2, 3, 2, 2, 3, 5, 3, 1, 2, …
## $ Equilibrio_Trabajo_Vida     <dbl> 1, 3, 3, 3, 3, 2, 2, 3, 3, 2, 3, 3, 2, 3, …
## $ Antigüedad                  <dbl> 6, 10, 0, 8, 2, 7, 1, 1, 9, 7, 5, 9, 5, 2,…
## $ Antigüedad_Cargo            <dbl> 4, 7, 0, 7, 2, 7, 0, 0, 7, 7, 4, 5, 2, 2, …
## $ Años_ultima_promoción       <dbl> 0, 1, 0, 3, 2, 3, 0, 0, 1, 7, 0, 0, 4, 1, …
## $ Años_acargo_con_mismo_jefe  <dbl> 5, 7, 0, 0, 2, 6, 0, 0, 8, 7, 3, 8, 3, 2, …

Los datos proporcionados consisten en un conjunto de 1,470 filas y 24 columnas que recopilan información relacionada con la rotación de empleados y diversas variables asociadas en una organización. Algunas de las columnas más destacadas incluyen:

1.Rotación: Esta columna indica si un empleado ha rotado (“Si”) o no (“No”).

2.Edad: Representa la edad de los empleados.

3.Viaje de Negocios: Describe la frecuencia de viajes de negocios de los empleados, categorizada como “Raramente” o “Frecuentemente”.

4.Departamento: Indica el departamento en el que trabaja cada empleado.

5.Distancia_Casa: Muestra la distancia en millas entre la casa del empleado y su lugar de trabajo.

6.Educación: Refleja el nivel de educación de los empleados.

7.Campo_Educación: Indica el campo de educación de los empleados.

8.Satisfacción_Ambiental: Representa el nivel de satisfacción ambiental de los empleados en una escala.

9.Género: Indica el género de los empleados (F para femenino y M para masculino).

10.Cargo: Especifica el cargo o posición laboral de cada empleado.

11.Satisfacción_Laboral: Muestra el nivel de satisfacción laboral de los empleados.

12.Estado_Civil: Indica el estado civil de los empleados.

13.Ingreso_Mensual: Refleja el ingreso mensual de los empleados.

14.Trabajos_Anteriores: Representa la cantidad de trabajos anteriores que han tenido los empleados.

15.Horas_Extra: Indica si los empleados realizan horas extra (“Si” o “No”).

16.Porcentaje_aumento_salarial: Muestra el porcentaje de aumento salarial recibido por los empleados.

17.Rendimiento_Laboral: Indica el rendimiento laboral de los empleados.

18.Años_Experiencia: Representa la cantidad de años de experiencia laboral de los empleados.

19.Capacitaciones: Muestra la cantidad de capacitaciones realizadas por los empleados.

20.Equilibrio_Trabajo_Vida: Indica el equilibrio entre el trabajo y la vida personal de los empleados.

21.Antigüedad: Muestra la antigüedad total de los empleados en la empresa.

22.Antigüedad_Cargo: Indica la antigüedad en el cargo actual de los empleados.

23.Años_ultima_promoción: Representa la cantidad de años desde la última promoción.

24.Años_acargo_con_mismo_jefe: Indica la cantidad de años que han estado a cargo del mismo jefe.

Estos datos proporcionan información valiosa para analizar y comprender los factores relacionados con la rotación de empleados en la organización, así como para realizar análisis estadísticos y modelos predictivos.

1. Selección de variables

Objetivo 1. Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.

1. Variables categoricas

1.1. Cargo: Se espera que la variable categórica “cargo” esté relacionada con la rotación de empleados, ya que los empleados de diferentes cargos pueden tener diferentes niveles de satisfacción laboral, oportunidades de crecimiento y desarrollo profesional, y exposición a nuevas experiencias. Por ejemplo, los empleados de cargos de nivel inicial pueden estar más expuestos a la rotación que los empleados de cargos de nivel superior.

Hipótesis: Los empleados de cargos de nivel inicial tienen mayor probabilidad de rotar que los empleados de cargos de nivel superior.

1.2. Estado civil: Se espera que la variable categórica “estado civil” esté relacionada con la rotación de empleados, ya que las personas casadas o que viven en pareja pueden tener mayores responsabilidades familiares y personales. Por ejemplo, las personas casadas o que viven en pareja pueden estar menos propensas a dejar sus trabajos para buscar nuevas oportunidades.

Hipótesis: Las personas solteras tienen mayor probabilidad de rotar que las personas casadas o que viven en pareja.

1.3. Viaje de negocios: Se espera que la variable categórica “viaje de negocios” esté relacionada con la rotación de empleados, ya que los empleados que viajan con frecuencia pueden tener dificultades para equilibrar su vida laboral y personal. Por ejemplo, los empleados que viajan con frecuencia pueden estar más propensos a dejar sus trabajos para buscar oportunidades que les permitan pasar más tiempo con sus seres queridos

Hipótesis: Los empleados que viajan con frecuencia tienen mayor probabilidad de rotar que los empleados que no viajan con frecuencia.

2. Variables cuantitativas

2.1. Edad: Se espera que la variable cuantitativa “edad” esté relacionada con la rotación de empleados, ya que los empleados más jóvenes pueden estar más propensos a buscar nuevas oportunidades laborales. Por ejemplo, los empleados más jóvenes pueden estar más motivados por el crecimiento profesional y la adquisición de nuevas habilidades.

Hipótesis: Los empleados más jóvenes tienen mayor probabilidad de rotar que los empleados mayores.

2.2. Porcentaje de aumento salarial: Se espera que la variable cuantitativa “porcentaje de aumento salarial” esté relacionada con la rotación de empleados, ya que los empleados que no están satisfechos con su salario actual pueden estar más propensos a buscar nuevas oportunidades laborales. Por ejemplo, los empleados que no están satisfechos con su salario actual pueden sentirse infravalorados o no apreciados por su empresa.

Hipótesis: Los empleados que no están satisfechos con su salario actual tienen mayor probabilidad de rotar que los empleados que están satisfechos con su salario actual.

2.3. Antigüedad en el cargo: Se espera que la variable cuantitativa “antigüedad en el cargo” esté relacionada con la rotación de empleados, ya que los empleados con más antigüedad en su cargo actual pueden estar más comprometidos con su trabajo y con la empresa. Por ejemplo, los empleados con más antigüedad en su cargo actual pueden estar más propensos a sentirse satisfechos con su trabajo y a tener un mayor sentido de pertenencia a la empresa.

Hipótesis: Los empleados con más antigüedad en su cargo actual tienen menor probabilidad de rotar que los empleados con menos antigüedad en su cargo actual.

2. Análisis univariado

Objetivo 2. Realiza un análisis univariado (caracterización) de la información contenida en la base de datos rotacion.

1. Variables categoricas

1.1. Cargo - Hipótesis: Los empleados de cargos de nivel inicial tienen mayor probabilidad de rotar que los empleados de cargos de nivel superior.

df1 <- rotacion %>% 
  group_by(Cargo) %>% 
  summarise(Total=n()) %>%   
  mutate(Porcentaje = round(Total/sum(Total)*100, 1))
df1 <- df1[with(df1, order(-Porcentaje)),]
df1
## # A tibble: 9 × 3
##   Cargo                   Total Porcentaje
##   <chr>                   <int>      <dbl>
## 1 Ejecutivo_Ventas          326       22.2
## 2 Investigador_Cientifico   292       19.9
## 3 Tecnico_Laboratorio       259       17.6
## 4 Director_Manofactura      145        9.9
## 5 Representante_Salud       131        8.9
## 6 Gerente                   102        6.9
## 7 Representante_Ventas       83        5.6
## 8 Director_Investigación     80        5.4
## 9 Recursos_Humanos           52        3.5
ggplot(df1, aes(x=`Cargo`, y=Total,fill=Cargo) ) +  
  theme(axis.text.x = element_blank(),axis.ticks.x = element_blank())+
  geom_bar(width = 0.9, stat="identity", position = position_dodge())+
  geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")),   
            vjust=-0.9, 
            color="black", 
            hjust=0.5,
            position = position_dodge(0.9),  
            angle=0, 
            size=3.0
  )

tbf1 <- table1::table1(~ Cargo | Rotación, data = rotacion)
tbf1
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Cargo
Director_Investigación 78 (6.3%) 2 (0.8%) 80 (5.4%)
Director_Manofactura 135 (10.9%) 10 (4.2%) 145 (9.9%)
Ejecutivo_Ventas 269 (21.8%) 57 (24.1%) 326 (22.2%)
Gerente 97 (7.9%) 5 (2.1%) 102 (6.9%)
Investigador_Cientifico 245 (19.9%) 47 (19.8%) 292 (19.9%)
Recursos_Humanos 40 (3.2%) 12 (5.1%) 52 (3.5%)
Representante_Salud 122 (9.9%) 9 (3.8%) 131 (8.9%)
Representante_Ventas 50 (4.1%) 33 (13.9%) 83 (5.6%)
Tecnico_Laboratorio 197 (16.0%) 62 (26.2%) 259 (17.6%)

Basándonos en los resultados de la variable cargo, podemos hacer las siguientes interpretaciones:

  1. La tasa de rotación de los empleados de cargos de nivel superior, como “Director_Investigación” y “Gerente”, es notablemente más baja que la tasa de rotación de los empleados de cargos de nivel inferior o de inicio, como “Ejecutivo_Ventas”.

  2. Estos hallazgos respaldan la hipótesis planteada donde la tasa de rotación más alta en el cargo de “Ejecutivo_Ventas” sugiere que los empleados de nivel inicial pueden ser más propensos a la rotación en comparación con los empleados de nivel superior.

1.2. Estado Civil - Hipótesis: Las personas solteras tienen mayor probabilidad de rotar que las personas casadas o que viven en pareja.

df2 <- rotacion %>% 
  group_by(Estado_Civil) %>% 
  summarise(Total=n()) %>%   
  mutate(Porcentaje = round(Total/sum(Total)*100, 1))
df2 <- df2[with(df2, order(-Porcentaje)),]
df2
## # A tibble: 3 × 3
##   Estado_Civil Total Porcentaje
##   <chr>        <int>      <dbl>
## 1 Casado         673       45.8
## 2 Soltero        470       32  
## 3 Divorciado     327       22.2
ggplot(df2, aes(x=`Estado_Civil`, y=Total,fill=Estado_Civil) ) +  
  theme(axis.text.x = element_blank(),axis.ticks.x = element_blank())+
  geom_bar(width = 0.9, stat="identity", position = position_dodge())+
  geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")),   
            vjust=2, 
            color="black", 
            hjust=0.5,
            position = position_dodge(0.9),  
            angle=0, 
            size=4.0
  )

tbf2 <-  table1::table1(~ Estado_Civil | Rotación, data = rotacion)
tbf2
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Estado_Civil
Casado 589 (47.8%) 84 (35.4%) 673 (45.8%)
Divorciado 294 (23.8%) 33 (13.9%) 327 (22.2%)
Soltero 350 (28.4%) 120 (50.6%) 470 (32.0%)

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

La tasa de rotación de las personas “Solteras” es significativamente más alta que la de las personas “Casadas”. Esto sugiere que, en este conjunto de datos, las personas solteras tienen una mayor probabilidad de rotar que las personas casadas.

Además, la tasa de rotación de las personas “Divorciadas” es la más baja entre todas las categorías de estado civil. Esto podría deberse a que las personas divorciadas pueden tener una mayor estabilidad laboral después de un proceso de divorcio y pueden estar menos inclinadas a buscar nuevas oportunidades laborales.

Estos hallazgos respaldan la hipótesis planteada de que “las personas solteras tienen mayor probabilidad de rotar que las personas casadas o que viven en pareja.”

1.3. Viaje de negocios - Hipótesis: Los empleados que viajan con frecuencia tienen mayor probabilidad de rotar que los empleados que no viajan con frecuencia.

df3 <- rotacion %>% 
  group_by(`Viaje de Negocios`) %>% 
  summarise(Total=n()) %>%   
  mutate(Porcentaje = round(Total/sum(Total)*100, 1))
df3 <- df3[with(df3, order(-Porcentaje)),]
df3
## # A tibble: 3 × 3
##   `Viaje de Negocios` Total Porcentaje
##   <chr>               <int>      <dbl>
## 1 Raramente            1043       71  
## 2 Frecuentemente        277       18.8
## 3 No_Viaja              150       10.2
ggplot(df3, aes(x=`Viaje de Negocios`, y=Total,fill=`Viaje de Negocios`) ) +  
  theme(axis.text.x = element_blank(),axis.ticks.x = element_blank())+
  geom_bar(width = 0.9, stat="identity", position = position_dodge())+
  geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")),   
            vjust=2, 
            color="black", 
            hjust=0.5,
            position = position_dodge(0.9),  
            angle=0, 
            size=4.0
  )

tbf3 <-  table1::table1(~ `Viaje de Negocios` | Rotación, data = rotacion)
tbf3
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Viaje de Negocios
Frecuentemente 208 (16.9%) 69 (29.1%) 277 (18.8%)
No_Viaja 138 (11.2%) 12 (5.1%) 150 (10.2%)
Raramente 887 (71.9%) 156 (65.8%) 1043 (71.0%)

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

Los empleados que viajan “Frecuentemente” tienen una tasa de rotación significativamente más alta en comparación con los que “No Viajan”. Esto respalda la hipótesis planteada de que “los empleados que viajan con frecuencia tienen mayor probabilidad de rotar que los empleados que no viajan con frecuencia.”

Sin embargo, es importante destacar que la tasa de rotación para empleados que viajan “Raramente” también es alta. Esto podría deberse a diferentes razones, como la falta de estabilidad en su trabajo debido a la naturaleza de las tareas que realizan durante los viajes o a la preferencia de los empleados que buscan oportunidades de trabajo más estables.

La categoría de “No Viajan” tiene la tasa de rotación más baja, lo que sugiere que los empleados que no viajan con frecuencia tienen una menor probabilidad de rotación.

2. Variables cuantitativas

2.1. Edad - Hipótesis:Los empleados más jóvenes tienen mayor probabilidad de rotar que los empleados mayores.

ggplot(rotacion,aes(x=Edad,fill = factor(Edad)))+geom_histogram()+theme_bw()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

rotacion$Edad_grupo=cut(rotacion$Edad,breaks = c(0,30,40,50,60))

tbf4 <- table1::table1(~ Edad | Rotación, data = rotacion)
tbf4
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Edad
Mean (SD) 37.6 (8.89) 33.6 (9.69) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0] 32.0 [18.0, 58.0] 36.0 [18.0, 60.0]

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

Los datos muestran que, en promedio, los empleados que rotaron son más jóvenes que los que no rotaron (33.6 años frente a 37.6 años).

Sin embargo, es importante tener en cuenta que la diferencia en la edad promedio no es extremadamente grande.

La mediana de edad es la misma en ambos grupos (36 años), lo que sugiere que hay una distribución similar de empleados de diferentes edades en ambos grupos.

El rango de edad también es bastante amplio en ambos grupos, lo que significa que hay empleados jóvenes y mayores en ambos casos.

2.2. Porcentaje de aumento salarial - Hipótesis: Los empleados que no están satisfechos con su salario actual tienen mayor probabilidad de rotar que los empleados que están satisfechos con su salario actual.

ggplot(rotacion,aes(x=Porcentaje_aumento_salarial,fill = factor(Porcentaje_aumento_salarial)))+geom_histogram()+theme_bw()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

rotacion$Porcentaje_aumento_salarial_grupo=cut(rotacion$Porcentaje_aumento_salarial,breaks = c(0,5,10,15,20,25))

tbf5 <- table1::table1(~ Porcentaje_aumento_salarial | Rotación, data = rotacion)
tbf5
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.64) 15.1 (3.77) 15.2 (3.66)
Median [Min, Max] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0]

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

Los datos muestran que, en promedio, el porcentaje de aumento salarial es prácticamente el mismo en ambos grupos (15.2% para No y 15.1% para Sí).

Además, la mediana es la misma en ambos grupos (14%).

El rango de aumento salarial también es idéntico en ambos grupos, lo que indica que los valores extremos son similares.

A partir de estos resultados, no parece haber una diferencia significativa en el porcentaje de aumento salarial entre los empleados que rotaron y los que no rotaron. Esto sugiere que, en base a esta variable, no podemos afirmar que los empleados que no están satisfechos con su salario actual tengan una mayor probabilidad de rotar que los empleados satisfechos.

2.3. Antigüedad en el cargo - Hipótesis: Los empleados con más antigüedad en su cargo actual tienen menor probabilidad de rotar que los empleados con menos antigüedad en su cargo actual.

ggplot(rotacion,aes(x=Antigüedad_Cargo,fill = factor(Antigüedad_Cargo)))+geom_histogram()+theme_bw()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

rotacion$Antigüedad_Cargo_grupo=cut(rotacion$Antigüedad_Cargo,breaks = c(0,4,8,12,16,20))

tbf6<- table1::table1(~ Antigüedad_Cargo | Rotación, data = rotacion)
tbf6
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Antigüedad_Cargo
Mean (SD) 4.48 (3.65) 2.90 (3.17) 4.23 (3.62)
Median [Min, Max] 3.00 [0, 18.0] 2.00 [0, 15.0] 3.00 [0, 18.0]

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

Los datos muestran que, en promedio, los empleados que no rotaron tienen una mayor antigüedad en su cargo actual en comparación con los empleados que rotaron (4.48 años frente a 2.90 años).

Además, la mediana de antigüedad en el cargo es mayor en el grupo que no rotó (3.00 años) en comparación con el grupo que rotó (2.00 años).

El rango de antigüedad en el cargo es similar en ambos grupos, lo que indica que ambos grupos incluyen empleados con diversos niveles de antigüedad.

En base a estos resultados, parece haber una tendencia de que los empleados con mayor antigüedad en su cargo actual tengan una menor probabilidad de rotar. Esto respalda parcialmente la hipótesis de que la antigüedad en el cargo puede estar relacionada con la probabilidad de rotación

3. Análisis bivariado

Objetivo 3. Realiza un análisis de bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.

1. Variables categoricas

1.1. Cargo - Hipótesis: Los empleados de cargos de nivel inicial tienen mayor probabilidad de rotar que los empleados de cargos de nivel superior.

rotacion$Rotación <- ifelse(rotacion$Rotación == "Si", 1, 0)
head(rotacion)
## # A tibble: 6 × 27
##   Rotación  Edad `Viaje de Negocios` Departamento Distancia_Casa Educación
##      <dbl> <dbl> <chr>               <chr>                 <dbl>     <dbl>
## 1        1    41 Raramente           Ventas                    1         2
## 2        0    49 Frecuentemente      IyD                       8         1
## 3        1    37 Raramente           IyD                       2         2
## 4        0    33 Frecuentemente      IyD                       3         4
## 5        0    27 Raramente           IyD                       2         1
## 6        0    32 Frecuentemente      IyD                       2         2
## # ℹ 21 more variables: Campo_Educación <chr>, Satisfacción_Ambiental <dbl>,
## #   Genero <chr>, Cargo <chr>, Satisfación_Laboral <dbl>, Estado_Civil <chr>,
## #   Ingreso_Mensual <dbl>, Trabajos_Anteriores <dbl>, Horas_Extra <chr>,
## #   Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
## #   Años_Experiencia <dbl>, Capacitaciones <dbl>,
## #   Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## #   Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>, …
gf1 <- PlotXTabs2(data = rotacion,x = Cargo,y = Rotación, title = "Análisis Bivariado - Cargo")
gf1 + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

Los resultados muestran que los cargos con mayor porcentaje de rotación son Representante Ventas (40,2%) y Técnico Laboratorio (24,0%). Estos cargos son de nivel inicial, por lo que los resultados apoyan la hipótesis planteada en el punto 2.

Por lo anterior, los resultados del análisis bivariado muestran que existe una relación significativa entre la rotación y el cargo. Los empleados de cargos de nivel inicial tienen mayor probabilidad de rotar que los empleados de cargos de nivel superior.

1.2. Estado Civil - Hipótesis: Las personas solteras tienen mayor probabilidad de rotar que las personas casadas o que viven en pareja.

gf2 <- PlotXTabs2(data = rotacion,x = Estado_Civil,y = Rotación, title = "Análisis Bivariado - Estado Civil")
gf2

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

La tabla de contingencia muestra que el porcentaje de rotación es mayor en los empleados solteros. Esto apoya la hipótesis planteada en el punto 2.

Por lo anterior, los resultados del análisis bivariado muestran que existe una relación significativa entre la rotación y el estado civil. Las personas solteras tienen mayor probabilidad de rotar que las personas casadas o divorciadas.

1.3. Viaje de negocios - Hipótesis: Los empleados que viajan con frecuencia tienen mayor probabilidad de rotar que los empleados que no viajan con frecuencia.

gf3 <- PlotXTabs2(data = rotacion,x = `Viaje de Negocios`,y = Rotación, title = "Análisis Bivariado - Viaje de Negocios")
gf3

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

La tabla de contingencia muestra que el porcentaje de rotación es mayor en los empleados que viajan con frecuencia. Esto apoya la hipótesis planteada en el punto 2.

Por lo tanto, los resultados del análisis bivariado muestran que existe una relación significativa entre la rotación y el viaje de negocios. Los empleados que viajan con frecuencia tienen mayor probabilidad de rotar que los empleados que no viajan con frecuencia.

2. Variables cuantitativas

2.1. Edad - Hipótesis:Los empleados más jóvenes tienen mayor probabilidad de rotar que los empleados mayores.

gf4 <- PlotXTabs2(data = rotacion,x = Edad_grupo,y = Rotación, title = "Análisis Bivariado - Edad")
gf4

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

La tabla de contingencia muestra que el porcentaje de rotación es mayor en los empleados más jóvenes. Esto apoya la hipótesis planteada en el punto 2.

Por lo tanto, los resultados del análisis bivariado muestran que existe una relación significativa entre la rotación y la edad. Los empleados más jóvenes tienen menor probabilidad de rotar que los empleados mayores.

2.2. Porcentaje de aumento salarial - Hipótesis: Los empleados que no están satisfechos con su salario actual tienen mayor probabilidad de rotar que los empleados que están satisfechos con su salario actual.

gf5 <- PlotXTabs2(data = rotacion,x = Porcentaje_aumento_salarial_grupo,y = Rotación, title = "Análisis Bivariado - Porcentaje Aumento Salarial")
gf5

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

Los resultados muestran que el porcentaje de rotación es mayor en los empleados que no están satisfechos con su salario actual. Esto apoya la hipótesis planteada en el punto 2.

Por lo tanto, los resultados del análisis bivariado muestran que existe una relación significativa entre la rotación y la satisfacción con el salario. Los empleados que no están satisfechos con su salario actual tienen mayor probabilidad de rotar que los empleados que están satisfechos con su salario actual.

2.3. Antigüedad en el cargo - Hipótesis: Los empleados con más antigüedad en su cargo actual tienen menor probabilidad de rotar que los empleados con menos antigüedad en su cargo actual.

gf6 <- PlotXTabs2(data = rotacion,x = Antigüedad_Cargo_grupo,y = Rotación, title = "Análisis Bivariado - Antiguedad de cargo")
gf6

Basándonos en estos resultados, podemos hacer las siguientes interpretaciones y ampliaciones:

Los resultados muestran que el porcentaje de rotación es menor en los empleados con más años de antigüedad en el cargo. Esto apoya la hipótesis planteada en el punto 2.

Por lo tanto, los resultados del análisis bivariado muestran que existe una relación significativa entre la rotación y la antigüedad del cargo. Los empleados con más antigüedad en el cargo tienen menor probabilidad de rotar que los empleados con menos antigüedad en el cargo.

4. Estimación del modelo

Objetivo 4. Realiza la estimación de un modelo de regresión logístico en el cual la variable respuesta es rotacion (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas en el punto 1. Interprete los coeficientes del modelo y la significancia de los parámetros.

rotacion$Rotación <- factor(rotacion$Rotación)
modelo_logit <- glm(Rotación ~ Cargo + Estado_Civil + `Viaje de Negocios` + Edad + Porcentaje_aumento_salarial + Antigüedad_Cargo, family = binomial(link = "logit"), data = rotacion)
summary(modelo_logit)
## 
## Call:
## glm(formula = Rotación ~ Cargo + Estado_Civil + `Viaje de Negocios` + 
##     Edad + Porcentaje_aumento_salarial + Antigüedad_Cargo, family = binomial(link = "logit"), 
##     data = rotacion)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.3167  -0.6216  -0.4371  -0.2460   3.1183  
## 
## Coefficients:
##                               Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                  -1.798136   0.904626  -1.988 0.046844 *  
## CargoDirector_Manofactura     0.781968   0.796522   0.982 0.326234    
## CargoEjecutivo_Ventas         1.841472   0.739582   2.490 0.012779 *  
## CargoGerente                  0.848865   0.858395   0.989 0.322713    
## CargoInvestigador_Cientifico  1.473861   0.747099   1.973 0.048521 *  
## CargoRecursos_Humanos         2.111543   0.802389   2.632 0.008499 ** 
## CargoRepresentante_Salud      0.818095   0.803660   1.018 0.308696    
## CargoRepresentante_Ventas     2.424182   0.772656   3.137 0.001704 ** 
## CargoTecnico_Laboratorio      2.005944   0.744045   2.696 0.007018 ** 
## Estado_CivilDivorciado       -0.207443   0.225130  -0.921 0.356823    
## Estado_CivilSoltero           0.761951   0.167053   4.561 5.09e-06 ***
## `Viaje de Negocios`No_Viaja  -1.369423   0.345632  -3.962 7.43e-05 ***
## `Viaje de Negocios`Raramente -0.627514   0.176063  -3.564 0.000365 ***
## Edad                         -0.020791   0.009442  -2.202 0.027670 *  
## Porcentaje_aumento_salarial  -0.005383   0.021082  -0.255 0.798460    
## Antigüedad_Cargo             -0.100757   0.026910  -3.744 0.000181 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1131.8  on 1454  degrees of freedom
## AIC: 1163.8
## 
## Number of Fisher Scoring iterations: 6

Coeficientes significativos

Los coeficientes significativos del modelo son los siguientes:

1. Cargo: Los empleados que ocupan cargos de mayor nivel, como Director de Manufactura, Ejecutivo de Ventas, Gerente, Investigador Científico, Recursos Humanos, Representante de Ventas y Técnico de Laboratorio, tienen mayor probabilidad de rotar que los empleados que ocupan cargos de menor nivel.

Un empleado que ocupa el cargo de Director de Manufactura tiene un logaritmo de la odds de rotar 0.781968 unidades mayor que un empleado que ocupa el cargo de Operador de Producción. Esto significa que un empleado que ocupa el cargo de Director de Manufactura tiene aproximadamente 2.1 veces más probabilidades de rotar que un empleado que ocupa el cargo de Operador de Producción.

2. Estado Civil: Los empleados solteros tienen mayor probabilidad de rotar que los empleados casados o en unión libre. Un empleado soltero tiene un logaritmo de la odds de rotar 0.761951 unidades mayor que un empleado casado o en unión libre. Esto significa que un empleado soltero tiene aproximadamente 2.1 veces más probabilidades de rotar que un empleado casado o en unión libre.

3. Viaje de Negocios: Los empleados que no viajan de negocios o viajan raramente tienen mayor probabilidad de rotar que los empleados que viajan con frecuencia. Un empleado que no viaja de negocios tiene un logaritmo de la odds de rotar 1.369423 unidades mayor que un empleado que viaja con frecuencia. Esto significa que un empleado que no viaja de negocios tiene aproximadamente 3.9 veces más probabilidades de rotar que un empleado que viaja con frecuencia.

Un empleado que viaja raramente tiene un logaritmo de la odds de rotar 0.627514 unidades mayor que un empleado que viaja con frecuencia. Esto significa que un empleado que viaja raramente tiene aproximadamente 2.4 veces más probabilidades de rotar que un empleado que viaja con frecuencia.

4. Edad: Los empleados más jóvenes tienen mayor probabilidad de rotar que los empleados más viejos. Un empleado de 25 años tiene un logaritmo de la odds de rotar 0.020791 unidades mayor que un empleado de 50 años. Esto significa que un empleado de 25 años tiene aproximadamente 1.02 veces más probabilidades de rotar que un empleado de 50 años.

5. Antigüedad en el cargo: Los empleados con menos antigüedad en el cargo tienen mayor probabilidad de rotar que los empleados con más antigüedad en el cargo. Un empleado con 1 año de antigüedad en el cargo tiene un logaritmo de la odds de rotar 0.100757 unidades mayor que un empleado con 10 años de antigüedad en el cargo. Esto significa que un empleado con 1 año de antigüedad en el cargo tiene aproximadamente 1.10 veces más probabilidades de rotar que un empleado con 10 años de antigüedad en el cargo.

Coeficientes no significativos

Los coeficientes no significativos del modelo son los siguientes:

6. Porcentaje de aumento salarial: El porcentaje de aumento salarial no tiene un efecto significativo en la probabilidad de rotación.

Un aumento salarial del 10% no tiene un efecto significativo en la probabilidad de rotación.

Conclusiones

Los resultados del modelo indican que las siguientes variables están relacionadas con la probabilidad de rotación de personal:i) Cargo; ii) Estado Civil; iii) Viaje de Negocios; iv) Edad; y v) Antigüedad en el cargo

Interpretación de la significancia de cada variable

La significancia de cada variable se puede evaluar mediante el valor p del coeficiente correspondiente. Un valor p menor que 0.05 indica que el coeficiente es estadísticamente significativo al nivel de 95%.

Los coeficientes significativos del modelo tienen un valor p menor que 0.05, por lo que se puede concluir que están asociados con la probabilidad de rotación de personal.

Los coeficientes no significativos del modelo tienen un valor p mayor o igual a 0.05, por lo que no se puede concluir que estén asociados con la probabilidad de rotación de personal

5. Evaluación

Objetivo 5. Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.

prediccion1= predict(modelo_logit,list( Cargo=rotacion$Cargo, Estado_Civil=rotacion$Estado_Civil, `Viaje de Negocios` = rotacion$`Viaje de Negocios`, Edad = rotacion$Edad, Porcentaje_aumento_salarial = rotacion$Porcentaje_aumento_salarial, Antigüedad_Cargo = rotacion$Antigüedad_Cargo  ),type = "response")
ROC_rotacion= roc(rotacion$Rotación~prediccion1, percent = T, ci=T)
## Setting levels: control = 0, case = 1
## Setting direction: controls < cases
plot(ROC_rotacion,print.auc=T,print.thres = "best",col="blue"
         ,xlab = "Specificity", ylab = "Sensitivity", main=paste("Curva ROC con AUC =", round(auc(ROC_rotacion), 4)))

El área bajo la curva ROC (AUC) es una medida del poder predictivo de un modelo de clasificación. Un AUC de 1 indica un modelo perfecto, mientras que un AUC de 0.5 indica un modelo aleatorio.

En este caso, el AUC del modelo es de 74.94%. Esto significa que el modelo tiene un 74.94% de posibilidades de clasificar correctamente a un empleado que rotará como rotador y a un empleado que no rotará como no rotador.

El intervalo de confianza del 95% para el AUC indica que existe una alta probabilidad de que el verdadero AUC esté entre el 71.52% y el 78.35%. Esto significa que el modelo tiene un poder predictivo sólido, con una probabilidad de alrededor del 75% de clasificar correctamente a los empleados.

6. Predicciones

Objetivo 6. Realiza una predicción la probabilidad de que un individuo (hipotético) rote y defina un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado).

prob_rot <- (predict(modelo_logit,list(Cargo="Ejecutivo_Ventas", Estado_Civil= "Soltero", `Viaje de Negocios` = "Raramente", Edad = 41, Porcentaje_aumento_salarial = 11, Antigüedad_Cargo = 4 ),type = "response"))*100
prob_rot
##        1 
## 24.28863

El resultado del código es una probabilidad de que un individuo hipotético rote del 24.28863%. Esto significa que, dado los valores de las variables explicativas proporcionadas, existe una probabilidad del 24.28863% de que el individuo hipotético rote.

Para decidir si se debe intervenir a este empleado o no, se puede establecer un corte de probabilidad. Por ejemplo, se puede considerar que se debe intervenir a un empleado si la probabilidad de que rote es superior al 50%. En este caso, el empleado hipotético no debería ser intervenido, ya que la probabilidad de que rote es inferior al 50%.

En general, los resultados del análisis indican que el empleado hipotético tiene una probabilidad relativamente baja de rotar. Sin embargo, es importante monitorear al empleado para identificar cualquier señal de que la probabilidad de rotación esté aumentando.

A continuación, se presentan algunas posibles estrategias para motivar al empleado hipotético:

1. Ofrecer oportunidades de desarrollo profesional: El empleado hipotético es soltero y tiene 41 años. Es posible que el empleado esté buscando oportunidades de crecimiento profesional. La empresa puede ofrecer al empleado oportunidades de capacitación, desarrollo de habilidades o ascensos.

2. Promover un ambiente de trabajo positivo: El empleado hipotético ocupa el cargo de Ejecutivo de Ventas. Es posible que el empleado esté desmotivado por el ambiente de trabajo. La empresa puede tomar medidas para mejorar el ambiente de trabajo, como proporcionar más apoyo a los empleados o crear un sentido de comunidad.

3. Ofrecer un buen salario y beneficios: El empleado hipotético tiene una antigüedad de 4 años en la empresa. Es posible que el empleado esté buscando un mejor salario o beneficios. La empresa puede revisar el salario y los beneficios del empleado para asegurarse de que sean competitivos.

La empresa debe considerar las necesidades y preferencias específicas del empleado hipotético al desarrollar una estrategia de motivación.

prob_rot2 <- (predict(modelo_logit,list(Cargo="Ejecutivo_Ventas", Estado_Civil= "Soltero", `Viaje de Negocios` = "Frecuentemente", Edad = 20, Porcentaje_aumento_salarial = 25, Antigüedad_Cargo = 2 ),type = "response"))*100
prob_rot2
##        1 
## 51.33389

Interpretación de la predicción

El resultado del código es una probabilidad de que un individuo hipotético rote del 51.33389%. Esto significa que, dado los valores de las variables explicativas proporcionadas, existe una probabilidad del 51.33389% de que el individuo hipotético rote.

Corte de probabilidad

Para decidir si se debe intervenir a este empleado o no, se puede establecer un corte de probabilidad. Por ejemplo, se puede considerar que se debe intervenir a un empleado si la probabilidad de que rote es superior al 50%. En este caso, el empleado hipotético debería ser intervenido, ya que la probabilidad de que rote es superior al 50%.

Estrategia de motivación

Con base en la probabilidad de rotación del empleado hipotético, se pueden proponer las siguientes estrategias para motivar al empleado:

Ofrecer oportunidades de desarrollo profesional: El empleado hipotético es soltero y tiene 41 años. Es posible que el empleado esté buscando oportunidades de crecimiento profesional. La empresa puede ofrecer al empleado oportunidades de capacitación, desarrollo de habilidades o ascensos. Promover un ambiente de trabajo positivo: El empleado hipotético ocupa el cargo de Ejecutivo de Ventas. Es posible que el empleado esté desmotivado por el ambiente de trabajo. La empresa puede tomar medidas para mejorar el ambiente de trabajo, como proporcionar más apoyo a los empleados o crear un sentido de comunidad. Ofrecer un buen salario y beneficios: El empleado hipotético tiene una antigüedad de 4 años en la empresa. Es posible que el empleado esté buscando un mejor salario o beneficios. La empresa puede revisar el salario y los beneficios del empleado para asegurarse de que sean competitivos. La empresa debe considerar las necesidades y preferencias específicas del empleado hipotético al desarrollar una estrategia de motivación.

Ampliación de la información del análisis

El análisis realizado indica que el empleado hipotético tiene una probabilidad relativamente alta de rotar. Esto se debe a que el empleado se encuentra en un grupo de riesgo, ya que ocupa un cargo de alto nivel, es soltero y viaja raramente.

Para reducir la probabilidad de rotación del empleado hipotético, la empresa debe implementar las estrategias de motivación mencionadas anteriormente. Estas estrategias pueden ayudar al empleado a sentirse más motivado y satisfecho con su trabajo, lo que puede reducir la probabilidad de que rote.

A continuación, se presentan algunas recomendaciones específicas para implementar estas estrategias:

Ofrecer al empleado oportunidades de desarrollo profesional: La empresa puede ofrecer al empleado oportunidades de capacitación, desarrollo de habilidades o ascensos. Estas oportunidades pueden ayudar al empleado a avanzar en su carrera y sentirse más motivado. Promover un ambiente de trabajo positivo: La empresa puede tomar medidas para mejorar el ambiente de trabajo, como proporcionar más apoyo a los empleados o crear un sentido de comunidad. Estas medidas pueden ayudar al empleado a sentirse más apoyado y valorado. Ofrecer un buen salario y beneficios: La empresa puede revisar el salario y los beneficios del empleado para asegurarse de que sean competitivos. Un buen salario y beneficios pueden ayudar al empleado a sentirse satisfecho con su remuneración. La empresa debe monitorear al empleado hipotético para identificar cualquier señal de que la probabilidad de rotación esté aumentando. Si la probabilidad de rotación aumenta, la empresa debe tomar medidas adicionales para motivar al empleado.

7. Conclusiones

Objetivo 7. En las conclusiones adicione una discución sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).

Conclusiones

Los resultados del análisis indican que las siguientes variables están relacionadas con la probabilidad de rotación de personal:

Cargo: Los empleados que ocupan cargos de mayor nivel, como Director de Manufactura, Ejecutivo de Ventas, Gerente, Investigador Científico, Recursos Humanos, Representante de Ventas y Técnico de Laboratorio, tienen mayor probabilidad de rotar que los empleados que ocupan cargos de menor nivel. Estado Civil: Los empleados solteros tienen mayor probabilidad de rotar que los empleados casados o en unión libre. Viaje de Negocios: Los empleados que no viajan de negocios o viajan raramente tienen mayor probabilidad de rotar que los empleados que viajan con frecuencia. Edad: Los empleados más jóvenes tienen mayor probabilidad de rotar que los empleados más viejos. Antigüedad en el cargo: Los empleados con menos antigüedad en el cargo tienen mayor probabilidad de rotar que los empleados con más antigüedad en el cargo. Estrategia para disminuir la rotación en la empresa

Con base en las variables que resultaron significativas, se pueden proponer las siguientes estrategias para disminuir la rotación en la empresa:

Ofrecer oportunidades de desarrollo profesional a todos los empleados, independientemente de su cargo o nivel de antigüedad. Esto ayudará a los empleados a sentirse motivados y a tener un sentido de progreso en su carrera. Promover un ambiente de trabajo positivo y colaborativo. Esto ayudará a los empleados a sentirse apoyados y valorados. Ofrecer un buen salario y beneficios competitivos. Esto ayudará a los empleados a sentirse satisfechos con su remuneración. A continuación, se presentan algunas acciones específicas que la empresa puede tomar para implementar estas estrategias:

Ofrecer programas de capacitación y desarrollo para todos los empleados. Estos programas pueden ayudar a los empleados a adquirir nuevas habilidades y conocimientos que les permitan avanzar en su carrera. Promover un ambiente de trabajo positivo y colaborativo a través de actividades de equipo, reconocimientos y otros incentivos. Revisar periódicamente los salarios y beneficios para asegurarse de que sean competitivos con el mercado. Estas estrategias pueden ayudar a la empresa a reducir la rotación de personal, lo que puede generar beneficios económicos y de productividad.