Unidad 3 - Modelo de regresión logístico

Universidad Pontificia Javeriana Cali

Métodos estadísticos para la toma de decisiones

Problema 1 : Rotación de cargo

Catalina Gómez Vallejo

Se trabajo con la base de datos “Rotación” del paqueteMOD

library(readxl)
library(dplyr)
library(readxl)
rotacion <- read_excel("C:/Users/Cata/Desktop/MAESTRIA CD/5. Metodos estadisticos/Regresion logistica/rotacion.xlsx", col_types = c("text", "numeric", "text", "text", "numeric", "text", "text", "text", "text", "text", "text", "text", "numeric", "numeric", "text", "numeric", "text", "numeric", "text", "text", "numeric", "numeric", "numeric", "numeric"))
glimpse(rotacion)
## Rows: 1,470
## Columns: 24
## $ Rotacion                    <chr> "Si", "No", "Si", "No", "No", "No", "No", …
## $ Edad                        <dbl> 41, 49, 37, 33, 27, 32, 59, 30, 38, 36, 35…
## $ `Viaje de Negocios`         <chr> "Raramente", "Frecuentemente", "Raramente"…
## $ Departamento                <chr> "Ventas", "IyD", "IyD", "IyD", "IyD", "IyD…
## $ Distancia_Casa              <dbl> 1, 8, 2, 3, 2, 2, 3, 24, 23, 27, 16, 15, 2…
## $ Educacion                   <chr> "2", "1", "2", "4", "1", "2", "3", "1", "3…
## $ Campo_Educacion             <chr> "Ciencias", "Ciencias", "Otra", "Ciencias"…
## $ Satisfaccion_Ambiental      <chr> "2", "3", "4", "4", "1", "4", "3", "4", "4…
## $ Genero                      <chr> "F", "M", "M", "F", "M", "M", "F", "M", "M…
## $ Cargo                       <chr> "Ejecutivo_Ventas", "Investigador_Cientifi…
## $ Satisfacion_Laboral         <chr> "4", "2", "3", "3", "2", "4", "1", "3", "3…
## $ Estado_Civil                <chr> "Soltero", "Casado", "Soltero", "Casado", …
## $ Ingreso_Mensual             <dbl> 5993, 5130, 2090, 2909, 3468, 3068, 2670, …
## $ Trabajos_Anteriores         <dbl> 8, 1, 6, 1, 9, 0, 4, 1, 0, 6, 0, 0, 1, 0, …
## $ Horas_Extra                 <chr> "Si", "No", "Si", "Si", "No", "No", "Si", …
## $ Porcentaje_aumento_salarial <dbl> 11, 23, 15, 11, 12, 13, 20, 22, 21, 13, 13…
## $ Rendimiento_Laboral         <chr> "3", "4", "3", "3", "3", "3", "4", "4", "4…
## $ Anos_Experiencia            <dbl> 8, 10, 7, 8, 6, 8, 12, 1, 10, 17, 6, 10, 5…
## $ Capacitaciones              <chr> "0", "3", "3", "3", "3", "2", "3", "2", "2…
## $ Equilibrio_Trabajo_Vida     <chr> "1", "3", "3", "3", "3", "2", "2", "3", "3…
## $ Antiguedad                  <dbl> 6, 10, 0, 8, 2, 7, 1, 1, 9, 7, 5, 9, 5, 2,…
## $ Antiguedad_Cargo            <dbl> 4, 7, 0, 7, 2, 7, 0, 0, 7, 7, 4, 5, 2, 2, …
## $ Anos_ultima_promocion       <dbl> 0, 1, 0, 3, 2, 3, 0, 0, 1, 7, 0, 0, 4, 1, …
## $ Anos_acargo_con_mismo_jefe  <dbl> 5, 7, 0, 0, 2, 6, 0, 0, 8, 7, 3, 8, 3, 2, …

1. Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.

1.1 variables categóricas:

  • Departamento: Se espera que la variable departamento de la empresa este asociada a la rotación, debido a que a pesar de pertenecer a una misma empresa la carga laboral, el ambiente laboral, el nivel de estrés, entre otros factores pueden variar internamente entre los departamentos. Hipótesis: Las personas que pertenecen a determinado departamento de la empresa tienen mayor probabilidad de rotar que las que pertenecen a los demás departamentos.

  • Satisfacción laboral: Se espera que la variable satisfacción laboral se asocie a la rotación, ya que un gran porcentaje del tiempo de nuestra vida se dedica al trabajo, por lo cual es importante estar conforme con cuanto al entorno y condiciones de trabajo. Hipótesis: Las personas que tienen un menor nivel de satisfacción laboral tienen mayor probabilidad de rotar que las personas que tienen un mayor nivel de satisfacción laboral.

  • Equilibrio trabajo vida: Se espera que la variable equilibrio trabajo vida se asocie a la rotación, ya que es importante dedicar el tiempo suficiente y no descuidar ningún aspecto de nuestras vidas, cuando no existe este equilibrio nos podemos ver afectados emocional y psicológicamente. Hipótesis: Las personas que tienen un menor nivel de equilibrio entre el trabajo y su vida personal tienen una mayor probabilidad de rotar que las personas que tiene un mayor nivel de equilibrio en estos aspectos.

1.2 Variables cuantitativas:

  • Porcentaje de aumento salarial: Se espera que la variable porcentaje de aumento salarial se asocie a la rotación, ya que anualmente los precios de la canasta familiar y el costo de vida incrementan de acuerdo al inflación, por lo cual el salario pierde valor en el tiempo si la empresa no realiza un aumento al menos acorde a este indicador. Hipótesis: Las personas con un menor porcentaje de aumento salarial tienen mayor probabilidad de rotar que las personas con un mayor porcentaje de aumento salarial.

  • Años última promoción: Se espera que la variable años de la última promoción se asocie a la rotación debido a que para los empleados es importante poder crecer personal, profesional y laboralmente, es importante que las empresas brinden al empleado la oportunidad de ascender cuando su desempeño laboral así lo amerite. Hipótesis: Las personas con mayor cantidad de años desde la última promoción tiene mayor probabilidad de rotar que las personas con menor cantidad de años desde la última promoción.

  • Años experiencia: Se espera que la variable años de experiencia este asociada a la rotación, ya que cuando una persona está recién egresada es complejo conseguir empleo, mientras que cuando una persona tiene una amplia experiencia laboral las empresas pueden ofrecer constantemente propuestas de cambio de trabajo mejorando las condiciones actuales del trabajador. Hipótesis: Las personas con mayor años de experiencia tienen mayor probabilidad de rotar que las personas con menor años de experiencia.

2. Análisis univariado

require(table1)
table1(~., data = rotacion, topclass="Rtable1-zebra")
Overall
(N=1470)
Rotacion
No 1233 (83.9%)
Si 237 (16.1%)
Edad
Mean (SD) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0]
Viaje de Negocios
Frecuentemente 277 (18.8%)
No_Viaja 150 (10.2%)
Raramente 1043 (71.0%)
Departamento
IyD 961 (65.4%)
RH 63 (4.3%)
Ventas 446 (30.3%)
Distancia_Casa
Mean (SD) 9.19 (8.11)
Median [Min, Max] 7.00 [1.00, 29.0]
Educacion
1 170 (11.6%)
2 282 (19.2%)
3 572 (38.9%)
4 398 (27.1%)
5 48 (3.3%)
Campo_Educacion
Ciencias 606 (41.2%)
Humanidades 27 (1.8%)
Mercadeo 159 (10.8%)
Otra 82 (5.6%)
Salud 464 (31.6%)
Tecnicos 132 (9.0%)
Satisfaccion_Ambiental
1 284 (19.3%)
2 287 (19.5%)
3 453 (30.8%)
4 446 (30.3%)
Genero
F 588 (40.0%)
M 882 (60.0%)
Cargo
Director_Investigación 80 (5.4%)
Director_Manofactura 145 (9.9%)
Ejecutivo_Ventas 326 (22.2%)
Gerente 102 (6.9%)
Investigador_Cientifico 292 (19.9%)
Recursos_Humanos 52 (3.5%)
Representante_Salud 131 (8.9%)
Representante_Ventas 83 (5.6%)
Tecnico_Laboratorio 259 (17.6%)
Satisfacion_Laboral
1 289 (19.7%)
2 280 (19.0%)
3 442 (30.1%)
4 459 (31.2%)
Estado_Civil
Casado 673 (45.8%)
Divorciado 327 (22.2%)
Soltero 470 (32.0%)
Ingreso_Mensual
Mean (SD) 6500 (4710)
Median [Min, Max] 4920 [1010, 20000]
Trabajos_Anteriores
Mean (SD) 2.69 (2.50)
Median [Min, Max] 2.00 [0, 9.00]
Horas_Extra
No 1054 (71.7%)
Si 416 (28.3%)
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.66)
Median [Min, Max] 14.0 [11.0, 25.0]
Rendimiento_Laboral
3 1244 (84.6%)
4 226 (15.4%)
Anos_Experiencia
Mean (SD) 11.3 (7.78)
Median [Min, Max] 10.0 [0, 40.0]
Capacitaciones
0 54 (3.7%)
1 71 (4.8%)
2 547 (37.2%)
3 491 (33.4%)
4 123 (8.4%)
5 119 (8.1%)
6 65 (4.4%)
Equilibrio_Trabajo_Vida
1 80 (5.4%)
2 344 (23.4%)
3 893 (60.7%)
4 153 (10.4%)
Antiguedad
Mean (SD) 7.01 (6.13)
Median [Min, Max] 5.00 [0, 40.0]
Antiguedad_Cargo
Mean (SD) 4.23 (3.62)
Median [Min, Max] 3.00 [0, 18.0]
Anos_ultima_promocion
Mean (SD) 2.19 (3.22)
Median [Min, Max] 1.00 [0, 15.0]
Anos_acargo_con_mismo_jefe
Mean (SD) 4.12 (3.57)
Median [Min, Max] 3.00 [0, 17.0]

2.1 variables categóricas:

library(ggplot2)
library(ggpubr)
library(patchwork)

g1<-ggplot(data=rotacion,aes(x=Rotacion))+ geom_bar(fill="#EED5D2")+
  geom_text(stat='count', aes(label=..count..), vjust=1)+
  labs(x="Rotacion")+ theme(axis.text = element_text(size=9))
g2<-ggplot(data=rotacion,aes(x=Departamento))+ geom_bar(fill = "#EED5D2")+
  geom_text(stat='count', aes(label=..count..), vjust=1)+
  labs(x="Departamento")+ theme(axis.text = element_text(size=9))
g3<-ggplot(data=rotacion,aes(x=Satisfacion_Laboral))+ geom_bar(fill = "#EED5D2")+
  geom_text(stat='count', aes(label=..count..), vjust=1)+
  labs(x="Satisfacion Laboral")+ theme(axis.text = element_text(size=9))
g4<-ggplot(data=rotacion,aes(x=Equilibrio_Trabajo_Vida))+ geom_bar(fill = "#EED5D2")+
  geom_text(stat='count', aes(label=..count..), vjust=1)+
  labs(x="Equilibrio Trabajo Vida")+ theme(axis.text = element_text(size=9))

g1+g2+g3+g4+
  plot_layout(ncol = 2)

De los 1470 empleados analizados de una empresa, se tiene una rotación de personal aproximadamente del 16%. Entre las caracteristicas mas frecuentes de los empleados se tiene que, el departamento con mayor personal es lyD, la satisfacción laboral de los empleados es superior a 3 y el equilibrio que llevan entre el trabajo y vida es 3-Medio.

2.2 Variables cuantitativas:

g1<-ggplot(data=rotacion,aes(x=Porcentaje_aumento_salarial))+ geom_histogram(fill="#EED5D2")+ xlab("Porcentaje aumento salarial")
g2<-ggplot(data=rotacion, aes(x=Porcentaje_aumento_salarial)) + geom_boxplot() + xlab("Porcentaje aumento salarial")
g3<-ggplot(data=rotacion,aes(x=Anos_Experiencia))+ geom_histogram(fill="#EED5D2")+ xlab("Años de experiencia")
g4<-ggplot(data=rotacion, aes(x=Anos_Experiencia)) + geom_boxplot() + xlab("Años de experiencia")
g5<-ggplot(data=rotacion,aes(x=Anos_ultima_promocion))+ geom_histogram(fill="#EED5D2")+ xlab("Años ultima promoción")
g6<-ggplot(data=rotacion, aes(x=Anos_ultima_promocion)) + geom_boxplot() + xlab("Años ultima promoción")

g1+g2+g3+g4+g5+g6+
  plot_layout(ncol = 2)

El porcentaje de aumento salarial que registran los empleados es en promedio de 15.2% (11% - 25%), los años de experiencia de los empleados es en promedio de 11 años (0 - 40 años) y la cantidad de años que han transcurrido desde la ultima promoción de los empleados es en promedio de 2 años (0 - 15 años).

3. Análisis bivariado

3.1 variables categóricas:

t<-table(rotacion$`Viaje de Negocios`, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 5.608614e-06
t<-table(rotacion$Departamento, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.004525607
t<-table(rotacion$Educacion, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.5455253
t<-table(rotacion$Campo_Educacion, rotacion$Rotacion)
chisq.test(t)$p.value
## Warning in chisq.test(t): Chi-squared approximation may be incorrect
## [1] 0.00677398
t<-table(rotacion$Satisfaccion_Ambiental, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 5.123469e-05
t<-table(rotacion$Genero, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.2905724
t<-table(rotacion$Cargo, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 2.752482e-15
t<-table(rotacion$Satisfacion_Laboral, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.0005563005
t<-table(rotacion$Estado_Civil, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 9.455511e-11
t<-table(rotacion$Horas_Extra, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 8.158424e-21
t<-table(rotacion$Rendimiento_Laboral, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.9900745
t<-table(rotacion$Capacitaciones, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.01914773
t<-table(rotacion$Equilibrio_Trabajo_Vida, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.0009725699

El valor p de la prueba Chi-cuadrado entre las variables cualitativas (Viajes de negocios, Departamento, Satisfacción ambiental, Cargo, Satisfacción laboral, Estado civil, Horas extras, Equilibrio trabajo-vida) y rotación es menor que 0,005 por lo cual se puede considerar que existe las variables anteriores influyen en la rotación de los empleados.

De acuerdo al valor p, las variables Educación, Campo de educación, Genero, Rendimiento laboral y Capacitaciones no influyen en la rotación de los empleados.

3.2 variables cuantitativas:

t.test(rotacion$Edad~rotacion$Rotacion)$p.value
## [1] 1.371249e-08
t.test(rotacion$Distancia_Casa~rotacion$Rotacion)$p.value
## [1] 0.004136512
t.test(rotacion$Ingreso_Mensual~rotacion$Rotacion)$p.value
## [1] 4.433589e-13
t.test(rotacion$Trabajos_Anteriores~rotacion$Rotacion)$p.value
## [1] 0.116334
t.test(rotacion$Porcentaje_aumento_salarial~rotacion$Rotacion)$p.value
## [1] 0.6144301
t.test(rotacion$Anos_Experiencia~rotacion$Rotacion)$p.value
## [1] 1.159817e-11
t.test(rotacion$Antiguedad~rotacion$Rotacion)$p.value
## [1] 2.285905e-07
t.test(rotacion$Antiguedad_Cargo~rotacion$Rotacion)$p.value
## [1] 3.18739e-11
t.test(rotacion$Anos_ultima_promocion~rotacion$Rotacion)$p.value
## [1] 0.1986513
t.test(rotacion$Anos_acargo_con_mismo_jefe~rotacion$Rotacion)$p.value
## [1] 1.185022e-10

El valor p de la prueba t entre las variables cuantitativas (Edad, Distancia a casa, Ingreso mensual, Años experiencia, Antiguedad, Antiguedad cargo, Años a cargo con mismo jefe) y rotación es menor que 0,005 por lo cual se puede considerar que existe diferencia entre las medias de las variables anteriores para los grupos de empleados retirados y no retirados.

De acuerdo al valor p, para las variables trabajos anteriores, porcentaje de aumento salarial y años desde la ultima promoción no existe diferencias entre las medias de los grupos de retirados y no retirados; por lo cual, se podria considerar que no son significativas para explicar la rotación de los empleados.

rotacion$Rotacion=as.numeric(rotacion$Rotacion=="Si")
require(table1)
table1(~. |Rotacion, data = rotacion, topclass="Rtable1-zebra")
0
(N=1233)
1
(N=237)
Overall
(N=1470)
Edad
Mean (SD) 37.6 (8.89) 33.6 (9.69) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0] 32.0 [18.0, 58.0] 36.0 [18.0, 60.0]
Viaje de Negocios
Frecuentemente 208 (16.9%) 69 (29.1%) 277 (18.8%)
No_Viaja 138 (11.2%) 12 (5.1%) 150 (10.2%)
Raramente 887 (71.9%) 156 (65.8%) 1043 (71.0%)
Departamento
IyD 828 (67.2%) 133 (56.1%) 961 (65.4%)
RH 51 (4.1%) 12 (5.1%) 63 (4.3%)
Ventas 354 (28.7%) 92 (38.8%) 446 (30.3%)
Distancia_Casa
Mean (SD) 8.92 (8.01) 10.6 (8.45) 9.19 (8.11)
Median [Min, Max] 7.00 [1.00, 29.0] 9.00 [1.00, 29.0] 7.00 [1.00, 29.0]
Educacion
1 139 (11.3%) 31 (13.1%) 170 (11.6%)
2 238 (19.3%) 44 (18.6%) 282 (19.2%)
3 473 (38.4%) 99 (41.8%) 572 (38.9%)
4 340 (27.6%) 58 (24.5%) 398 (27.1%)
5 43 (3.5%) 5 (2.1%) 48 (3.3%)
Campo_Educacion
Ciencias 517 (41.9%) 89 (37.6%) 606 (41.2%)
Humanidades 20 (1.6%) 7 (3.0%) 27 (1.8%)
Mercadeo 124 (10.1%) 35 (14.8%) 159 (10.8%)
Otra 71 (5.8%) 11 (4.6%) 82 (5.6%)
Salud 401 (32.5%) 63 (26.6%) 464 (31.6%)
Tecnicos 100 (8.1%) 32 (13.5%) 132 (9.0%)
Satisfaccion_Ambiental
1 212 (17.2%) 72 (30.4%) 284 (19.3%)
2 244 (19.8%) 43 (18.1%) 287 (19.5%)
3 391 (31.7%) 62 (26.2%) 453 (30.8%)
4 386 (31.3%) 60 (25.3%) 446 (30.3%)
Genero
F 501 (40.6%) 87 (36.7%) 588 (40.0%)
M 732 (59.4%) 150 (63.3%) 882 (60.0%)
Cargo
Director_Investigación 78 (6.3%) 2 (0.8%) 80 (5.4%)
Director_Manofactura 135 (10.9%) 10 (4.2%) 145 (9.9%)
Ejecutivo_Ventas 269 (21.8%) 57 (24.1%) 326 (22.2%)
Gerente 97 (7.9%) 5 (2.1%) 102 (6.9%)
Investigador_Cientifico 245 (19.9%) 47 (19.8%) 292 (19.9%)
Recursos_Humanos 40 (3.2%) 12 (5.1%) 52 (3.5%)
Representante_Salud 122 (9.9%) 9 (3.8%) 131 (8.9%)
Representante_Ventas 50 (4.1%) 33 (13.9%) 83 (5.6%)
Tecnico_Laboratorio 197 (16.0%) 62 (26.2%) 259 (17.6%)
Satisfacion_Laboral
1 223 (18.1%) 66 (27.8%) 289 (19.7%)
2 234 (19.0%) 46 (19.4%) 280 (19.0%)
3 369 (29.9%) 73 (30.8%) 442 (30.1%)
4 407 (33.0%) 52 (21.9%) 459 (31.2%)
Estado_Civil
Casado 589 (47.8%) 84 (35.4%) 673 (45.8%)
Divorciado 294 (23.8%) 33 (13.9%) 327 (22.2%)
Soltero 350 (28.4%) 120 (50.6%) 470 (32.0%)
Ingreso_Mensual
Mean (SD) 6830 (4820) 4790 (3640) 6500 (4710)
Median [Min, Max] 5200 [1050, 20000] 3200 [1010, 19900] 4920 [1010, 20000]
Trabajos_Anteriores
Mean (SD) 2.65 (2.46) 2.94 (2.68) 2.69 (2.50)
Median [Min, Max] 2.00 [0, 9.00] 1.00 [0, 9.00] 2.00 [0, 9.00]
Horas_Extra
No 944 (76.6%) 110 (46.4%) 1054 (71.7%)
Si 289 (23.4%) 127 (53.6%) 416 (28.3%)
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.64) 15.1 (3.77) 15.2 (3.66)
Median [Min, Max] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0]
Rendimiento_Laboral
3 1044 (84.7%) 200 (84.4%) 1244 (84.6%)
4 189 (15.3%) 37 (15.6%) 226 (15.4%)
Anos_Experiencia
Mean (SD) 11.9 (7.76) 8.24 (7.17) 11.3 (7.78)
Median [Min, Max] 10.0 [0, 38.0] 7.00 [0, 40.0] 10.0 [0, 40.0]
Capacitaciones
0 39 (3.2%) 15 (6.3%) 54 (3.7%)
1 62 (5.0%) 9 (3.8%) 71 (4.8%)
2 449 (36.4%) 98 (41.4%) 547 (37.2%)
3 422 (34.2%) 69 (29.1%) 491 (33.4%)
4 97 (7.9%) 26 (11.0%) 123 (8.4%)
5 105 (8.5%) 14 (5.9%) 119 (8.1%)
6 59 (4.8%) 6 (2.5%) 65 (4.4%)
Equilibrio_Trabajo_Vida
1 55 (4.5%) 25 (10.5%) 80 (5.4%)
2 286 (23.2%) 58 (24.5%) 344 (23.4%)
3 766 (62.1%) 127 (53.6%) 893 (60.7%)
4 126 (10.2%) 27 (11.4%) 153 (10.4%)
Antiguedad
Mean (SD) 7.37 (6.10) 5.13 (5.95) 7.01 (6.13)
Median [Min, Max] 6.00 [0, 37.0] 3.00 [0, 40.0] 5.00 [0, 40.0]
Antiguedad_Cargo
Mean (SD) 4.48 (3.65) 2.90 (3.17) 4.23 (3.62)
Median [Min, Max] 3.00 [0, 18.0] 2.00 [0, 15.0] 3.00 [0, 18.0]
Anos_ultima_promocion
Mean (SD) 2.23 (3.23) 1.95 (3.15) 2.19 (3.22)
Median [Min, Max] 1.00 [0, 15.0] 1.00 [0, 15.0] 1.00 [0, 15.0]
Anos_acargo_con_mismo_jefe
Mean (SD) 4.37 (3.59) 2.85 (3.14) 4.12 (3.57)
Median [Min, Max] 3.00 [0, 17.0] 2.00 [0, 14.0] 3.00 [0, 17.0]

Las variables categoricas seleccionadas en el punto 1 fueron Departamento, Satisfacción laboral y equilibrio trabajo-vida, de acuerdo a las prueba Chi-cuadrado se pudo evidenciar que las variables si influyen en la rotación de personal. De acuerdo a las hipotesis plateadas se esperaba que en algun departamento la rotación fuera mayor, lo cual se evidencia en el departamento lyD; se planteo que a menor satisfacción laboral mayor rotación, sin embargo, se evidencia que apesar de influir la variable en la rotación del personal no se evidencia esta escala en la tabla bivariada; se planteo que a menor equilibrio entre vida y trabajo mayor rotación de empleados, sin embargo, se evidencia que apesar de influir la variable en la rotación del personal tampoco se evidencia esta escala en la tabla bivariada.

Las variables cuantitativas seleccionadas en el punto 1 fueron porcentaje de aumento salarial, años desde la ultima promoción y años de experiencia, de acuerdo a la prueba t se evidencia que las variables porcentaje de aumento salarial y años desde la ultima promoción no influyen en la rotación de personal; para la variable años de experiencia se planteo la hipotesis que a mayor experiencia laboral mayor rotación de personal, sin embargo el comportamiento que se aprecia en la tabla bivariada en al contrario.

4. Estimación modelo de regresión logístico

require(caret)
control=trainControl(method = "cv", number = 10, p=0.2)
mod=train(Rotacion~ Departamento+ Satisfacion_Laboral+ Equilibrio_Trabajo_Vida+ Porcentaje_aumento_salarial+ Anos_ultima_promocion+ Anos_Experiencia, data=rotacion, method="glm", family="binomial", trControl=control)
summary(mod)
## 
## Call:
## NULL
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.3475  -0.6365  -0.4909  -0.3059   3.1168  
## 
## Coefficients:
##                             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                  0.58727    0.44891   1.308  0.19080    
## DepartamentoRH               0.42811    0.34854   1.228  0.21934    
## DepartamentoVentas           0.54592    0.15610   3.497  0.00047 ***
## Satisfacion_Laboral2        -0.52498    0.22217  -2.363  0.01813 *  
## Satisfacion_Laboral3        -0.47311    0.19689  -2.403  0.01626 *  
## Satisfacion_Laboral4        -0.95745    0.21034  -4.552 5.32e-06 ***
## Equilibrio_Trabajo_Vida2    -0.83923    0.29258  -2.868  0.00413 ** 
## Equilibrio_Trabajo_Vida3    -1.14855    0.27162  -4.228 2.35e-05 ***
## Equilibrio_Trabajo_Vida4    -0.87067    0.33527  -2.597  0.00941 ** 
## Porcentaje_aumento_salarial -0.01090    0.02051  -0.532  0.59496    
## Anos_ultima_promocion        0.05807    0.02837   2.047  0.04064 *  
## Anos_Experiencia            -0.09454    0.01439  -6.568 5.11e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1196.5  on 1458  degrees of freedom
## AIC: 1220.5
## 
## Number of Fisher Scoring iterations: 5
  • Según el departamento al que pertenezca el empleado mayor posibilidad de rotación.
  • Según el nivel de satisfacción laboral del empleado menor posibilidad de rotación.
  • Según el nivel de equilibrio entre trabajo y vida menor posibilidad de rotación.
  • A mayor porcentaje de aumento salarial menor posibilidad de rotación.
  • A mayor cantidad de años desde la ultima promoción mayor posibilidad de rotación.
  • A mayor años de experiencia menor posibilidad de rotación.

A un nivel de significancia del 5%, el porcentaje de aumento salarial y pertenecer al departamento RH no influyen significativamente en la rotación de los empleados.

varImp(mod)
## glm variable importance
## 
##                             Overall
## Anos_Experiencia             100.00
## Satisfacion_Laboral4          66.60
## Equilibrio_Trabajo_Vida3      61.24
## DepartamentoVentas            49.13
## Equilibrio_Trabajo_Vida2      38.71
## Equilibrio_Trabajo_Vida4      34.21
## Satisfacion_Laboral3          31.00
## Satisfacion_Laboral2          30.34
## Anos_ultima_promocion         25.11
## DepartamentoRH                11.54
## Porcentaje_aumento_salarial    0.00
plot(varImp(mod))

Las variables que mas discriminan la rotación de los empleados son los años de experiencia, nivel de satisfación laboral 4, nivel de equilibrio entre trabajo - vida 3, y pertenecer al departamento de ventas.

5. Poder predictivo del modelo

Pred=predict(mod, rotacion)
Pred_modelo=as.factor(ifelse(Pred>0.5,"1","0"))
Pred_real=as.factor(rotacion$Rotacion)
confusionMatrix(Pred_modelo,Pred_real)
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction    0    1
##          0 1230  234
##          1    3    3
##                                          
##                Accuracy : 0.8388         
##                  95% CI : (0.819, 0.8572)
##     No Information Rate : 0.8388         
##     P-Value [Acc > NIR] : 0.5173         
##                                          
##                   Kappa : 0.0169         
##                                          
##  Mcnemar's Test P-Value : <2e-16         
##                                          
##             Sensitivity : 0.99757        
##             Specificity : 0.01266        
##          Pos Pred Value : 0.84016        
##          Neg Pred Value : 0.50000        
##              Prevalence : 0.83878        
##          Detection Rate : 0.83673        
##    Detection Prevalence : 0.99592        
##       Balanced Accuracy : 0.50511        
##                                          
##        'Positive' Class : 0              
## 

El modelo esta clasificando bien aproximadamente el 84% de los empleados, sin embargo, de la cantidad de empleados que se retiraron clasifico correctamente solo el 1,3% aproximadamente.

library(caTools)
colAUC(Pred, Pred_real, plotROC = TRUE)

##              [,1]
## 0 vs. 1 0.7093244

De acuerdo al área comprendida entre la curva ROC y el AUC (0.709), significa que el modelo de predicción tiene un buen ajuste.

6. Predicción

Se calcula la probabilidad de que un empleado con las siguientes caracteristicas rote: Departamento ventas, nivel de satisfacción laboral 3, nivel de equilibrio trabajo-vida 3, porcentaje aumento salarial 15%, años desde la ultima promoción 2 y cuente con 8 años de experiencia

datos=data.frame(Departamento="Ventas", Satisfacion_Laboral="3", Equilibrio_Trabajo_Vida="3", Porcentaje_aumento_salarial=15, Anos_ultima_promocion=2, Anos_Experiencia=8)

predict(mod, datos)
##         1 
## 0.2154848

La probabilidad de rotación de un empleado con las caracteristicas mencionadas anteriormente es aproximadamente del 22%. Un punto de corte para definir si el empleado deberia ser intervenido o no puede ser el 0.5 , todo empleado que tenga una probabilidad de rotación igual o mayor al 50% debe ser intervenido por la empresa.

7. Conclusiones

Entre las estrategias que la empresa podria implementar para mitigar la rotación de personal se podria considerar las siguientes:

  • Incentivar a los empleados jovenes con diversas estrategias que se ajusten a las necesidades propias de cada grupo de edad.

  • Implementar estrategias de trabajo remoto, priorizando a aquellos empleados que viven a mayor distancia del trabajo.

  • Evaluar internamente los salarios de los trabajores tomando como referecias otras compañias del mismo sector, con el fin de evaluar algunos sueldo de acuerdo a la demanda del mercado.

  • Evuluar la satisfacción ambiental y laboral en los diferentes departamentos de la empresa para identificar brechas y crear estrategias que mejoren estos indicadores.

  • Evaluar la carga de horas extras de los empleados, de manera que se puedan distribuir equitativamente sin afectar el funcionamiento de la empresa, mitigan asi la carga sobre un grupo especifico de trabajadores.

  • Implementar estrategias que permitan que los trabajadores logren un equilibrio entre las actividades laborales y las actividades propias de su hogas, garantizando salud metal y emocional.