Se trabajo con la base de datos “Rotación” del paqueteMOD
library(readxl)
library(dplyr)
library(readxl)
rotacion <- read_excel("C:/Users/Cata/Desktop/MAESTRIA CD/5. Metodos estadisticos/Regresion logistica/rotacion.xlsx", col_types = c("text", "numeric", "text", "text", "numeric", "text", "text", "text", "text", "text", "text", "text", "numeric", "numeric", "text", "numeric", "text", "numeric", "text", "text", "numeric", "numeric", "numeric", "numeric"))
glimpse(rotacion)
## Rows: 1,470
## Columns: 24
## $ Rotacion <chr> "Si", "No", "Si", "No", "No", "No", "No", …
## $ Edad <dbl> 41, 49, 37, 33, 27, 32, 59, 30, 38, 36, 35…
## $ `Viaje de Negocios` <chr> "Raramente", "Frecuentemente", "Raramente"…
## $ Departamento <chr> "Ventas", "IyD", "IyD", "IyD", "IyD", "IyD…
## $ Distancia_Casa <dbl> 1, 8, 2, 3, 2, 2, 3, 24, 23, 27, 16, 15, 2…
## $ Educacion <chr> "2", "1", "2", "4", "1", "2", "3", "1", "3…
## $ Campo_Educacion <chr> "Ciencias", "Ciencias", "Otra", "Ciencias"…
## $ Satisfaccion_Ambiental <chr> "2", "3", "4", "4", "1", "4", "3", "4", "4…
## $ Genero <chr> "F", "M", "M", "F", "M", "M", "F", "M", "M…
## $ Cargo <chr> "Ejecutivo_Ventas", "Investigador_Cientifi…
## $ Satisfacion_Laboral <chr> "4", "2", "3", "3", "2", "4", "1", "3", "3…
## $ Estado_Civil <chr> "Soltero", "Casado", "Soltero", "Casado", …
## $ Ingreso_Mensual <dbl> 5993, 5130, 2090, 2909, 3468, 3068, 2670, …
## $ Trabajos_Anteriores <dbl> 8, 1, 6, 1, 9, 0, 4, 1, 0, 6, 0, 0, 1, 0, …
## $ Horas_Extra <chr> "Si", "No", "Si", "Si", "No", "No", "Si", …
## $ Porcentaje_aumento_salarial <dbl> 11, 23, 15, 11, 12, 13, 20, 22, 21, 13, 13…
## $ Rendimiento_Laboral <chr> "3", "4", "3", "3", "3", "3", "4", "4", "4…
## $ Anos_Experiencia <dbl> 8, 10, 7, 8, 6, 8, 12, 1, 10, 17, 6, 10, 5…
## $ Capacitaciones <chr> "0", "3", "3", "3", "3", "2", "3", "2", "2…
## $ Equilibrio_Trabajo_Vida <chr> "1", "3", "3", "3", "3", "2", "2", "3", "3…
## $ Antiguedad <dbl> 6, 10, 0, 8, 2, 7, 1, 1, 9, 7, 5, 9, 5, 2,…
## $ Antiguedad_Cargo <dbl> 4, 7, 0, 7, 2, 7, 0, 0, 7, 7, 4, 5, 2, 2, …
## $ Anos_ultima_promocion <dbl> 0, 1, 0, 3, 2, 3, 0, 0, 1, 7, 0, 0, 4, 1, …
## $ Anos_acargo_con_mismo_jefe <dbl> 5, 7, 0, 0, 2, 6, 0, 0, 8, 7, 3, 8, 3, 2, …
1.1 variables categóricas:
Departamento: Se espera que la variable departamento de la empresa este asociada a la rotación, debido a que a pesar de pertenecer a una misma empresa la carga laboral, el ambiente laboral, el nivel de estrés, entre otros factores pueden variar internamente entre los departamentos. Hipótesis: Las personas que pertenecen a determinado departamento de la empresa tienen mayor probabilidad de rotar que las que pertenecen a los demás departamentos.
Satisfacción laboral: Se espera que la variable satisfacción laboral se asocie a la rotación, ya que un gran porcentaje del tiempo de nuestra vida se dedica al trabajo, por lo cual es importante estar conforme con cuanto al entorno y condiciones de trabajo. Hipótesis: Las personas que tienen un menor nivel de satisfacción laboral tienen mayor probabilidad de rotar que las personas que tienen un mayor nivel de satisfacción laboral.
Equilibrio trabajo vida: Se espera que la variable equilibrio trabajo vida se asocie a la rotación, ya que es importante dedicar el tiempo suficiente y no descuidar ningún aspecto de nuestras vidas, cuando no existe este equilibrio nos podemos ver afectados emocional y psicológicamente. Hipótesis: Las personas que tienen un menor nivel de equilibrio entre el trabajo y su vida personal tienen una mayor probabilidad de rotar que las personas que tiene un mayor nivel de equilibrio en estos aspectos.
1.2 Variables cuantitativas:
Porcentaje de aumento salarial: Se espera que la variable porcentaje de aumento salarial se asocie a la rotación, ya que anualmente los precios de la canasta familiar y el costo de vida incrementan de acuerdo al inflación, por lo cual el salario pierde valor en el tiempo si la empresa no realiza un aumento al menos acorde a este indicador. Hipótesis: Las personas con un menor porcentaje de aumento salarial tienen mayor probabilidad de rotar que las personas con un mayor porcentaje de aumento salarial.
Años última promoción: Se espera que la variable años de la última promoción se asocie a la rotación debido a que para los empleados es importante poder crecer personal, profesional y laboralmente, es importante que las empresas brinden al empleado la oportunidad de ascender cuando su desempeño laboral así lo amerite. Hipótesis: Las personas con mayor cantidad de años desde la última promoción tiene mayor probabilidad de rotar que las personas con menor cantidad de años desde la última promoción.
Años experiencia: Se espera que la variable años de experiencia este asociada a la rotación, ya que cuando una persona está recién egresada es complejo conseguir empleo, mientras que cuando una persona tiene una amplia experiencia laboral las empresas pueden ofrecer constantemente propuestas de cambio de trabajo mejorando las condiciones actuales del trabajador. Hipótesis: Las personas con mayor años de experiencia tienen mayor probabilidad de rotar que las personas con menor años de experiencia.
require(table1)
table1(~., data = rotacion, topclass="Rtable1-zebra")
| Overall (N=1470) |
|
|---|---|
| Rotacion | |
| No | 1233 (83.9%) |
| Si | 237 (16.1%) |
| Edad | |
| Mean (SD) | 36.9 (9.14) |
| Median [Min, Max] | 36.0 [18.0, 60.0] |
| Viaje de Negocios | |
| Frecuentemente | 277 (18.8%) |
| No_Viaja | 150 (10.2%) |
| Raramente | 1043 (71.0%) |
| Departamento | |
| IyD | 961 (65.4%) |
| RH | 63 (4.3%) |
| Ventas | 446 (30.3%) |
| Distancia_Casa | |
| Mean (SD) | 9.19 (8.11) |
| Median [Min, Max] | 7.00 [1.00, 29.0] |
| Educacion | |
| 1 | 170 (11.6%) |
| 2 | 282 (19.2%) |
| 3 | 572 (38.9%) |
| 4 | 398 (27.1%) |
| 5 | 48 (3.3%) |
| Campo_Educacion | |
| Ciencias | 606 (41.2%) |
| Humanidades | 27 (1.8%) |
| Mercadeo | 159 (10.8%) |
| Otra | 82 (5.6%) |
| Salud | 464 (31.6%) |
| Tecnicos | 132 (9.0%) |
| Satisfaccion_Ambiental | |
| 1 | 284 (19.3%) |
| 2 | 287 (19.5%) |
| 3 | 453 (30.8%) |
| 4 | 446 (30.3%) |
| Genero | |
| F | 588 (40.0%) |
| M | 882 (60.0%) |
| Cargo | |
| Director_Investigación | 80 (5.4%) |
| Director_Manofactura | 145 (9.9%) |
| Ejecutivo_Ventas | 326 (22.2%) |
| Gerente | 102 (6.9%) |
| Investigador_Cientifico | 292 (19.9%) |
| Recursos_Humanos | 52 (3.5%) |
| Representante_Salud | 131 (8.9%) |
| Representante_Ventas | 83 (5.6%) |
| Tecnico_Laboratorio | 259 (17.6%) |
| Satisfacion_Laboral | |
| 1 | 289 (19.7%) |
| 2 | 280 (19.0%) |
| 3 | 442 (30.1%) |
| 4 | 459 (31.2%) |
| Estado_Civil | |
| Casado | 673 (45.8%) |
| Divorciado | 327 (22.2%) |
| Soltero | 470 (32.0%) |
| Ingreso_Mensual | |
| Mean (SD) | 6500 (4710) |
| Median [Min, Max] | 4920 [1010, 20000] |
| Trabajos_Anteriores | |
| Mean (SD) | 2.69 (2.50) |
| Median [Min, Max] | 2.00 [0, 9.00] |
| Horas_Extra | |
| No | 1054 (71.7%) |
| Si | 416 (28.3%) |
| Porcentaje_aumento_salarial | |
| Mean (SD) | 15.2 (3.66) |
| Median [Min, Max] | 14.0 [11.0, 25.0] |
| Rendimiento_Laboral | |
| 3 | 1244 (84.6%) |
| 4 | 226 (15.4%) |
| Anos_Experiencia | |
| Mean (SD) | 11.3 (7.78) |
| Median [Min, Max] | 10.0 [0, 40.0] |
| Capacitaciones | |
| 0 | 54 (3.7%) |
| 1 | 71 (4.8%) |
| 2 | 547 (37.2%) |
| 3 | 491 (33.4%) |
| 4 | 123 (8.4%) |
| 5 | 119 (8.1%) |
| 6 | 65 (4.4%) |
| Equilibrio_Trabajo_Vida | |
| 1 | 80 (5.4%) |
| 2 | 344 (23.4%) |
| 3 | 893 (60.7%) |
| 4 | 153 (10.4%) |
| Antiguedad | |
| Mean (SD) | 7.01 (6.13) |
| Median [Min, Max] | 5.00 [0, 40.0] |
| Antiguedad_Cargo | |
| Mean (SD) | 4.23 (3.62) |
| Median [Min, Max] | 3.00 [0, 18.0] |
| Anos_ultima_promocion | |
| Mean (SD) | 2.19 (3.22) |
| Median [Min, Max] | 1.00 [0, 15.0] |
| Anos_acargo_con_mismo_jefe | |
| Mean (SD) | 4.12 (3.57) |
| Median [Min, Max] | 3.00 [0, 17.0] |
2.1 variables categóricas:
library(ggplot2)
library(ggpubr)
library(patchwork)
g1<-ggplot(data=rotacion,aes(x=Rotacion))+ geom_bar(fill="#EED5D2")+
geom_text(stat='count', aes(label=..count..), vjust=1)+
labs(x="Rotacion")+ theme(axis.text = element_text(size=9))
g2<-ggplot(data=rotacion,aes(x=Departamento))+ geom_bar(fill = "#EED5D2")+
geom_text(stat='count', aes(label=..count..), vjust=1)+
labs(x="Departamento")+ theme(axis.text = element_text(size=9))
g3<-ggplot(data=rotacion,aes(x=Satisfacion_Laboral))+ geom_bar(fill = "#EED5D2")+
geom_text(stat='count', aes(label=..count..), vjust=1)+
labs(x="Satisfacion Laboral")+ theme(axis.text = element_text(size=9))
g4<-ggplot(data=rotacion,aes(x=Equilibrio_Trabajo_Vida))+ geom_bar(fill = "#EED5D2")+
geom_text(stat='count', aes(label=..count..), vjust=1)+
labs(x="Equilibrio Trabajo Vida")+ theme(axis.text = element_text(size=9))
g1+g2+g3+g4+
plot_layout(ncol = 2)
De los 1470 empleados analizados de una empresa, se tiene una rotación de personal aproximadamente del 16%. Entre las caracteristicas mas frecuentes de los empleados se tiene que, el departamento con mayor personal es lyD, la satisfacción laboral de los empleados es superior a 3 y el equilibrio que llevan entre el trabajo y vida es 3-Medio.
2.2 Variables cuantitativas:
g1<-ggplot(data=rotacion,aes(x=Porcentaje_aumento_salarial))+ geom_histogram(fill="#EED5D2")+ xlab("Porcentaje aumento salarial")
g2<-ggplot(data=rotacion, aes(x=Porcentaje_aumento_salarial)) + geom_boxplot() + xlab("Porcentaje aumento salarial")
g3<-ggplot(data=rotacion,aes(x=Anos_Experiencia))+ geom_histogram(fill="#EED5D2")+ xlab("Años de experiencia")
g4<-ggplot(data=rotacion, aes(x=Anos_Experiencia)) + geom_boxplot() + xlab("Años de experiencia")
g5<-ggplot(data=rotacion,aes(x=Anos_ultima_promocion))+ geom_histogram(fill="#EED5D2")+ xlab("Años ultima promoción")
g6<-ggplot(data=rotacion, aes(x=Anos_ultima_promocion)) + geom_boxplot() + xlab("Años ultima promoción")
g1+g2+g3+g4+g5+g6+
plot_layout(ncol = 2)
El porcentaje de aumento salarial que registran los empleados es en promedio de 15.2% (11% - 25%), los años de experiencia de los empleados es en promedio de 11 años (0 - 40 años) y la cantidad de años que han transcurrido desde la ultima promoción de los empleados es en promedio de 2 años (0 - 15 años).
3.1 variables categóricas:
t<-table(rotacion$`Viaje de Negocios`, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 5.608614e-06
t<-table(rotacion$Departamento, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.004525607
t<-table(rotacion$Educacion, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.5455253
t<-table(rotacion$Campo_Educacion, rotacion$Rotacion)
chisq.test(t)$p.value
## Warning in chisq.test(t): Chi-squared approximation may be incorrect
## [1] 0.00677398
t<-table(rotacion$Satisfaccion_Ambiental, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 5.123469e-05
t<-table(rotacion$Genero, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.2905724
t<-table(rotacion$Cargo, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 2.752482e-15
t<-table(rotacion$Satisfacion_Laboral, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.0005563005
t<-table(rotacion$Estado_Civil, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 9.455511e-11
t<-table(rotacion$Horas_Extra, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 8.158424e-21
t<-table(rotacion$Rendimiento_Laboral, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.9900745
t<-table(rotacion$Capacitaciones, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.01914773
t<-table(rotacion$Equilibrio_Trabajo_Vida, rotacion$Rotacion)
chisq.test(t)$p.value
## [1] 0.0009725699
El valor p de la prueba Chi-cuadrado entre las variables cualitativas (Viajes de negocios, Departamento, Satisfacción ambiental, Cargo, Satisfacción laboral, Estado civil, Horas extras, Equilibrio trabajo-vida) y rotación es menor que 0,005 por lo cual se puede considerar que existe las variables anteriores influyen en la rotación de los empleados.
De acuerdo al valor p, las variables Educación, Campo de educación, Genero, Rendimiento laboral y Capacitaciones no influyen en la rotación de los empleados.
3.2 variables cuantitativas:
t.test(rotacion$Edad~rotacion$Rotacion)$p.value
## [1] 1.371249e-08
t.test(rotacion$Distancia_Casa~rotacion$Rotacion)$p.value
## [1] 0.004136512
t.test(rotacion$Ingreso_Mensual~rotacion$Rotacion)$p.value
## [1] 4.433589e-13
t.test(rotacion$Trabajos_Anteriores~rotacion$Rotacion)$p.value
## [1] 0.116334
t.test(rotacion$Porcentaje_aumento_salarial~rotacion$Rotacion)$p.value
## [1] 0.6144301
t.test(rotacion$Anos_Experiencia~rotacion$Rotacion)$p.value
## [1] 1.159817e-11
t.test(rotacion$Antiguedad~rotacion$Rotacion)$p.value
## [1] 2.285905e-07
t.test(rotacion$Antiguedad_Cargo~rotacion$Rotacion)$p.value
## [1] 3.18739e-11
t.test(rotacion$Anos_ultima_promocion~rotacion$Rotacion)$p.value
## [1] 0.1986513
t.test(rotacion$Anos_acargo_con_mismo_jefe~rotacion$Rotacion)$p.value
## [1] 1.185022e-10
El valor p de la prueba t entre las variables cuantitativas (Edad, Distancia a casa, Ingreso mensual, Años experiencia, Antiguedad, Antiguedad cargo, Años a cargo con mismo jefe) y rotación es menor que 0,005 por lo cual se puede considerar que existe diferencia entre las medias de las variables anteriores para los grupos de empleados retirados y no retirados.
De acuerdo al valor p, para las variables trabajos anteriores, porcentaje de aumento salarial y años desde la ultima promoción no existe diferencias entre las medias de los grupos de retirados y no retirados; por lo cual, se podria considerar que no son significativas para explicar la rotación de los empleados.
rotacion$Rotacion=as.numeric(rotacion$Rotacion=="Si")
require(table1)
table1(~. |Rotacion, data = rotacion, topclass="Rtable1-zebra")
| 0 (N=1233) |
1 (N=237) |
Overall (N=1470) |
|
|---|---|---|---|
| Edad | |||
| Mean (SD) | 37.6 (8.89) | 33.6 (9.69) | 36.9 (9.14) |
| Median [Min, Max] | 36.0 [18.0, 60.0] | 32.0 [18.0, 58.0] | 36.0 [18.0, 60.0] |
| Viaje de Negocios | |||
| Frecuentemente | 208 (16.9%) | 69 (29.1%) | 277 (18.8%) |
| No_Viaja | 138 (11.2%) | 12 (5.1%) | 150 (10.2%) |
| Raramente | 887 (71.9%) | 156 (65.8%) | 1043 (71.0%) |
| Departamento | |||
| IyD | 828 (67.2%) | 133 (56.1%) | 961 (65.4%) |
| RH | 51 (4.1%) | 12 (5.1%) | 63 (4.3%) |
| Ventas | 354 (28.7%) | 92 (38.8%) | 446 (30.3%) |
| Distancia_Casa | |||
| Mean (SD) | 8.92 (8.01) | 10.6 (8.45) | 9.19 (8.11) |
| Median [Min, Max] | 7.00 [1.00, 29.0] | 9.00 [1.00, 29.0] | 7.00 [1.00, 29.0] |
| Educacion | |||
| 1 | 139 (11.3%) | 31 (13.1%) | 170 (11.6%) |
| 2 | 238 (19.3%) | 44 (18.6%) | 282 (19.2%) |
| 3 | 473 (38.4%) | 99 (41.8%) | 572 (38.9%) |
| 4 | 340 (27.6%) | 58 (24.5%) | 398 (27.1%) |
| 5 | 43 (3.5%) | 5 (2.1%) | 48 (3.3%) |
| Campo_Educacion | |||
| Ciencias | 517 (41.9%) | 89 (37.6%) | 606 (41.2%) |
| Humanidades | 20 (1.6%) | 7 (3.0%) | 27 (1.8%) |
| Mercadeo | 124 (10.1%) | 35 (14.8%) | 159 (10.8%) |
| Otra | 71 (5.8%) | 11 (4.6%) | 82 (5.6%) |
| Salud | 401 (32.5%) | 63 (26.6%) | 464 (31.6%) |
| Tecnicos | 100 (8.1%) | 32 (13.5%) | 132 (9.0%) |
| Satisfaccion_Ambiental | |||
| 1 | 212 (17.2%) | 72 (30.4%) | 284 (19.3%) |
| 2 | 244 (19.8%) | 43 (18.1%) | 287 (19.5%) |
| 3 | 391 (31.7%) | 62 (26.2%) | 453 (30.8%) |
| 4 | 386 (31.3%) | 60 (25.3%) | 446 (30.3%) |
| Genero | |||
| F | 501 (40.6%) | 87 (36.7%) | 588 (40.0%) |
| M | 732 (59.4%) | 150 (63.3%) | 882 (60.0%) |
| Cargo | |||
| Director_Investigación | 78 (6.3%) | 2 (0.8%) | 80 (5.4%) |
| Director_Manofactura | 135 (10.9%) | 10 (4.2%) | 145 (9.9%) |
| Ejecutivo_Ventas | 269 (21.8%) | 57 (24.1%) | 326 (22.2%) |
| Gerente | 97 (7.9%) | 5 (2.1%) | 102 (6.9%) |
| Investigador_Cientifico | 245 (19.9%) | 47 (19.8%) | 292 (19.9%) |
| Recursos_Humanos | 40 (3.2%) | 12 (5.1%) | 52 (3.5%) |
| Representante_Salud | 122 (9.9%) | 9 (3.8%) | 131 (8.9%) |
| Representante_Ventas | 50 (4.1%) | 33 (13.9%) | 83 (5.6%) |
| Tecnico_Laboratorio | 197 (16.0%) | 62 (26.2%) | 259 (17.6%) |
| Satisfacion_Laboral | |||
| 1 | 223 (18.1%) | 66 (27.8%) | 289 (19.7%) |
| 2 | 234 (19.0%) | 46 (19.4%) | 280 (19.0%) |
| 3 | 369 (29.9%) | 73 (30.8%) | 442 (30.1%) |
| 4 | 407 (33.0%) | 52 (21.9%) | 459 (31.2%) |
| Estado_Civil | |||
| Casado | 589 (47.8%) | 84 (35.4%) | 673 (45.8%) |
| Divorciado | 294 (23.8%) | 33 (13.9%) | 327 (22.2%) |
| Soltero | 350 (28.4%) | 120 (50.6%) | 470 (32.0%) |
| Ingreso_Mensual | |||
| Mean (SD) | 6830 (4820) | 4790 (3640) | 6500 (4710) |
| Median [Min, Max] | 5200 [1050, 20000] | 3200 [1010, 19900] | 4920 [1010, 20000] |
| Trabajos_Anteriores | |||
| Mean (SD) | 2.65 (2.46) | 2.94 (2.68) | 2.69 (2.50) |
| Median [Min, Max] | 2.00 [0, 9.00] | 1.00 [0, 9.00] | 2.00 [0, 9.00] |
| Horas_Extra | |||
| No | 944 (76.6%) | 110 (46.4%) | 1054 (71.7%) |
| Si | 289 (23.4%) | 127 (53.6%) | 416 (28.3%) |
| Porcentaje_aumento_salarial | |||
| Mean (SD) | 15.2 (3.64) | 15.1 (3.77) | 15.2 (3.66) |
| Median [Min, Max] | 14.0 [11.0, 25.0] | 14.0 [11.0, 25.0] | 14.0 [11.0, 25.0] |
| Rendimiento_Laboral | |||
| 3 | 1044 (84.7%) | 200 (84.4%) | 1244 (84.6%) |
| 4 | 189 (15.3%) | 37 (15.6%) | 226 (15.4%) |
| Anos_Experiencia | |||
| Mean (SD) | 11.9 (7.76) | 8.24 (7.17) | 11.3 (7.78) |
| Median [Min, Max] | 10.0 [0, 38.0] | 7.00 [0, 40.0] | 10.0 [0, 40.0] |
| Capacitaciones | |||
| 0 | 39 (3.2%) | 15 (6.3%) | 54 (3.7%) |
| 1 | 62 (5.0%) | 9 (3.8%) | 71 (4.8%) |
| 2 | 449 (36.4%) | 98 (41.4%) | 547 (37.2%) |
| 3 | 422 (34.2%) | 69 (29.1%) | 491 (33.4%) |
| 4 | 97 (7.9%) | 26 (11.0%) | 123 (8.4%) |
| 5 | 105 (8.5%) | 14 (5.9%) | 119 (8.1%) |
| 6 | 59 (4.8%) | 6 (2.5%) | 65 (4.4%) |
| Equilibrio_Trabajo_Vida | |||
| 1 | 55 (4.5%) | 25 (10.5%) | 80 (5.4%) |
| 2 | 286 (23.2%) | 58 (24.5%) | 344 (23.4%) |
| 3 | 766 (62.1%) | 127 (53.6%) | 893 (60.7%) |
| 4 | 126 (10.2%) | 27 (11.4%) | 153 (10.4%) |
| Antiguedad | |||
| Mean (SD) | 7.37 (6.10) | 5.13 (5.95) | 7.01 (6.13) |
| Median [Min, Max] | 6.00 [0, 37.0] | 3.00 [0, 40.0] | 5.00 [0, 40.0] |
| Antiguedad_Cargo | |||
| Mean (SD) | 4.48 (3.65) | 2.90 (3.17) | 4.23 (3.62) |
| Median [Min, Max] | 3.00 [0, 18.0] | 2.00 [0, 15.0] | 3.00 [0, 18.0] |
| Anos_ultima_promocion | |||
| Mean (SD) | 2.23 (3.23) | 1.95 (3.15) | 2.19 (3.22) |
| Median [Min, Max] | 1.00 [0, 15.0] | 1.00 [0, 15.0] | 1.00 [0, 15.0] |
| Anos_acargo_con_mismo_jefe | |||
| Mean (SD) | 4.37 (3.59) | 2.85 (3.14) | 4.12 (3.57) |
| Median [Min, Max] | 3.00 [0, 17.0] | 2.00 [0, 14.0] | 3.00 [0, 17.0] |
Las variables categoricas seleccionadas en el punto 1 fueron Departamento, Satisfacción laboral y equilibrio trabajo-vida, de acuerdo a las prueba Chi-cuadrado se pudo evidenciar que las variables si influyen en la rotación de personal. De acuerdo a las hipotesis plateadas se esperaba que en algun departamento la rotación fuera mayor, lo cual se evidencia en el departamento lyD; se planteo que a menor satisfacción laboral mayor rotación, sin embargo, se evidencia que apesar de influir la variable en la rotación del personal no se evidencia esta escala en la tabla bivariada; se planteo que a menor equilibrio entre vida y trabajo mayor rotación de empleados, sin embargo, se evidencia que apesar de influir la variable en la rotación del personal tampoco se evidencia esta escala en la tabla bivariada.
Las variables cuantitativas seleccionadas en el punto 1 fueron porcentaje de aumento salarial, años desde la ultima promoción y años de experiencia, de acuerdo a la prueba t se evidencia que las variables porcentaje de aumento salarial y años desde la ultima promoción no influyen en la rotación de personal; para la variable años de experiencia se planteo la hipotesis que a mayor experiencia laboral mayor rotación de personal, sin embargo el comportamiento que se aprecia en la tabla bivariada en al contrario.
require(caret)
control=trainControl(method = "cv", number = 10, p=0.2)
mod=train(Rotacion~ Departamento+ Satisfacion_Laboral+ Equilibrio_Trabajo_Vida+ Porcentaje_aumento_salarial+ Anos_ultima_promocion+ Anos_Experiencia, data=rotacion, method="glm", family="binomial", trControl=control)
summary(mod)
##
## Call:
## NULL
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.3475 -0.6365 -0.4909 -0.3059 3.1168
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.58727 0.44891 1.308 0.19080
## DepartamentoRH 0.42811 0.34854 1.228 0.21934
## DepartamentoVentas 0.54592 0.15610 3.497 0.00047 ***
## Satisfacion_Laboral2 -0.52498 0.22217 -2.363 0.01813 *
## Satisfacion_Laboral3 -0.47311 0.19689 -2.403 0.01626 *
## Satisfacion_Laboral4 -0.95745 0.21034 -4.552 5.32e-06 ***
## Equilibrio_Trabajo_Vida2 -0.83923 0.29258 -2.868 0.00413 **
## Equilibrio_Trabajo_Vida3 -1.14855 0.27162 -4.228 2.35e-05 ***
## Equilibrio_Trabajo_Vida4 -0.87067 0.33527 -2.597 0.00941 **
## Porcentaje_aumento_salarial -0.01090 0.02051 -0.532 0.59496
## Anos_ultima_promocion 0.05807 0.02837 2.047 0.04064 *
## Anos_Experiencia -0.09454 0.01439 -6.568 5.11e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1196.5 on 1458 degrees of freedom
## AIC: 1220.5
##
## Number of Fisher Scoring iterations: 5
A un nivel de significancia del 5%, el porcentaje de aumento salarial y pertenecer al departamento RH no influyen significativamente en la rotación de los empleados.
varImp(mod)
## glm variable importance
##
## Overall
## Anos_Experiencia 100.00
## Satisfacion_Laboral4 66.60
## Equilibrio_Trabajo_Vida3 61.24
## DepartamentoVentas 49.13
## Equilibrio_Trabajo_Vida2 38.71
## Equilibrio_Trabajo_Vida4 34.21
## Satisfacion_Laboral3 31.00
## Satisfacion_Laboral2 30.34
## Anos_ultima_promocion 25.11
## DepartamentoRH 11.54
## Porcentaje_aumento_salarial 0.00
plot(varImp(mod))
Las variables que mas discriminan la rotación de los empleados son los años de experiencia, nivel de satisfación laboral 4, nivel de equilibrio entre trabajo - vida 3, y pertenecer al departamento de ventas.
Pred=predict(mod, rotacion)
Pred_modelo=as.factor(ifelse(Pred>0.5,"1","0"))
Pred_real=as.factor(rotacion$Rotacion)
confusionMatrix(Pred_modelo,Pred_real)
## Confusion Matrix and Statistics
##
## Reference
## Prediction 0 1
## 0 1230 234
## 1 3 3
##
## Accuracy : 0.8388
## 95% CI : (0.819, 0.8572)
## No Information Rate : 0.8388
## P-Value [Acc > NIR] : 0.5173
##
## Kappa : 0.0169
##
## Mcnemar's Test P-Value : <2e-16
##
## Sensitivity : 0.99757
## Specificity : 0.01266
## Pos Pred Value : 0.84016
## Neg Pred Value : 0.50000
## Prevalence : 0.83878
## Detection Rate : 0.83673
## Detection Prevalence : 0.99592
## Balanced Accuracy : 0.50511
##
## 'Positive' Class : 0
##
El modelo esta clasificando bien aproximadamente el 84% de los empleados, sin embargo, de la cantidad de empleados que se retiraron clasifico correctamente solo el 1,3% aproximadamente.
library(caTools)
colAUC(Pred, Pred_real, plotROC = TRUE)
## [,1]
## 0 vs. 1 0.7093244
De acuerdo al área comprendida entre la curva ROC y el AUC (0.709), significa que el modelo de predicción tiene un buen ajuste.
Se calcula la probabilidad de que un empleado con las siguientes caracteristicas rote: Departamento ventas, nivel de satisfacción laboral 3, nivel de equilibrio trabajo-vida 3, porcentaje aumento salarial 15%, años desde la ultima promoción 2 y cuente con 8 años de experiencia
datos=data.frame(Departamento="Ventas", Satisfacion_Laboral="3", Equilibrio_Trabajo_Vida="3", Porcentaje_aumento_salarial=15, Anos_ultima_promocion=2, Anos_Experiencia=8)
predict(mod, datos)
## 1
## 0.2154848
La probabilidad de rotación de un empleado con las caracteristicas mencionadas anteriormente es aproximadamente del 22%. Un punto de corte para definir si el empleado deberia ser intervenido o no puede ser el 0.5 , todo empleado que tenga una probabilidad de rotación igual o mayor al 50% debe ser intervenido por la empresa.
Entre las estrategias que la empresa podria implementar para mitigar la rotación de personal se podria considerar las siguientes:
Incentivar a los empleados jovenes con diversas estrategias que se ajusten a las necesidades propias de cada grupo de edad.
Implementar estrategias de trabajo remoto, priorizando a aquellos empleados que viven a mayor distancia del trabajo.
Evaluar internamente los salarios de los trabajores tomando como referecias otras compañias del mismo sector, con el fin de evaluar algunos sueldo de acuerdo a la demanda del mercado.
Evuluar la satisfacción ambiental y laboral en los diferentes departamentos de la empresa para identificar brechas y crear estrategias que mejoren estos indicadores.
Evaluar la carga de horas extras de los empleados, de manera que se puedan distribuir equitativamente sin afectar el funcionamiento de la empresa, mitigan asi la carga sobre un grupo especifico de trabajadores.
Implementar estrategias que permitan que los trabajadores logren un equilibrio entre las actividades laborales y las actividades propias de su hogas, garantizando salud metal y emocional.