Con base en los datos de rotación realizar los puntos 1 a 4:
library(readxl)
datos = read_excel("~/Desktop/Datos_Rotación.xlsx")
names(datos)
## [1] "Rotación" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfación_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Años_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Años_ultima_promoción" "Años_acargo_con_mismo_jefe"
Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación. Nota: Justificar por que estas variables están relacionadas y que tipo de relación se espera (Hipótesis). Ejemplo: Se espera que las horas extra se relacionen con la rotación ya que las personas podrían desgastarse mas al trabajar horas extra y descuidan aspectos personales. La hipótesis es que las personas que trabajan horas extra tienen mayor posibilidad de rotar que las que no trabajan extra. (serian 6, una por variable).
Realizar un análisis univariado (caracterización). Nota: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuanti o cuali). Incluir interpretaciones de la rotación.
require(ggplot2)
require(ggpubr)
g1=ggplot(datos,aes(x=Edad))+geom_histogram()+theme_bw()
g2=ggplot(datos,aes(x=`Viaje de Negocios`))+geom_bar()+theme_bw()
ggarrange(g1, g2,labels = c("A", "B"),ncol = 2, nrow = 1)
datos$Edad_grupo=cut(datos$Edad,breaks = c(0,30,40,50,60))
require(table1)
y <- table1::table1(~ Edad_grupo+`Viaje de Negocios`+Estado_Civil+Ingreso_Mensual+Genero | Rotación, data = datos)
y
No (N=1233) |
Si (N=237) |
Overall (N=1470) |
|
---|---|---|---|
Edad_grupo | |||
(0,30] | 286 (23.2%) | 100 (42.2%) | 386 (26.3%) |
(30,40] | 534 (43.3%) | 85 (35.9%) | 619 (42.1%) |
(40,50] | 288 (23.4%) | 34 (14.3%) | 322 (21.9%) |
(50,60] | 125 (10.1%) | 18 (7.6%) | 143 (9.7%) |
Viaje de Negocios | |||
Frecuentemente | 208 (16.9%) | 69 (29.1%) | 277 (18.8%) |
No_Viaja | 138 (11.2%) | 12 (5.1%) | 150 (10.2%) |
Raramente | 887 (71.9%) | 156 (65.8%) | 1043 (71.0%) |
Estado_Civil | |||
Casado | 589 (47.8%) | 84 (35.4%) | 673 (45.8%) |
Divorciado | 294 (23.8%) | 33 (13.9%) | 327 (22.2%) |
Soltero | 350 (28.4%) | 120 (50.6%) | 470 (32.0%) |
Ingreso_Mensual | |||
Mean (SD) | 6830 (4820) | 4790 (3640) | 6500 (4710) |
Median [Min, Max] | 5200 [1050, 20000] | 3200 [1010, 19900] | 4920 [1010, 20000] |
Genero | |||
F | 501 (40.6%) | 87 (36.7%) | 588 (40.0%) |
M | 732 (59.4%) | 150 (63.3%) | 882 (60.0%) |
t.test(datos$Edad~datos$Rotación)
##
## Welch Two Sample t-test
##
## data: datos$Edad by datos$Rotación
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si
## 37.56123 33.60759
require(CGPfunctions)
PlotXTabs2(data = datos,x = Edad_grupo,y = Rotación)
Realizar la estimación de un modelo de regresión logistico en el cual la variable respuesta es rotación (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas. Interprete los coeficientes del modelo y la significancia de los parametros.
Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.
Predeccir la probabilida de que un individuo (hipotetico) rote y defina un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado).
En las conclusiones se discute sobre cual seria la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3). Ejemplo: Mejorar el ambiente laboral, los incentivos económicos, distribuir la carga de horas extra (menos turnos y mas personal).