A continuación vamos a importar los datos de rotación de empleados para la compañia:
#Importar Datos
library(readxl)
datos = read_excel("Datos_Rotación.xlsx")
head(datos[,1:5])
| Rotación | Rotación_bin | Edad | Viaje de Negocios | Departamento |
|---|---|---|---|---|
| Si | 1 | 41 | Raramente | Ventas |
| No | 0 | 49 | Frecuentemente | IyD |
| Si | 1 | 37 | Raramente | IyD |
| No | 0 | 33 | Frecuentemente | IyD |
| No | 0 | 27 | Raramente | IyD |
| No | 0 | 32 | Frecuentemente | IyD |
como se puede observar en la tabla la base cuenta con 1470 registros (empleados) y 25 variables dentro de las cuales se encuentra.
Se priorizaron las siguientes variables:
Vamos a iniciar la exploración univariada:
library(table1)
table1(~Horas_Extra+Estado_Civil+Edad,data=datos)
| Overall (N=1470) |
|
|---|---|
| Horas_Extra | |
| No | 1054 (71.7%) |
| Si | 416 (28.3%) |
| Estado_Civil | |
| Casado | 673 (45.8%) |
| Divorciado | 327 (22.2%) |
| Soltero | 470 (32.0%) |
| Edad | |
| Mean (SD) | 36.9 (9.14) |
| Median [Min, Max] | 36.0 [18.0, 60.0] |
Se observa que en la compañia el 28% trabaja horas extra, el 46% son casados y la edad promedio es de 37 años.
Vamos a realizar la exploración bivariada entre rotación y horas extra:
library(CGPfunctions)
PlotXTabs2(data = datos,x = Horas_Extra,y=Rotación)
Se observa que el valor p de la prueba \(X^2\) es muy bajo (<0.001) es decir que existe una relación entre trabajar horas extra y la rotación. Los porcentajes nos indican que las personas que trabajan horas extra tienen un 31% de rotación mientras que las que no tan solo un 10%, soportando de esta manera la hipotesis inicial planteada.