1. Importar Datos

A continuación vamos a importar los datos de rotación de empleados para la compañia:

#Importar Datos
library(readxl)
datos = read_excel("Datos_Rotación.xlsx")
head(datos[,1:5])
Rotación Rotación_bin Edad Viaje de Negocios Departamento
Si 1 41 Raramente Ventas
No 0 49 Frecuentemente IyD
Si 1 37 Raramente IyD
No 0 33 Frecuentemente IyD
No 0 27 Raramente IyD
No 0 32 Frecuentemente IyD

como se puede observar en la tabla la base cuenta con 1470 registros (empleados) y 25 variables dentro de las cuales se encuentra.

2. Plantear las hipotesis para las variables

Se priorizaron las siguientes variables:

  1. Horas Extra: Mas horas extra mayor posibilidad de rotar.
  2. Estado Civil: Los solteros tienen mas posibilidad de rotar.
  3. Edad: Los jovenes tienen mas posibilida de rotar.

3. Exploración de Datos

Vamos a iniciar la exploración univariada:

library(table1)
table1(~Horas_Extra+Estado_Civil+Edad,data=datos)
Overall
(N=1470)
Horas_Extra
No 1054 (71.7%)
Si 416 (28.3%)
Estado_Civil
Casado 673 (45.8%)
Divorciado 327 (22.2%)
Soltero 470 (32.0%)
Edad
Mean (SD) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0]

Se observa que en la compañia el 28% trabaja horas extra, el 46% son casados y la edad promedio es de 37 años.

4. Exploración Bivariada

Vamos a realizar la exploración bivariada entre rotación y horas extra:

library(CGPfunctions)
PlotXTabs2(data = datos,x = Horas_Extra,y=Rotación)

Se observa que el valor p de la prueba \(X^2\) es muy bajo (<0.001) es decir que existe una relación entre trabajar horas extra y la rotación. Los porcentajes nos indican que las personas que trabajan horas extra tienen un 31% de rotación mientras que las que no tan solo un 10%, soportando de esta manera la hipotesis inicial planteada.