Informe 1

1. Importar Datos

A continuación vamos a importar los datos de rotación de empleados para la compañia:

#Importar Datos
library(readxl)
datos = read_excel("Datos_Rotación.xlsx")
head(datos[,1:5])

Rotación	Rotación_bin	Edad	Viaje de Negocios	Departamento
Si	1	41	Raramente	Ventas
No	0	49	Frecuentemente	IyD
Si	1	37	Raramente	IyD
No	0	33	Frecuentemente	IyD
No	0	27	Raramente	IyD
No	0	32	Frecuentemente	IyD

como se puede observar en la tabla la base cuenta con 1470 registros (empleados) y 25 variables dentro de las cuales se encuentra.

2. Plantear las hipotesis para las variables

Se priorizaron las siguientes variables:

Horas Extra: Mas horas extra mayor posibilidad de rotar.
Estado Civil: Los solteros tienen mas posibilidad de rotar.
Edad: Los jovenes tienen mas posibilida de rotar.

3. Exploración de Datos

Vamos a iniciar la exploración univariada:

library(table1)
table1(~Horas_Extra+Estado_Civil+Edad,data=datos)

	Overall (N=1470)
Horas_Extra
No	1054 (71.7%)
Si	416 (28.3%)
Estado_Civil
Casado	673 (45.8%)
Divorciado	327 (22.2%)
Soltero	470 (32.0%)
Edad
Mean (SD)	36.9 (9.14)
Median [Min, Max]	36.0 [18.0, 60.0]

Se observa que en la compañia el 28% trabaja horas extra, el 46% son casados y la edad promedio es de 37 años.

4. Exploración Bivariada

Vamos a realizar la exploración bivariada entre rotación y horas extra:

library(CGPfunctions)
PlotXTabs2(data = datos,x = Horas_Extra,y=Rotación)

Se observa que el valor p de la prueba \(X^2\) es muy bajo (<0.001) es decir que existe una relación entre trabajar horas extra y la rotación. Los porcentajes nos indican que las personas que trabajan horas extra tienen un 31% de rotación mientras que las que no tan solo un 10%, soportando de esta manera la hipotesis inicial planteada.

Informe 1

David Arango

2022-10-18

1. Importar Datos

2. Plantear las hipotesis para las variables

3. Exploración de Datos

4. Exploración Bivariada