1.Importar datos

A continuación importaremos los datos de rotación de empleados para algunas compañías:

Rotacion Rotación_bin Edad Viaje de Negocios Departamento
Si 1 41 Raramente Ventas
No 0 49 Frecuentemente IyD
Si 1 37 Raramente IyD
No 0 33 Frecuentemente IyD
No 0 27 Raramente IyD
No 0 32 Frecuentemente IyD

La base de datos cuenta con 1.470 registros (empleados) y 25 variables que consideraremos para el ejercicio en clase.

2.Plantear las hipotesis para las variables

Se priorizaron algunas variables que podrían determinar en alguna medida la rotación de los empleados, tres categóricas y tres numéricas.

Variables categóricas: 1. Satisfacción con el ambiente laboral 2. Satisfacción con las actividades que le competen realizar 3. Estado civil

Variables numéricas: 4.Ingreso mensual 5.Edad 6.Porcentaje aumento salarial

3.Exploracion de datos

Vamos a iniciar la exploración univariada. Primero para las variables categóricas y luego para las numéricas.

Variables categóricas:

Overall
(N=1470)
Satisfaccion_Ambiental
Mean (SD) 2.72 (1.09)
Median [Min, Max] 3.00 [1.00, 4.00]
Estado_Civil
Casado 673 (45.8%)
Divorciado 327 (22.2%)
Soltero 470 (32.0%)
Satisfacion_Laboral
Mean (SD) 2.73 (1.10)
Median [Min, Max] 3.00 [1.00, 4.00]

Variables numéricas:

Overall
(N=1470)
Ingreso_Mensual
Mean (SD) 6500 (4710)
Median [Min, Max] 4920 [1010, 20000]
Edad
Mean (SD) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0]
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.66)
Median [Min, Max] 14.0 [11.0, 25.0]

4.Exploración bivariada

A continuación se hará una exploracion bivariada que busque identificar si existe o no relación entre las variables consideradas como explicativas y la variable rotación. Primero se realizará para variables categóricas.

  1. Variable satisfacción laboral Se observa que el p-valor de la prueba \(x^2\) es menor a 0.05, por lo que podría decirse que existe una relación entre satisfacción laboral y la variable rotaciones. En la figura se puede observar que los individuos que registran una mayor satisfaccion laboral reportan una menor rotación.

A continuación se presentan los resultados de la aplicación de la prueba chi-cuadrado para las 3 variables categóricas contempladas.

## $`1`

## 
## $`2`

## 
## attr(,"class")
## [1] "list"      "ggarrange"

De acuerdo a los p-valores reportados por las anteriores figuras, se puede inferir que las tres variables consideradas si están relacionadas con la variable rotación.

5. Analisis de variables cuantitativas (sin creación de categorias)

No
(N=1233)
Si
(N=237)
p-value
Ingreso_Mensual
Mean (SD) 6830 (4820) 4790 (3640) <0.001
Median [Min, Max] 5200 [1050, 20000] 3200 [1010, 19900]
Edad
Mean (SD) 37.6 (8.89) 33.6 (9.69) <0.001
Median [Min, Max] 36.0 [18.0, 60.0] 32.0 [18.0, 58.0]
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.64) 15.1 (3.77) 0.614
Median [Min, Max] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0]

De acuerdo a la tabla, las variables ingreso mensual y la edadestán relacionadas estadisticamente con la variable rotación, mientras que el p-valor de la variable “porcentaje de aumento salarial” indica que no hay evidencia estadística que permita relacionarla con la variable rotación.