A continuación importaremos los datos de rotación de empleados para algunas compañías:
| Rotacion | Rotación_bin | Edad | Viaje de Negocios | Departamento |
|---|---|---|---|---|
| Si | 1 | 41 | Raramente | Ventas |
| No | 0 | 49 | Frecuentemente | IyD |
| Si | 1 | 37 | Raramente | IyD |
| No | 0 | 33 | Frecuentemente | IyD |
| No | 0 | 27 | Raramente | IyD |
| No | 0 | 32 | Frecuentemente | IyD |
La base de datos cuenta con 1.470 registros (empleados) y 25 variables que consideraremos para el ejercicio en clase.
Se priorizaron algunas variables que podrían determinar en alguna medida la rotación de los empleados, tres categóricas y tres numéricas.
Variables categóricas: 1. Satisfacción con el ambiente laboral 2. Satisfacción con las actividades que le competen realizar 3. Estado civil
Variables numéricas: 4.Ingreso mensual 5.Edad 6.Porcentaje aumento salarial
Vamos a iniciar la exploración univariada. Primero para las variables categóricas y luego para las numéricas.
Variables categóricas:
| Overall (N=1470) |
|
|---|---|
| Satisfaccion_Ambiental | |
| Mean (SD) | 2.72 (1.09) |
| Median [Min, Max] | 3.00 [1.00, 4.00] |
| Estado_Civil | |
| Casado | 673 (45.8%) |
| Divorciado | 327 (22.2%) |
| Soltero | 470 (32.0%) |
| Satisfacion_Laboral | |
| Mean (SD) | 2.73 (1.10) |
| Median [Min, Max] | 3.00 [1.00, 4.00] |
Variables numéricas:
| Overall (N=1470) |
|
|---|---|
| Ingreso_Mensual | |
| Mean (SD) | 6500 (4710) |
| Median [Min, Max] | 4920 [1010, 20000] |
| Edad | |
| Mean (SD) | 36.9 (9.14) |
| Median [Min, Max] | 36.0 [18.0, 60.0] |
| Porcentaje_aumento_salarial | |
| Mean (SD) | 15.2 (3.66) |
| Median [Min, Max] | 14.0 [11.0, 25.0] |
A continuación se hará una exploracion bivariada que busque identificar si existe o no relación entre las variables consideradas como explicativas y la variable rotación. Primero se realizará para variables categóricas.
A continuación se presentan los resultados de la aplicación de la prueba chi-cuadrado para las 3 variables categóricas contempladas.
## $`1`
##
## $`2`
##
## attr(,"class")
## [1] "list" "ggarrange"
De acuerdo a los p-valores reportados por las anteriores figuras, se puede inferir que las tres variables consideradas si están relacionadas con la variable rotación.
| No (N=1233) |
Si (N=237) |
p-value | |
|---|---|---|---|
| Ingreso_Mensual | |||
| Mean (SD) | 6830 (4820) | 4790 (3640) | <0.001 |
| Median [Min, Max] | 5200 [1050, 20000] | 3200 [1010, 19900] | |
| Edad | |||
| Mean (SD) | 37.6 (8.89) | 33.6 (9.69) | <0.001 |
| Median [Min, Max] | 36.0 [18.0, 60.0] | 32.0 [18.0, 58.0] | |
| Porcentaje_aumento_salarial | |||
| Mean (SD) | 15.2 (3.64) | 15.1 (3.77) | 0.614 |
| Median [Min, Max] | 14.0 [11.0, 25.0] | 14.0 [11.0, 25.0] |
De acuerdo a la tabla, las variables ingreso mensual y la edadestán relacionadas estadisticamente con la variable rotación, mientras que el p-valor de la variable “porcentaje de aumento salarial” indica que no hay evidencia estadística que permita relacionarla con la variable rotación.