En el siguiente documento vamos a realizar un analisis exploratorio de los datos de rotación que se presentan a contuniación:
library(readxl)
datos = read_excel("~/Desktop/Datos_Rotación.xlsx")
head(datos,3)
## # A tibble: 3 x 24
## Rotación Edad `Viaje de Negoc… Departamento Distancia_Casa Educación
## <chr> <dbl> <chr> <chr> <dbl> <dbl>
## 1 Si 41 Raramente Ventas 1 2
## 2 No 49 Frecuentemente IyD 8 1
## 3 Si 37 Raramente IyD 2 2
## # … with 18 more variables: Campo_Educación <chr>,
## # Satisfacción_Ambiental <dbl>, Genero <chr>, Cargo <chr>,
## # Satisfación_Laboral <dbl>, Estado_Civil <chr>, Ingreso_Mensual <dbl>,
## # Trabajos_Anteriores <dbl>, Horas_Extra <chr>,
## # Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
## # Años_Experiencia <dbl>, Capacitaciones <dbl>,
## # Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## # Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>
Se observa que la base de datos contiene un total de 24 variables medidas en 1470 empleados. El objetivo es identificar posteriormente posibles causas que llevaron a los empleados a rotar de la empresa. Para esto inicialmente vamos a realizar un analisis exploratorio univariado.
tabla1=table(datos$Rotación)/1470*100
tabla1
##
## No Si
## 83.87755 16.12245
pie(tabla1)
Como se puede observar en los resultados de la variable rotación, la compañia presenta unos niveles importantes de rotación de empleados (16.12%), lo cual lo convierte en un problema clave para la operación continua de la compañia.
summary(datos$Edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 30.00 36.00 36.92 43.00 60.00
hist(datos$Edad,col="gray",main="Histograma de Edad",ylab="Frecuencia",xlab="Edad")
Se observa que los empleados de la compañia tienen una edad promedio de 36 años (jovenes), con un rango que va desde los 18 hasta los 60 años. Sin embargo el histograma muestra que la gran mayoria son jovenes con edades entre los 30 y 40 años.
tapply(datos$Edad,datos$Rotación,mean)
## No Si
## 37.56123 33.60759
boxplot(datos$Edad~datos$Rotación,col="gray")
Se observa que la edad promedio de los que rotaron (33 años) no es muy diferente de los que no rotaron (37 años), lo cual tambien podemos validarlo con el grafico de cajas que no presenta una diferencia entre las dos cajas de manera signifitcativa.
tapply(datos$Ingreso_Mensual,datos$Rotación,mean)
## No Si
## 6832.740 4787.093
boxplot(datos$Ingreso_Mensual~datos$Rotación,col="gray")
vporcentual=(6800-4800)/6800*100
vporcentual
## [1] 29.41176
tabla1=table(datos$Rotación,datos$Genero)
tabla1
##
## F M
## No 501 732
## Si 87 150
tabla2=prop.table(tabla1,margin = 1)*100
tabla2
##
## F M
## No 40.63260 59.36740
## Si 36.70886 63.29114
barplot(tabla2,beside = T)
tabla1=table(datos$Rotación,datos$`Viaje de Negocios`)
tabla1
##
## Frecuentemente No_Viaja Raramente
## No 208 138 887
## Si 69 12 156
tabla2=prop.table(tabla1,margin = 1)*100
tabla2
##
## Frecuentemente No_Viaja Raramente
## No 16.869424 11.192214 71.938362
## Si 29.113924 5.063291 65.822785
barplot(tabla2,beside = T)
Se observa que en el caso de las personas que si rotaron el 29% viaja frecuentemente mientras que los que no rotaron este % es de 16, lo cual nos indica que las personas que tienen mayor carga de viajes a su vez tienen mas posibilidad de rotaron (posiblemente desgaste por viaje, alejados de sus familias, pocos insentivos para viajar como viaticos…)