En el siguiente documento vamos a realizar un analisis exploratorio de los datos de rotación que se presentan a contuniación:

library(readxl)
datos = read_excel("~/Desktop/Datos_Rotación.xlsx")
head(datos,3)
## # A tibble: 3 x 24
##   Rotación  Edad `Viaje de Negoc… Departamento Distancia_Casa Educación
##   <chr>    <dbl> <chr>            <chr>                 <dbl>     <dbl>
## 1 Si          41 Raramente        Ventas                    1         2
## 2 No          49 Frecuentemente   IyD                       8         1
## 3 Si          37 Raramente        IyD                       2         2
## # … with 18 more variables: Campo_Educación <chr>,
## #   Satisfacción_Ambiental <dbl>, Genero <chr>, Cargo <chr>,
## #   Satisfación_Laboral <dbl>, Estado_Civil <chr>, Ingreso_Mensual <dbl>,
## #   Trabajos_Anteriores <dbl>, Horas_Extra <chr>,
## #   Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
## #   Años_Experiencia <dbl>, Capacitaciones <dbl>,
## #   Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## #   Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>

Se observa que la base de datos contiene un total de 24 variables medidas en 1470 empleados. El objetivo es identificar posteriormente posibles causas que llevaron a los empleados a rotar de la empresa. Para esto inicialmente vamos a realizar un analisis exploratorio univariado.

Exploratorio Univariado

Rotación

tabla1=table(datos$Rotación)/1470*100
tabla1
## 
##       No       Si 
## 83.87755 16.12245
pie(tabla1)

Como se puede observar en los resultados de la variable rotación, la compañia presenta unos niveles importantes de rotación de empleados (16.12%), lo cual lo convierte en un problema clave para la operación continua de la compañia.

Edad

summary(datos$Edad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   30.00   36.00   36.92   43.00   60.00
hist(datos$Edad,col="gray",main="Histograma de Edad",ylab="Frecuencia",xlab="Edad")

Se observa que los empleados de la compañia tienen una edad promedio de 36 años (jovenes), con un rango que va desde los 18 hasta los 60 años. Sin embargo el histograma muestra que la gran mayoria son jovenes con edades entre los 30 y 40 años.

Exploratorio Bivariado

Rotación vs Edad

tapply(datos$Edad,datos$Rotación,mean)
##       No       Si 
## 37.56123 33.60759
boxplot(datos$Edad~datos$Rotación,col="gray")

Se observa que la edad promedio de los que rotaron (33 años) no es muy diferente de los que no rotaron (37 años), lo cual tambien podemos validarlo con el grafico de cajas que no presenta una diferencia entre las dos cajas de manera signifitcativa.

Rotación vs Ingresos

tapply(datos$Ingreso_Mensual,datos$Rotación,mean)
##       No       Si 
## 6832.740 4787.093
boxplot(datos$Ingreso_Mensual~datos$Rotación,col="gray")

vporcentual=(6800-4800)/6800*100
vporcentual
## [1] 29.41176

Rotación vs Genero

tabla1=table(datos$Rotación,datos$Genero)
tabla1
##     
##        F   M
##   No 501 732
##   Si  87 150
tabla2=prop.table(tabla1,margin = 1)*100
tabla2
##     
##             F        M
##   No 40.63260 59.36740
##   Si 36.70886 63.29114
barplot(tabla2,beside = T)

Rotación vs Viajes de Negocio

tabla1=table(datos$Rotación,datos$`Viaje de Negocios`)
tabla1
##     
##      Frecuentemente No_Viaja Raramente
##   No            208      138       887
##   Si             69       12       156
tabla2=prop.table(tabla1,margin = 1)*100
tabla2
##     
##      Frecuentemente  No_Viaja Raramente
##   No      16.869424 11.192214 71.938362
##   Si      29.113924  5.063291 65.822785
barplot(tabla2,beside = T)

Se observa que en el caso de las personas que si rotaron el 29% viaja frecuentemente mientras que los que no rotaron este % es de 16, lo cual nos indica que las personas que tienen mayor carga de viajes a su vez tienen mas posibilidad de rotaron (posiblemente desgaste por viaje, alejados de sus familias, pocos insentivos para viajar como viaticos…)