La siguiente actividad corresponde a una compañía que presenta una situación de alta rotación (personas que se retiran de manera voluntaria de la compañía) en algunos empleados. La actividad consiste en por medio de la exploración de una base de datos en la cual se identifican posibles factores que se relacionan con la rotación tales como salario, carga laboral entre otros. Se pretende que el estudiante realice una descripción de la base, luego relaciones entre factores previamente identificados con la rotación y finalmente con estos factores proponer una estrategia de retención para mejorar las cifras de rotación.
library(readxl)
datos = read_excel("~/Downloads/Datos_Rotación.xlsx")
names(datos)
## [1] "Rotacion" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educacion"
## [7] "Campo_Educacion" "Satisfaccion_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfacion_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Anos_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antiguedad" "Antiguedad_Cargo"
## [23] "Anos_ultima_promocion" "Anos_acargo_con_mismo_jefe"
Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas que consideren estén relacionadas con la rotación:
VARIABLES CATEGÓRICAS:
Hipótesis:A mayor grado de educación mayor probabilidad de rotar o cambiar de trabajo
Analisis univariado de los datos:
require(ggplot2)
## Loading required package: ggplot2
require(ggpubr)
## Loading required package: ggpubr
g1=ggplot(datos,aes(x=Educacion))+geom_bar()+theme_bw()
ggarrange(g1, labels = c("A"),ncol = 1, nrow = 1)
Se identifica que el grueso de los individuos corresponden a profesionales universitarios (grupo 3), seguido por un grupo que cuenta con maestria (grupo 4).
Hipótesis: A mayor grado de satisfacción en el ambiente laboral, menor propabilidad de rotación laboral.
Analisis univariado de los datos:
require(ggplot2)
require(ggpubr)
g2=ggplot(datos,aes(x=Satisfaccion_Ambiental))+geom_bar()+theme_bw()
ggarrange(g2, labels = c("B"),ncol = 1, nrow = 1)
Accorde al grafico la santisfacción Ambiental de los individuos analizados se encuentra entre “Alta” y “Muy alta” las cuales en conjunto superan los 800 indiviuos de los 1470 registrados en la tabla de datos. Por lo cual se puede decir que mas del 50% tienen un ambiente laboral acorde a sus espectativas lo cual se refleja en un alto nivel de satisfacción ambiental.
Hipótesis: Si el individuo se encuentra en estado civil “solter@” es mas probable que rote o cambie de trabajo
Analisis univariado de los datos:
pie(table(datos$Estado_Civil))
La mayor proporción de los indivisuos se identifican con estado civil casado con casi la mitad del pastel, seguido por el grupo de solteros y en ultima instancia el grupo de divorciados con menor proporción.
require(ggplot2)
require(ggpubr)
g1=ggplot(datos,aes(x=Educacion))+geom_bar(bins=30)+theme_bw()
## Warning: Ignoring unknown parameters: bins
g2=ggplot(datos,aes(x=Satisfaccion_Ambiental))+geom_bar()+theme_bw()
g3=ggplot(datos,aes(x=Estado_Civil))+geom_bar()+theme_bw()
ggarrange(g1, g2, g3, labels = c("A", "B", "C"),ncol = 3, nrow = 1)
VARIABLES CUANTITATIVAS:
Hipótesis: A menor edad del individuo hay mayor probabiliadd de rotación o cambio de empleo
Análisis univariado de los datos:
require(ggplot2)
require(ggpubr)
g4=ggplot(datos,aes(x=Edad))+geom_histogram(bins=30)+theme_bw()
ggarrange(g4, labels = c("D"),ncol = 1, nrow = 1)
Se evidencia en el grafico que la concentraciñon en edad del grupo de 1470 individuos se da entre los 30 y 35 años, seguido por los de 35 a 40 años. Siendo en menor número aquellos menores a 25 años.
Hipótesis: A mayor distancia entre el trabajo y la vivienda, mayor probabilidad de cambiar o rotar de empleo.
Analisis univariado de los datos:
require(ggplot2)
require(ggpubr)
g5=ggplot(datos,aes(x=Distancia_Casa))+geom_bar()+theme_bw()
ggarrange(g5,labels = c("E"),ncol = 1, nrow = 1)
La mayoria de los individuos deben recorrer distancias menores a 10Km para ir de su lugar de residencia a su trabajo. Por lo que se podria decir que gran parte de los empleados deben recorrer distancias inferiores a los 5km, lo cual puede ser una ventaja. Sin embargo, hay un grupo que supera los 20km de distancia y estos podrian ser los que no esten comodos en su trabajo y busquen algo mas cerca a sus viviendas.
Hipótesis: Cuanto menor sea el ingreso mensual del individuo mayor es la probabilidad de cambiar o rotar de empleo.
require(ggplot2)
require(ggpubr)
g6=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
ggarrange(g6,labels = c("F"),ncol = 1, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Se evidencia que el ingreso mensual de los individuos en su mayoria se encuentran por debajo de los 5’000.000, lo cual puede ser uno de los factores que justifican la rotación ya que ser que dentro de este grupo muchos de ellos no se encuentren satisfechos con su remuneración o se sientan mal remuerados.
pie(table(datos$Rotacion))
require(ggplot2)
require(ggpubr)
g4=ggplot(datos,aes(x=Edad))+geom_histogram(bins=30)+theme_bw()
g5=ggplot(datos,aes(x=Distancia_Casa))+geom_bar()+theme_bw()
g6=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
ggarrange(g4, g5, g6, labels = c("D", "E", "F"),ncol = 3, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
datos$Edad_grupo=cut(datos$Edad,breaks = c(0,30,40,50,60))
require(table1)
## Loading required package: table1
##
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
##
## units, units<-
y <- table1::table1(~ Educacion+Satisfaccion_Ambiental+Estado_Civil+Edad+Distancia_Casa+Ingreso_Mensual | Rotacion, data = datos)
y
| No (N=1233) |
Si (N=237) |
Overall (N=1470) |
|
|---|---|---|---|
| Educacion | |||
| Mean (SD) | 2.93 (1.03) | 2.84 (1.01) | 2.91 (1.02) |
| Median [Min, Max] | 3.00 [1.00, 5.00] | 3.00 [1.00, 5.00] | 3.00 [1.00, 5.00] |
| Satisfaccion_Ambiental | |||
| Mean (SD) | 2.77 (1.07) | 2.46 (1.17) | 2.72 (1.09) |
| Median [Min, Max] | 3.00 [1.00, 4.00] | 3.00 [1.00, 4.00] | 3.00 [1.00, 4.00] |
| Estado_Civil | |||
| Casado | 589 (47.8%) | 84 (35.4%) | 673 (45.8%) |
| Divorciado | 294 (23.8%) | 33 (13.9%) | 327 (22.2%) |
| Soltero | 350 (28.4%) | 120 (50.6%) | 470 (32.0%) |
| Edad | |||
| Mean (SD) | 37.6 (8.89) | 33.6 (9.69) | 36.9 (9.14) |
| Median [Min, Max] | 36.0 [18.0, 60.0] | 32.0 [18.0, 58.0] | 36.0 [18.0, 60.0] |
| Distancia_Casa | |||
| Mean (SD) | 8.92 (8.01) | 10.6 (8.45) | 9.19 (8.11) |
| Median [Min, Max] | 7.00 [1.00, 29.0] | 9.00 [1.00, 29.0] | 7.00 [1.00, 29.0] |
| Ingreso_Mensual | |||
| Mean (SD) | 6830 (4820) | 4790 (3640) | 6500 (4710) |
| Median [Min, Max] | 5200 [1050, 20000] | 3200 [1010, 19900] | 4920 [1010, 20000] |
Podemos identificar que para el caso de la educación la mediana tanto para los que No rotan como para los que Si lo hacen se encuentra en 3 lo que indica que el grueso de los individuos tienen un nivel educativo profesional. Y se podria intuir que dicha variable no es significativa en el momento en el que el individuo toma la decisión de permanecer o cambiar de trabajo.
Para el caso de la satisfacción en el ambiente laboral se encuentra una media muy cercana para aquellos que No rotan (2,77) y para aquellos que Si lo hacen (2,46). Lo que nos podria indicar que este aspecto es indiferente en el momento de tomar la decisión de rotar de empleo.
De los que si rotaron el 50% corresponde a solteros, mientras que de los que no lo hicieron los casados son los que mayor porcentaje abarcan con el 48%. Lo que nos permite inferir que a el estado civil de un individuo si puede tener incidencia al momento de tomar la decisión de rotar de empleo.
Podemos observar que los que Si rotaron son un poco mas jovenes que los No rotaron ya que la media de los que Si rotaron se encuentra en 33.6, mientras que la media de los que No rotaron se encuentra en 37.6, hay una leve diferencia. Sin embargo, puede que no sea tan marcada para establecer que el factor edad es fundamental al momento de rotar de un empleo a otro.
la Distancia por su parte refleja que para el caso de los que Si rotaron es dos veces mayor la distancia en KM, que la distancia que recorren los que No rotaron en KM. Lo que permite identificar que el factor distancia puede ser importante o significativo en el momento que el individuo toma la decisión de rotar de un empleo a otro.
Por ultimo la diferencia de ingreso entre aquellos que si rotaron y aquellos que no lo hicieron, es cercano a 2`000.000 por lo cual esta diferencia en el momento de cambiar de trabajo puede ser relevante ya que el incremento de su ingreso mensual puede constituirse en el factor decisivo al momento de tomar la decisión de rotar o no hacerlo.
##Si es Cuantitativa
t.test(datos$Distancia_Casa~datos$Rotacion)
##
## Welch Two Sample t-test
##
## data: datos$Distancia_Casa by datos$Rotacion
## t = -2.8882, df = 322.72, p-value = 0.004137
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## -2.8870025 -0.5475146
## sample estimates:
## mean in group No mean in group Si
## 8.915653 10.632911
t.test(datos$Edad~datos$Rotacion)
##
## Welch Two Sample t-test
##
## data: datos$Edad by datos$Rotacion
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si
## 37.56123 33.60759
t.test(datos$Ingreso_Mensual~datos$Rotacion)
##
## Welch Two Sample t-test
##
## data: datos$Ingreso_Mensual by datos$Rotacion
## t = 7.4826, df = 412.74, p-value = 4.434e-13
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 1508.244 2583.050
## sample estimates:
## mean in group No mean in group Si
## 6832.740 4787.093
##Si es Cualitativa
require(CGPfunctions)
## Loading required package: CGPfunctions
PlotXTabs2(data = datos,x = Edad_grupo,y = Rotacion)
PlotXTabs2(data = datos,x = Satisfaccion_Ambiental,y = Rotacion)
PlotXTabs2(data = datos,x = Educacion,y = Rotacion)
PlotXTabs2(data = datos,x = Estado_Civil,y = Rotacion)
CONCLUSIONES:
Acorde a los hallazgos identificados con las variables analizadas, podemos inferir que algunas de ellas como el nivel educativo o la edad no constituyen un factor relevante en el momento de tomar al decisión de cambiar de trabajo. Sin embargo, se podria indicar que el estado civil, la distancia y el ingreso mensual son factores significativos en la toma de decisiones de los individuos. Por lo cual las estrategias de la compañia deben estar relacionadas a:
Implementar alternativas para sus empleados que les permitan facil acceso a creditos de vivienda o de educación para los empleados o sus hijos. También subsidios o bonos de vivienda o educación. Lo que puede llevar a que los empleados casados, sientan mayores garantias al ser parte de la compañia.
Se podria implementar una ruta que cubra la generalidad de las zonas donde viven los empleados o en un punto común donde estos puedan tener este servicio de transporte por parte de la compañia. Otra alternativa podria ser la implementación de home office, lo que puede reducir los costos y mejorar la calidad de vida para los empleados.
Estipular los rangos de salariales acorde a los cargos que se encuentran en la compañia y que sean de publico conocimiento para los empleados, esto permite que identifiquen su rango salarian y se sientan mas comodos con su ingreso mensual. A su vez, algunos incentivos salariales como bonos por iniciativas para reducción de costos o bonos por antiguedad en la compañia podrian ser un factor que impacte positivamente a los empleados.