Esta actividad tiene por objetivo identificar mediante el análisis exploratorio de datos, las posibles causas o determinantes de la rotación de personal, es decir, aquellos empleados que se retiran voluntariamente de la empresa.
A continuación se realiza el cargue de la base de datos, la cual cuenta con 24 variables y 1.470 observaciones.
library(readxl)
Datos <- read_excel("C:/Users/User/Desktop/Datos_Rotacion.xlsx",
sheet = "Base")
names(Datos)
## [1] "Rotación" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfación_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Años_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Años_ultima_promoción" "Años_acargo_con_mismo_jefe"
El Departamento en el cual desempeña la actividad el trabajador se relaciona con la rotación, teniendo en cuenta que un trabajador que desempeña actividades en departamentos como innovación y desarrollo y ventas tienen una mayor propensión a desenvolverse en entornos cambiantes.
El nivel de Satisfacción Laboral se relaciona con la rotación, ya que en la medida en que exista un menor nivel de satisfacción se desarrolla una mayor propensión a cambiar de empleo. (Esta variable va de 1 a 4, siendo 1 el mayor nivel de satisfacción y 4 el menor)
El Estado Civil podría influir sobre la rotación, debido a que una persona soltera es más propensa a cambiar de empleo ya que cuenta con menos compromisos para moverse de trabajo, incluso si esto implica un traslado de ciudad.
La Edad es un determinante importante de la rotación, es más probable que la población juvenil entre 18 - 35 años asuma nuevos retos laborales, pues tienen en su mayoría menos compromisos en su vida personal y no le temen asumir riesgos.
Los Años de Antiguedad en el cargo influyen sobre la rotación, dado que cuando una persona lleva mucho tiempo desempeñando el mismo rol le resulta más complejo cambiar de actividad, que para una persona que no lleva más de 5 años en una misma posición laboral.
El Porcentaje de Aumento Salarial es un determinante de la movilidad laboral, pues entre menor sea el incremento del salario (%) por parte de un segmento de trabajadores frente a otros del mismo segmento, mayor será su rotación.
library("ggplot2")
library("ggpubr")
gc1= ggplot(data = Datos, aes(x=Departamento, fill=Rotación)) + geom_bar() + theme_dark()
gc2= ggplot(data = Datos, aes(x=Estado_Civil, fill=Rotación)) + geom_bar() + theme_grey()
gc3= ggplot(data = Datos, aes(x=Satisfación_Laboral, fill=Rotación)) + geom_bar() + theme_light()
ggarrange(gc1, gc2, gc3,
labels = c("A", "B", "C"), ncol= 2, nrow =2)
Sobre las tres variables catégoricas se observa lo siguiente según en Gráfico:
A. El 65,37% labora en el área de Innovación y Desarrollo, mientras que el 30,34% está en el área de ventas y el 4,29% restante en Recursos Humanos. Así mismo se observa que la mayor cantidad de personas que rotan están en el área de innovación y Desarrollo.
B. Con respecto al estado civil, un 45,78% del total están casados, mientras que el 31,97% son solteros y el 22,24% están divorciados. En contraste, la mayor participación de las personas que rotan corresponde a los solteros.
C. En cuanto a la satisfacción laboral, las categorías 3 y 4 que denotan un menor nivel de satisfacción representan más del 60% del total de observaciones. Las personas en el rango 3, son las de mayor rotación.
s <- table1::table1(~ factor(Estado_Civil)+factor(Departamento)+factor(Satisfación_Laboral) | Rotación, data = Datos)
s
| No (N=1233) |
Si (N=237) |
Overall (N=1470) |
|
|---|---|---|---|
| factor(Estado_Civil) | |||
| Casado | 589 (47.8%) | 84 (35.4%) | 673 (45.8%) |
| Divorciado | 294 (23.8%) | 33 (13.9%) | 327 (22.2%) |
| Soltero | 350 (28.4%) | 120 (50.6%) | 470 (32.0%) |
| factor(Departamento) | |||
| IyD | 828 (67.2%) | 133 (56.1%) | 961 (65.4%) |
| RH | 51 (4.1%) | 12 (5.1%) | 63 (4.3%) |
| Ventas | 354 (28.7%) | 92 (38.8%) | 446 (30.3%) |
| factor(Satisfación_Laboral) | |||
| 1 | 223 (18.1%) | 66 (27.8%) | 289 (19.7%) |
| 2 | 234 (19.0%) | 46 (19.4%) | 280 (19.0%) |
| 3 | 369 (29.9%) | 73 (30.8%) | 442 (30.1%) |
| 4 | 407 (33.0%) | 52 (21.9%) | 459 (31.2%) |
Como se muestra en la tabla anterior, del total de personas que rotan según el Estado Civil la mayor participación corresponde a los solteros con 50,6%, seguido de Casados con 35,4% y por último, divorciados con el 13,9%. En cuanto al Departamento que concentra la mayor proporción de la rotación es Innovación y Desarrollo (56,1%), seguido de Ventas (38,8%) y Recursos Humanos (5,1%).Por ultimo, las personas que rotan según su Nivel de satisfacción laboral son los del Nivel 3 (30,8%) siendo uno de los más bajos, luego se ubican los niveles 1 y 4 con 27,8% y 21,9%, cabe anotar que los niveles de satisfacción más bajos concentran el 52,7% de la rotación.
library("ggplot2")
library("ggpubr")
edad_final = cut(Datos$Edad, breaks = c(0, 17, 35, 52, Inf),
labels = c("Menor de edad", "Joven", "Adulto", "Mayor"))
Porcentaje_aumento_salarial_Final = cut(Datos$Porcentaje_aumento_salarial, breaks = c(0, 16, 24, Inf),
labels = c("Bajo", "Mediano", "Alto"))
gcc1= ggplot(data = Datos, aes(x=Edad, fill=Rotación)) + geom_bar() + theme_dark()
gcc2= ggplot(data = Datos, aes(x=edad_final, fill=Rotación)) + geom_bar() + theme_grey()
gcc3= ggplot(data = Datos, aes(x=Antigüedad_Cargo, fill=Rotación)) + geom_histogram(bins = 15) + theme_light()
gcc4= ggplot(data = Datos, aes(x=Porcentaje_aumento_salarial_Final, fill=Rotación)) + geom_bar() + theme_classic()
ggarrange(gcc1, gcc2, gcc3,gcc4,
labels = c("A", "B", "C", "D"), ncol= 2, nrow =2)
Sobre las tres variables cuantitativas se observa lo siguiente según el Gráfico:
A. y B. La distribución de las observaciones según la Edad muestra que la mayor parte de la población es joven (49,59%), es decir, tienen edades entre los 18 y 35 años siendo este a su vez el segmento de mayor rotación. En segundo lugar, se ubica el rango de adulto, correspondiente a edades entre 36 y 52 años con una participación del 43,20%, y por último los adultos con edades superiores a 52, los cuales tienen una participación del 7,21% restante.
C. La Antiguedad en el cargo muestra que un 45,78% de los trabajadores lleva entre 0 y 2 años en el cargo que desempeña actualmente, entre tanto, los colaboradores con una antigüedad entre 3 y 10 años representa un 48,91% del total.
D. La variable Porcentaje de aumento salarial categorizada, indica que el 62,52% de los trabajadores percibe un aumento de sueldo inferior o igual al 15%, el cual se clasifica como bajo, mientras que un 36,26% recibe un aumento de sueldo entre 16-24%; los aumentos superiores a este último valor se clasifican como altos y representan al 1,22% restante.
Datos$Edad_grupo=cut(Datos$Edad,breaks = c(0,30,40,50,60))
library("table1", warn.conflicts = FALSE)
y <- table1::table1(~ Edad+Antigüedad_Cargo+Porcentaje_aumento_salarial | Rotación, data = Datos)
y
| No (N=1233) |
Si (N=237) |
Overall (N=1470) |
|
|---|---|---|---|
| Edad | |||
| Mean (SD) | 37.6 (8.89) | 33.6 (9.69) | 36.9 (9.14) |
| Median [Min, Max] | 36.0 [18.0, 60.0] | 32.0 [18.0, 58.0] | 36.0 [18.0, 60.0] |
| Antigüedad_Cargo | |||
| Mean (SD) | 4.48 (3.65) | 2.90 (3.17) | 4.23 (3.62) |
| Median [Min, Max] | 3.00 [0, 18.0] | 2.00 [0, 15.0] | 3.00 [0, 18.0] |
| Porcentaje_aumento_salarial | |||
| Mean (SD) | 15.2 (3.64) | 15.1 (3.77) | 15.2 (3.66) |
| Median [Min, Max] | 14.0 [11.0, 25.0] | 14.0 [11.0, 25.0] | 14.0 [11.0, 25.0] |
Como se observa en la tabla anterior, tomaremos en cuenta como medida de tendencia central la mediana para cada una de las variables:
library("CGPfunctions")
PlotXTabs2(data = Datos, x= Estado_Civil, y=Rotación)
Con el gráfico anterior se puede constatar que hay una mayor propensión a la rotación laboral según el estado civil del trabajador, ya que, por ejemplo, un 26% de los solteros rota, mientras que la incidencia en casados y divorciados es solo de 12% y 10% respectivamente.Lo anterior, se puede envidenciar al contrastar el p-value que es menor al nivel de significancia.
library("CGPfunctions")
PlotXTabs2(data = Datos, x= Departamento, y=Rotación)
Se observa que, aunque el mayor valor absoluto de personas que rotan se encuentra en el departamento de innovación, como se aprecia en el gráfico anterior, la mayor representatividad al interior de cada grupo por departamento, los que concentran en términos relativos la rotación son Ventas (21%) y Recursos Humanos (19%).Al contrastar el p-value frente a la significancia se demuestra la relación que existe entre las dos variables.
library("CGPfunctions")
PlotXTabs2(data = Datos, x= Satisfación_Laboral, y=Rotación)
En este caso, contrario a lo expuesto en la hipótesis, los rangos que mayor satisfacción laboral muestran son también los que en términos relativos obtienen el mayor porcentaje de rotación, cabe anotar que los rangos 3 y 4 tienen mayores observaciones, es decir, en términos absolutos si explican esta relación. Igualmente al evaluar el p-value frente a la significancia se confirma la relación existente entre las dos variables.
t.test (Datos$Edad~Datos$Rotación)
##
## Welch Two Sample t-test
##
## data: Datos$Edad by Datos$Rotación
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si
## 37.56123 33.60759
Según los resultados de la distribución t student, se observa que el p-value es inferior al nivel de significancia, por tanto se puede rechazar la hipótesis nula lo cual indica que si existe evidencia sobre la relación entre la edad y la rotación en la empresa.
ggplot(data = Datos, aes(x = Rotación, y = Edad)) +
geom_boxplot(fill="slateblue", alpha=0.2)
En el boxplot anterior, la distribución de la edad con respecto a la variable rotación muestra un menor rango de edad para las personas que rotan, ya que la mediana de los que no rotan es de 36 años mientras que los que rotan tienen una mediana de 32 años, incluso mostrando que el 75% de las personas que rotan tienen una edad inferior a 38 años, lo cual confirma lo evidenciado en el test anterior sobre la significancia de esta variable para explicar la rotación.
t.test (Datos$Antigüedad_Cargo~Datos$Rotación)
##
## Welch Two Sample t-test
##
## data: Datos$Antigüedad_Cargo by Datos$Rotación
## t = 6.8471, df = 366.57, p-value = 3.187e-11
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 1.127107 2.035355
## sample estimates:
## mean in group No mean in group Si
## 4.484185 2.902954
Para esta variable, los resultados del t.test sobre el p-value muestra un valor inferior a la significancia (0,05), por tanto, se rechaza la hipótesis nula, determinando que si existe relación entre la antiguedad en el cargo y la rotación.
ggplot(data = Datos, aes(x = Rotación, y = Antigüedad_Cargo)) +
geom_boxplot(fill="slateblue", alpha=0.2)
El boxplot anterior contrasta la antigüedad en un cargo y la rotación, denota que el 50% de las personas tienen una antigüedad inferior o igual a 2 años, y más del 75% de estas no tiene más de 4 años desempeñándose en el mismo cargo, por tanto, se confirma que esta variable si explica en buena medida la rotación de personal en la empresa.
t.test (Datos$Porcentaje_aumento_salarial~Datos$Rotación)
##
## Welch Two Sample t-test
##
## data: Datos$Porcentaje_aumento_salarial by Datos$Rotación
## t = 0.50424, df = 326.11, p-value = 0.6144
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## -0.3890709 0.6572652
## sample estimates:
## mean in group No mean in group Si
## 15.23114 15.09705
En el caso de porcentaje de aumento salarial muestra un resultado de 0,6144 en el p-value, lo cual es superior al valor de la significancia, por tanto se acepta la hipótesis nula, lo cual indica que no existe relación entre esta variable y la rotación.
ggplot(data = Datos, aes(x = Rotación, y = Porcentaje_aumento_salarial)) +
geom_boxplot(fill="slateblue", alpha=0.2)
En el boxplot anterior, se aprecia que no hay grandes diferencias entre el personal que rota y el que no, en función de la proporción del incremento salarial, lo cual reafirma el resultado obtenido en el t.test, ya que tanto el primer cuartil como la mediana en ambas distribuciones es igual.
Dentro de las variables analizadas en este reporte, en cuanto a las categóricas se determinó que tanto el Estado Civil, como el departamento en el que se ubica cada trabajador y la satisfacción laboral inciden sobre la variable rotación. Con respecto a las cuantitativas, se logró identificar que la Edad y la Antiguedad en un cargo contribuyen a incrementar la incidencia de la rotación en la empresa.
Frente a las estrategias a desarrollar, es necesario implementar un programa de permanencia laboral que se constituya como una intervención cruzada, es decir, fomentar la vinculación y permanencia del talento jóven en la empresa, correspondiente a las personas en su mayoría solteras con rango de edad principalmente entre 28 y 38 años, en departamentos estratégicos como Innovación y Ventas donde las habilidades y conocimientos especializados se deberían preservar para mantener la curva de aprendizaje en las empresas.
Un segundo programa de promoción o crecimiento al interior de la organización, fomentando el crecimiento profesional de colaboradores que lleven varios años dentro de un mismo cargo o rol, focalizando esta intervención en primera medida con aquellos colaboradores que manifiestan un menor nivel de satisfacción en el trabajo.