Descripción

Esta actividad tiene por objetivo identificar mediante el análisis exploratorio de datos, las posibles causas o determinantes de la rotación de personal, es decir, aquellos empleados que se retiran voluntariamente de la empresa.

A continuación se realiza el cargue de la base de datos, la cual cuenta con 24 variables y 1.470 observaciones.

library(readxl)
Datos <- read_excel("C:/Users/User/Desktop/Datos_Rotacion.xlsx", 
    sheet = "Base")
names(Datos) 
##  [1] "Rotación"                    "Edad"                       
##  [3] "Viaje de Negocios"           "Departamento"               
##  [5] "Distancia_Casa"              "Educación"                  
##  [7] "Campo_Educación"             "Satisfacción_Ambiental"     
##  [9] "Genero"                      "Cargo"                      
## [11] "Satisfación_Laboral"         "Estado_Civil"               
## [13] "Ingreso_Mensual"             "Trabajos_Anteriores"        
## [15] "Horas_Extra"                 "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral"         "Años_Experiencia"           
## [19] "Capacitaciones"              "Equilibrio_Trabajo_Vida"    
## [21] "Antigüedad"                  "Antigüedad_Cargo"           
## [23] "Años_ultima_promoción"       "Años_acargo_con_mismo_jefe"

1. Selección de variables categóricas y cuantitativas.

Variables Categóricas

  • El Departamento en el cual desempeña la actividad el trabajador se relaciona con la rotación, teniendo en cuenta que un trabajador que desempeña actividades en departamentos como innovación y desarrollo y ventas tienen una mayor propensión a desenvolverse en entornos cambiantes.

  • El nivel de Satisfacción Laboral se relaciona con la rotación, ya que en la medida en que exista un menor nivel de satisfacción se desarrolla una mayor propensión a cambiar de empleo. (Esta variable va de 1 a 4, siendo 1 el mayor nivel de satisfacción y 4 el menor)

  • El Estado Civil podría influir sobre la rotación, debido a que una persona soltera es más propensa a cambiar de empleo ya que cuenta con menos compromisos para moverse de trabajo, incluso si esto implica un traslado de ciudad.

Variables Cuantitativas

  • La Edad es un determinante importante de la rotación, es más probable que la población juvenil entre 18 - 35 años asuma nuevos retos laborales, pues tienen en su mayoría menos compromisos en su vida personal y no le temen asumir riesgos.

  • Los Años de Antiguedad en el cargo influyen sobre la rotación, dado que cuando una persona lleva mucho tiempo desempeñando el mismo rol le resulta más complejo cambiar de actividad, que para una persona que no lleva más de 5 años en una misma posición laboral.

  • El Porcentaje de Aumento Salarial es un determinante de la movilidad laboral, pues entre menor sea el incremento del salario (%) por parte de un segmento de trabajadores frente a otros del mismo segmento, mayor será su rotación.

2. Análisis Univariado

Variables Categóricas

library("ggplot2")
library("ggpubr")

gc1= ggplot(data = Datos, aes(x=Departamento, fill=Rotación)) + geom_bar() + theme_dark()
gc2= ggplot(data = Datos, aes(x=Estado_Civil, fill=Rotación)) + geom_bar() + theme_grey()
gc3= ggplot(data = Datos, aes(x=Satisfación_Laboral, fill=Rotación)) + geom_bar() + theme_light()

ggarrange(gc1, gc2, gc3, 
          labels = c("A", "B", "C"), ncol= 2, nrow =2)

Sobre las tres variables catégoricas se observa lo siguiente según en Gráfico:

s <- table1::table1(~ factor(Estado_Civil)+factor(Departamento)+factor(Satisfación_Laboral) | Rotación, data = Datos)
s
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
factor(Estado_Civil)
Casado 589 (47.8%) 84 (35.4%) 673 (45.8%)
Divorciado 294 (23.8%) 33 (13.9%) 327 (22.2%)
Soltero 350 (28.4%) 120 (50.6%) 470 (32.0%)
factor(Departamento)
IyD 828 (67.2%) 133 (56.1%) 961 (65.4%)
RH 51 (4.1%) 12 (5.1%) 63 (4.3%)
Ventas 354 (28.7%) 92 (38.8%) 446 (30.3%)
factor(Satisfación_Laboral)
1 223 (18.1%) 66 (27.8%) 289 (19.7%)
2 234 (19.0%) 46 (19.4%) 280 (19.0%)
3 369 (29.9%) 73 (30.8%) 442 (30.1%)
4 407 (33.0%) 52 (21.9%) 459 (31.2%)

Como se muestra en la tabla anterior, del total de personas que rotan según el Estado Civil la mayor participación corresponde a los solteros con 50,6%, seguido de Casados con 35,4% y por último, divorciados con el 13,9%. En cuanto al Departamento que concentra la mayor proporción de la rotación es Innovación y Desarrollo (56,1%), seguido de Ventas (38,8%) y Recursos Humanos (5,1%).Por ultimo, las personas que rotan según su Nivel de satisfacción laboral son los del Nivel 3 (30,8%) siendo uno de los más bajos, luego se ubican los niveles 1 y 4 con 27,8% y 21,9%, cabe anotar que los niveles de satisfacción más bajos concentran el 52,7% de la rotación.

Variables Cuantitativas

library("ggplot2")
library("ggpubr")

edad_final = cut(Datos$Edad, breaks = c(0, 17, 35, 52, Inf), 
labels = c("Menor de edad", "Joven", "Adulto", "Mayor"))


Porcentaje_aumento_salarial_Final = cut(Datos$Porcentaje_aumento_salarial, breaks = c(0, 16, 24, Inf), 
labels = c("Bajo", "Mediano", "Alto"))


gcc1= ggplot(data = Datos, aes(x=Edad, fill=Rotación)) + geom_bar() + theme_dark()
gcc2= ggplot(data = Datos, aes(x=edad_final, fill=Rotación)) + geom_bar() + theme_grey()
gcc3= ggplot(data = Datos, aes(x=Antigüedad_Cargo, fill=Rotación)) + geom_histogram(bins = 15) + theme_light()
gcc4= ggplot(data = Datos, aes(x=Porcentaje_aumento_salarial_Final, fill=Rotación)) + geom_bar() + theme_classic()

ggarrange(gcc1, gcc2, gcc3,gcc4, 
          labels = c("A", "B", "C", "D"), ncol= 2, nrow =2)

Sobre las tres variables cuantitativas se observa lo siguiente según el Gráfico:

Datos$Edad_grupo=cut(Datos$Edad,breaks = c(0,30,40,50,60))
library("table1", warn.conflicts = FALSE)
y <- table1::table1(~ Edad+Antigüedad_Cargo+Porcentaje_aumento_salarial | Rotación, data = Datos)
y
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Edad
Mean (SD) 37.6 (8.89) 33.6 (9.69) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0] 32.0 [18.0, 58.0] 36.0 [18.0, 60.0]
Antigüedad_Cargo
Mean (SD) 4.48 (3.65) 2.90 (3.17) 4.23 (3.62)
Median [Min, Max] 3.00 [0, 18.0] 2.00 [0, 15.0] 3.00 [0, 18.0]
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.64) 15.1 (3.77) 15.2 (3.66)
Median [Min, Max] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0]

Como se observa en la tabla anterior, tomaremos en cuenta como medida de tendencia central la mediana para cada una de las variables:

3. Análisis Bivariado

Variables Categóricas

library("CGPfunctions")
PlotXTabs2(data = Datos, x= Estado_Civil, y=Rotación)

Con el gráfico anterior se puede constatar que hay una mayor propensión a la rotación laboral según el estado civil del trabajador, ya que, por ejemplo, un 26% de los solteros rota, mientras que la incidencia en casados y divorciados es solo de 12% y 10% respectivamente.Lo anterior, se puede envidenciar al contrastar el p-value que es menor al nivel de significancia.

library("CGPfunctions")
PlotXTabs2(data = Datos, x= Departamento, y=Rotación)

Se observa que, aunque el mayor valor absoluto de personas que rotan se encuentra en el departamento de innovación, como se aprecia en el gráfico anterior, la mayor representatividad al interior de cada grupo por departamento, los que concentran en términos relativos la rotación son Ventas (21%) y Recursos Humanos (19%).Al contrastar el p-value frente a la significancia se demuestra la relación que existe entre las dos variables.

library("CGPfunctions")
PlotXTabs2(data = Datos, x= Satisfación_Laboral, y=Rotación)

En este caso, contrario a lo expuesto en la hipótesis, los rangos que mayor satisfacción laboral muestran son también los que en términos relativos obtienen el mayor porcentaje de rotación, cabe anotar que los rangos 3 y 4 tienen mayores observaciones, es decir, en términos absolutos si explican esta relación. Igualmente al evaluar el p-value frente a la significancia se confirma la relación existente entre las dos variables.

Variables Cuantitativas

t.test  (Datos$Edad~Datos$Rotación)
## 
##  Welch Two Sample t-test
## 
## data:  Datos$Edad by Datos$Rotación
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si 
##         37.56123         33.60759

Según los resultados de la distribución t student, se observa que el p-value es inferior al nivel de significancia, por tanto se puede rechazar la hipótesis nula lo cual indica que si existe evidencia sobre la relación entre la edad y la rotación en la empresa.

ggplot(data = Datos, aes(x = Rotación, y = Edad)) +
  geom_boxplot(fill="slateblue", alpha=0.2)

En el boxplot anterior, la distribución de la edad con respecto a la variable rotación muestra un menor rango de edad para las personas que rotan, ya que la mediana de los que no rotan es de 36 años mientras que los que rotan tienen una mediana de 32 años, incluso mostrando que el 75% de las personas que rotan tienen una edad inferior a 38 años, lo cual confirma lo evidenciado en el test anterior sobre la significancia de esta variable para explicar la rotación.

t.test  (Datos$Antigüedad_Cargo~Datos$Rotación)
## 
##  Welch Two Sample t-test
## 
## data:  Datos$Antigüedad_Cargo by Datos$Rotación
## t = 6.8471, df = 366.57, p-value = 3.187e-11
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  1.127107 2.035355
## sample estimates:
## mean in group No mean in group Si 
##         4.484185         2.902954

Para esta variable, los resultados del t.test sobre el p-value muestra un valor inferior a la significancia (0,05), por tanto, se rechaza la hipótesis nula, determinando que si existe relación entre la antiguedad en el cargo y la rotación.

ggplot(data = Datos, aes(x = Rotación, y = Antigüedad_Cargo)) +
  geom_boxplot(fill="slateblue", alpha=0.2)

El boxplot anterior contrasta la antigüedad en un cargo y la rotación, denota que el 50% de las personas tienen una antigüedad inferior o igual a 2 años, y más del 75% de estas no tiene más de 4 años desempeñándose en el mismo cargo, por tanto, se confirma que esta variable si explica en buena medida la rotación de personal en la empresa.

t.test  (Datos$Porcentaje_aumento_salarial~Datos$Rotación)
## 
##  Welch Two Sample t-test
## 
## data:  Datos$Porcentaje_aumento_salarial by Datos$Rotación
## t = 0.50424, df = 326.11, p-value = 0.6144
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  -0.3890709  0.6572652
## sample estimates:
## mean in group No mean in group Si 
##         15.23114         15.09705

En el caso de porcentaje de aumento salarial muestra un resultado de 0,6144 en el p-value, lo cual es superior al valor de la significancia, por tanto se acepta la hipótesis nula, lo cual indica que no existe relación entre esta variable y la rotación.

ggplot(data = Datos, aes(x = Rotación, y = Porcentaje_aumento_salarial)) +
  geom_boxplot(fill="slateblue", alpha=0.2)

En el boxplot anterior, se aprecia que no hay grandes diferencias entre el personal que rota y el que no, en función de la proporción del incremento salarial, lo cual reafirma el resultado obtenido en el t.test, ya que tanto el primer cuartil como la mediana en ambas distribuciones es igual.

4. Conclusiones

Dentro de las variables analizadas en este reporte, en cuanto a las categóricas se determinó que tanto el Estado Civil, como el departamento en el que se ubica cada trabajador y la satisfacción laboral inciden sobre la variable rotación. Con respecto a las cuantitativas, se logró identificar que la Edad y la Antiguedad en un cargo contribuyen a incrementar la incidencia de la rotación en la empresa.

Frente a las estrategias a desarrollar, es necesario implementar un programa de permanencia laboral que se constituya como una intervención cruzada, es decir, fomentar la vinculación y permanencia del talento jóven en la empresa, correspondiente a las personas en su mayoría solteras con rango de edad principalmente entre 28 y 38 años, en departamentos estratégicos como Innovación y Ventas donde las habilidades y conocimientos especializados se deberían preservar para mantener la curva de aprendizaje en las empresas.

Un segundo programa de promoción o crecimiento al interior de la organización, fomentando el crecimiento profesional de colaboradores que lleven varios años dentro de un mismo cargo o rol, focalizando esta intervención en primera medida con aquellos colaboradores que manifiestan un menor nivel de satisfacción en el trabajo.