La siguiente actividad corresponde a una compañía que presenta una situación de alta rotación (personas que se retiran de manera voluntaria de la compañía) en algunos empleados. La actividad consiste en por medio de la exploración de una base de datos en la cual se identifican posibles factores que se relacionan con la rotación tales como salario, carga laboral entre otros. Se pretende que el estudiante realice una descripción de la base, luego relaciones entre factores previamente identificados con la rotación y finalmente con estos factores proponer una estrategia de retención para mejorar las cifras de rotación. La base de datos contiene las siguientes variables:
library(readxl)
datos <- read_excel("C:/Users/Cata/Desktop/MAESTRIA CD/1. Metodos y tecnicas de simulación estadistica/Unidad 1/Datos_Rotación.xlsx",sheet = "Base")
names(datos)
## [1] "Rotación" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfación_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Anos_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Anos_ultima_promoción" "Años_acargo_con_mismo_jefe"
1.1 Variables cualitativas:
Departamento: Se espera que la variable departamento de la empresa este asociada a la rotación, debido a que a pesar de pertenecer a una misma empresa la carga laboral, el ambiente laboral, el nivel de estrés, entre otros factores pueden variar internamente entre los departamentos. Hipótesis: Las personas que pertenecen a determinado departamento de la empresa tienen mayor posibilidad de rotar que las que pertenecen a los demás departamentos.
Satisfacción laboral: Se espera que la variable satisfacción laboral se asocie a la rotación, ya que un gran porcentaje del tiempo de nuestra vida se dedica al trabajo, por lo cual es importante estar conforme con cuanto al entorno y condiciones de trabajo. Hipótesis: Las personas que tienen un menor nivel de satisfacción laboral tienen mayor posibilidad de rotar que las personas que tienen un mayor nivel de satisfacción laboral.
Equilibrio trabajo vida: Se espera que la variable equilibrio trabajo vida se asocie a la rotación, ya que es importante dedicar el tiempo suficiente y no descuidar ningún aspecto de nuestras vidas, cuando no existe este equilibrio nos podemos ver afectados emocional y psicológicamente. Hipótesis: Las personas que tienen un menor nivel de equilibrio entre el trabajo y su vida personal tienen una mayor posibilidad de rotar que las personas que tiene un mayor nivel de equilibrio en estos aspectos.
1.2 Variables cuantitativas:
Porcentaje de aumento salarial: Se espera que la variable porcentaje de aumento salarial se asocie a la rotación, ya que anualmente los precios de la canasta familiar y el costo de vida incrementan de acuerdo al inflación, por lo cual el salario pierde valor en el tiempo si la empresa no realiza un aumento al menos acorde a este indicador. Hipótesis: Las personas con un menor porcentaje de aumento salarial tienen mayor posibilidad de rotar que las personas con un mayor porcentaje de aumento salarial.
Años última promoción: Se espera que la variable años de la última promoción se asocie a la rotación debido a que para los empleados es importante poder crecer personal, profesional y laboralmente, es importante que las empresas brinden al empleado la oportunidad de ascender cuando su desempeño laboral así lo amerite. Hipótesis: Las personas con mayor cantidad de años desde la última promoción tiene mayor posibilidad de rotar que las personas con menor cantidad de años desde la última promoción.
Años experiencia: Se espera que la variable años de experiencia este asociada a la rotación, ya que cuando una persona está recién egresada es complejo conseguir empleo, mientras que cuando una persona tiene una amplia experiencia laboral las empresas pueden ofrecer constantemente propuestas de cambio de trabajo mejorando las condiciones actuales del trabajador. Hipótesis: Las personas con mayor años de experiencia tienen mayor posibilidad de rotar que las personas con menor años de experiencia.
2.1 Variables cualitativas:
library(ggplot2)
library(ggpubr)
require(ggplot2)
require(ggpubr)
ggplot(datos,aes(x=Departamento))+
geom_bar(fill="#FF4040")+
labs(title="Departamento",x="")+
theme(axis.text = element_text(size=14))
La variable Departamento contiene información sobre la cantidad de personas que pertenecen a cada sección de la empresa (Investigación y Desarrollo, Recursos Humanos, Ventas), se observa que la mayor cantidad de empleados pertenecen al departamento IyD (961 empleados), Ventas con 446 empleados y RH con 63 empleados.
ggplot(datos,aes(x=Satisfación_Laboral))+
geom_bar(fill="#FFD39B")+
labs(title="Satisfacción laboral",x="")+
theme(axis.text = element_text(size=14))
La satisfacción laboral es una variable categórica porque a pesar de estar en números, hacen referencia a categorías que se otorgan por una cualidad que el encuestado da a la satisfacción, donde 1 hace referencia a poca satisfacción laboral, y 4 a mayor satisfacción laboral. De acuerdo al grafico se puede observar que más del 50% de los empleados de la compañía, tienen un mayor nivel de satisfacción laboral.
ggplot(datos,aes(x=Equilibrio_Trabajo_Vida))+
geom_bar(fill="lightblue")+
labs(title="Equilibrio Trabajo Vida",x="")+
theme(axis.text = element_text(size=14))
Equilibrio trabajo vida es una variable categórica porque a pesar de estar en números, hacen referencia al nivel de equilibrio entre la relación trabajo-vida, donde 1 hace referencia a un bajo nivel de equilibrio, mientras que 4 hace referencia a un alto nivel de equilibrio. De acuerdo al grafico se puede observar que el mayor porcentaje de empleados tienen un nivel de equilibrio medio alto respecto a la relación trabajo-vida seguido por un nivel de equilibrio medio bajo.
2.2 Variables cuantitativas:
g1<-ggplot(datos,aes(x=Porcentaje_aumento_salarial))+
geom_histogram(color="black", fill="#FF7F24")
g2<-ggplot(datos, aes(x = 1, y = Porcentaje_aumento_salarial)) + geom_boxplot() +
xlab("Porcentaje aumento salarial")
ggarrange(g1, g2,labels = c("A", "B"),ncol = 2, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
summary(datos$Porcentaje_aumento_salarial)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 11.00 12.00 14.00 15.21 18.00 25.00
En los gráficos de la variable porcentaje de aumento salarial se observa asimetría, la distribución de la cantidad de empleados se encuentra concentrada en su mayoría en los porcentajes más bajos de aumento salarial, mientras que a mayor porcentaje de aumento salarial menor frecuencia de empleados. El porcentaje de aumento salarial tiene una mediana de 14 y el 50 % de los datos se encuentran entre 12% y 18%.
g3<-ggplot(datos,aes(x=Anos_ultima_promoción))+
geom_histogram(color="black", fill="#FFD39B")
g4<-ggplot(datos, aes(x = 1, y = Anos_ultima_promoción)) + geom_boxplot() +
xlab("Años ultima promoción")
ggarrange(g3, g4,labels = c("C", "D"),ncol = 2, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
summary(datos$Anos_ultima_promoción)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 1.000 2.188 3.000 15.000
Los gráficos de la variable años desde la última promoción muestran una distribución asimétrica de los datos, el 50% de los empleados se concentran entre 0 y 3 años desde su última promocion, la mediana es un año desde la última promoción, con un máximo de 15 años.
g5<-ggplot(datos,aes(x=Anos_Experiencia))+
geom_histogram(color="black", fill="#FFD39B")
g6<-ggplot(datos, aes(x = 1, y = Anos_Experiencia)) + geom_boxplot() +
xlab("Años_Experiencia")
ggarrange(g5, g6,labels = c("E", "F"),ncol = 2, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
summary(datos$Anos_Experiencia)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 6.00 10.00 11.28 15.00 40.00
Los gráficos de la variable de experiencia muestran una distribución asimétrica de los datos, el 50% de los empleados se concentran entre 6 y 15 años de experiencia, la mediana es 10 años de experiencia, con un máximo de 40 años de experiencia.
3.1 Variables cualitativas:
require(CGPfunctions)
## Loading required package: CGPfunctions
require(emmeans)
## Loading required package: emmeans
PlotXTabs2(data = datos,x =Departamento,y = Rotación)
La prueba de hipótesis chi-cuadrado calculada entre las variables rotación y departamento, da un valor del estadístico alto y un valor p menor o igual a 0,005 por lo cual se rechaza la hipótesis nula, es decir que se puede considerar que la variable departamento influye en la rotación de los empleados, en el grafico se puede apreciar que el departamento de ventas registra el mayor porcentaje de rotación de personal (21%), seguido del departamento RH con un 19% de rotación.
PlotXTabs2(data = datos,x =Satisfación_Laboral,y = Rotación)
La prueba de hipótesis chi-cuadrado calculada entre las variables rotación y satisfacción laboral, da un valor del estadístico alto y un valor p menor al 0,005 por lo cual se rechaza la hipótesis nula, es decir que se puede considerar que la variable satisfacción laboral influye en la rotación de los empleados, en el grafico se puede apreciar que a menor nivel de satisfacción laboral hay mayor porcentaje de rotación (23%) y a mayor nivel de satisfacción laboral hay menor porcentaje de rotación (11%).
PlotXTabs2(data = datos,x =Equilibrio_Trabajo_Vida,y = Rotación)
La prueba de hipótesis chi-cuadrado calculada entre las variables rotación y Equilibrio_Trabajo_Vida, da un valor del estadístico alto y un valor p menor o igual a 0,005 por lo cual se rechaza la hipótesis nula, es decir que se puede considerar que la variable Equilibrio_Trabajo_Vida influye en la rotación de los empleados, en el grafico se puede apreciar que a menor nivel de equilibrio entre la relación Trabajo_Vida mayor porcentaje de rotación (31%), y a mayor nivel de equilibrio entre la relación Trabajo_Vida menor porcentaje de rotación (18%) .
3.2 Variables cuantitativas:
t.test(datos$Porcentaje_aumento_salarial~datos$Rotación)
##
## Welch Two Sample t-test
##
## data: datos$Porcentaje_aumento_salarial by datos$Rotación
## t = 0.50424, df = 326.11, p-value = 0.6144
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## -0.3890709 0.6572652
## sample estimates:
## mean in group No mean in group Si
## 15.23114 15.09705
El valor p de la prueba t entre las variables Porcentaje de aumento salarial y rotación es mayor que 0,005 por lo cual no existe evidencia suficiente para rechazar la hipótesis nula, por lo cual se puede considerar que no existe diferencia entre la medias del porcentaje entre los grupos de rotación, es decir esta variable no influye en el comportamiento de la rotación de empleados.
t.test(datos$Anos_ultima_promoción~datos$Rotación)
##
## Welch Two Sample t-test
##
## data: datos$Anos_ultima_promoción by datos$Rotación
## t = 1.2879, df = 338.49, p-value = 0.1987
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## -0.1525043 0.7309843
## sample estimates:
## mean in group No mean in group Si
## 2.234388 1.945148
El valor p de la prueba t entre las variables años de la última promoción y rotación es mayor que 0,005 por lo cual no existe evidencia suficiente para rechazar la hipótesis nula, por lo cual se puede considerar que no existe diferencia entre la medias de años de la última promoción entre los grupos de rotación, es decir esta variable no influye en el comportamiento de la rotación de empleados.
t.test(datos$Anos_Experiencia~datos$Rotación)
##
## Welch Two Sample t-test
##
## data: datos$Anos_Experiencia by datos$Rotación
## t = 7.0192, df = 350.88, p-value = 1.16e-11
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
## 2.604401 4.632019
## sample estimates:
## mean in group No mean in group Si
## 11.862936 8.244726
El valor p de la prueba t entre las variables años de experiencia y rotación es menor o igual que 0,005 por lo cual se rechaza la hipótesis nula, por lo cual se puede considerar que existe diferencia entre la medias de años de experiencia entre los grupos de rotación, es decir esta variable influye en el comportamiento de la rotación de empleados.
Con base en el análisis descriptivo univariado y bivariado de las 6 variables seleccionadas, se pudo evidenciar que las variables departamento, satisfacción laboral, equilibrio trabajo vida y años de experiencia influyen en la rotación del personal de la expresa, por lo cual se debería identificar en el departamento ventas internamente que influye en esta rotación, se deberían crear campañas para mejorar la satisfacción laboral y estrategias que permitan que el empleado tenga un equilibrio adecuado entre la carga laboral y su vida personal.