PUNTO 1:
Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación. Nota: Justificar por que estas variables están relacionadas y que tipo de relación se espera (Hipótesis). Ejemplo: Se espera que las horas extra se relacionen con la rotación ya que las personas podrían desgastarse mas al trabajar horas extra y descuidan aspectos personales. La hipótesis es que las personas qu etrabajan horas extra tienen mayor posibilidad de rotar que las que no trabajan extra. (serian 6, una por variable).
Pensar en qué variables pueden influir más en la rotación del personal (no se refiere a despido). Las rotaciones afectan mucho las curvas de desempeño de una compañía, y éstas constantemente buscan retener su personal para evitar gastos en reentrenamientos e inducciones.
SOLUCIÓN:
Primer variable cuantitativa: edad. Se espera que la edad se relacione de forma directa con la rotación debido a que los jóvenes tienen mayores potencialidades temporales para crecer profesionalmente y las compañías no suelen estar en la capacidad de ofrecer constantes ascensos o aumentos salariales significativos. La hipótesis es que las personas menores de 30 años rotan más que las mayores de esta edad.
Segunda variable cuantitativa: porcentaje aumento salarial. Se espera que el porcentaje de aumento salarial se relacione de forma directa con la rotación debido a que aumento bajos podrían afectar el estado de ánimo de los trabajadores y generar comparaciones salariales con los mismos colegas y similares roles en otras oorganizaciones e impulsar búsqueda de nuevas oportunidades laborales. La hipótesis es que las personas que tienen aumento salarial por debajo del promedio rotan más que las que tienen aumentos significativos (mayor al promedio).
Tercera variable cuantitativa: distancia de la casa al trabajo: Se espera que la distancia de la casa al trabajo se relacione de forma directa con la rotación debido a que las personas sienten esa carga adicional de transporte en cuanto a dinero y tiempo específicamente (más considerando aún el tráfico en horas pico). La hipótesis es que las personas que viven a más de 10 Km de la empresa rotan más que las que viven más cerca (menos de 10 km).
Primer variable cualitativa:Viaje de negocios. Se espera que la frecuencia en los viajes de negocios se relacione de forma directa con la rotación debido a que los las personas que más viajan podrían experimentar inconformidad por alejarse de su nucleo familiar y sobrecargar laboral por atender temas de oficina en el viaje de negoicos. La hipótesis es que las personas que viajan de manera frecuento presenten mayor porcentaje de rotación que las que no viajan o rara vez lo hacen.
Segunda variable cualitativa: Estado civil. Se espera que el estado civil se relacione de forma directa con la rotación, debido a que de acuerdo a la condición en que se encuentre el empleado (soltero, casado, divorciado) puede influir en sus deseos de buscar nuevas oportunidades laborales o por el contrario buscar una mayor estabilidad en la misma compañía. La hipótesis es que las personas solteras y divorciadas rotan más que las personas casadas.
Tercera variable cualitativa: Satisfacción laboral. Se espera que la satisfacción laboral se relacione de forma directa con la rotación, debido a que si el empleado no se encuentra a gusto con la compañía podría empezar la búsqueda de nuevas oportunidades laborales que influyan en su decisión de dejar la empresa. La hipótesis es que las personas que no se encuentran satisfechas laboralmente roten más que las que manifiestan satisfacción con su trabajo.
library(readxl)
Datos_Rotacion <- read_excel("C:/Users/Asus/Desktop/Datos_Rotacion.xlsx")
names(Datos_Rotacion)
## [1] "Rotacion" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfacion_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Años_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Años_ultima_promoción" "Años_acargo_con_mismo_jefe"
promedio_edad=mean(Datos_Rotacion$Edad)
mediana_edad=median(Datos_Rotacion$Edad)
minimo_edad=min(Datos_Rotacion$Edad)
maximo_edad=max(Datos_Rotacion$Edad)
promedio_aumento=mean(Datos_Rotacion$Porcentaje_aumento_salarial)
mediana_aumento=median(Datos_Rotacion$Porcentaje_aumento_salarial)
minimo_aumento=min(Datos_Rotacion$Porcentaje_aumento_salarial)
maximo_aumento=max(Datos_Rotacion$Porcentaje_aumento_salarial)
promedio_dist=mean(Datos_Rotacion$Distancia_Casa)
mediana_dist=median(Datos_Rotacion$Distancia_Casa)
minimo_dist=min(Datos_Rotacion$Distancia_Casa)
maximo_dist=max(Datos_Rotacion$Distancia_Casa)
tabla_Edad=data.frame(promedio_edad,mediana_edad,minimo_edad,maximo_edad)
tabla_aumento_sal=data.frame(promedio_aumento,mediana_aumento,minimo_aumento,maximo_aumento)
tabla_distancia_casa=data.frame(promedio_dist,mediana_dist,minimo_dist,maximo_dist)
tabla_Edad
| promedio_edad | mediana_edad | minimo_edad | maximo_edad |
|---|---|---|---|
| 36.92381 | 36 | 18 | 60 |
tabla_aumento_sal
| promedio_aumento | mediana_aumento | minimo_aumento | maximo_aumento |
|---|---|---|---|
| 15.20952 | 14 | 11 | 25 |
tabla_distancia_casa
| promedio_dist | mediana_dist | minimo_dist | maximo_dist |
|---|---|---|---|
| 9.192517 | 7 | 1 | 29 |
prop.table(table(Datos_Rotacion$Rotacion))*100
##
## No Si
## 83.87755 16.12245
PUNTO 2
Realizar un análisis univariado(caracterización). Nota: Losindicadores o gráficos se usan dependiendo del tipo de variable (cuanti o cuali). Incluir interpretaciones de la rotación.
require(ggplot2)
require(ggpubr)
g1=ggplot(Datos_Rotacion,aes(x=Edad))+geom_histogram(binwidth=3, fill="#69b3a2", color="white")+theme_bw()
g2=ggplot(Datos_Rotacion,aes(x=Porcentaje_aumento_salarial))+geom_histogram(binwidth=1, fill="#69b3a2", color="white")+theme_bw()
g3=ggplot(Datos_Rotacion,aes(x=Distancia_Casa))+geom_histogram(binwidth=1, fill="#69b3a2", color="white")+theme_bw()
g4=ggplot(Datos_Rotacion,aes(x=`Viaje de Negocios`))+geom_bar(fill="#69b3a2", color="white")+theme_bw()+theme(axis.text.x=element_text(angle=90))
g5=ggplot(Datos_Rotacion,aes(x=`Estado_Civil`))+geom_bar(fill="#69b3a2", color="white")+theme_bw()
g6=ggplot(Datos_Rotacion,aes(x=`Satisfacion_Laboral`))+geom_bar(fill="#69b3a2", color="white")+theme_bw()
ggarrange(g1, g2, g3, g4, g5,g6, labels = c("A", "B", "C", "D", "E", "F"),ncol = 3, nrow = 2)
GRAFICA A: Indica que el mayor número de personas en la empresa se encuentra entre un rango de edad de 30 a 40 años, observándose una gran desidad con esta caracterización. Apoyándonos en la tabla Edad, también se destaca una media de 37 años y una mediana de 36 años, lo cual da muestra de la simetría de la variable. Por otro lado, la edad máxima es de 60 años y mínima de 18 años.
GRAFICA B: Indica que el mayor % de aumento salarial se presenta en el rango del 11% a 15%. Mientras que aumentos de 25% son muy bajos. Apoyándonos en la tabla de aumento salarial, también se destaca una media de 15.2% y una mediana de 14%. Por otro lado, el mayor % de aumento salarial es de 25% y el menor es de 11%.
GRAFICA C: Indica que la gran mayoría de trabajadores viven en distancias menores a 10 Km de la empresa y se podría considerar además que más de 400 personas del total (1470) residen en las inmedicaciones de la empresa. Apoyándonos en la tabla de distancia a la casa, también se destaca una media de 9.19% y una mediana de 7%, las cuales no son tan similares, denotándose una asmimetría en los datos. Por otro lado, la mayor distancia registrada es de 29 km y la menor de 1 km.
GRAFICA D:Indica que la gran mayoría de los trabajadores (mayor a 1000 del gran total de 1470) viajan raramente, sin embargo, alrededor de 250 perosnas viajan de manera frecuente y una baja proporción nunca viaja.
GRAFICA E:Indica que el estado civil predominante de los trabajadores es “Casado”, sin embargo, hay una buena proporción de personas solteras (entre 400 y 500) y divorciadas (entre 300 y 400).
GRAFICA F:Se debe considerar que 1: Muy insatisfecho:, 2: insatisfecho, 3: satisfecho y 4: Muy satisfecho. Bajo este entendido, la gráfica muestra que son más las personas que presentan manifiestan sensaciones de satisfacción que las que no. Además es importante mencionar que la discriminación entre muy insatisfecho e insatisfecho son muy similares entre sí; al igual que en el caso de satisfecho y muy satisfecho.
PUNTO 3:
Realizar un análisis bivariado (siempre contra la rotación). Nota: Los indicadores y gráficos se usan dependiendo del tipo de variable (cuanti VS cuali, cuali VS cuali). Comparar los resultados con la hipótesis planteada inicialmente y determinar si los datos apoyan o no la hipótesis
require(CGPfunctions)
##GRÁFICAS DE LAS VARIABLES CUANTITATIVAS
##ANÁLISIS BIVARIADO EDAD VS ROTACIÓN
g7=ggplot(Datos_Rotacion,aes(x=Rotacion,y=Edad,fill=Rotacion))+geom_boxplot()+theme_bw()
g7
##Datos estadísticos de Edad en las personas que SI rotan
pos1=Datos_Rotacion$Rotacion=="Si"
Datos_Rotacion_Si=Datos_Rotacion[pos1,]
promedio_edad=mean(Datos_Rotacion_Si$Edad)
mediana_edad=median(Datos_Rotacion_Si$Edad)
minimo_edad=min(Datos_Rotacion_Si$Edad)
maximo_edad=max(Datos_Rotacion_Si$Edad)
tabla_Edad_Si=data.frame(promedio_edad,mediana_edad,minimo_edad,maximo_edad)
tabla_Edad_Si
| promedio_edad | mediana_edad | minimo_edad | maximo_edad |
|---|---|---|---|
| 33.60759 | 32 | 18 | 58 |
##Datos estadísticos de Edad en las personas que NO rotan
pos2=Datos_Rotacion$Rotacion=="No"
Datos_Rotacion_No=Datos_Rotacion[pos2,]
promedio_edad=mean(Datos_Rotacion_No$Edad)
mediana_edad=median(Datos_Rotacion_No$Edad)
minimo_edad=min(Datos_Rotacion_No$Edad)
maximo_edad=max(Datos_Rotacion_No$Edad)
tabla_Edad_No=data.frame(promedio_edad,mediana_edad,minimo_edad,maximo_edad)
tabla_Edad_No
| promedio_edad | mediana_edad | minimo_edad | maximo_edad |
|---|---|---|---|
| 37.56123 | 36 | 18 | 60 |
##Los datos de gráfica y la tabla muestran que el grupo de personas que NO rotan tienen edades superiores al grupo de personas que sí rotan. Por ejemplo para el caso de las personas que SI rotan se tiene un promedio de 33 años, mediana de 32 años, edad máxima de 58 años y mínima de 18 años. Debidoa a la similitud entre la media y mediana podemos considerar simetría en los datos. Por el otro lado, para las personas que NO rotan, se tiene un promedio de edad de de 38 años, una mediada de 36 años y una edad mínima de 18 años y edad máxima de 60 años. Según lo anterior, se puede concluir que no hay suficiente información para corroborar la hipótesis que las personas menores de 30 años rotan más que las mayores de esta edad. Si bien se evidencia en las personas de mayor edad que NO rotan, esta diferencia no es tan marcado como para determinar políticas de mejora que impacten significativamente en el nivel de rotación del personal.
##ANÁLISIS BIVARIADO % AUMENTO SALARIAL VS ROTACIÓN
g8=ggplot(Datos_Rotacion,aes(x=Rotacion,y=Porcentaje_aumento_salarial,fill=Rotacion))+geom_boxplot()+theme_bw()
g8
##Datos estadísticos de la variable % aumento salarial en las personas que SI rotan
promedio_sal=mean(Datos_Rotacion_Si$Porcentaje_aumento_salarial)
mediana_sal=median(Datos_Rotacion_Si$Porcentaje_aumento_salarial)
minimo_sal=min(Datos_Rotacion_Si$Porcentaje_aumento_salarial)
maximo_sal=max(Datos_Rotacion_Si$Porcentaje_aumento_salarial)
tabla_Edad_Si=data.frame(promedio_sal,mediana_sal,minimo_sal,maximo_sal)
tabla_Edad_Si
| promedio_sal | mediana_sal | minimo_sal | maximo_sal |
|---|---|---|---|
| 15.09705 | 14 | 11 | 25 |
##Datos estadísticos de la variable % aumento salarial en las personas que NO rotan
promedio_sal=mean(Datos_Rotacion_No$Porcentaje_aumento_salarial)
mediana_sal=median(Datos_Rotacion_No$Porcentaje_aumento_salarial)
minimo_sal=min(Datos_Rotacion_No$Porcentaje_aumento_salarial)
maximo_sal=max(Datos_Rotacion_No$Porcentaje_aumento_salarial)
tabla_Edad_No=data.frame(promedio_sal,mediana_sal,minimo_sal,maximo_sal)
tabla_Edad_No
| promedio_sal | mediana_sal | minimo_sal | maximo_sal |
|---|---|---|---|
| 15.23114 | 14 | 11 | 25 |
##Los datos de gráfica y la tabla muestran que el porcentaje de aumento salarial no es tan significativo como para influir en la decisión de rotación de un trabajador. De la tabla, además se puede observar que en los dos grupos se tiene promedio de salario, median, máximo y mínimo muy similares (casi iguales). Según lo anterior, se puede concluir que la hipótesis que expresa que las personas que tienen aumento salarial por debajo del promedio rotan más que las que tienen aumentos significativos (mayor al promedio) es incorrecta y no debe ser tenida en cuenta a la hora de generar una politica de bienestar laboral y retención de personal.
##ANÁLISIS BIVARIADO DISTANCIA DE LA CASA AL TRABAJO VS ROTACIÓN
g9=ggplot(Datos_Rotacion,aes(x=Rotacion,y=Distancia_Casa,fill=Rotacion))+geom_boxplot()+theme_bw()
g9
##Datos estadísticos de la variable distancia casa al trabajo en las personas que SI rotan
promedio_dist=mean(Datos_Rotacion_Si$Distancia_Casa)
mediana_dist=median(Datos_Rotacion_Si$Distancia_Casa)
minimo_dist=min(Datos_Rotacion_Si$Distancia_Casa)
maximo_dist=max(Datos_Rotacion_Si$Distancia_Casa)
tabla_Edad_Si=data.frame(promedio_dist,mediana_dist,minimo_dist,maximo_dist)
tabla_Edad_Si
| promedio_dist | mediana_dist | minimo_dist | maximo_dist |
|---|---|---|---|
| 10.63291 | 9 | 1 | 29 |
##Datos estadísticos de la variable distancia casa al trabajo en las personas que NO rotan
promedio_dist=mean(Datos_Rotacion_No$Distancia_Casa)
mediana_dist=median(Datos_Rotacion_No$Distancia_Casa)
minimo_dist=min(Datos_Rotacion_No$Distancia_Casa)
maximo_dist=max(Datos_Rotacion_No$Distancia_Casa)
tabla_Edad_No=data.frame(promedio_dist,mediana_dist,minimo_dist,maximo_dist)
tabla_Edad_No
| promedio_dist | mediana_dist | minimo_dist | maximo_dist |
|---|---|---|---|
| 8.915653 | 7 | 1 | 29 |
##Los datos de gráfica y la tabla muestran que el grupo de personas que más rotan viven mayoritariamente más lejos que el grupo de personas que no rotan. Sin embargo, no se evidencia mayor peso en esta variable. Según lo anterior, se puede concluir que la hipótesis que expresa que las personas que viven a más de 10 Km de la empresa rotan más que las que viven más cerca (menos de 10 km) no es totalmente correcta y no debería considerarse a la hora de estructurar el plan de retención del personal, a menos que sea abordado de manera indirectamente con otro tipo de variable (por ejemplo nivel de satisfacción laboral)
##GRÁFICAS DE LAS VARIABLES CATEGÓRICAS
## ANÁLISIS BIVARIADO VIAJE DE NEGOCIOS VS ROTACIÓN
Datos_Rotacion$`Viaje de Negocios`=factor(Datos_Rotacion$`Viaje de Negocios`,levels = c("No_Viaja","Raramente","Frecuentemente"))
Datos_Rotacion$`Rotacion`=factor(Datos_Rotacion$`Rotacion`,levels = c("Si","No"))
g10=PlotXTabs2(Datos_Rotacion,`Viaje de Negocios`,Rotacion, plottype = "percent")
g10
table1=table(Datos_Rotacion$`Viaje de Negocios`,Datos_Rotacion$Rotacion)
prop.table(table1,margin = 1)*100
##
## Si No
## No_Viaja 8.00000 92.00000
## Raramente 14.95686 85.04314
## Frecuentemente 24.90975 75.09025
##Los datos de gráfica y la tabla muestran que a medida que aumenta el nivel de frecuencia de viaje (empezando por la frecuencia nula de no viaje, seguida por viaja raramente, hasta la opción de viajes frecuentes), también aumenta de forma directa el porcentaje de rotación del personal. Por ejemplo, mientras en el grupo poblacional de los que no viajan se presenta un porcentaje de 8% de rotación, en el grupo de los que viajan frecuentemente este porcentaje se triplica, alcanzado 24%. Otro aspecto a resaltar es que la gran mayoría del personal (1043/1470) se encuentra en el grupo poblacional de los que viajan raramente. Según lo anterior, se puede concluir que se comprueba la hipótesis que las personas que viajan de manera frecuente presenten mayor porcentaje de rotación que las que no viajan o rara vez lo hacen.
## ANÁLISIS BIVARIADO VIAJE ESTADO CIVIL VS ROTACIÓN
g11=PlotXTabs2(Datos_Rotacion, Estado_Civil,Rotacion, plottype = "percent")
g11
table2=table(Datos_Rotacion$`Estado_Civil`,Datos_Rotacion$Rotacion)
prop.table(table2,margin = 1)*100
##
## Si No
## Casado 12.48143 87.51857
## Divorciado 10.09174 89.90826
## Soltero 25.53191 74.46809
##Los datos de gráfica y la tabla muestran que el mayor porcentaje de rotación se presenta en las personas solteras con un 26% mientras que las personas divorciadas o casadas presentan menos de la mitad (<13%) del porcentaje de rotación que las casadas. Según lo anterior, se puede concluir que se comprueba parcialmente la hipótesis que establecía que las personas solteras y divorciadas rotan más que las personas casadas; ya que si bien se observa que las personas solteras son las que más rotación presentan, por otro lado, las personas divorsiadas son las que menos rotación presentan, siendo este último argumento lo contrario de la hipótesis.
## ANÁLISIS BIVARIADO SATISFACCIÓN LABORAL VS ROTACIÓN
g12=PlotXTabs2(Datos_Rotacion, Satisfacion_Laboral,Rotacion, plottype = "percent")
g12
table3=table(Datos_Rotacion$`Satisfacion_Laboral`,Datos_Rotacion$Rotacion)
prop.table(table3,margin = 1)*100
##
## Si No
## 1 22.83737 77.16263
## 2 16.42857 83.57143
## 3 16.51584 83.48416
## 4 11.32898 88.67102
##Los datos de gráfica y la tabla muestran que las personas con satisfacción laboral de 1 (muy insatisfechos) son los que mayor porcentaje de rotación presentan con un 23%, mientras que el grupo población 4 (muy satisfechos) es el que menor nivel de rotación presentan con 11%. Algo particular sucede en los grupos poblacionales 2 y 3 (insatisfecho y satisfecho respectivamente), ya que presentan un porcentaje de rotación muy similar entre el 16% y 17%, lo que hace pensar que en estos rangos medios de satisfacción la variable no es tan significativa pero en los extremos (muy insatisfecho y satisfecho) sí lo es. Según lo anterior, se puede concluir que se comprueba parcialmete la hipótesis que las personas que no se encuentran satisfechas laboralmente roten más que las que manifiestan satisfacción con su trabajo; ya que si bien los muy insatisfechos rotan más que los muy satisfechos con una diferencia porcentual en % de rotación de 12%, esta diferencia no se ve tan marcada en los insatisfechos y satisfechos con sólo una diferencia del 1%.
PUNTO 4: En las conclusiones se discute sobre cual seria la estrategia para disminuir la rotación en la empresa. Ejemplo: Mejorar el ambiente laboral, los incentivos económicos, distribuir la carga de horas extra (menos turnos y mas personal)
ESTRATEGIA RECOMENDADA PARA LA EMPRESA:
Identificar a las personas que realizan viajes de manera frecuente y poner en marcha un plan de bonificación ya sea económico o por días compensatorios por cada semana de viaje. Por ejemplo podría funcionar una política de revisión de viáticos y condiciones de viaje sumado a una política de acumulación de 1 día libre a manera de compensatorio por cada 12 días de viajes.
Elaborar un diagnóstico de las condiciones de trabajo, salarios, equipos, y demás que permita conocer las razones principales por las cuales el personal manifiesta estar muy insatisfecho. Una vez establecido tomar acciones al respecto, y se podría considerar además, implementar una política de home-office lo cual ha influenciado positivamente los niveles de satisfacción laboral, y de pasa se aborda otra variable como es el distanciamiento de algunas personas a la oficina.
Recomendaría iniciar con estas dos estrategias, ya que si bien la variable de estado civil es influyente, hay pocas alternativas que la empresa pueda tomar respecto a su mitigación, considerando que obedecen a decisiones personales.