Punto 1. Selección de hipótesis

H1.Viajes laborales. Se espera que las personas que tengan que viajar con mayor frecuencia podrían tener una mayor rotación, debido al desgaste fisico que produce o menor tiempo disponible para compartir con la familia e hijos.

H2.Dpto de Ventas. Se espera que las personas que trabajen en ventas puedan tener mayor rotación asociado al cumplimiento de metas de ventas u oportunidades laborales con mayores esquemas de comisión en otras empresas.

H3.Equilibrio vida personal. Las personas que manifiestan tener poco equlibrio entre la vida personal y el trabajo buscan cambiar a trabajos que le permitan alcanzar ese equilibrio deseado.

H4.Cantidad de trabajos. Las personas que las personas con mayor cantidad de trabajos anteriores tengan una mayor rotación, debido a problemas de adaptación al cargo o a la cultura de la empresa o acceso a mejores salarios.

H5.% Aumento salario. Se espera que las personas con menor tasa de aumento laboral tengan una mayor rotación buscando aumentar su nivel de ingresos.

H6.Capacitaciones. Se espera que las personas con menor número de capacitaciones tengan mayor rotación buscando nuevas opciones laborales que les permitan fortalecer sus conocimiento s.

Punto 2. Caracterización Variables independientes

#Transformar variable satisfacción laboral
library(readxl)
Datos_R=read_excel("~/Maestria/Simulacion estadistica/Datos_Rotacion.xlsx")
require(dplyr)
## Loading required package: dplyr
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
Datos_Re=Datos_R %>%
  mutate(Equilibrio=case_when(Equilibrio_Trabajo_Vida==1~"bajo",
                            Equilibrio_Trabajo_Vida==2~"regular",
                            Equilibrio_Trabajo_Vida==3~"bueno",
                            Equilibrio_Trabajo_Vida==4~"excelente"))

Variables categoricas

require(ggplot2)
require(ggpubr)
require(ggplot2)
require(ggpubr)
names (Datos_Re)[1] = "Rotacion"

g1=ggplot(Datos_Re,aes(x=`Viaje de Negocios`))+geom_bar(aes(x = `Viaje de Negocios`),fill ='orange')+theme_bw()
g2=ggplot(Datos_Re,aes(x=Departamento))+geom_bar(aes(x = Departamento),fill ='orange')+theme_bw()
g3=ggplot(Datos_Re,aes(x=Equilibrio))+geom_bar(aes(x = Equilibrio),fill ='orange')+theme_bw()
g4=ggplot(Datos_Re,aes(x=Rotacion))+geom_bar(aes(x =Rotacion),fill ='orange')+theme_bw()

ggarrange(g1,g2,g3,g4,labels=c("A","B","C","D"), ncol=2,nrow=2)

Tablas de frecuencia

prop.table(table(Datos_Re$`Viaje de Negocios`))*100
## 
## Frecuentemente       No_Viaja      Raramente 
##       18.84354       10.20408       70.95238
prop.table(table(Datos_Re$Departamento))*100
## 
##       IyD        RH    Ventas 
## 65.374150  4.285714 30.340136
prop.table(table(Datos_Re$Equilibrio))*100
## 
##      bajo     bueno excelente   regular 
##  5.442177 60.748299 10.408163 23.401361
prop.table(table(Datos_Re$Rotacion))*100
## 
##       No       Si 
## 83.87755 16.12245

Discusión resultados análisis univariable - Variables cualitativas

H1. Sólo el 18% de los empleados viaja de manera frecuente. No se descarta como un factor que incida en la rotación pero puede que solo lo haga para una determinada proporción de la población con ciertas características.

H2. El 30% de los empleados pertenece al area de ventas. Con esta información no se puede descartar o profundizar en la hipotesis inicial sobre su impacto en la rotación.

H3. Un 29% de los empleados opinan que el equilibrio entre la vida personal y laboral en la empresa es bajo o regular. Es una cifra importante, que puede estar afectando las cifras de rotación

Se tiene una rotación del 16% del total de la planta encuestada.

Variables cuantitativas

g5=ggplot(Datos_Re,aes(x=Trabajos_Anteriores))+geom_histogram(color="black", fill="orange")+theme_bw()
g6=ggplot(Datos_Re,aes(x=Porcentaje_aumento_salarial))+geom_histogram(color="black", fill="orange")+theme_bw()
g7=ggplot(Datos_Re,aes(x=Capacitaciones))+geom_histogram(color="black", fill="orange")+theme_bw()


ggarrange(g5,g6,g7,labels=c("E","F","G"), ncol=2,nrow=2)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Estadísticos tendencia central - Variables cuantitativas

#Tabla Trabajos anteriores
promedio_trabajos=mean(Datos_Re$Trabajos_Anteriores,na.rm = TRUE)
mediana_trabajos=median(Datos_Re$Trabajos_Anteriores,na.rm = TRUE)
maximo_trabajos=max(Datos_Re$Trabajos_Anteriores)
minimo_trabajos=min(Datos_Re$Trabajos_Anteriores)

#Tabla Aumento salarial
promedio_aumento=mean(Datos_Re$Porcentaje_aumento_salarial,na.rm = TRUE)
mediana_aumento=median(Datos_Re$Porcentaje_aumento_salarial,na.rm = TRUE)
maximo_aumento=max(Datos_Re$Porcentaje_aumento_salarial)
minimo_aumento=min(Datos_Re$Porcentaje_aumento_salarial)

#Tabla Capacitaciones
promedio_capacitaciones=mean(Datos_Re$Capacitaciones,na.rm = TRUE)
mediana_capacitaciones=median(Datos_Re$Capacitaciones,na.rm = TRUE)
maximo_capacitaciones=max(Datos_Re$Capacitaciones)
minimo_capacitaciones=min(Datos_Re$Capacitaciones)

#Generación tablas resumen
resultado_trabajos=data.frame(promedio_trabajos,mediana_trabajos,maximo_trabajos,minimo_trabajos)
resultado_aumentos=data.frame(promedio_aumento,mediana_aumento,maximo_aumento,minimo_aumento)
resultado_capacitaciones=data.frame(promedio_capacitaciones,mediana_capacitaciones,maximo_capacitaciones,minimo_capacitaciones)

resultado_trabajos
promedio_trabajos mediana_trabajos maximo_trabajos minimo_trabajos
2.693197 2 9 0
resultado_aumentos
promedio_aumento mediana_aumento maximo_aumento minimo_aumento
15.20952 14 25 11
resultado_capacitaciones
promedio_capacitaciones mediana_capacitaciones maximo_capacitaciones minimo_capacitaciones
2.79932 3 6 0

Discusión resultados análisis univariable - Variables cuantitativas

H4. La mediana de No de trabajos anteriores es baja, ubicandose en 2. Estos resultados indicarian en una primera etapa que un mayor número de trabajos no esta incidiendo de manera negativa en la rotación. Una pregunta que surge es elresultado del cruce del número de trabajos y edad, para validar si la poca experiencia y edad podrían ser un determinante.

H5. El aumento salarial es desigual y existe un grupo importante que recibe mayores incrementos salariales en comparación al resto.Esto podría indicar preferencias o criterios diferentes para fijar los aumentos salariales, generando incentivos para buscar nuevos trabajos, aumentando la rotación.

H6. En general se presenta un número similar de capacitaciones para todos. Puede que en lineas generales se perciba por parte de los empleados que el número recibida es baho en comparación a la necesidades.

Punto 3. Analisis Bivariado

require(CGPfunctions)
## Loading required package: CGPfunctions
require(plotly)
## Loading required package: plotly
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
PlotXTabs2(Datos_Re,`Viaje de Negocios`,Rotacion,plottype = "percent")

PlotXTabs2(Datos_Re, Departamento,Rotacion,plottype = "percent")

PlotXTabs2(Datos_Re, Equilibrio,Rotacion,plottype = "percent")

g4=ggplot(Datos_Re,aes(Rotacion,Trabajos_Anteriores,fill=Rotacion))+geom_violin()+geom_boxplot(fill="black", color="white",lwd=0.001, width=0.001)+theme_bw()+ scale_fill_brewer(palette= "Set2")+   theme(legend.position = "none")+
  xlab("Rotacion")+  ylab("No trabajos anteriores")+ coord_flip()
g5=ggplot(Datos_Re,aes(x=Rotacion,y=Porcentaje_aumento_salarial,fill=Rotacion))+geom_boxplot()+theme_bw()
g6=ggplot(Datos_Re,aes(x=Rotacion,y=Capacitaciones,fill=Rotacion))+geom_boxplot()+theme_bw()

ggplotly(g4)
ggplotly(g5)
ggplotly(g6)

Conclusión

El análisis bivariado permite concluir en primera instancia que las siguientes variables podrían ser objeto de una política:

Propuesta: La estrategia tendría tres frentes, el primero estaría enfocado en generar acciones que permitan un mayor equilibrio entre la vida laboral y personal, para lo cual se daría la opción de un horario diferencial dos viernes del mes donde se trabajara hasta mediodía, permitiendo que las personas puedan tener un fin de semana más largo para disfrutar con su familia e intereses personales. Adicional se establecerían horarios flexibles que permitan que las personas cumplan con las horas de trabajo en el espacio que mejor se adecue a sus intereses (ejercicio, vida familiar, estudio, entre otras). Finalmente, la empresa contratará un mensajero que realizara todas las vueltas o diligencias personales que pueda realizarle a los empleados (consignaciones, pago de servicios, compras, entre otros).

El segundo frente estaría en estandarizar y divulgar los criterios de aumento salarial, de tal forma que todas las personas tengan claro como poder acceder a los rangos más altos y sean transparentes las condiciones especiales que determinadas areas puedan tener. Es importante validar que en la practica no se presenten manejos especiales de la política.

El tercer frente estaria en la realización de grupos focales en el área de ventas que permitan establecer cuales son las condiciones particulares de la misma que pueden estar influyendo para tener la mayor tasa de rotación de la compañía. Una mayor profundización de los datos podrían ayudar a estructurar estos grupos y definir unas hipotesis a validar.