1.Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación. ## Nota: Justificar por que estas variables están relacionadas y que tipo de relación se espera (Hipótesis). Ejemplo: Se espera que las horas extra se relacionen con la rotación ya que las personas podrían desgastarse mas al trabajar horas extra y descuidan aspectos personales. La hipótesis es que las personas que trabajan horas extra tienen mayor posibilidad de rotar que las que no trabajan extra. (serian 6, una por variable).
library(readxl) datos = read_excel(“C:/Users/LUISA GIRALDO/Desktop/Masters/Maestria Ciencia de Datos/1semestre/Metodos y simulacion estadisica/Actividad 2/YDRAY-Datos_Rotacion (2).xlsx”)
Viaje de Negocios:Si se viaja demasiado puede que haga que las personas quieran irse, ya que no permitiria para muchos tener vida social y en el caso de tener familias probablemente descuidarlas.
Departamento: Personas que pertenecen a cierto departamento pueden rotar debido a la carga laboral que se encuentre en el mismo, es decir, no hay suficientes personas en el departamento y las labores les estan quedan muy pesadas.
Genero: Si en la compañia hay mas mujeres que hombres o viceversa, pueda que se aburran las persona, ya que sientan que no se pueden integrar o que no hay mucho en comun, por lo cual pueden pensar que quieren irse de la compañia para un ambiente mas apto.
Cargo: puede que el cargo sea muy nuevo y el mismo todavia no este bien diseñado, lo cual haga que las personas se aburran y decidan irse.
Estado civil: dependiendo del trabajo puede que una persona soltera que no tenga obligaciones decida rotar mas hasta que encuentre un lugar que le llame mas la atencion y cumpla con sus expectativas.
Horas Extras: la personas pueden estar rotando porque no tienen suficiente horas extras.
Edad: personas jovenes pueden tender a cambiar mas de trabajo, ya que las mismas estan dispuestas a tomar riesgos y tener diferentes experiencias.
Distancia casa: si una persona vive muy lejos de la compañia y esta se gasta gran cantidad de tiempo en el viaje, ademas de que la empresa no le paga biaticos, entonces para una situacion de estas, puede existir bastante rotacion debido al costo-beneficio.
Ingreso mensual:probablemente el ingreso mensual no era suficiente para cubrir necesidades y decide irse a buscar mejores oportunidades.
% Aumento salarial: la persona lleva tiempo en la compañia y cuando revisa sus ingresos en diferentes años, nota que el aumento que ha tenido en su salario es muy poco para el trabajo que debe realizar.
Años de experiencia: si la persona no tiene mucha experiencia y siente que las cosas en la compañia son un poco confusas, pueda que decida irse, donde si pueda tener un mejor entendimiento en sus labores.
Antiguedad: esta variable puede decir que las personas que llevan mucho tiempo en la compañia no rotarian porque se encuentran una zona de confort, pero una persona que apenas empieza puede buscar cambiar mas rapido.
2.Realizar un análisis univariado (caracterización). Nota: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuanti o cuali). Incluir interpretaciones de la rotación.
library(readxl)
datos = read_excel("C:/Users/LUISA GIRALDO/Desktop/Masters/Maestria Ciencia de Datos/1semestre/Metodos y simulacion estadisica/Actividad 2/YDRAY-Datos_Rotacion (2).xlsx")
require(ggplot2)
require(ggpubr)
# VARIABLES CATEGORICAS
g1=ggplot(datos,aes(x=`Viaje de Negocios`))+geom_bar()+theme_bw()+theme(axis.text.x = element_text(angle = 90))
g2=ggplot(datos,aes(x=Departamento))+geom_bar()+theme_bw()
g3=ggplot(datos,aes(x=Genero))+geom_bar()+theme_bw()
g4=ggplot(datos,aes(x=Cargo))+geom_bar()+theme_bw()+theme(axis.text.x = element_text(angle = 90))
g5=ggplot(datos,aes(x=Estado_Civil))+geom_bar()+theme_bw()
g6=ggplot(datos,aes(x=Horas_Extra))+geom_bar()+theme_bw()
g_rotacion=ggplot(datos,aes(x=Rotación))+geom_bar()+theme_bw()
#VARIABLES CUANTITATIVAS
g1c=ggplot(datos,aes(x=Edad))+geom_histogram()+theme_bw()
g2c=ggplot(datos,aes(x=Distancia_Casa))+geom_histogram()+theme_bw()
g3c=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
g4c=ggplot(datos,aes(x=Porcentaje_aumento_salarial))+geom_histogram()+theme_bw()
g5c=ggplot(datos,aes(x=Años_Experiencia))+geom_histogram()+theme_bw()
g6c=ggplot(datos,aes(x=Antigüedad))+geom_histogram()+theme_bw()
g_rotacion
graf_cat=ggarrange(g1, g2, g3, g4, g5, g6,labels = c("A", "B","C","D","E","F"), ncol = 3, nrow = 2)
graf_cat
graf_cual=ggarrange(g1c, g2c, g3c, g4c, g5c, g6c,labels = c("G", "H","I","J","K","L"), ncol = 3, nrow = 2)
graf_cual
round(prop.table(table(datos$Rotación))*100,digits = 0)
##
## No Si
## 84 16
En las variables categoricas se noto que: Las personas que trabajan en la compañia en su mayoria viajan raramente, que el departamento IyD posee la mayor cantidad de trabajadores. En la empresa trabajan mas hombres que mujeres no es una diferencia muy grande. En los cargos hay tres que muestran exactamente cual es el core de la compañia, ya que para el mismo hay mas ejecutivos de ventas, Investigadores cientificos y Tecnicos de laboratorio.En su mayoria los trabajadores no hacen muchas horas extras, esto puede ir relacionado con la carga laboral.
Por otro lado, para las variables cuantitativas, se noto que: la mayoria de personas se encuentran en un rango de edad entre 30 y 40 años, donde la edad promedio es de 37 años aproximadamente.Ademas, las personas que trabajan en la compañia viven en su mayoria cerca de la empresa y estas reciben aproximadamente de 0 a 15% de aumento en el salario. En la compañia se nota que las personas que estan en la compañia llevan la misma cantidad de años de experiencia con respecto a la antiguedad, lo que podria decir que es ahi donde las mismas han ido creciendo en conocimiento.
edad_promedio=round(mean(datos$Edad),0)
ingreso_promedio= round(mean(datos$Ingreso_Mensual),0)
mean(datos$Años_Experiencia)
## [1] 11.27959
max(datos$Años_Experiencia)
## [1] 40
3.Realizar un análisis bivariado (siempre contra la rotación). Nota: Los indicadores y gráficos se usan dependiendo del tipo de variable (cuanti VS cuali, cuali VS cuali). Comparar los resultados con lahipótesis planteada inicialmente y determinar si los datos apoyan o no la hipótesis.
require(CGPfunctions)
require(ggpubr)
require(plotly)
g1r=ggplot(datos,aes(x=Rotación, y=Edad, fill=Rotación))+geom_boxplot()+theme_bw()
g2r=ggplot(datos,aes(x=Rotación, y=Distancia_Casa, fill=Rotación))+geom_boxplot()+theme_bw()
g3r=ggplot(datos,aes(x=Rotación, y=Ingreso_Mensual, fill=Rotación))+geom_boxplot()+theme_bw()
g4r=ggplot(datos,aes(x=Rotación, y=Porcentaje_aumento_salarial, fill=Rotación))+geom_boxplot()+theme_bw()+ylab("%Aumento salario")
g5r=ggplot(datos,aes(x=Rotación, y=Años_Experiencia, fill=Rotación))+geom_boxplot()+theme_bw()
g6r=ggplot(datos,aes(x=Rotación, y=Antigüedad, fill=Rotación))+geom_boxplot()+theme_bw()
##Segun lo que muestra la grafica entre edad y rotación, es que si estaba relacionada con personas jovenes y esto se puede basar como en un principio se dijo, a que las mismas quieren obtener experiencia, ademas de tomar la decision cual es el campo por el cual quisieran enfocarse. En la grafica g1r, se muestra que la diferncia no es gigantesca pero que si las personas mas jovenes han decidico irse.
ggplotly(g1r)
##En el caso de la variable rotación contra la distancia en donde la persona vive, si se logro diferenciar que las personas entre mas lejos viven tambien deciden irse de la compañia.
ggplotly(g2r)
##Acontinuación se muestra como la variable de ingreso mensual, si influye en la decision de rotacion para las personas, ya que se ve que para quienes estan ganando menos, son quienes han rotado. Lo que comprueba la primera hipotesis que se realizo.
ggplotly(g3r)
##En caso de la variable rotación relacionada con el % en el aumento del salario, la hipotesis no se muestra claramente en la grafica, ya que las diferencias entre las personas que rotaron y no rotaron no es muy grande, lo que nos puede decir que para el caso de la rotación el porcentaje en el aumento salarial, no es una variable significativa en el analisis.
ggplotly(g4r)
##La primera hipotesis planteada se comprobo con la grafica, ya que se vio que personas que no tienen menos años de experiencia deciden irse, y esto puede ser debido a que los puestos no estan claramente definidos y les esta quedando un poco complicado desembolverse en sus labores.
ggplotly(g5r)
##La hipotesis se comprobo, mostrando que las personas que tenian menor tiempo en la compañia estaban rotando mucho mas que las personas que tenian antiguedad en la misma.
ggplotly(g6r)
datos$`Viaje de Negocios`=factor(datos$`Viaje de Negocios`,levels = c("Frecuentemente","Raramente","No_Viaja"))
tabla1=table(datos$`Viaje de Negocios`,datos$Rotación)
round(prop.table(tabla1,margin = 1)*100,0)
##
## No Si
## Frecuentemente 75 25
## Raramente 85 15
## No_Viaja 92 8
g1cr=PlotXTabs2(datos,`Viaje de Negocios`, Rotación, plottype = "percent" )
g2cr=PlotXTabs2(datos,Departamento, Rotación, plottype = "percent" )
g3cr=PlotXTabs2(datos,Genero, Rotación, plottype = "percent" )
g4cr=PlotXTabs2(datos,Cargo, Rotación, plottype = "percent" )+theme(axis.text.x = element_text(angle = 90))
g5cr=PlotXTabs2(datos,Estado_Civil, Rotación, plottype = "percent" )
g6cr=PlotXTabs2(datos,Horas_Extra, Rotación, plottype = "percent" )
## Se noto claramente que las personas que viajan mas son las que deciden rotar y esto se noto con la grafica donde se muestra como hay aumento en las rotaciones cuando hay mas viajes.
g1cr
##Esta hipotesis tambien se compromo ya que se muestra que las personas que existe un nivel de rotación de acuerdo a los departamentos, y claramente las personas en ventas rotaron mucho mas que las personas en los otros departamentos. Esto puede ser debido a la carga laboral y a las expectativas de ventas ajustadas para cada trabajador.
g2cr
## El genero se noto que realmente tampoco es una variable significativa, ya que la diferencia de rotación entre generos no es muy diferente.
g3cr
##La hipotesis se comprobo con respecto a los cargos y esta tambien va conectada con los departamentos, en la cual se muestra que hay mayor rotacion para los representantes de ventas, lo que puede deberse a diferentes razones tales como: metas no realistas, presión laboral y demas.
g4cr
##La hipotesis se comprobo ya que las personas solteras rotan mucho mas que las persona que estan casadas o divorcidas, ya que en estas dos ultimas no se encuentra una importante diferencia.
g5cr
##La hipotesis se comprobo ya que las personas que si tienen horas extras tienden a rotar mas que las personas que no tienen las mismas.
g6cr
##ESTRATEGIAS.