Actividad 2

1.Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación. ## Nota: Justificar por que estas variables están relacionadas y que tipo de relación se espera (Hipótesis). Ejemplo: Se espera que las horas extra se relacionen con la rotación ya que las personas podrían desgastarse mas al trabajar horas extra y descuidan aspectos personales. La hipótesis es que las personas que trabajan horas extra tienen mayor posibilidad de rotar que las que no trabajan extra. (serian 6, una por variable).

library(readxl) datos = read_excel(“C:/Users/LUISA GIRALDO/Desktop/Masters/Maestria Ciencia de Datos/1semestre/Metodos y simulacion estadisica/Actividad 2/YDRAY-Datos_Rotacion (2).xlsx”)

Variables categoricas:

  1. Viaje de Negocios:Si se viaja demasiado puede que haga que las personas quieran irse, ya que no permitiria para muchos tener vida social y en el caso de tener familias probablemente descuidarlas.

  2. Departamento: Personas que pertenecen a cierto departamento pueden rotar debido a la carga laboral que se encuentre en el mismo, es decir, no hay suficientes personas en el departamento y las labores les estan quedan muy pesadas.

  3. Genero: Si en la compañia hay mas mujeres que hombres o viceversa, pueda que se aburran las persona, ya que sientan que no se pueden integrar o que no hay mucho en comun, por lo cual pueden pensar que quieren irse de la compañia para un ambiente mas apto.

  4. Cargo: puede que el cargo sea muy nuevo y el mismo todavia no este bien diseñado, lo cual haga que las personas se aburran y decidan irse.

  5. Estado civil: dependiendo del trabajo puede que una persona soltera que no tenga obligaciones decida rotar mas hasta que encuentre un lugar que le llame mas la atencion y cumpla con sus expectativas.

  6. Horas Extras: la personas pueden estar rotando porque no tienen suficiente horas extras.

Variables cuantitativas:

  1. Edad: personas jovenes pueden tender a cambiar mas de trabajo, ya que las mismas estan dispuestas a tomar riesgos y tener diferentes experiencias.

  2. Distancia casa: si una persona vive muy lejos de la compañia y esta se gasta gran cantidad de tiempo en el viaje, ademas de que la empresa no le paga biaticos, entonces para una situacion de estas, puede existir bastante rotacion debido al costo-beneficio.

  3. Ingreso mensual:probablemente el ingreso mensual no era suficiente para cubrir necesidades y decide irse a buscar mejores oportunidades.

  4. % Aumento salarial: la persona lleva tiempo en la compañia y cuando revisa sus ingresos en diferentes años, nota que el aumento que ha tenido en su salario es muy poco para el trabajo que debe realizar.

  5. Años de experiencia: si la persona no tiene mucha experiencia y siente que las cosas en la compañia son un poco confusas, pueda que decida irse, donde si pueda tener un mejor entendimiento en sus labores.

  6. Antiguedad: esta variable puede decir que las personas que llevan mucho tiempo en la compañia no rotarian porque se encuentran una zona de confort, pero una persona que apenas empieza puede buscar cambiar mas rapido.

2.Realizar un análisis univariado (caracterización). Nota: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuanti o cuali). Incluir interpretaciones de la rotación.

library(readxl)
datos = read_excel("C:/Users/LUISA GIRALDO/Desktop/Masters/Maestria Ciencia de Datos/1semestre/Metodos y simulacion estadisica/Actividad 2/YDRAY-Datos_Rotacion (2).xlsx")

require(ggplot2)
require(ggpubr)

# VARIABLES CATEGORICAS
g1=ggplot(datos,aes(x=`Viaje de Negocios`))+geom_bar()+theme_bw()+theme(axis.text.x = element_text(angle = 90))
g2=ggplot(datos,aes(x=Departamento))+geom_bar()+theme_bw()
g3=ggplot(datos,aes(x=Genero))+geom_bar()+theme_bw()
g4=ggplot(datos,aes(x=Cargo))+geom_bar()+theme_bw()+theme(axis.text.x = element_text(angle = 90))
g5=ggplot(datos,aes(x=Estado_Civil))+geom_bar()+theme_bw()
g6=ggplot(datos,aes(x=Horas_Extra))+geom_bar()+theme_bw()
g_rotacion=ggplot(datos,aes(x=Rotación))+geom_bar()+theme_bw()

#VARIABLES CUANTITATIVAS

g1c=ggplot(datos,aes(x=Edad))+geom_histogram()+theme_bw()
g2c=ggplot(datos,aes(x=Distancia_Casa))+geom_histogram()+theme_bw()
g3c=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
g4c=ggplot(datos,aes(x=Porcentaje_aumento_salarial))+geom_histogram()+theme_bw()
g5c=ggplot(datos,aes(x=Años_Experiencia))+geom_histogram()+theme_bw()
g6c=ggplot(datos,aes(x=Antigüedad))+geom_histogram()+theme_bw()


g_rotacion

graf_cat=ggarrange(g1, g2, g3, g4, g5, g6,labels = c("A", "B","C","D","E","F"), ncol = 3, nrow = 2)

graf_cat

graf_cual=ggarrange(g1c, g2c, g3c, g4c, g5c, g6c,labels = c("G", "H","I","J","K","L"), ncol = 3, nrow = 2)

graf_cual

Interpretación

round(prop.table(table(datos$Rotación))*100,digits = 0)
## 
## No Si 
## 84 16
edad_promedio=round(mean(datos$Edad),0)
ingreso_promedio= round(mean(datos$Ingreso_Mensual),0)
mean(datos$Años_Experiencia)
## [1] 11.27959
max(datos$Años_Experiencia)
## [1] 40

3.Realizar un análisis bivariado (siempre contra la rotación). Nota: Los indicadores y gráficos se usan dependiendo del tipo de variable (cuanti VS cuali, cuali VS cuali). Comparar los resultados con lahipótesis planteada inicialmente y determinar si los datos apoyan o no la hipótesis.

require(CGPfunctions)
require(ggpubr)
require(plotly)

g1r=ggplot(datos,aes(x=Rotación, y=Edad, fill=Rotación))+geom_boxplot()+theme_bw()
g2r=ggplot(datos,aes(x=Rotación, y=Distancia_Casa, fill=Rotación))+geom_boxplot()+theme_bw()
g3r=ggplot(datos,aes(x=Rotación, y=Ingreso_Mensual, fill=Rotación))+geom_boxplot()+theme_bw()
g4r=ggplot(datos,aes(x=Rotación, y=Porcentaje_aumento_salarial, fill=Rotación))+geom_boxplot()+theme_bw()+ylab("%Aumento salario")
g5r=ggplot(datos,aes(x=Rotación, y=Años_Experiencia, fill=Rotación))+geom_boxplot()+theme_bw()
g6r=ggplot(datos,aes(x=Rotación, y=Antigüedad, fill=Rotación))+geom_boxplot()+theme_bw()


##Segun lo que muestra la grafica entre edad y rotación, es que si estaba relacionada con personas jovenes y esto se puede basar como en un principio se dijo, a que las mismas quieren obtener experiencia, ademas de tomar la decision cual es el campo por el cual quisieran enfocarse. En la grafica g1r, se muestra que la diferncia no es gigantesca pero que si las personas mas jovenes han decidico irse.

ggplotly(g1r)
##En el caso de la variable rotación contra la distancia en donde la persona vive, si se logro diferenciar que las personas entre mas lejos viven tambien deciden irse de la compañia.

ggplotly(g2r)
##Acontinuación se muestra como la variable de ingreso mensual, si influye en la decision de rotacion para las personas, ya que se ve que para quienes estan ganando menos, son quienes han rotado. Lo que comprueba la primera hipotesis que se realizo.

ggplotly(g3r)
##En caso de la variable rotación relacionada con el % en el aumento del salario, la hipotesis no se muestra claramente en la grafica, ya que las diferencias entre las personas que rotaron y no rotaron no es muy grande, lo que nos puede decir que para el caso de la rotación el porcentaje en el aumento salarial, no es una variable significativa en el analisis.

ggplotly(g4r)
##La primera hipotesis planteada se comprobo con la grafica, ya que se vio que personas que no tienen menos años de experiencia deciden irse, y esto puede ser debido a que los puestos no estan claramente definidos y les esta quedando un poco complicado desembolverse en sus labores.

ggplotly(g5r)
##La hipotesis se comprobo, mostrando que las personas que tenian menor tiempo en la compañia estaban rotando mucho mas que las personas que tenian antiguedad en la misma.

ggplotly(g6r)
datos$`Viaje de Negocios`=factor(datos$`Viaje de Negocios`,levels = c("Frecuentemente","Raramente","No_Viaja"))

tabla1=table(datos$`Viaje de Negocios`,datos$Rotación)

round(prop.table(tabla1,margin = 1)*100,0)
##                 
##                  No Si
##   Frecuentemente 75 25
##   Raramente      85 15
##   No_Viaja       92  8
g1cr=PlotXTabs2(datos,`Viaje de Negocios`,  Rotación, plottype = "percent" )
g2cr=PlotXTabs2(datos,Departamento,  Rotación, plottype = "percent" )
g3cr=PlotXTabs2(datos,Genero,  Rotación, plottype = "percent" )
g4cr=PlotXTabs2(datos,Cargo,  Rotación, plottype = "percent" )+theme(axis.text.x = element_text(angle = 90))
g5cr=PlotXTabs2(datos,Estado_Civil,  Rotación, plottype = "percent" )
g6cr=PlotXTabs2(datos,Horas_Extra,  Rotación, plottype = "percent" )





## Se noto claramente que las personas que viajan mas son las que deciden rotar y esto se noto con la grafica donde se muestra como hay aumento en las rotaciones cuando hay mas viajes.

g1cr

##Esta hipotesis tambien se compromo ya que se muestra que las personas que existe un nivel de rotación de acuerdo a los departamentos, y claramente las personas en ventas rotaron mucho mas que las personas en los otros departamentos. Esto puede ser debido a la carga laboral y a las expectativas de ventas ajustadas para cada trabajador.

g2cr

## El genero se noto que realmente tampoco es una variable significativa, ya que la diferencia de rotación entre generos no es muy diferente.

g3cr

##La hipotesis se comprobo con respecto a los cargos y esta tambien va conectada con los departamentos, en la cual se muestra que hay mayor rotacion para los representantes de ventas, lo que puede deberse a diferentes razones tales como: metas no realistas, presión laboral y demas.

g4cr

##La hipotesis se comprobo ya que las personas solteras rotan mucho mas que las persona que estan casadas o divorcidas, ya que en estas dos ultimas no se encuentra una importante diferencia.

g5cr

##La hipotesis se comprobo ya que las personas que si tienen horas extras tienden a rotar mas que las personas que no tienen las mismas.

g6cr

  1. En las conclusiones se discute sobre cual seria la estrategia para disminuir la rotación en la empresa. Ejemplo: Mejorar el ambiente laboral, los incentivos económicos, distribuir la carga de horas extra (menos turnos y mas personal).

##ESTRATEGIAS.