Actividad 1 - Datos Rotación

La siguiente actividad corresponde a una compañía que presenta una situación de alta rotación (personas que se retiran de manera voluntaria de la compañía) en algunos empleados. La actividad consiste en por medio de la exploración de una base de datos en la cual se identifican posibles factores que se relacionan con la rotación tales como salario, carga laboral entre otros. Se pretende que el estudiante realice una descripción de la base, luego relaciones entre factores previamente identificados con la rotación y finalmente con estos factores proponer una estrategia de retención para mejorar las cifras de rotación.

1. Selección de Variables

Las variables priorizadas fueron:

CUALITATIVAS:

  1. Genero: Se espera que el género se relacione con la rotación ya que los hombres y las mujeres tiene dinámicas de vida distintas.
Hipotesis: Las mujeres tienen mayor posibilidad de rotar que los hombres.
  1. Satisfacción Laboral: Se espera que la satisfacción laboral se relacione con la rotación ya que las personas que no están a gusto con sus labores en la empresa tienden a renunciar.
Hipotesis: La personas que tienen baja satisfacción laboral tienen mayor posibilidad de rotar que las de alta satisfacción laboral.
  1. Equilibrio_Trabajo_Vida: Hipotesis: Se espera que el quilibrio trabajo vida se relacione con la rotación ya que las personas que dedican mas tiempo al trabajo que a su vida, podrian estar insatisfechos en su ambiente laboral.
Hipotesis: Las personas que cuentan con mala percepción de equilibrio entre trbajo-vida tienen mayor posibilidad de rotar que las de mejor equilibrio.

CUANTITATIVAS:

  1. Distancia_Casa: La distancia de la casa al trabajo se relaciona con la rotación ya que influye en el tiempo de desplazamiento al trabajo y puede afectar el rendimiento y disminuye su tiempo de ocio.
Hipotesis: Las personas que estan a mayor distancia del trabajo tienen mayor posibilidad de rotar que las que viven mas cerca al trabajo.
  1. Porcentaje_aumento_salarial: Se espera que el porcentaje de aumento salarial se relacione con la rotación ya que la percepción de poca remuneración de unos trabajadores frente a otros causa descontento dentro de la empresa.
Hipotesis: Las personas que tienen menos aumento salarial tienen mas posibilidad de rotar que las de mayor incremento salarial.
  1. Años_Experiencia: Se espera que los años de experiencia se relacione con la rotación ya que al tener más años de experiencia, la persona puede ser más atractiva para otras empresas
Hipotesis: Las personas con mas años de experiencia tienen mayor posibilidad de rotar que las de menos años de experiencia.
#Importamos la base de datos en formato excel.
library(readxl)
Datos_Rotacio_n = read_excel("C:/Users/ADMIN/Desktop/Maestria Ciencia de Datos/1. Metodos y Simulacion estadistica/Unidad 1. Analisis exploratorio de datos/Datos_Rotación.xlsx")

#Mostramos los primeros datos de la base de datos importada.
head(Datos_Rotacio_n,4)
## # A tibble: 4 × 24
##   Rotacion  Edad Viaje de…¹ Depar…² Dista…³ Educa…⁴ Campo…⁵ Satis…⁶ Genero Cargo
##   <chr>    <dbl> <chr>      <chr>     <dbl>   <dbl> <chr>     <dbl> <chr>  <chr>
## 1 Si          41 Raramente  Ventas        1       2 Cienci…       2 F      Ejec…
## 2 No          49 Frecuente… IyD           8       1 Cienci…       3 M      Inve…
## 3 Si          37 Raramente  IyD           2       2 Otra          4 M      Tecn…
## 4 No          33 Frecuente… IyD           3       4 Cienci…       4 F      Inve…
## # … with 14 more variables: Satisfaccion_Laboral <dbl>, Estado_Civil <chr>,
## #   Ingreso_Mensual <dbl>, Trabajos_Anteriores <dbl>, Horas_Extra <chr>,
## #   Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
## #   Anhos_Experiencia <dbl>, Capacitaciones <dbl>,
## #   Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## #   Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>, and
## #   abbreviated variable names ¹​`Viaje de Negocios`, ²​Departamento, …
## # ℹ Use `colnames()` to see all variable names

2. A continuación realizaremos una exploración univariada de datos de las variables cualitativas:

#Cambio de variables de Satisfaccion_Laboral de numerico a texto
Datos_Rotacio_n$Satisfaccion_Laboral[Datos_Rotacio_n$Satisfaccion_Laboral=="1"]<-"1. Low"
Datos_Rotacio_n$Satisfaccion_Laboral[Datos_Rotacio_n$Satisfaccion_Laboral=="2"]<-"2. Medium"
Datos_Rotacio_n$Satisfaccion_Laboral[Datos_Rotacio_n$Satisfaccion_Laboral=="3"]<-"3. High"
Datos_Rotacio_n$Satisfaccion_Laboral[Datos_Rotacio_n$Satisfaccion_Laboral=="4"]<-"4. Very High"
#Cambio de variables de Equilibrio_Trabajo_Vida de numerico a texto
Datos_Rotacio_n$Equilibrio_Trabajo_Vida[Datos_Rotacio_n$Equilibrio_Trabajo_Vida=="1"]<-"1. Bad"
Datos_Rotacio_n$Equilibrio_Trabajo_Vida[Datos_Rotacio_n$Equilibrio_Trabajo_Vida=="2"]<-"2. Good"
Datos_Rotacio_n$Equilibrio_Trabajo_Vida[Datos_Rotacio_n$Equilibrio_Trabajo_Vida=="3"]<-"3. Better"
Datos_Rotacio_n$Equilibrio_Trabajo_Vida[Datos_Rotacio_n$Equilibrio_Trabajo_Vida=="4"]<-"4. Best"
require(table1)
## Loading required package: table1
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
## 
##     units, units<-
y <- table1::table1(~Genero+Satisfaccion_Laboral+Equilibrio_Trabajo_Vida+Rotacion, data = Datos_Rotacio_n)
y
Overall
(N=1470)
Genero
F 588 (40.0%)
M 882 (60.0%)
Satisfaccion_Laboral
1. Low 289 (19.7%)
2. Medium 280 (19.0%)
3. High 442 (30.1%)
4. Very High 459 (31.2%)
Equilibrio_Trabajo_Vida
1. Bad 80 (5.4%)
2. Good 344 (23.4%)
3. Better 893 (60.7%)
4. Best 153 (10.4%)
Rotacion
No 1233 (83.9%)
Si 237 (16.1%)
require(ggplot2)
## Loading required package: ggplot2
require(ggpubr)
## Loading required package: ggpubr
g1=ggplot(Datos_Rotacio_n,aes(x=Genero))+geom_bar(fill=3, color=5)+geom_text(stat='count', aes(x=Genero,label=..count..),vjust=2, col="darkgreen")+theme_bw()
g2=ggplot(Datos_Rotacio_n,aes(x=Satisfaccion_Laboral))+geom_bar(fill=4, color=1, alpha = 0.9)+geom_text(stat='count', aes(x=Satisfaccion_Laboral,label=..count..),vjust=2, col="white")+theme_classic()
g3=ggplot(Datos_Rotacio_n,aes(x=Equilibrio_Trabajo_Vida))+geom_bar(fill=5, color=8)+geom_text(stat='count', aes(x=Equilibrio_Trabajo_Vida,label=..count..),vjust=1, col="blue")+theme_bw()
g4=ggplot(Datos_Rotacio_n,aes(x=Rotacion))+geom_bar(fill=2, color=7)+geom_text(stat='count', aes(x=Rotacion,label=..count..),vjust=2, col="white")+theme_bw()
ggarrange(g1, g2, g3, g4, labels = c("A.", "B.", "C.", "D."),ncol = 2, nrow = 2)

Análisis univariado variables cualitativas:

Genero: De un total de 1.470 empleados encuestados el 40% que corresponde a 588 personas, son mujeres y el 60% que corresponde a 882 personas son hombres.

Satisfacción Laboral: El 61.3% (901) de los empleados manifiesta que su satisfacción laboral es alta (30.1%) y muy alta (31.2%), mientras el 38.7% (569) se ubica en baja (19.7%) y media (19%). Aunque estos últimos no son la mayoría, si es un dato que genera alerta ya que este podría ser un motivo relevante para la rotación del personal.

Equilibrio trabajo vida: En su mayoría la respuesta fue positiva, el 94.6% (1.390) catalogaron su equilibrio trabajo vida como bueno (23.4%), mejor (60.7%) y mucho mejor (10.4%). Mientras que el 5.4% (80) restante indicó que era malo. Donde más personas se ubicaron fue en mejor con un 60.7% (893). Esto puede indicar que la compañía tiende a respetar e incentivar el quilibrio entre trabajo y tiempos de ocio de sus colaboradores, lo cual podría impactar de manera positiva en la rotación.

Rotación: El 83.9% (1.233) de los empleados no rota, es decir no renuncia de forma voluntaria al trabajo, mientras el 16,1% (237) si lo hace.

Ahora realizaremos una exploracion univariada de datos de las variables cuantitativas:

Datos_Rotacio_n$Distancia_grupo=cut(Datos_Rotacio_n$Distancia_Casa,breaks = c(0,5,10,15,20,25,30))
Datos_Rotacio_n$P_Aum_Salar_grupo=cut(Datos_Rotacio_n$Porcentaje_aumento_salarial,breaks = c(0,10,15,20,25))
Datos_Rotacio_n$Anhos_exp_grupo=cut(Datos_Rotacio_n$Anhos_Experiencia,breaks = c(0,10,20,30,40))

require(table1)
table1(~Distancia_Casa+Porcentaje_aumento_salarial+Anhos_Experiencia+Distancia_grupo+P_Aum_Salar_grupo+Anhos_exp_grupo, data = Datos_Rotacio_n)
Overall
(N=1470)
Distancia_Casa
Mean (SD) 9.19 (8.11)
Median [Min, Max] 7.00 [1.00, 29.0]
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.66)
Median [Min, Max] 14.0 [11.0, 25.0]
Anhos_Experiencia
Mean (SD) 11.3 (7.78)
Median [Min, Max] 10.0 [0, 40.0]
Distancia_grupo
(0,5] 632 (43.0%)
(5,10] 394 (26.8%)
(10,15] 115 (7.8%)
(15,20] 125 (8.5%)
(20,25] 117 (8.0%)
(25,30] 87 (5.9%)
P_Aum_Salar_grupo
(0,10] 0 (0%)
(10,15] 919 (62.5%)
(15,20] 380 (25.9%)
(20,25] 171 (11.6%)
Anhos_exp_grupo
(0,10] 912 (62.0%)
(10,20] 340 (23.1%)
(20,30] 161 (11.0%)
(30,40] 46 (3.1%)
Missing 11 (0.7%)
require(ggplot2)
require(ggpubr)
require(dplyr)
## Loading required package: dplyr
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
bp5=ggplot(Datos_Rotacio_n,aes(x=Distancia_Casa))+geom_boxplot(fill=7, color=1)+theme_bw()
g5=ggplot(Datos_Rotacio_n,aes(x=Distancia_Casa))+geom_bar(fill=7, color=1)+theme_bw()
bp6=ggplot(Datos_Rotacio_n,aes(x=Porcentaje_aumento_salarial))+geom_boxplot(fill=8, color=4)+theme_bw()
g6=ggplot(Datos_Rotacio_n,aes(x=Porcentaje_aumento_salarial))+geom_bar(fill=8, color=4)+geom_text(stat='count', aes(x=Porcentaje_aumento_salarial,label=..count..), size=2.5, vjust=1, col="white")+theme_bw()
bp7=ggplot(Datos_Rotacio_n,aes(x=Anhos_Experiencia))+geom_boxplot(fill=5, color=7)+theme_bw()
g7=ggplot(Datos_Rotacio_n,aes(x=Anhos_Experiencia))+geom_histogram(fill=5, color=7)+geom_text(stat='count', aes(x=Anhos_Experiencia,label=..count..), size=1.5, vjust=0, col="black")+theme_bw()
g8=ggplot(Datos_Rotacio_n,aes(x=Distancia_grupo))+geom_bar(fill=4, color=6)+geom_text(stat='count', aes(x=Distancia_grupo,label=..count..),vjust=1, col="white")+theme_bw()
ggs=ggplot(Datos_Rotacio_n,aes(x=P_Aum_Salar_grupo))+geom_bar(fill=6, color=4)+geom_text(stat='count', aes(x=P_Aum_Salar_grupo,label=..count..),vjust=1, col="white")+theme_bw()
gga=ggplot(Datos_Rotacio_n,aes(x=Anhos_exp_grupo))+geom_bar(fill=5, color=7)+geom_text(stat='count', aes(x=Anhos_exp_grupo,label=..count..), size=3,vjust=0.5, col="black")+theme_bw()

ggarrange(bp5, g5, bp6, g6, bp7, g7, g8, ggs, gga, ncol = 2, nrow = 3)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## $`1`

## 
## $`2`

## 
## attr(,"class")
## [1] "list"      "ggarrange"
Análisis univariado variables cuantitativas:

Distancia casa: El promedio de trabajadores encuestados se encuentran a 9.19 km del trabajo, sin embargo tiene una desviación estandar de 8.11 km mostrando que la distancia se desvía de la media aproximandamente 8.11 km, lo que indica que la media no es una medida certera en este caso. Tambien es de notar que el 50% de las personas se encuentran a mas de 7 km de distancia de la empresa, y que el 69.8% correspondiente a 1.026 personas viven entre 1 y 10 km de distancia. Esto indica que la grafica es asimétrica positiva o sesgada hacia la derecha.

Porcentaje de aumento salarial: El promedio de trabajadores encuestados tiene un incrmeento salarial del 15.2%, con una desviación estandar de 3.66% lo que indica que la variación frente la media es baja. También es de notar que el 50% de las personas han contado con un incremento entre el 14% y el 25%, pero el 62.5% correspondiente a 919 personas han tenido un incremento salarial en un rango entre el 10% y el 15%. Esto indica que la grafica es asimétrica positiva o sesgada hacia la derecha.

Años de experiencia: El promedio de trabajadores encuestados tiene 11.3 años de experiencia, con una desviación estandar de 7.87 años, lo que indica que la media no es una medida certera en este caso. También es de notar que el 50% de las personas tienen entre 10 y 40 años de experiencia con una concentrcion de los datos en 10 años de experiencia correspondiente a 202 personas, sin embargo el 62% correspondiente a 912 personas tienen de 0 a 10 años de experiencia y solo el 3.1% de personas tienen entre 30 y 40 años de experiencia laboral dentro de la empresa. Esto indica que la grafica es asimétrica positiva o sesgada hacia la derecha.

3. En esta sección se realizará el análisis bivariable de datos, la variable de respuesta será la Rotación.

Variables cuantitativas:

require(ggplot2)
require(ggpubr)
g9=ggplot(Datos_Rotacio_n,aes(x=Distancia_Casa, fill=Rotacion))+geom_bar()+theme_bw()
g9a=ggplot(Datos_Rotacio_n,aes(x=Distancia_grupo, fill=Rotacion))+geom_bar()+theme_bw()
g10=ggplot(Datos_Rotacio_n,aes(x=Porcentaje_aumento_salarial, fill=Rotacion))+geom_bar()+theme_bw()
g10a=ggplot(Datos_Rotacio_n,aes(x=P_Aum_Salar_grupo, fill=Rotacion))+geom_bar()+theme_bw()
g11=ggplot(Datos_Rotacio_n,aes(x=Anhos_Experiencia, fill=Rotacion))+geom_histogram()+theme_bw()
g11a=ggplot(Datos_Rotacio_n,aes(x=Anhos_exp_grupo, fill=Rotacion))+geom_bar()+theme_bw()
ggarrange(g9, g9a, g10, g10a, g11, g11a, labels = c("E.", "E.", "F.", "F.", "G.", "G."),ncol = 2, nrow = 3)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

require(ggplot2)
require(ggpubr)

b1=ggplot(Datos_Rotacio_n,aes(x=Distancia_Casa, y=Rotacion))+geom_boxplot(fill=5, color=1)+theme_bw()
b2=ggplot(Datos_Rotacio_n,aes(x=Porcentaje_aumento_salarial, y=Rotacion))+geom_boxplot(fill=8, color=4)+theme_bw()
b3=ggplot(Datos_Rotacio_n,aes(x=Anhos_Experiencia, y=Rotacion))+geom_boxplot(fill=3, color=7)+theme_bw()

ggarrange(b1, b2, b3, labels = c("H.", "I.", "J."),ncol = 2, nrow = 2)

require(table1)
y <- table1::table1(~Distancia_Casa+Porcentaje_aumento_salarial+Anhos_Experiencia+Distancia_grupo+P_Aum_Salar_grupo+Anhos_exp_grupo|Rotacion, data = Datos_Rotacio_n)
y
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Distancia_Casa
Mean (SD) 8.92 (8.01) 10.6 (8.45) 9.19 (8.11)
Median [Min, Max] 7.00 [1.00, 29.0] 9.00 [1.00, 29.0] 7.00 [1.00, 29.0]
Porcentaje_aumento_salarial
Mean (SD) 15.2 (3.64) 15.1 (3.77) 15.2 (3.66)
Median [Min, Max] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0] 14.0 [11.0, 25.0]
Anhos_Experiencia
Mean (SD) 11.9 (7.76) 8.24 (7.17) 11.3 (7.78)
Median [Min, Max] 10.0 [0, 38.0] 7.00 [0, 40.0] 10.0 [0, 40.0]
Distancia_grupo
(0,5] 545 (44.2%) 87 (36.7%) 632 (43.0%)
(5,10] 337 (27.3%) 57 (24.1%) 394 (26.8%)
(10,15] 90 (7.3%) 25 (10.5%) 115 (7.8%)
(15,20] 102 (8.3%) 23 (9.7%) 125 (8.5%)
(20,25] 85 (6.9%) 32 (13.5%) 117 (8.0%)
(25,30] 74 (6.0%) 13 (5.5%) 87 (5.9%)
P_Aum_Salar_grupo
(0,10] 0 (0%) 0 (0%) 0 (0%)
(10,15] 769 (62.4%) 150 (63.3%) 919 (62.5%)
(15,20] 323 (26.2%) 57 (24.1%) 380 (25.9%)
(20,25] 141 (11.4%) 30 (12.7%) 171 (11.6%)
Anhos_exp_grupo
(0,10] 735 (59.6%) 177 (74.7%) 912 (62.0%)
(10,20] 301 (24.4%) 39 (16.5%) 340 (23.1%)
(20,30] 150 (12.2%) 11 (4.6%) 161 (11.0%)
(30,40] 41 (3.3%) 5 (2.1%) 46 (3.1%)
Missing 6 (0.5%) 5 (2.1%) 11 (0.7%)
Análisis bivariado de variables cuantitativas vs la rotación:

Distancia Casa: De las personas que si rotan en la empresa viven en promedio a 10.6 km de distancia a diferencia de los que no rotan que se encuentran a 8.92 km de la empresa, sin embargo, ambos cuentan con una desviación estandar al rededor de 8.11 km del promedio general, lo cual no evidencia una tendencia significativa con respecto a la rotación, sin embargo se nota una leve tendencia a rotar más los que viven entre 0 y 10 km.

Porcentaje de Aumento Salarial: Al revisar las medidas de tendencia central y las medidas de dispersión, refleja que el porcentaje de aumento salarial no es una variable significativa para determinar la rotación, ya que el promedio, desviación estándar, mediana, mínimos y máximos se comportan semejantes entre los que rotan y los que no rotan. Sin embargo, al momento de agrupar los datos se evidencia que entre más es el incremento salarial, menos es la rotación ya que el 63.3% tuvieron aumento entre el 10 y el 15%.

Años de Experiencia: Las personas que tienen menos años de experiencia tienden a rotar con más facilidad, esto debido a que los que rotan tienen en promedio 8.24 años de experiencia y los que no 11.9 años. Es de notar que el 74.7% de los que rotan tienen entre 0 y 10 años de experiencia.

Variables cualitativas:

#Datos_Rotacio_n$Edad_grupo=cut(Datos_Rotacio_n$Edad,breaks = c(0,30,40,50,60))
#table(Datos_Rotacio_n$Edad_grupo)
#table(Datos_Rotacio_n$Distancia_grupo)

require(table1)
y <- table1::table1(~Genero+Satisfaccion_Laboral+Equilibrio_Trabajo_Vida|Rotacion, data = Datos_Rotacio_n)
y
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Genero
F 501 (40.6%) 87 (36.7%) 588 (40.0%)
M 732 (59.4%) 150 (63.3%) 882 (60.0%)
Satisfaccion_Laboral
1. Low 223 (18.1%) 66 (27.8%) 289 (19.7%)
2. Medium 234 (19.0%) 46 (19.4%) 280 (19.0%)
3. High 369 (29.9%) 73 (30.8%) 442 (30.1%)
4. Very High 407 (33.0%) 52 (21.9%) 459 (31.2%)
Equilibrio_Trabajo_Vida
1. Bad 55 (4.5%) 25 (10.5%) 80 (5.4%)
2. Good 286 (23.2%) 58 (24.5%) 344 (23.4%)
3. Better 766 (62.1%) 127 (53.6%) 893 (60.7%)
4. Best 126 (10.2%) 27 (11.4%) 153 (10.4%)
require(ggplot2)
require(ggpubr)

g1r=ggplot(Datos_Rotacio_n,aes(x=Genero, fill=Rotacion))+geom_bar()+geom_text(stat='count', aes(x=Genero,label=..count..), size=3, vjust=1, col="white")+theme_bw()
g2r=ggplot(Datos_Rotacio_n,aes(x=Satisfaccion_Laboral, fill=Rotacion))+geom_bar()+geom_text(stat='count', aes(x=Satisfaccion_Laboral,label=..count..), size=3, vjust=1, col="white")+theme_classic()
g3r=ggplot(Datos_Rotacio_n,aes(x=Equilibrio_Trabajo_Vida, fill=Rotacion))+geom_bar()+geom_text(stat='count', aes(x=Equilibrio_Trabajo_Vida,label=..count..), size=2.1 ,vjust=1)+theme_bw()

ggarrange(g1r, g2r, g3r, labels = c("K.", "L.", "M.") ,ncol = 2, nrow = 2)

#para cualitativos -- 1. Genero 2. Satisfacción_Laboral 3. Equilibrio_Trabajo_Vida
require(CGPfunctions)
## Loading required package: CGPfunctions
g12=PlotXTabs2(data = Datos_Rotacio_n,x = Genero,y = Rotacion)
g13=PlotXTabs2(data = Datos_Rotacio_n,x = Rotacion,y = Genero)

ggarrange(g12, g13, labels = c("N.", "O."),ncol = 2, nrow = 1)

g14=PlotXTabs2(data = Datos_Rotacio_n,x = Satisfaccion_Laboral,y = Rotacion)
g15=PlotXTabs2(data = Datos_Rotacio_n,x = Rotacion,y = Satisfaccion_Laboral)

ggarrange(g14, g15, labels = c("P.", "Q."),ncol = 1, nrow = 2)

g16=PlotXTabs2(data = Datos_Rotacio_n,x = Equilibrio_Trabajo_Vida,y = Rotacion)
g17=PlotXTabs2(data = Datos_Rotacio_n,x = Rotacion,y = Equilibrio_Trabajo_Vida)

ggarrange(g16, g17, labels = c("R.", "S."),ncol = 1, nrow = 2)

Análisis bivariado de variables cualitativas vs la rotación:

Genero: De las 237 personas que rotan en la empresa, el 37% (87) corresonde a las mujeres y el 63% (150) a los hombres, este 37% de mujeres que rota, corresponde al 15% del total de las mujeres encuestadas, mientras que el 63% de los hombres que rotan, corresponde al 17% de los hombres. Se infiere entonces que de las personas que rotan, son mas los hombres que las mujeres, incluso revisando la proporción de rotación de hombres frente al de las mujeres, se evidencia que tiene una tendencia leve de rotar mas los hombres que las mujeres (17% hombres vs 15% mujeres). Se requiere implementar estrategia para evitar la rotación en hombres.

Satisfacción Laboral: De la muestra de 1470 personas, el 16% rota que equivale a 237 personas, estas personas tienen diferentes percepciones frente a su satisfacción laboral que puede influir en su rotación, pues el 28% menciona que es baja, el 19% que es media, el 31% alta y el 22% muy alta.

Las personas que tienen una percepción de la salsfacción laboral baja son las que en su mayor proporción rotan, pues un 23% lo hace frente a las demás categorías que conservan una proporción de rotación similar, media el 16%, alta 17% y muy alta que tiene la menor proporción de rotación con un 11%.

Equilibrio Trabajo Vida: Se evidencia que de las 237 personas que rotan, el 54% corresopnde a las personas que dicen tener “mejor” equilibrio trabajo vida, seguido del 24% que corresponde a las personas que tienen “buen” equilibrio y finalmente con 11% para ambos casos de las personas que mencionan tener “mal” y “el mejor” equilibrio trabajo vida.

El 54% de las personas que rotan y dicen tener “mejor” equilibrio trabajo vida corresponde a 127 personas de las 237 que rotan, sin embargo, al analizar cada categoría de equilibrio trabajo vida, se evidencia que el 54% corresponde al 14% de la población que menciona tener “mejor” equilibrio, mientras que las personas que mencionan tener “mal” equilibrio trabajo vida el 31% rota, que corresponde a 25 personas.

Los datos denotan que los colaboradores que tienen una percpeción equilibrio trabajo vida mala rotan un 31% siendo esta proporción mayor a las demás categorías que se ubican en un porcentaje similar las 3, buena 17%, mejor 14% y mucho mejor 18%.

Así entonces, se requiere implementar estrategias para que las personas no caigan en una percepción de equilibrio trabajo vida malo, dado que, a pesar de que en número de personas es mas bajo, su porcentaje de rotación es mayor. Igualmente, se debe detectar porque las personas a pesar de tener “mejor” equilibrio vida presentan rotación, aunque es de aclarar que la mayor concentración de datos se encuentran entre equilibrio trabajo vida “mejor” y “el mejor”.

#Prueba tstudent para cuantitativos.
t.test(Datos_Rotacio_n$Distancia_Casa~Datos_Rotacio_n$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  Datos_Rotacio_n$Distancia_Casa by Datos_Rotacio_n$Rotacion
## t = -2.8882, df = 322.72, p-value = 0.004137
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  -2.8870025 -0.5475146
## sample estimates:
## mean in group No mean in group Si 
##         8.915653        10.632911
t.test(Datos_Rotacio_n$Porcentaje_aumento_salarial~Datos_Rotacio_n$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  Datos_Rotacio_n$Porcentaje_aumento_salarial by Datos_Rotacio_n$Rotacion
## t = 0.50424, df = 326.11, p-value = 0.6144
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  -0.3890709  0.6572652
## sample estimates:
## mean in group No mean in group Si 
##         15.23114         15.09705
t.test(Datos_Rotacio_n$Anhos_Experiencia~Datos_Rotacio_n$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  Datos_Rotacio_n$Anhos_Experiencia by Datos_Rotacio_n$Rotacion
## t = 7.0192, df = 350.88, p-value = 1.16e-11
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  2.604401 4.632019
## sample estimates:
## mean in group No mean in group Si 
##        11.862936         8.244726

4. Conclusiones

Se encontró que el género no es una variable significativa con respecto a la rotación, ya que hombres y mujeres tienen un comportamiento similar, pero sí tienen una influencia importante en la rotación la satisfacción laboral y la percepción de equilibrio trabajo vida puesto que 1=“baja” y 1=“malo” respectivamente son los que presentan una mayor proporción de personas que rotan. Es por esto que se recomienda crear estrategias que lleven a mejorar el bienestar de sus colaboradores como lo podría ser horarios de trabajo flexibles, acuerdos de algunos días a la semana de trabajo en casa y evitar hacer requerimientos fuera del horario laboral. Los datos también arrojaron que la varible distancia a casa tiene una baja influencia en la rotación ya que quienes más rotan son los que más cerca viven del trabajo, aunque aquí se concentra la mayor parte de la muestra. Por su parte, el aumento salarial tiene efectos positivos frente a la rotación, por lo que se recomienda continuar con la estrategia actual de la compañía en este sentido. Sin embargo, se recomienda hacer un análisis más detallado de la variable años de experiencia frente a la rotación que permita crear un plan o programa para prevenir deserciones ya que se concentra una mayor rotación en las personas que tienen entre 0 y 10 años de experiencia, especialmente en este último año.