Punto 1. Selección de Variables

Variables Categóricas

Variable 1: Viaje de Negocios

Se espera que los viajes de negocio se relacionen con la rotación ya que las personas que viajan frecuentemente se pueden sentir agotados y no tienen tiempo disponible para sus asuntos personales. Estar fuera de casa hace que no se afianzen lazos de amistad o de pareja y/o se alejen de sus familias. Aquí quizás no importa la retribución económica en viáticos y gastos de representación sino que afecta la parte social y humana del individuo.La hipótesis es que las personas que viajan frecuentemente tienen una mayor posibilidad de rotar que las que viajan raramente o no viajan.

Variable 2: Género

Se espera que el género se relacione con la rotación ya que las personas de sexo masculino tienden a rotar más porque son más arriesgados y tienen la percepción de que pueden conseguir trabajo más rápido que las mujeres. La hipótesis es que las personas de sexo masculino tienen mayor posibilidad de rotar que las personas de sexo femenino.

Variable 3: Estado Civil

Se espera que el estado civil se relacione con la rotación ya que las personas solteras tienen menos obligaciones debido a que no tienen una familia a cargo y tienen mayor flexibilidad. La hipótesis es que las personas solteras tienen mayor posibilidad de rotar que las personas casadas o divorciadas.

Variables Cuantitativas

Variable 1: Trabajos Anteriores

Se espera que la cantidad de trabajos anteriores se relacione con la rotación ya que las personas que han tenido la menor cantidad de trabajos anteriores tienen tendencia a aventurar más y a buscar nuevos y mejores horizontes, se encuentran en la búsqueda de un trabajo a su gusto y estable y quizás el primer trabajo no lo sea. La hipótesis es que las personas que han tenido la menor cantidad de trabajos anteriores tienen mayor posibilidad de rotar que las personas que han tenido varios trabajos anteriores.

Variable 2: Porcentaje de Aumento Salarial

Se espera que el porcentaje de aumento salarial se relacione con la rotación ya que las personas con menor aumento salarial no se sientan muy a gusto y quieran irse en busca de un mejor trabajo con menor remuneración. La hipótesis es que las personas que tienen menos porcentaje de aumento salarial tienen mayor posibilidad de rotar que las personas que tienen un mayor aumento salarial.

Variable 3: Antigüedad

Se espera que la antigüedad se relacione con la rotación ya que las personas con menos antigüedad pueden sentir que no tienen estabilidad y quieran obtener más experiencia laboral buscando nuevas y mejores oportunidades en otras empresas. La hipótesis es que las personas que tienen menos antigüedad tienen mayor posibilidad de rotar que las personas que tienen mayor antigüedad.

Punto 2. Análisis univariado ( caracterización)

library(readxl)
Datos <- read_excel("C:/ALL/Personal/Maestria/01_Simulacion_Estadística/Unidad 1/Actividad_2/Datos_Rotacion.xlsx")
head(Datos)
Rotación Edad Viaje de Negocios Departamento Distancia_Casa Educación Campo_Educación Satisfacción_Ambiental Genero Cargo Satisfación_Laboral Estado_Civil Ingreso_Mensual Trabajos_Anteriores Horas_Extra Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia Capacitaciones Equilibrio_Trabajo_Vida Antigüedad Antigüedad_Cargo Años_ultima_promoción Años_acargo_con_mismo_jefe
Si 41 Raramente Ventas 1 2 Ciencias 2 F Ejecutivo_Ventas 4 Soltero 5993 8 Si 11 3 8 0 1 6 4 0 5
No 49 Frecuentemente IyD 8 1 Ciencias 3 M Investigador_Cientifico 2 Casado 5130 1 No 23 4 10 3 3 10 7 1 7
Si 37 Raramente IyD 2 2 Otra 4 M Tecnico_Laboratorio 3 Soltero 2090 6 Si 15 3 7 3 3 0 0 0 0
No 33 Frecuentemente IyD 3 4 Ciencias 4 F Investigador_Cientifico 3 Casado 2909 1 Si 11 3 8 3 3 8 7 3 0
No 27 Raramente IyD 2 1 Salud 1 M Tecnico_Laboratorio 2 Casado 3468 9 No 12 3 6 3 3 2 2 2 2
No 32 Frecuentemente IyD 2 2 Ciencias 4 M Tecnico_Laboratorio 4 Soltero 3068 0 No 13 3 8 2 2 7 7 3 6
summary(Datos)
##    Rotación              Edad       Viaje de Negocios  Departamento      
##  Length:1470        Min.   :18.00   Length:1470        Length:1470       
##  Class :character   1st Qu.:30.00   Class :character   Class :character  
##  Mode  :character   Median :36.00   Mode  :character   Mode  :character  
##                     Mean   :36.92                                        
##                     3rd Qu.:43.00                                        
##                     Max.   :60.00                                        
##  Distancia_Casa     Educación     Campo_Educación    Satisfacción_Ambiental
##  Min.   : 1.000   Min.   :1.000   Length:1470        Min.   :1.000         
##  1st Qu.: 2.000   1st Qu.:2.000   Class :character   1st Qu.:2.000         
##  Median : 7.000   Median :3.000   Mode  :character   Median :3.000         
##  Mean   : 9.193   Mean   :2.913                      Mean   :2.722         
##  3rd Qu.:14.000   3rd Qu.:4.000                      3rd Qu.:4.000         
##  Max.   :29.000   Max.   :5.000                      Max.   :4.000         
##     Genero             Cargo           Satisfación_Laboral Estado_Civil      
##  Length:1470        Length:1470        Min.   :1.000       Length:1470       
##  Class :character   Class :character   1st Qu.:2.000       Class :character  
##  Mode  :character   Mode  :character   Median :3.000       Mode  :character  
##                                        Mean   :2.729                         
##                                        3rd Qu.:4.000                         
##                                        Max.   :4.000                         
##  Ingreso_Mensual Trabajos_Anteriores Horas_Extra       
##  Min.   : 1009   Min.   :0.000       Length:1470       
##  1st Qu.: 2911   1st Qu.:1.000       Class :character  
##  Median : 4919   Median :2.000       Mode  :character  
##  Mean   : 6503   Mean   :2.693                         
##  3rd Qu.: 8379   3rd Qu.:4.000                         
##  Max.   :19999   Max.   :9.000                         
##  Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia
##  Min.   :11.00               Min.   :3.000       Min.   : 0.00   
##  1st Qu.:12.00               1st Qu.:3.000       1st Qu.: 6.00   
##  Median :14.00               Median :3.000       Median :10.00   
##  Mean   :15.21               Mean   :3.154       Mean   :11.28   
##  3rd Qu.:18.00               3rd Qu.:3.000       3rd Qu.:15.00   
##  Max.   :25.00               Max.   :4.000       Max.   :40.00   
##  Capacitaciones  Equilibrio_Trabajo_Vida   Antigüedad     Antigüedad_Cargo
##  Min.   :0.000   Min.   :1.000           Min.   : 0.000   Min.   : 0.000  
##  1st Qu.:2.000   1st Qu.:2.000           1st Qu.: 3.000   1st Qu.: 2.000  
##  Median :3.000   Median :3.000           Median : 5.000   Median : 3.000  
##  Mean   :2.799   Mean   :2.761           Mean   : 7.008   Mean   : 4.229  
##  3rd Qu.:3.000   3rd Qu.:3.000           3rd Qu.: 9.000   3rd Qu.: 7.000  
##  Max.   :6.000   Max.   :4.000           Max.   :40.000   Max.   :18.000  
##  Años_ultima_promoción Años_acargo_con_mismo_jefe
##  Min.   : 0.000        Min.   : 0.000            
##  1st Qu.: 0.000        1st Qu.: 2.000            
##  Median : 1.000        Median : 3.000            
##  Mean   : 2.188        Mean   : 4.123            
##  3rd Qu.: 3.000        3rd Qu.: 7.000            
##  Max.   :15.000        Max.   :17.000
require(ggplot2)
require(ggpubr)
g1=ggplot(Datos,aes(x=`Trabajos_Anteriores`))+geom_histogram()+theme_bw()
g2=ggplot(Datos,aes(x=`Viaje de Negocios`))+geom_bar()+theme_bw()
ggarrange(g1, g2,labels = c("Var 1", "Var 2"),ncol = 2, nrow = 1)

Análisis variable Trabajos_Anteriores

table(Datos$Trabajos_Anteriores)
## 
##   0   1   2   3   4   5   6   7   8   9 
## 197 521 146 159 139  63  70  74  49  52
prop.table(table(Datos$Trabajos_Anteriores))*100
## 
##         0         1         2         3         4         5         6         7 
## 13.401361 35.442177  9.931973 10.816327  9.455782  4.285714  4.761905  5.034014 
##         8         9 
##  3.333333  3.537415

Análisis variable Viaje de Negocios

table(Datos$`Viaje de Negocios`)
## 
## Frecuentemente       No_Viaja      Raramente 
##            277            150           1043
prop.table(table(Datos$`Viaje de Negocios`))*100
## 
## Frecuentemente       No_Viaja      Raramente 
##       18.84354       10.20408       70.95238

Análisis de las gráficas

En el histograma de la variable Trabajos Anteriores podemos ver que la carga de datos se encuentra hacia la parte izquierda, con clase modal en 1. En la gráfica de barras de la variable Viaje de Negocios podemos ver que la mayor cantidad se encuentra en la barra Raramente con gran amplitud sobre las otras barras.

require(ggplot2)
require(ggpubr)
g1=ggplot(Datos,aes(x=`Porcentaje_aumento_salarial`))+geom_histogram()+theme_bw()
g2=ggplot(Datos,aes(x=`Genero`))+geom_bar()+theme_bw()
ggarrange(g1, g2,labels = c("Var 3", "Var 4"),ncol = 2, nrow = 1)

Análisis variable Porcentaje_aumento_salarial

table(Datos$Porcentaje_aumento_salarial)
## 
##  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25 
## 210 198 209 201 101  78  82  89  76  55  48  56  28  21  18
prop.table(table(Datos$Porcentaje_aumento_salarial))*100
## 
##        11        12        13        14        15        16        17        18 
## 14.285714 13.469388 14.217687 13.673469  6.870748  5.306122  5.578231  6.054422 
##        19        20        21        22        23        24        25 
##  5.170068  3.741497  3.265306  3.809524  1.904762  1.428571  1.224490

Análisis variable Genero

table(Datos$Genero)
## 
##   F   M 
## 588 882
prop.table(table(Datos$Genero))*100
## 
##  F  M 
## 40 60

Análisis de las gráficas

En el histograma de la variable Porcentaje_aumento_salarial podemos ver que la carga de datos se encuentra hacia la parte izquierda, con la mayoría entre 0 y 15 años. En la gráfica de barras de la variable género podemos ver que la mayor cantidad se encuentra en la barra de sexo Masculino.

require(ggplot2)
require(ggpubr)
g1=ggplot(Datos,aes(x=`Antigüedad`))+geom_histogram()+theme_bw()
g2=ggplot(Datos,aes(x=`Estado_Civil`))+geom_bar()+theme_bw()
ggarrange(g1, g2,labels = c("Var 5", "Var 6"),ncol = 2, nrow = 1)

Análisis variable Antigüedad

table(Datos$Antigüedad)
## 
##   0   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19 
##  44 171 127 128 110 196  76  90  80  82 120  32  14  24  18  20  12   9  13  11 
##  20  21  22  23  24  25  26  27  29  30  31  32  33  34  36  37  40 
##  27  14  15   2   6   4   4   2   2   1   3   3   5   1   2   1   1
prop.table(table(Datos$Antigüedad))*100
## 
##           0           1           2           3           4           5 
##  2.99319728 11.63265306  8.63945578  8.70748299  7.48299320 13.33333333 
##           6           7           8           9          10          11 
##  5.17006803  6.12244898  5.44217687  5.57823129  8.16326531  2.17687075 
##          12          13          14          15          16          17 
##  0.95238095  1.63265306  1.22448980  1.36054422  0.81632653  0.61224490 
##          18          19          20          21          22          23 
##  0.88435374  0.74829932  1.83673469  0.95238095  1.02040816  0.13605442 
##          24          25          26          27          29          30 
##  0.40816327  0.27210884  0.27210884  0.13605442  0.13605442  0.06802721 
##          31          32          33          34          36          37 
##  0.20408163  0.20408163  0.34013605  0.06802721  0.13605442  0.06802721 
##          40 
##  0.06802721

Análisis variable Estado_Civil

table(Datos$Estado_Civil)
## 
##     Casado Divorciado    Soltero 
##        673        327        470
prop.table(table(Datos$Estado_Civil))*100
## 
##     Casado Divorciado    Soltero 
##   45.78231   22.24490   31.97279

Análisis de las gráficas

En el histograma de la variable Antigüedad podemos ver que la carga de datos se encuentra hacia la parte izquierda, con clase modal en 1 año.En la gráfica de barras de la variable género podemos ver que la mayor cantidad se encuentra en la barra de Casado.

Punto 3. Análisis bivariado

3.1 Análisis de la hipótesis Variable Viaje de Negocios

require(CGPfunctions)
PlotXTabs2(Datos, `Viaje de Negocios`,Rotación,plottype =  "percent")

Análisis

Realizando la comparación de resultados se puede observar que las personas que viajan frecuentemente tienen mayor índice de rotación con un 25%. Este valor apoya la hipótesis planteada.

3.2 Análisis de la hipótesis Variable Trabajos_Anteriores

require(ggplot2)
g1 = ggplot(Datos,aes(x=Rotación,y=Trabajos_Anteriores,fill=Rotación))+geom_boxplot()+theme_bw()
require(plotly)
ggplotly(g1)

Análisis

Realizando la comparación de resultados se puede observar que las personas que han tenido menos trabajos anteriores tienen mayor índice de rotación. Este valor apoya la hipótesis planteada.

3.3 Análisis de la hipótesis Variable Genero

require(CGPfunctions)
PlotXTabs2(Datos,Genero,Rotación,plottype =  "percent")

Análisis

Realizando la comparación de resultados se puede observar que las personas de género masculino presentan más alto índice de rotación. Este valor apoya la hipótesis planteada, aunque la diferencia no es mucha con respecto al género femenino.

3.4 Análisis de la hipótesis Variable Porcentaje_aumento_salarial

require(ggplot2)
g2 = ggplot(Datos,aes(x=Rotación,y=Porcentaje_aumento_salarial,fill=Rotación))+geom_boxplot()+theme_bw()
require(plotly)
ggplotly(g2)

Análisis

Realizando la comparación de resultados se puede observar que el porcentaje de aumento salarial tiene el mismo promedio en ambas variables de la rotación. Por esto podemos decir que los resultados no son conluyentes y que el resultado del análisis no apoya la hipótesis.

3.5 Análisis de la hipótesis Variable Estado_Civil

require(CGPfunctions)
PlotXTabs2(Datos, Estado_Civil,Rotación,plottype =  "percent")

Análisis

Realizando la comparación de resultados se puede observar que las personas solteras presentan el más alto índice de rotación. Este resultado apoya la hipótesis planteada.

3.6 Análisis de la hipótesis Variable Antigüedad

require(ggplot2)
g1 = ggplot(Datos,aes(x=Rotación,y=Antigüedad,fill=Rotación))+geom_boxplot()+theme_bw()
require(plotly)
ggplotly(g1)

Análisis

Realizando la comparación de resultados se puede observar que las personas con menos años de antiguedad son los que tienen más alto índice de rotación. Este resultado apoya la hipótesis planteada

Punto 4. Conclusiones y estrategia

Se concluye que de las seis hipótesis propuestas y de acuerdo al análisis estadístico los resultados me apoyan cinco de ellas. Como estrategia la empresa puede realizar un plan de rotación del personal para los viajes de negocio de tal manera que sea equitativo, además se pueden programar viajes cortos, esto con el fin de que los empleados tengan más tiempo de calidad con su familia. Se debe crear un clima laboral agradable para que las personas que apenas tienen su primer empleo no se retiren de la empresa, para esto la empresa debe estar en constante monitoreo de las necesidades de los empleados con el fin de evitar que las personas se retiren. Se deben priorizar a los empleados solteros ya que son personas que están más dispuestas a asumir riesgos, se deben crear actividades para ellos con el fin de que puedan mejorar su calidad de vida. Se puede pensar en hacer la implementación de un plan carrera o bonificación por antiguedad para evitar el retiro de los empleados que tienen pocos años en la empresa.