Actividad 1 - Datos Rotación

La siguiente actividad corresponde a una compañía que presenta una situación de alta rotación (personas que se retiran de manera voluntaria de la compañía) en algunos empleados. La actividad consiste en por medio de la exploración de una base de datos en la cual se identifican posibles factores que se relacionan con la rotación tales como salario, carga laboral entre otros. Se pretende que el estudiante realice una descripción de la base, luego relaciones entre factores previamente identificados con la rotación y finalmente con estos factores proponer una estrategia de retención para mejorar las cifras de rotación.

La base de datos a utilizar es una hoja de excel, con las siguientes variables.

library(readxl)
datos = read_excel("C:/Users/manue/Downloads/Datos_Rotacion.xlsx")
names(datos)
##  [1] "Rotacion"                    "Edad"                       
##  [3] "Viaje de Negocios"           "Departamento"               
##  [5] "Distancia_Casa"              "Educación"                  
##  [7] "Campo_Educación"             "Satisfacción_Ambiental"     
##  [9] "Genero"                      "Cargo"                      
## [11] "Satisfacion_Laboral"         "Estado_Civil"               
## [13] "Ingreso_Mensual"             "Trabajos_Anteriores"        
## [15] "Horas_Extra"                 "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral"         "Años_Experiencia"           
## [19] "Capacitaciones"              "Equilibrio_Trabajo_Vida"    
## [21] "Antigüedad"                  "Antigüedad_Cargo"           
## [23] "Años_ultima_promoción"       "Años_acargo_con_mismo_jefe"

Primer Ejercicio

Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que consideren estén relacionadas con la rotación. Nota: Justificar por que estas variables están relacionadas y que tipo de relación se espera (Hipótesis).

Variables Categóricas:

  1. Satisfacción laboral: En este análisis se espera que la satisfacción laboral se relacione con la rotación, ya que, si la persona manifiesta un nivel de satisfacción bajo, buscara nuevas oportunidades en donde sentirse apreciado y cómodo. Hipotesis: Las personas con menor satisfacción laboral, tienen mayor posibilidad de rotar, que aquellas que manifiestan un nivel de satisfacción alto.

  2. Estado civil: En este análisis se espera que el estado civil se relacione con la rotación ya que, al existir mayores responsabilidades y más personas a cargo, como el caso de los casados, querrán mantener un trabajo de forma estable. Hipotesis: Las personas con estado civil casado, tienen menor posibilidad de rotar, que aquellos de estado civil soltero.

  3. Horas extra: En este análisis se espera que las horas extra esté relacionada con la rotación, ya que, si a las personas les demandan mayor tiempo de permanencia en el trabajo, con actividades extra de forma seguida, dejando sin tiempo y energías para realizar sus actividades personales, buscara nuevas oportunidades laborales. Hipotesis: Las personas que trabajan horas extra tienen mayor posibilidad de rotar, que aquellas que no trabajan horas extra.

Variables Cuantitativas:

  1. Edad: En este análisis se espera que la edad se relacione con la rotación, ya que las personas más jóvenes son proclives a los cambios de rumbo. Hipótesis: Las personas que tiene menor edad tienen mayor posibilidad de rotar, que aquellas que tienen mayor edad.

  2. Distancia a la casa: En este análisis se espera que la distancia a la casa se relacione con la rotación, ya que a una mayor distancia de viaje afecta la comodidad al disponer de menos tiempo libre para otras actividades. Hipotesis: Las personas que viven más lejos del trabajo, tienen mayor posibilidad de rotar que aquellas que viven cerca al mismo.

  3. Ingresos Mensual: Las personas que perciben menores ingresos laborales, tienen mayor posibilidad de rotar, que aquellas que perciben mayores ingresos. Hipotesis: Percibir una compensación económica inferior a lo que los empleados consideran adecuado con base en sus deberes, formación, conocimientos y experiencias también puede ocasionar muchas rotaciones

Segundo Ejercicio

Realizar un análisis univariado (caracterización). Incluir interpretaciones de la rotación.

Variables Categóricas:

Las categorias de la variable Satisfacción laboral son: 1: muy bajo, 2: bajo, 3: media, 4: alta. Podemos apreciar, que para la variable Satisfacción Laboral de 1470 personas, 901 manisfestaron un nivel de satisfaccion alto y medio que representa un 61.3% del total. En cuanto a la rotación, las personas que si lo hicieron son un total de 237, aquellas que manisfestaron un nivel de satisfaccion laboral medio fueron las que más rotaron y represento un 30.1% seguido de personas con nivel de satisfacción muy bajo que fueron un 27.8%.

En cuanto a la variable Estado civil. En general es mayor el numero de personas casadas, seguido por las personas con estado civil soltero y por ultimo los divorciados, de las personas que si rotaron, 50.6% son solteros.

Por otra parte, analizando la variable horas extra, en general, es mayor la cantidad de personas que no realizan horas extra. Pero dentro del grupo de personas que si rotaron, 53.6% realizaron horas extra y cambiaron de trabajo.

require(ggplot2)
## Loading required package: ggplot2
require(ggpubr)
## Loading required package: ggpubr
g1=ggplot(datos,aes(x=Satisfacion_Laboral))+geom_bar()+theme_bw()
g2=ggplot(datos,aes(x=Estado_Civil))+geom_bar()+theme_bw() 
g3=ggplot(datos,aes(x=Horas_Extra))+geom_bar()+theme_bw()
ggarrange(g1,g2,g3, labels=c("A","B","C"),ncol=2,nrow=2)

y <- table1::table1(~factor(Satisfacion_Laboral)+factor(Estado_Civil)+factor(Horas_Extra) | Rotacion, data = datos)
y
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
factor(Satisfacion_Laboral)
1 223 (18.1%) 66 (27.8%) 289 (19.7%)
2 234 (19.0%) 46 (19.4%) 280 (19.0%)
3 369 (29.9%) 73 (30.8%) 442 (30.1%)
4 407 (33.0%) 52 (21.9%) 459 (31.2%)
factor(Estado_Civil)
Casado 589 (47.8%) 84 (35.4%) 673 (45.8%)
Divorciado 294 (23.8%) 33 (13.9%) 327 (22.2%)
Soltero 350 (28.4%) 120 (50.6%) 470 (32.0%)
factor(Horas_Extra)
No 944 (76.6%) 110 (46.4%) 1054 (71.7%)
Si 289 (23.4%) 127 (53.6%) 416 (28.3%)

Variables Cuantitativas:

En cuanto a la variable Edad la mayoría de personas se encuentra entre los 30 y 40 años, en cuanto a las personas que si rotaron por lo general tienen un promedio de edad de 33.6 años, aunque esta diferencia no es tan significativa con respecto a los que no rotaron, teniendo en cuenta la desviación estándar.

Para la variable distancia a casa en general la mayoría de personas se encontraban a una distancia menor a 10km, y aquí ocurre lo mismo que con la variable edad, la diferencia entre aquellas personas que rotaron y las que no, no es tan significativa, solo un par de kilómetros la diferencia.

Por otra parte, analizando la variable ingreso mensual podemos visualizar que es significativa la diferencia entre los salarios de las personas que, si rotaron con respecto a las que no rotaron, los que si rotaron tenían ingresos mensuales menores con una diferencia de aproximadamente 2 millones de pesos, el cual es una cantidad importante que motiva a realizar un cambio de trabajo.

require(ggplot2)
require(ggpubr)

g1=ggplot(datos,aes(x=Edad))+geom_histogram()+theme_bw()
g2=ggplot(datos,aes(x=Distancia_Casa))+geom_histogram()+theme_bw()
g3=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
ggarrange(g1,g2,g3, labels=c("A","B","C"),ncol=2,nrow=2)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

datos$Edad_grupo=cut(datos$Edad,breaks=c(0,30,40,50,60)) 
require(table1) 
## Loading required package: table1
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
## 
##     units, units<-
y<-table1::table1(~Edad+Distancia_Casa+Ingreso_Mensual|Rotacion,data=datos) 
y
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Edad
Mean (SD) 37.6 (8.89) 33.6 (9.69) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0] 32.0 [18.0, 58.0] 36.0 [18.0, 60.0]
Distancia_Casa
Mean (SD) 8.92 (8.01) 10.6 (8.45) 9.19 (8.11)
Median [Min, Max] 7.00 [1.00, 29.0] 9.00 [1.00, 29.0] 7.00 [1.00, 29.0]
Ingreso_Mensual
Mean (SD) 6830 (4820) 4790 (3640) 6500 (4710)
Median [Min, Max] 5200 [1050, 20000] 3200 [1010, 19900] 4920 [1010, 20000]

Tercer Ejercicio

Realizar un análisis de bivariado en donde la variable respuesta sea la rotación, con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar. Compare estos resultados con la hipotesis planteada en el punto 1.

Variables Categóricas:

Con respecto a la variable satisfaccion laboral podemos apreciar que hay una diferencia en la proporción de empleados que si rotaron para las categorías de satisfacción laboral muy bajo y alta, una rotación de 23% y una rotación de 11%, respectivamente. Comparando con el planteamiento de la pregunta 1, en esta empresa la rotación esta influenciado por la satisfacción laboral, las personas tienden a renunciar cuando manifiestan un nivel de satisfacción laboral bajo.

require(CGPfunctions) 
## Loading required package: CGPfunctions
PlotXTabs2(data=datos,x=Satisfacion_Laboral,y=Rotacion)

Con respecto a la variable Estado Civil podemos apreciar que hay una diferencia en la proporción de empleados que si rotaron para las categorías de estado civil solteros y casados, con una rotación del 26% y 12% respectivamente. Comparando con el planteamiento de la pregunta 1, en esta empresa la rotación esta influenciado por el estado civil, las personas tienden a renunciar cuando estan solteras.

require(CGPfunctions) 
PlotXTabs2(data=datos,x=Estado_Civil,y=Rotacion)

Con respecto a la variable horas extra podemos apreciar que hay una diferencia en la proporción de empleados que si rotaron para las categorías horas extra si y horas extra no, con una rotación del 31% y 10% respectivamente. Comparando con el planteamiento de la pregunta 1, en esta empresa la rotación esta influenciado por la realización de horas extra, las personas tienden a renunciar cuando les solicitan realizar horas extra.

require(CGPfunctions) 
PlotXTabs2(data=datos,x=Horas_Extra,y=Rotacion)

Variables Cuantitativas:

En cuanto a la variable EDAD podemos apreciar que se presenta una mayor rotación en los empleados con menor edad, lo podemos apreciar en el grafico boxplot, ya que la mediana de edad de los empleados que si rotaron es menor que la mediana de los empleados que no rotaron. Comparando con el planteamiento de la pregunta 1, en esta empresa la rotación esta influenciada por la edad, las personas tienden a renunciar cuando son más jovenes.

t.test(datos$Edad~datos$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  datos$Edad by datos$Rotacion
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si 
##         37.56123         33.60759
ggplot(data = datos, aes(x = Rotacion, y = Edad)) +
  geom_boxplot()

En cuanto a la variable Distancia a Casa, visualizando el grafico boxplot, se puede concluir que la rotación en esta empresa no depende de la distancia al trabajo, ya que no se evidencia una diferencia significativa en la mediana de los grupos que rotaron y los que no rotaron. Comparando con el planteamiento de la pregunta 1, encontramos una diferencia y es que en esta empresa la rotación no depende de distancia al trabajo.

t.test(datos$Distancia_Casa~datos$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  datos$Distancia_Casa by datos$Rotacion
## t = -2.8882, df = 322.72, p-value = 0.004137
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  -2.8870025 -0.5475146
## sample estimates:
## mean in group No mean in group Si 
##         8.915653        10.632911
ggplot(data = datos, aes(x = Rotacion, y = Distancia_Casa)) +
  geom_boxplot()

Por otra parte, analizando la variable ingreso mensual podemos visualizar en el grafico que es significativa la diferencia entre las medianas de los salarios de las personas que si rotaron con respecto a las que no rotaron. Comparando con el planteamiento de la pregunta 1, en esta empresa la rotación esta influenciada por el ingreso mensual, las personas tienden a rotar cuando tienen un salario más bajo.

t.test(datos$Ingreso_Mensual~datos$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  datos$Ingreso_Mensual by datos$Rotacion
## t = 7.4826, df = 412.74, p-value = 4.434e-13
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  1508.244 2583.050
## sample estimates:
## mean in group No mean in group Si 
##         6832.740         4787.093
ggplot(data = datos, aes(x = Rotacion, y = Ingreso_Mensual)) +
  geom_boxplot()

Cuarto Ejercicio

Conclusiones

Segun lo visualizado en las variables analizadas, podemos determinarr que algunas de ellas como la distancia al trabajo constituyen un factor relevante en el momento de tomar la decisión de rotar. Sin embargo, se podria indicar que el estado civil, el ingreso mensual y horas extra son factores significativos en la toma de decisiones de las personas a la hora de rotar. Por lo cual las estrategias de la compañia deben estar relacionadas.

  • Generar oportunidades de crecimiento, los empleados pueden ser la mejor fuente de talento cuando hay nuevas oportunidades en la empresa. Idealmente, los empleados deberían enterarse de esas oportunidades a través de la dirección y por medio de una charla abierta con sus jefes sobre metas y aspiraciones profesionales.

  • Promover un balance sano vida-trabajo, Ofrecer flexibilidad para que los empleados alcancen un balance sano entre la vida y el trabajo puede ayudar a tu empresa a generar una cultura de confianza y respeto.

  • Invertir en mejores salarios, pagarles a los empleados más de lo que podrían conseguir en un trabajo similar, puede ayudar a que permanezcan en la empresa. Por ello invertir en mejores salarios será más provechoso en aquellos casos en los que la experiencia o capacitación representen un alto coste por el aprendizaje.

  • Crea un espacio de trabajo ideal, indispensable generar un ambiente de trabajo que motive a los empleados es fundamental para evitar la rotación de personal. generar un ambiente de trabajo que motive a los empleados es fundamental para evitar la rotación de personal.