Actividad 1 - Datos Rotaciòn

La siguiente actividad corresponde a una compañía que presenta una situación de alta rotación (personas que se retiran de manera voluntaria de la compañía) en algunos empleados. La actividad consiste en por medio de la exploración de una base de datos en la cual se identifican posibles factores que se relacionan con la rotación tales como salario, carga laboral entre otros. Se pretende que el estudiante realice una descripción de la base, luego relaciones entre factores previamente identificados con la rotación y finalmente con estos factores proponer una estrategia de retención para mejorar las cifras de rotación.

library(readxl)
datos = read_excel("~/Downloads/Datos_Rotación.xlsx")
names(datos)
##  [1] "Rotacion"                    "Edad"                       
##  [3] "Viaje de Negocios"           "Departamento"               
##  [5] "Distancia_Casa"              "Educacion"                  
##  [7] "Campo_Educacion"             "Satisfaccion_Ambiental"     
##  [9] "Genero"                      "Cargo"                      
## [11] "Satisfacion_Laboral"         "Estado_Civil"               
## [13] "Ingreso_Mensual"             "Trabajos_Anteriores"        
## [15] "Horas_Extra"                 "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral"         "Anos_Experiencia"           
## [19] "Capacitaciones"              "Equilibrio_Trabajo_Vida"    
## [21] "Antiguedad"                  "Antiguedad_Cargo"           
## [23] "Anos_ultima_promocion"       "Anos_acargo_con_mismo_jefe"

Seleccionar 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas que consideren estén relacionadas con la rotación:

VARIABLES CATEGÓRICAS:

  1. La EDUCACIÓN como variable cualitativa ordinal puede estar relacionada a la rotación de una persona ya que al tener un mayor grado de estudio el individuo busca mejores oportunidades laborales lo cual genera cambios constantes segun sus logros academicos.

Hipótesis:A mayor grado de educación mayor probabilidad de rotar o cambiar de trabajo

Analisis univariado de los datos:

require(ggplot2)
## Loading required package: ggplot2
require(ggpubr)
## Loading required package: ggpubr
g1=ggplot(datos,aes(x=Educacion))+geom_bar()+theme_bw()
ggarrange(g1, labels = c("A"),ncol = 1, nrow = 1)

Se identifica que el grueso de los individuos corresponden a profesionales universitarios (grupo 3), seguido por un grupo que cuenta con maestria (grupo 4).

  1. La SATISFACCIÓN AMBIENTAL se puede considerar actualmente como un punto de referenia para que un individuo decida quedarse o ser parte de una organizaciòn, ya que en este aspecto influyen temas como la comodidad con su entorno, con su jefe y compañeros, que tan conforme se encuentra desempeñando sus actividades y si se siente valorado por su trabajo, entre otros. Por lo cual podriamos decir que cuanto mayor sea el grado de Satisfacción Ambiental hay menor probabilidad de rotar para un individuo.

Hipótesis: A mayor grado de satisfacción en el ambiente laboral, menor propabilidad de rotación laboral.

Analisis univariado de los datos:

require(ggplot2)
require(ggpubr)
g2=ggplot(datos,aes(x=Satisfaccion_Ambiental))+geom_bar()+theme_bw()
ggarrange(g2, labels = c("B"),ncol = 1, nrow = 1)

Accorde al grafico la santisfacción Ambiental de los individuos analizados se encuentra entre “Alta” y “Muy alta” las cuales en conjunto superan los 800 indiviuos de los 1470 registrados en la tabla de datos. Por lo cual se puede decir que mas del 50% tienen un ambiente laboral acorde a sus espectativas lo cual se refleja en un alto nivel de satisfacción ambiental.

  1. El ESTADO CIVIL de un individuo puede ser relevante al momento de tomar la decisión de cambiar de trabajo ya que pueden haber numerosas responsabilidades que varian segun el estado civil y estas pueden generar que el individuo quiera mantener un trabajo de forma estable, por lo que podriamos decir que una persona con estado civil casad@ es menos probable que tenga una alta rotación laboral, mientras que una persona soltera puede que tenga mayor rotación laboral.

Hipótesis: Si el individuo se encuentra en estado civil “solter@” es mas probable que rote o cambie de trabajo

Analisis univariado de los datos:

pie(table(datos$Estado_Civil))

La mayor proporción de los indivisuos se identifican con estado civil casado con casi la mitad del pastel, seguido por el grupo de solteros y en ultima instancia el grupo de divorciados con menor proporción.

require(ggplot2)
require(ggpubr)
g1=ggplot(datos,aes(x=Educacion))+geom_bar(bins=30)+theme_bw()
## Warning: Ignoring unknown parameters: bins
g2=ggplot(datos,aes(x=Satisfaccion_Ambiental))+geom_bar()+theme_bw()
g3=ggplot(datos,aes(x=Estado_Civil))+geom_bar()+theme_bw()
ggarrange(g1, g2, g3, labels = c("A", "B", "C"),ncol = 3, nrow = 1)

VARIABLES CUANTITATIVAS:

  1. La EDAD como variable cuantitativa continua puede estar relacionada directamente con la rotaciòn de una persona ya que ha menor edad mas alta es la probabilidad de que el individuo rote de trabajo al estar dentro de la etapa mas productiva de su vida laboral, por lo cual puede acceder a una mayor cantidad de ofertas laborales.

Hipótesis: A menor edad del individuo hay mayor probabiliadd de rotación o cambio de empleo

Análisis univariado de los datos:

require(ggplot2)
require(ggpubr)
g4=ggplot(datos,aes(x=Edad))+geom_histogram(bins=30)+theme_bw()
ggarrange(g4, labels = c("D"),ncol = 1, nrow = 1)

Se evidencia en el grafico que la concentraciñon en edad del grupo de 1470 individuos se da entre los 30 y 35 años, seguido por los de 35 a 40 años. Siendo en menor número aquellos menores a 25 años.

  1. La DISTANCIA entre el lugar de trabajo y la vivienda, pueden convertise en un factor de suma importancia en el momento de rotar de un trabajo y podriamos indicar que a menor distancia es menor la posibilidad de rotar o cambiar de trabajo. En la data disponible tenemos unicamente distancia en Km, pero también pueden haber otros factores inmersos dentro la misma como: Tiempo utilizado para recorrer la distancia, facilidad del medio de transporte, costo del transporte entre otros.

Hipótesis: A mayor distancia entre el trabajo y la vivienda, mayor probabilidad de cambiar o rotar de empleo.

Analisis univariado de los datos:

require(ggplot2)
require(ggpubr)
g5=ggplot(datos,aes(x=Distancia_Casa))+geom_bar()+theme_bw()
ggarrange(g5,labels = c("E"),ncol = 1, nrow = 1)

La mayoria de los individuos deben recorrer distancias menores a 10Km para ir de su lugar de residencia a su trabajo. Por lo que se podria decir que gran parte de los empleados deben recorrer distancias inferiores a los 5km, lo cual puede ser una ventaja. Sin embargo, hay un grupo que supera los 20km de distancia y estos podrian ser los que no esten comodos en su trabajo y busquen algo mas cerca a sus viviendas.

  1. El INGRESO MENSUAL que recibe una persona es uno de los principales factores que se tienen encuenta en el momento de cambiar de trabajo, ya que si las funciones que se estan ejecutando son mejor remuneradas en otros lugares, es probable que la persona decida cambiar de trabajo. Pór lo cual con un menor ingreso mensual se incrementa la posibilidad de cambiar de trabajo, es decir se incrementa la posibilidad de rotrar.

Hipótesis: Cuanto menor sea el ingreso mensual del individuo mayor es la probabilidad de cambiar o rotar de empleo.

require(ggplot2)
require(ggpubr)
g6=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
ggarrange(g6,labels = c("F"),ncol = 1, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Se evidencia que el ingreso mensual de los individuos en su mayoria se encuentran por debajo de los 5’000.000, lo cual puede ser uno de los factores que justifican la rotación ya que ser que dentro de este grupo muchos de ellos no se encuentren satisfechos con su remuneración o se sientan mal remuerados.

  1. Para la ROTACIÓN se identifica que es mayor la proporción de empleados (1233) que no rotan, que aquellos que si lo hacen (237). Por lo que se podria entender que mas del 80% de los empleados estan conformes con su trabajo y no estan interesados en cambiar su trabajo.
pie(table(datos$Rotacion))

require(ggplot2)
require(ggpubr)
g4=ggplot(datos,aes(x=Edad))+geom_histogram(bins=30)+theme_bw()
g5=ggplot(datos,aes(x=Distancia_Casa))+geom_bar()+theme_bw()
g6=ggplot(datos,aes(x=Ingreso_Mensual))+geom_histogram()+theme_bw()
ggarrange(g4, g5, g6, labels = c("D", "E", "F"),ncol = 3, nrow = 1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

datos$Edad_grupo=cut(datos$Edad,breaks = c(0,30,40,50,60))
require(table1)
## Loading required package: table1
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
## 
##     units, units<-
y <- table1::table1(~ Educacion+Satisfaccion_Ambiental+Estado_Civil+Edad+Distancia_Casa+Ingreso_Mensual | Rotacion, data = datos)
y
No
(N=1233)
Si
(N=237)
Overall
(N=1470)
Educacion
Mean (SD) 2.93 (1.03) 2.84 (1.01) 2.91 (1.02)
Median [Min, Max] 3.00 [1.00, 5.00] 3.00 [1.00, 5.00] 3.00 [1.00, 5.00]
Satisfaccion_Ambiental
Mean (SD) 2.77 (1.07) 2.46 (1.17) 2.72 (1.09)
Median [Min, Max] 3.00 [1.00, 4.00] 3.00 [1.00, 4.00] 3.00 [1.00, 4.00]
Estado_Civil
Casado 589 (47.8%) 84 (35.4%) 673 (45.8%)
Divorciado 294 (23.8%) 33 (13.9%) 327 (22.2%)
Soltero 350 (28.4%) 120 (50.6%) 470 (32.0%)
Edad
Mean (SD) 37.6 (8.89) 33.6 (9.69) 36.9 (9.14)
Median [Min, Max] 36.0 [18.0, 60.0] 32.0 [18.0, 58.0] 36.0 [18.0, 60.0]
Distancia_Casa
Mean (SD) 8.92 (8.01) 10.6 (8.45) 9.19 (8.11)
Median [Min, Max] 7.00 [1.00, 29.0] 9.00 [1.00, 29.0] 7.00 [1.00, 29.0]
Ingreso_Mensual
Mean (SD) 6830 (4820) 4790 (3640) 6500 (4710)
Median [Min, Max] 5200 [1050, 20000] 3200 [1010, 19900] 4920 [1010, 20000]
  1. Podemos identificar que para el caso de la educación la mediana tanto para los que No rotan como para los que Si lo hacen se encuentra en 3 lo que indica que el grueso de los individuos tienen un nivel educativo profesional. Y se podria intuir que dicha variable no es significativa en el momento en el que el individuo toma la decisión de permanecer o cambiar de trabajo.

  2. Para el caso de la satisfacción en el ambiente laboral se encuentra una media muy cercana para aquellos que No rotan (2,77) y para aquellos que Si lo hacen (2,46). Lo que nos podria indicar que este aspecto es indiferente en el momento de tomar la decisión de rotar de empleo.

  3. De los que si rotaron el 50% corresponde a solteros, mientras que de los que no lo hicieron los casados son los que mayor porcentaje abarcan con el 48%. Lo que nos permite inferir que a el estado civil de un individuo si puede tener incidencia al momento de tomar la decisión de rotar de empleo.

  4. Podemos observar que los que Si rotaron son un poco mas jovenes que los No rotaron ya que la media de los que Si rotaron se encuentra en 33.6, mientras que la media de los que No rotaron se encuentra en 37.6, hay una leve diferencia. Sin embargo, puede que no sea tan marcada para establecer que el factor edad es fundamental al momento de rotar de un empleo a otro.

  5. la Distancia por su parte refleja que para el caso de los que Si rotaron es dos veces mayor la distancia en KM, que la distancia que recorren los que No rotaron en KM. Lo que permite identificar que el factor distancia puede ser importante o significativo en el momento que el individuo toma la decisión de rotar de un empleo a otro.

  6. Por ultimo la diferencia de ingreso entre aquellos que si rotaron y aquellos que no lo hicieron, es cercano a 2`000.000 por lo cual esta diferencia en el momento de cambiar de trabajo puede ser relevante ya que el incremento de su ingreso mensual puede constituirse en el factor decisivo al momento de tomar la decisión de rotar o no hacerlo.

##Si es Cuantitativa
t.test(datos$Distancia_Casa~datos$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  datos$Distancia_Casa by datos$Rotacion
## t = -2.8882, df = 322.72, p-value = 0.004137
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  -2.8870025 -0.5475146
## sample estimates:
## mean in group No mean in group Si 
##         8.915653        10.632911
t.test(datos$Edad~datos$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  datos$Edad by datos$Rotacion
## t = 5.828, df = 316.93, p-value = 1.38e-08
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  2.618930 5.288346
## sample estimates:
## mean in group No mean in group Si 
##         37.56123         33.60759
t.test(datos$Ingreso_Mensual~datos$Rotacion)
## 
##  Welch Two Sample t-test
## 
## data:  datos$Ingreso_Mensual by datos$Rotacion
## t = 7.4826, df = 412.74, p-value = 4.434e-13
## alternative hypothesis: true difference in means between group No and group Si is not equal to 0
## 95 percent confidence interval:
##  1508.244 2583.050
## sample estimates:
## mean in group No mean in group Si 
##         6832.740         4787.093
##Si es Cualitativa
require(CGPfunctions)
## Loading required package: CGPfunctions
PlotXTabs2(data = datos,x = Edad_grupo,y = Rotacion)

PlotXTabs2(data = datos,x = Satisfaccion_Ambiental,y = Rotacion)

PlotXTabs2(data = datos,x = Educacion,y = Rotacion)

PlotXTabs2(data = datos,x = Estado_Civil,y = Rotacion)

CONCLUSIONES:

Acorde a los hallazgos identificados con las variables analizadas, podemos inferir que algunas de ellas como el nivel educativo o la edad no constituyen un factor relevante en el momento de tomar al decisión de cambiar de trabajo. Sin embargo, se podria indicar que el estado civil, la distancia y el ingreso mensual son factores significativos en la toma de decisiones de los individuos. Por lo cual las estrategias de la compañia deben estar relacionadas a:

  1. Implementar alternativas para sus empleados que les permitan facil acceso a creditos de vivienda o de educación para los empleados o sus hijos. También subsidios o bonos de vivienda o educación. Lo que puede llevar a que los empleados casados, sientan mayores garantias al ser parte de la compañia.

  2. Se podria implementar una ruta que cubra la generalidad de las zonas donde viven los empleados o en un punto común donde estos puedan tener este servicio de transporte por parte de la compañia. Otra alternativa podria ser la implementación de home office, lo que puede reducir los costos y mejorar la calidad de vida para los empleados.

  3. Estipular los rangos de salariales acorde a los cargos que se encuentran en la compañia y que sean de publico conocimiento para los empleados, esto permite que identifiquen su rango salarian y se sientan mas comodos con su ingreso mensual. A su vez, algunos incentivos salariales como bonos por iniciativas para reducción de costos o bonos por antiguedad en la compañia podrian ser un factor que impacte positivamente a los empleados.