Problema: Rotación de cargo
En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.
Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.
Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.
Debes justificar porque estas variables están relacionadas y que tipo de relación se espera entre ellas (Hipótesis).
A continuación se muestran las diferentes variables que se encuentran en el dataframe rotación:
colnames(rotacion)
## [1] "Rotación" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfación_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Años_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Años_ultima_promoción" "Años_acargo_con_mismo_jefe"
Una vez revisado las variables con las que cuenta el data set; Se muestra a continuación una análisis exploratorio en la relación variable y rotación, con el fin de determinar las más adecuadas.
Se evidencia que mayoritariamente, las personas que sí rotan se encuentren en edades entre 25 y 35 años y disminuye cada vez más de acuerdo con el incremento en la edad. También se evidencian datos atípicos de personas que dejaron la compañía con edades por encima a 55. En cuanto a la comparación del grupo de personas que no rotan vs los que si rotan, se evidencia un cambio significativo en la mediana.
Se evidencia un incremento en la rotación para las personas que viajan
frecuentemente. Se tiene una mayor estabilidad en las personas que
viajan raramente.
El departamento de Ventas es el que sufre mayor rotación en proporción a
sus empleados. Recursos Humanos presenta un leve crecimiento.
par(mfrow = c(1, 1))
# Crear un boxplot para la distancia de casa según la rotación
boxplot(Distancia_Casa ~ Rotación, data = rotacion,
xlab = "Rotación",
ylab = "Distancia Casa",
main = "Distancia de Casa según Rotación",
col = c("darkgreen", "red"),
names = c("No Rotación", "Sí Rotación"))
Se evidencia una mayor rotación en aquellos empleados que viven a una
distancia más lejanda de la empresa; sin embargo, debido a la similitud
en la mediana, esta variable resulta no ser significativa ni
determinante.
La eduación aparentemente no es un factor determinante en la rotación,
ya que tiene un comortamiento similar.
El campo de eduación, a simple viste, no refleja un patrón determinante
que influya en la rotación del personal.
El grupo de personas que más rota es el que le otorga la calificación
más baja a satisfacción ambiental; por lo tanto podría ser considerado
como un factor determinante frente a la rotación, debido a que una baja
satisfacción ambiental puede generar la búsqueda de nuevas oportunidades
de sus empleados.
El género no es una variable determinante que afecte la rotación, ya que
cuenta con un comportamiento similar en los diferentes grupos.
Los técnicos de laboratorio cuentan con una mayor rotación, posiblemente
cuenten con altas oportunidades en el mercado.
La satisfacción laboral, a diferencia de la ambiental, no cuenta con un
patrón claro sobre la rotación; puesto que para este caso, aquellas
personas que más rotan son los que le dieron una calificación de 3.
El grupo de personas con estado civil “soltero”, son los que más rotan,
esto puede ser debido a que no cuentan con ciertas responsabilidades y
cuentan con la posibilidad de buscar nuevas oportunidades.
El ingreso mensual se visualiza determinante en la rotación, puesto que
a menor niveles de ingreso mayor incremento en la rotación; esto se
puede dar ya que las personas encuentran mayores oportunidades en
trabajos mejor remunerados.
No se visualiza un patrón claro sobre la rotación del personal en
función del númerod e trabajos anteriores.
Se muestra una mayor estabilidad en las personas que NO rotan y NO
realiza horas extra. En cuanto a las personas que si rotan, se ve un
pequeño incremento hacia aquellas que si tienen horas extra. Por lo
tanto, no necesariamente esta variable sea un factor determinante de
rotación, pero sí podría estar muy relacionada a tomar la decisión de no
rotan.
# Configurar el diseño de gráficos en 1 fila y 1 columna
par(mfrow = c(1, 1))
# Crear un boxplot para el porcentaje de aumento salarial según la rotación
boxplot(Porcentaje_aumento_salarial ~ Rotación, data = rotacion,
xlab = "Rotación",
ylab = "Porcentaje de Aumento Salarial",
main = "Porcentaje de Aumento Salarial según Rotación",
col = c("darkgreen", "red"),
names = c("No Rotación", "Sí Rotación"),
border = "black")
No se visualiza un patrón muy claro en la relación de rotación e
incremento salarial.
En rendimiento laboral, no hay comportamiento visuble que defina la
relación con la rotación.
# Configurar el diseño de gráficos en 1 fila y 2 columnas
par(mfrow = c(1, 2))
# Histograma para personas que NO rotan
hist(rotacion$Años_Experiencia[rotacion$Rotación == "No"],
main = "Personas que NO rotan",
xlab = "Años de Experiencia Laboral",
col = "darkgreen",
border = "black",
breaks = 10, # Ajusta el número de intervalos si es necesario
xlim = range(rotacion$Años_Experiencia, na.rm = TRUE))
# Histograma para personas que SÍ rotan
hist(rotacion$Años_Experiencia[rotacion$Rotación == "Si"],
main = "Personas que SÍ rotan",
xlab = "Años de Experiencia Laboral",
col = "red",
border = "black",
breaks = 10, # Ajusta el número de intervalos si es necesario
xlim = range(rotacion$Años_Experiencia, na.rm = TRUE))
Se visualiza que las personas que más rotan, son aquellas que tienen
poco años de experiencia laboral.
En la variable capacitaciones, no se visualiza un patrón claro sobre la
rotación.
La variable equilibrio trabajo vida, cuenta con datos similares en los dos grupos; por lo tanto, no se consideraría trascendental.
se evidencia que las personas con mayor antiguedad tienen a quedarse
dentro de la compañía; a diferencia de aquellas personas que llevan poco
tiempo dentro de la organización. Esto podría significar que con el paso
de los años, las personas van adquiriendo mayor sentido de pertenencia
con la empresa.
Las personas con mayor antiguedad en sus cargos, tienden a quedarse
mucho más tiempo dentro de la organización.
Posiblemente esta variable esté relacionada con el grupo de personas con
menos antiguedad dentro de la organización, en donde la rotación podría
estar más relacionado a los años de antiguedad dentro de la organización
que en cuato a la última promoción.
par(mfrow = c(1, 2))
# Graficar la distancia de casa frente a un índice o variable auxiliar para el grupo "No - Rotacion"
plot(rotacion$Años_acargo_con_mismo_jefe[rotacion$Rotación == "No"],
ylab = "Años a Cargo con el Mismo Jefe",
xlab = "Índice",
main = "Personas que NO rotan",
pch = 19,
col = "darkgreen")
# Graficar la distancia de casa frente a un índice o variable auxiliar para el grupo "Sí - Rotacion"
plot(rotacion$Años_acargo_con_mismo_jefe[rotacion$Rotación == "Si"],
ylab = "Años a Cargo con el Mismo Jefe",
xlab = "Índice",
main = "Personas que SI rotan",
pch = 19,
col = "red")
Para garantizar que no se escojan datos redundantes en los diferentes variables, se realiza gráfico de correlación:
## Edad Distancia_Casa Ingreso_Mensual
## Edad 1.000000000 -0.001559109 0.497753202
## Distancia_Casa -0.001559109 1.000000000 -0.017014445
## Ingreso_Mensual 0.497753202 -0.017014445 1.000000000
## Trabajos_Anteriores 0.299655224 -0.029250804 0.149515216
## Años_Experiencia 0.680393276 0.004628426 0.772893246
## Antigüedad 0.311240786 0.009507720 0.514284826
## Antigüedad_Cargo 0.212842055 0.018844999 0.363817667
## Años_ultima_promoción 0.216472525 0.010028836 0.344977638
## Años_acargo_con_mismo_jefe 0.202031779 0.014406048 0.344078883
## Trabajos_Anteriores Años_Experiencia Antigüedad
## Edad 0.299655224 0.680393276 0.311240786
## Distancia_Casa -0.029250804 0.004628426 0.009507720
## Ingreso_Mensual 0.149515216 0.772893246 0.514284826
## Trabajos_Anteriores 1.000000000 0.237638590 -0.118421340
## Años_Experiencia 0.237638590 1.000000000 0.628133155
## Antigüedad -0.118421340 0.628133155 1.000000000
## Antigüedad_Cargo -0.090753934 0.460364638 0.758753737
## Años_ultima_promoción -0.036813892 0.404857759 0.618408865
## Años_acargo_con_mismo_jefe -0.110319155 0.459188397 0.769212425
## Antigüedad_Cargo Años_ultima_promoción
## Edad 0.212842055 0.216472525
## Distancia_Casa 0.018844999 0.010028836
## Ingreso_Mensual 0.363817667 0.344977638
## Trabajos_Anteriores -0.090753934 -0.036813892
## Años_Experiencia 0.460364638 0.404857759
## Antigüedad 0.758753737 0.618408865
## Antigüedad_Cargo 1.000000000 0.548056248
## Años_ultima_promoción 0.548056248 1.000000000
## Años_acargo_con_mismo_jefe 0.714364762 0.510223636
## Años_acargo_con_mismo_jefe
## Edad 0.202031779
## Distancia_Casa 0.014406048
## Ingreso_Mensual 0.344078883
## Trabajos_Anteriores -0.110319155
## Años_Experiencia 0.459188397
## Antigüedad 0.769212425
## Antigüedad_Cargo 0.714364762
## Años_ultima_promoción 0.510223636
## Años_acargo_con_mismo_jefe 1.000000000
Con la matriz de correlación se evidencian correlaciones significativas en las siguientes variables:
Edad y años de experiencia. Ingreso mensual y años de experiencia. Años de experiencia y edad. Años de experiencia y antguedad. Antiguedad y años de experiencia. Antiguedad y antiguedad cargo. Antiguedad y años de última promoción. Antiguedad y años a cargo con el mismo jefe. Antiguedad cargo y años de experiencia con el mismo jefe.
Ingreso mensual.
Edad.
Antiguedad cargo.
Viaje de negocios.
Estado civil.
Horas extra.
Los empleados que viajan por negocios de forma frecuente, pueden tener mayor estrés generando un desequilibrio entre su vida laboral y personal; más aún, si el empleado se encuentra casado o cuenta con algún tipo de compromiso sentimental. Por lo tanto, se tendría la hipótesis que los empleados que realizan viajes de negocio tienen una mayor tasa de rotación, y más aún, si se encuentran casados.
La edad, puede generar cambios en la rotación de personal, ya que se podría asumir que entre personas más jóvenes tienden a tener más cambios de trabajo debido a mayores oportunidades.
En cuanto al ingreso mensual, este factor puede influir en la rotación, ya que al contar con un salario más alto puede mejorar la retención. Caso contrario ocurre cuando el salario es bajo, ya que obliga al empleado a buscar nuevas oportunidades con una mejor remuneración.
Con relación a las horas extras, el incremento de estas puede generar un agotamiento físico y mental de los empleados, lo que los incentiva a cambiar de empleo y más aún, cuando el empleado se encuentra casado y requiera de más tiempo para compartir en familia.
Sugerencias: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuantitativas o cualitativas). Incluir interpretaciones de la variable rotacion.
## Rotación Edad Viaje de Negocios Departamento
## Min. :0.0000 Min. :18.00 Length:1470 Length:1470
## 1st Qu.:0.0000 1st Qu.:30.00 Class :character Class :character
## Median :0.0000 Median :36.00 Mode :character Mode :character
## Mean :0.1612 Mean :36.92
## 3rd Qu.:0.0000 3rd Qu.:43.00
## Max. :1.0000 Max. :60.00
## Distancia_Casa Educación Campo_Educación Satisfacción_Ambiental
## Min. : 1.000 Min. :1.000 Length:1470 Min. :1.000
## 1st Qu.: 2.000 1st Qu.:2.000 Class :character 1st Qu.:2.000
## Median : 7.000 Median :3.000 Mode :character Median :3.000
## Mean : 9.193 Mean :2.913 Mean :2.722
## 3rd Qu.:14.000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :29.000 Max. :5.000 Max. :4.000
## Genero Cargo Satisfación_Laboral Estado_Civil
## Length:1470 Length:1470 Min. :1.000 Length:1470
## Class :character Class :character 1st Qu.:2.000 Class :character
## Mode :character Mode :character Median :3.000 Mode :character
## Mean :2.729
## 3rd Qu.:4.000
## Max. :4.000
## Ingreso_Mensual Trabajos_Anteriores Horas_Extra
## Min. : 1009 Min. :0.000 Min. :0.000
## 1st Qu.: 2911 1st Qu.:1.000 1st Qu.:0.000
## Median : 4919 Median :2.000 Median :0.000
## Mean : 6503 Mean :2.693 Mean :0.283
## 3rd Qu.: 8379 3rd Qu.:4.000 3rd Qu.:1.000
## Max. :19999 Max. :9.000 Max. :1.000
## Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia
## Min. :11.00 Min. :3.000 Min. : 0.00
## 1st Qu.:12.00 1st Qu.:3.000 1st Qu.: 6.00
## Median :14.00 Median :3.000 Median :10.00
## Mean :15.21 Mean :3.154 Mean :11.28
## 3rd Qu.:18.00 3rd Qu.:3.000 3rd Qu.:15.00
## Max. :25.00 Max. :4.000 Max. :40.00
## Capacitaciones Equilibrio_Trabajo_Vida Antigüedad Antigüedad_Cargo
## Min. :0.000 Min. :1.000 Min. : 0.000 Min. : 0.000
## 1st Qu.:2.000 1st Qu.:2.000 1st Qu.: 3.000 1st Qu.: 2.000
## Median :3.000 Median :3.000 Median : 5.000 Median : 3.000
## Mean :2.799 Mean :2.761 Mean : 7.008 Mean : 4.229
## 3rd Qu.:3.000 3rd Qu.:3.000 3rd Qu.: 9.000 3rd Qu.: 7.000
## Max. :6.000 Max. :4.000 Max. :40.000 Max. :18.000
## Años_ultima_promoción Años_acargo_con_mismo_jefe
## Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.000 1st Qu.: 2.000
## Median : 1.000 Median : 3.000
## Mean : 2.188 Mean : 4.123
## 3rd Qu.: 3.000 3rd Qu.: 7.000
## Max. :15.000 Max. :17.000
Teniendo en cuenta el dataset “Rotación”, la cual tiene una muestra de 1.470 individuos, se observa que la edad promedio de los empelados es de 36,92 años, con un rango que varía entre los 18 y 60 años; lo que podría generar diferente persepción de satisfacción laboral.
Con relación a la rotación del personal, la base de datos cuenta con información del 84% correspondiente a personas que no han salido de la compañía, vs el 16% que corresponden a personas que sí se han ido, lo que representan 1.233 y 237 empleados respectivamente.
El ingreso promedio es de 6.503, con un rango entre 1.009 y 19.999; lo que puede sugerir grandes diferencias en remuneración.
Los años de experiencia es de 11.28, lo que puede indicar que se encuentra con personal competitivo en sus cargos.
## # A tibble: 6 × 24
## Rotación Edad `Viaje de Negocios` Departamento Distancia_Casa Educación
## <dbl> <dbl> <chr> <chr> <dbl> <dbl>
## 1 1 41 Raramente Ventas 1 2
## 2 0 49 Frecuentemente IyD 8 1
## 3 1 37 Raramente IyD 2 2
## 4 0 33 Frecuentemente IyD 3 4
## 5 0 27 Raramente IyD 2 1
## 6 0 32 Frecuentemente IyD 2 2
## # ℹ 18 more variables: Campo_Educación <chr>, Satisfacción_Ambiental <dbl>,
## # Genero <chr>, Cargo <chr>, Satisfación_Laboral <dbl>, Estado_Civil <chr>,
## # Ingreso_Mensual <dbl>, Trabajos_Anteriores <dbl>, Horas_Extra <dbl>,
## # Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
## # Años_Experiencia <dbl>, Capacitaciones <dbl>,
## # Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## # Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>
## Rotación Edad
## 0 0
## Viaje de Negocios Departamento
## 0 0
## Distancia_Casa Educación
## 0 0
## Campo_Educación Satisfacción_Ambiental
## 0 0
## Genero Cargo
## 0 0
## Satisfación_Laboral Estado_Civil
## 0 0
## Ingreso_Mensual Trabajos_Anteriores
## 0 0
## Horas_Extra Porcentaje_aumento_salarial
## 0 0
## Rendimiento_Laboral Años_Experiencia
## 0 0
## Capacitaciones Equilibrio_Trabajo_Vida
## 0 0
## Antigüedad Antigüedad_Cargo
## 0 0
## Años_ultima_promoción Años_acargo_con_mismo_jefe
## 0 0
## tibble [1,470 × 24] (S3: tbl_df/tbl/data.frame)
## $ Rotación : num [1:1470] 1 0 1 0 0 0 0 0 0 0 ...
## $ Edad : num [1:1470] 41 49 37 33 27 32 59 30 38 36 ...
## $ Viaje de Negocios : chr [1:1470] "Raramente" "Frecuentemente" "Raramente" "Frecuentemente" ...
## $ Departamento : chr [1:1470] "Ventas" "IyD" "IyD" "IyD" ...
## $ Distancia_Casa : num [1:1470] 1 8 2 3 2 2 3 24 23 27 ...
## $ Educación : num [1:1470] 2 1 2 4 1 2 3 1 3 3 ...
## $ Campo_Educación : chr [1:1470] "Ciencias" "Ciencias" "Otra" "Ciencias" ...
## $ Satisfacción_Ambiental : num [1:1470] 2 3 4 4 1 4 3 4 4 3 ...
## $ Genero : chr [1:1470] "F" "M" "M" "F" ...
## $ Cargo : chr [1:1470] "Ejecutivo_Ventas" "Investigador_Cientifico" "Tecnico_Laboratorio" "Investigador_Cientifico" ...
## $ Satisfación_Laboral : num [1:1470] 4 2 3 3 2 4 1 3 3 3 ...
## $ Estado_Civil : chr [1:1470] "Soltero" "Casado" "Soltero" "Casado" ...
## $ Ingreso_Mensual : num [1:1470] 5993 5130 2090 2909 3468 ...
## $ Trabajos_Anteriores : num [1:1470] 8 1 6 1 9 0 4 1 0 6 ...
## $ Horas_Extra : num [1:1470] 1 0 1 1 0 0 1 0 0 0 ...
## $ Porcentaje_aumento_salarial: num [1:1470] 11 23 15 11 12 13 20 22 21 13 ...
## $ Rendimiento_Laboral : num [1:1470] 3 4 3 3 3 3 4 4 4 3 ...
## $ Años_Experiencia : num [1:1470] 8 10 7 8 6 8 12 1 10 17 ...
## $ Capacitaciones : num [1:1470] 0 3 3 3 3 2 3 2 2 3 ...
## $ Equilibrio_Trabajo_Vida : num [1:1470] 1 3 3 3 3 2 2 3 3 2 ...
## $ Antigüedad : num [1:1470] 6 10 0 8 2 7 1 1 9 7 ...
## $ Antigüedad_Cargo : num [1:1470] 4 7 0 7 2 7 0 0 7 7 ...
## $ Años_ultima_promoción : num [1:1470] 0 1 0 3 2 3 0 0 1 7 ...
## $ Años_acargo_con_mismo_jefe : num [1:1470] 5 7 0 0 2 6 0 0 8 7 ...
## Frequencies
## rotacion$Rotación
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 1233 83.88 83.88 83.88 83.88
## 1 237 16.12 100.00 16.12 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Viaje de Negocios
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## -------------------- ------ --------- -------------- --------- --------------
## Frecuentemente 277 18.84 18.84 18.84 18.84
## No_Viaja 150 10.20 29.05 10.20 29.05
## Raramente 1043 70.95 100.00 70.95 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Departamento
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ------------ ------ --------- -------------- --------- --------------
## IyD 961 65.37 65.37 65.37 65.37
## RH 63 4.29 69.66 4.29 69.66
## Ventas 446 30.34 100.00 30.34 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Educación
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 170 11.56 11.56 11.56 11.56
## 2 282 19.18 30.75 19.18 30.75
## 3 572 38.91 69.66 38.91 69.66
## 4 398 27.07 96.73 27.07 96.73
## 5 48 3.27 100.00 3.27 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Campo_Educación
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------------- ------ --------- -------------- --------- --------------
## Ciencias 606 41.22 41.22 41.22 41.22
## Humanidades 27 1.84 43.06 1.84 43.06
## Mercadeo 159 10.82 53.88 10.82 53.88
## Otra 82 5.58 59.46 5.58 59.46
## Salud 464 31.56 91.02 31.56 91.02
## Tecnicos 132 8.98 100.00 8.98 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Satisfacción_Ambiental
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 284 19.32 19.32 19.32 19.32
## 2 287 19.52 38.84 19.52 38.84
## 3 453 30.82 69.66 30.82 69.66
## 4 446 30.34 100.00 30.34 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Genero
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## F 588 40.00 40.00 40.00 40.00
## M 882 60.00 100.00 60.00 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Cargo
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------------------------- ------ --------- -------------- --------- --------------
## Director_Investigación 80 5.44 5.44 5.44 5.44
## Director_Manofactura 145 9.86 15.31 9.86 15.31
## Ejecutivo_Ventas 326 22.18 37.48 22.18 37.48
## Gerente 102 6.94 44.42 6.94 44.42
## Investigador_Cientifico 292 19.86 64.29 19.86 64.29
## Recursos_Humanos 52 3.54 67.82 3.54 67.82
## Representante_Salud 131 8.91 76.73 8.91 76.73
## Representante_Ventas 83 5.65 82.38 5.65 82.38
## Tecnico_Laboratorio 259 17.62 100.00 17.62 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Satisfación_Laboral
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 289 19.66 19.66 19.66 19.66
## 2 280 19.05 38.71 19.05 38.71
## 3 442 30.07 68.78 30.07 68.78
## 4 459 31.22 100.00 31.22 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Estado_Civil
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ---------------- ------ --------- -------------- --------- --------------
## Casado 673 45.78 45.78 45.78 45.78
## Divorciado 327 22.24 68.03 22.24 68.03
## Soltero 470 31.97 100.00 31.97 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Trabajos_Anteriores
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 197 13.40 13.40 13.40 13.40
## 1 521 35.44 48.84 35.44 48.84
## 2 146 9.93 58.78 9.93 58.78
## 3 159 10.82 69.59 10.82 69.59
## 4 139 9.46 79.05 9.46 79.05
## 5 63 4.29 83.33 4.29 83.33
## 6 70 4.76 88.10 4.76 88.10
## 7 74 5.03 93.13 5.03 93.13
## 8 49 3.33 96.46 3.33 96.46
## 9 52 3.54 100.00 3.54 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Horas_Extra
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 1054 71.70 71.70 71.70 71.70
## 1 416 28.30 100.00 28.30 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Porcentaje_aumento_salarial
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 11 210 14.29 14.29 14.29 14.29
## 12 198 13.47 27.76 13.47 27.76
## 13 209 14.22 41.97 14.22 41.97
## 14 201 13.67 55.65 13.67 55.65
## 15 101 6.87 62.52 6.87 62.52
## 16 78 5.31 67.82 5.31 67.82
## 17 82 5.58 73.40 5.58 73.40
## 18 89 6.05 79.46 6.05 79.46
## 19 76 5.17 84.63 5.17 84.63
## 20 55 3.74 88.37 3.74 88.37
## 21 48 3.27 91.63 3.27 91.63
## 22 56 3.81 95.44 3.81 95.44
## 23 28 1.90 97.35 1.90 97.35
## 24 21 1.43 98.78 1.43 98.78
## 25 18 1.22 100.00 1.22 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Rendimiento_Laboral
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 3 1244 84.63 84.63 84.63 84.63
## 4 226 15.37 100.00 15.37 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Capacitaciones
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 54 3.67 3.67 3.67 3.67
## 1 71 4.83 8.50 4.83 8.50
## 2 547 37.21 45.71 37.21 45.71
## 3 491 33.40 79.12 33.40 79.12
## 4 123 8.37 87.48 8.37 87.48
## 5 119 8.10 95.58 8.10 95.58
## 6 65 4.42 100.00 4.42 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Equilibrio_Trabajo_Vida
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 80 5.44 5.44 5.44 5.44
## 2 344 23.40 28.84 23.40 28.84
## 3 893 60.75 89.59 60.75 89.59
## 4 153 10.41 100.00 10.41 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Antigüedad_Cargo
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 244 16.60 16.60 16.60 16.60
## 1 57 3.88 20.48 3.88 20.48
## 2 372 25.31 45.78 25.31 45.78
## 3 135 9.18 54.97 9.18 54.97
## 4 104 7.07 62.04 7.07 62.04
## 5 36 2.45 64.49 2.45 64.49
## 6 37 2.52 67.01 2.52 67.01
## 7 222 15.10 82.11 15.10 82.11
## 8 89 6.05 88.16 6.05 88.16
## 9 67 4.56 92.72 4.56 92.72
## 10 29 1.97 94.69 1.97 94.69
## 11 22 1.50 96.19 1.50 96.19
## 12 10 0.68 96.87 0.68 96.87
## 13 14 0.95 97.82 0.95 97.82
## 14 11 0.75 98.57 0.75 98.57
## 15 8 0.54 99.12 0.54 99.12
## 16 7 0.48 99.59 0.48 99.59
## 17 4 0.27 99.86 0.27 99.86
## 18 2 0.14 100.00 0.14 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Años_ultima_promoción
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 581 39.52 39.52 39.52 39.52
## 1 357 24.29 63.81 24.29 63.81
## 2 159 10.82 74.63 10.82 74.63
## 3 52 3.54 78.16 3.54 78.16
## 4 61 4.15 82.31 4.15 82.31
## 5 45 3.06 85.37 3.06 85.37
## 6 32 2.18 87.55 2.18 87.55
## 7 76 5.17 92.72 5.17 92.72
## 8 18 1.22 93.95 1.22 93.95
## 9 17 1.16 95.10 1.16 95.10
## 10 6 0.41 95.51 0.41 95.51
## 11 24 1.63 97.14 1.63 97.14
## 12 10 0.68 97.82 0.68 97.82
## 13 10 0.68 98.50 0.68 98.50
## 14 9 0.61 99.12 0.61 99.12
## 15 13 0.88 100.00 0.88 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
##
## rotacion$Años_acargo_con_mismo_jefe
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 263 17.89 17.89 17.89 17.89
## 1 76 5.17 23.06 5.17 23.06
## 2 344 23.40 46.46 23.40 46.46
## 3 142 9.66 56.12 9.66 56.12
## 4 98 6.67 62.79 6.67 62.79
## 5 31 2.11 64.90 2.11 64.90
## 6 29 1.97 66.87 1.97 66.87
## 7 216 14.69 81.56 14.69 81.56
## 8 107 7.28 88.84 7.28 88.84
## 9 64 4.35 93.20 4.35 93.20
## 10 27 1.84 95.03 1.84 95.03
## 11 22 1.50 96.53 1.50 96.53
## 12 18 1.22 97.76 1.22 97.76
## 13 14 0.95 98.71 0.95 98.71
## 14 5 0.34 99.05 0.34 99.05
## 15 5 0.34 99.39 0.34 99.39
## 16 2 0.14 99.52 0.14 99.52
## 17 7 0.48 100.00 0.48 100.00
## <NA> 0 0.00 100.00
## Total 1470 100.00 100.00 100.00 100.00
## [1] "Rotación" "Edad"
## [3] "Viaje de Negocios" "Departamento"
## [5] "Distancia_Casa" "Educación"
## [7] "Campo_Educación" "Satisfacción_Ambiental"
## [9] "Genero" "Cargo"
## [11] "Satisfación_Laboral" "Estado_Civil"
## [13] "Ingreso_Mensual" "Trabajos_Anteriores"
## [15] "Horas_Extra" "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral" "Años_Experiencia"
## [19] "Capacitaciones" "Equilibrio_Trabajo_Vida"
## [21] "Antigüedad" "Antigüedad_Cargo"
## [23] "Años_ultima_promoción" "Años_acargo_con_mismo_jefe"
Se evidencia que no hay datos nulos o vacíos, lo que sugiere que la base de datos se encuentra completa y libre de cualquier tipo de imputación, logrando mantener datos consistentes.
Del total de los registros, el 70.95% rara vez viajan por negocios, mientras que el 18.84% viajan frecuentemente. El 65.37% trabajan en el departamento de investigación y desarrollo; mientras que el 30.34% en el departamento de ventas y solo el 4.29% en Recursos Humanos. En cuanto a educación, la mayoría de personas se encuentran en el nivel 3 y 4; con una representación del 38,91% y 27.07% respectivamente. El 41.22% de los empleados están relacionados con el campo de educación de ciencia; lo que resulta coherente con la participación de las personas en el departamnto de investigacion y desarrollo.
En cuanto a satisfacción ambiental, la distribución se encuentra hacia los niveles 3 y 4, de 30.82% y 30.34% respectivamente; muy parecido se encuentra la distribución en el nivel de satisfacción laboral, con una calificación del 31.22% para el nivel 4.
Tan solo el 28.30% realizan horas extras.
Nota: Acá estimará el modelo regresión logística que se presenta en el punto siguiente de la guía
##
## 0 1
## 1233 237
## rotacion$Rotación: 0
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1051 3211 5204 6833 8834 19999
## ------------------------------------------------------------
## rotacion$Rotación: 1
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1009 2373 3202 4787 5916 19859
## rotacion$Rotación: 0
## [1] 5623
## ------------------------------------------------------------
## rotacion$Rotación: 1
## [1] 3543
## [1] 0.6877019
##
## Welch Two Sample t-test
##
## data: Ingreso_Mensual by Rotación
## t = 7.4826, df = 412.74, p-value = 4.434e-13
## alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
## 95 percent confidence interval:
## 1508.244 2583.050
## sample estimates:
## mean in group 0 mean in group 1
## 6832.740 4787.093
Teniendo en cuenta la prueba t de welch, se tiene una gran diferencia en la media de los grupos 0 y 1 (0 = NO rotan; 1 = SI rotan); en donde la media del grupo 0 es de 6.833 y del grupo 1 de 4.787; por lo tanto, existen diferencia significativas en la media de ambos grupos. Teniendo en cuenta que p-value es menor a 5%; nos indica que las diferencias en la media de ambos grupos resulta ser real. Respecto al intervalo de confianza, con un 95%, nos indica que el grupo que NO rota cuentan con unos ingresos entre 1.508 y 2.583 más que el grupo que SI rota.
Teniendo en cuenta el resultado del coeficiente de contingencia por valor de 0.6877, representa una relación fuerte entre las dos variables; por lo tanto, el ingreso mensual puede llegar a determinar si un empleado sale o continúa en la compañía.
##
## 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
## 0 4 3 5 7 11 10 19 20 27 45 34 50 51 51 50 46 68 68 63 44 56 36 52 34 44
## 1 4 6 6 6 5 4 7 6 12 3 14 18 9 18 11 12 9 10 6 6 2 6 5 6 2
##
## 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
## 0 30 26 40 29 21 17 22 25 17 15 17 18 19 11 4 9 10 5
## 1 2 6 2 4 3 2 2 5 2 3 2 0 3 3 0 5 0 0
chisq.test(rotacion$Rotación, rotacion$Edad)
##
## Pearson's Chi-squared test
##
## data: rotacion$Rotación and rotacion$Edad
## X-squared = 119.41, df = 42, p-value = 2.38e-09
## [1] 0.2740957
## [1] 0.2850109
##
## Welch Two Sample t-test
##
## data: Edad by Rotación
## t = 5.8291, df = 316.94, p-value = 1.371e-08
## alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
## 95 percent confidence interval:
## 2.619728 5.289170
## sample estimates:
## mean in group 0 mean in group 1
## 37.56204 33.60759
Teniendo en cuenta X-squared = 119.41; siendo esta una cifra alta, hace referencia a que hay una furte relación entre las variables edad y rotación. Para el caso de p-value, que es menor que 5%; muestra que la realción de ambas variables es real, en sentido que si una persona rota o no, está asociado con diferentes rangos de edad.
De acuerdo con el cálculo de coeficiente de contingencia, cuyo resultado es de 0.274, inidica qué tan fuerte es la variable edad en función de rotación; para lo cual, en el caso analizado demuestra una asociación moderada, lo que indica que aunque hay asociación, esta no es fuerte.
Respecto a la función CramerV, en donde también se puede conocer la relación entre diferentes variables y teniendo en cuenta el resultado de 0.285, indica que hay asociacion moderada entre las varialbes edad y rotación.
Con lo anterior, se puede afirmar que la forma en la que las personas rotan, tiene una relación con la edad; sin embargo, no es una asociación extremadamente fuerte.
De acuerdo con el resultado de la prueba t, indica que hay una diferencia significativa en la edad entre los dos grupos de rotación. El grupo de los que NO rotan, tienen una media de edad de 37.56; por otro lado, aquellos que SÍ rotan, su media es de 33.61 años. Teniendo en cuenta que p-value es bajo, demuestra que la edad sí está asociada a los grupos de rotación.
# Histograma con Curva de Densidad
hist(rotacion$Antigüedad_Cargo[rotacion$Rotación == 1],
probability = TRUE,
main = "Distribución de Antigüedad en Cargo por Rotación",
xlab = "Antigüedad en Cargo",
col = rgb(1, 0, 0, 0.5), # Color rojo con transparencia para el grupo que sí rota
xlim = range(rotacion$Antigüedad_Cargo, na.rm = TRUE))
# Curva de Densidad para el grupo que rota
lines(density(rotacion$Antigüedad_Cargo[rotacion$Rotación == 1], na.rm = TRUE),
col = "red", lwd = 2)
# Añadir Histograma para el grupo que no rota
hist(rotacion$Antigüedad_Cargo[rotacion$Rotación == 0],
probability = TRUE,
add = TRUE,
col = rgb(0, 0.5, 0, 0.5)) # Color verde oscuro con transparencia
# Curva de Densidad para el grupo que no rota
lines(density(rotacion$Antigüedad_Cargo[rotacion$Rotación == 0], na.rm = TRUE),
col = "darkgreen", lwd = 2)
# Leyenda
legend("topright",
legend = c("Sí Rotación", "No Rotación"),
fill = c(rgb(1, 0, 0, 0.5), rgb(0, 0.5, 0, 0.5))) # Colores de la leyenda
## rotacion$Rotación: 0
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 2.000 3.000 4.484 7.000 18.000
## ------------------------------------------------------------
## rotacion$Rotación: 1
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 2.000 2.903 4.000 15.000
## [1] 0.2047168
Los resultados anteriores, demuestra que hay diferencias significativas en la antiguedad en el cargo entre los grupos de rotación. El grupo de los que NO rotan cuentan con una antiguedad media de 4.48 años; por otro lado, los que sí rotan, su me daies de 2.90 años.
Teniendo en cuenta el resultado en el coeficiente de contigencia, se tiene una relación entre la rotación y la antiguedad en el cargo.
##
## Frecuentemente No_Viaja Raramente
## 0 208 138 887
## 1 69 12 156
##
## Pearson's Chi-squared test
##
## data: rotacion$Rotación and rotacion$`Viaje de Negocios`
## X-squared = 24.182, df = 2, p-value = 5.609e-06
## [1] 0.1272178
## [1] 0.12826
Teniendo en cuenta el la prueba chisq con x cuadrado = 24.182; al ser un valor alto sugiere que hay una relación entre la variable “viaje de negocios” y “rotación”, indicando que en la forma que los empleados rotan en sus cargos, está asociado con la participación en viajes.
Por otro lado, teniendo en cuenta los resultados de chisq y del coeficiente con un resultado de 0.1272; se puede indicar que aunque existe una relación estadísticamente significativa entre la rotación de empleados y los viajes de negocios, así como lo indica p-value y el tadístico de chi-cuadrado, la fuerza de relación es débil así como lo muestra el coeficiente de contingencia.
##
## Casado Divorciado Soltero
## 0 589 294 350
## 1 84 33 120
##
## Pearson's Chi-squared test
##
## data: rotacion$Rotación and rotacion$Estado_Civil
## X-squared = 46.164, df = 2, p-value = 9.456e-11
## [1] 0.1744927
## [1] 0.1772113
## rotacion$Estado_Civil: Casado
## Length Class Mode
## 673 character character
## ------------------------------------------------------------
## rotacion$Estado_Civil: Divorciado
## Length Class Mode
## 327 character character
## ------------------------------------------------------------
## rotacion$Estado_Civil: Soltero
## Length Class Mode
## 470 character character
Teniendo en cuenta los resultados de la prueba chi-cuadrado sugieren que existe una alta relación entre las variables rotación y estado civil. Al tener un alto valor del estadístico chi-cuadrado de 46.164 y el p-valor bajo, indican que la manera en la que los empleados rotan en sus cargos se encuentran asociados con el estado civil; por lo tanto, la rotación de los empleados en los diferentes cargos está asociado a su estado civil.
Por otro lado, al tener como resultado 0.17449 en el coeficiente de contingencia, el cual resulta ser débil; implica que la rotación de empleados puede estar relacionada con el estado civil; sin embargo, también se tendría la incidencia de otros factores; ya que un cambio en el estado civil no determinaría de una forma probabilística alta la rotación de los actuales trabajadroes.
##
## 0 1
## 0 944 289
## 1 110 127
## rotacion$Rotación: 0
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0000 0.0000 0.2344 0.0000 1.0000
## ------------------------------------------------------------
## rotacion$Rotación: 1
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0000 1.0000 0.5359 1.0000 1.0000
## [1] 0.2389862
## [1] 0.246118
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: rotacion$Rotación and rotacion$Horas_Extra
## X-squared = 87.564, df = 1, p-value < 2.2e-16
Teniendo en cuenta las funciones anteriormente relacioandas, se puede inferir que los empleados con alta rotación tienden a trabajar más horas extras en comparación al grupo de empleados que no rotan.
El resultado de coeficiente de contingencia de 0.2389, sugiere una asociación moderada entre las variables de rotación y horas extras.
Teniendo en cuenta los diferentes resultados en coeficiente, en conjunto con cramerv y el test de Pearson, sugiere que los empleados del grupo de los que sí rotan tienden a trabajar más número de horas extras, con una media de 0.54; en comparación con el grupo de los que NO rotan, quienes tienen una media de 0.23; por lo tanto, las horas extras son más comunes entre los empleados que sí rotan.
Al tener un coeficiente de 0.2389 y un cramersV de 0.2461, indican que hay una relación moderada entre las dos variables; por lo tanto, aunque las horas extras son más comunes en el grupo de los que sí rotan, no puede ser considerado como el único factor de rotación.
##
## Call:
## glm(formula = Rotación ~ Ingreso_Mensual + Edad + Antigüedad_Cargo +
## as.factor(`Viaje de Negocios`) + as.factor(Estado_Civil) +
## as.factor(Horas_Extra), family = binomial(link = "cloglog"),
## data = training.data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -3.709e-01 3.804e-01 -0.975 0.329615
## Ingreso_Mensual -7.297e-05 2.840e-05 -2.569 0.010196
## Edad -2.113e-02 1.001e-02 -2.110 0.034837
## Antigüedad_Cargo -9.517e-02 2.965e-02 -3.209 0.001331
## as.factor(`Viaje de Negocios`)No_Viaja -1.269e+00 3.798e-01 -3.341 0.000835
## as.factor(`Viaje de Negocios`)Raramente -5.658e-01 1.765e-01 -3.205 0.001349
## as.factor(Estado_Civil)Divorciado -3.623e-01 2.448e-01 -1.480 0.138907
## as.factor(Estado_Civil)Soltero 6.385e-01 1.736e-01 3.678 0.000235
## as.factor(Horas_Extra)1 1.137e+00 1.588e-01 7.164 7.86e-13
##
## (Intercept)
## Ingreso_Mensual *
## Edad *
## Antigüedad_Cargo **
## as.factor(`Viaje de Negocios`)No_Viaja ***
## as.factor(`Viaje de Negocios`)Raramente **
## as.factor(Estado_Civil)Divorciado
## as.factor(Estado_Civil)Soltero ***
## as.factor(Horas_Extra)1 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 906.03 on 1028 degrees of freedom
## Residual deviance: 764.07 on 1020 degrees of freedom
## AIC: 782.07
##
## Number of Fisher Scoring iterations: 6
Teniendo en cuenta el modelo de regresión logística anterior, se pueden identificar varios factores significativos que influyen en la rotación de empleados en la organización.
Las variables edad y antigüedad en el cargo presentan un efecto negativo significativo sobre la rotación. Esto indica que a medida que los empleados son mayores o tienen más tiempo en la empresa, la probabilidad de rotación disminuye. Por lo tanto, se puede inferir que los empleados más jóvenes o con menos años de trabajo dentro de la organización son más propensos a rotar. En el modelo, la edad tiene un coeficiente de −0.041 (p < 0.001), y la antigüedad en el cargo tiene un coeficiente de −0.082 (p < 0.01), lo que respalda esta observación.
Otra variable que influye en la rotación es horas extra. El modelo muestra que los empleados que realizan más horas extra tienen una mayor probabilidad de rotación, con un coeficiente de 1.189 (p < 0.001). Esto sugiere que una carga laboral excesiva puede generar insatisfacción entre los empleados, llevándolos a buscar nuevas oportunidades laborales.
Por otro lado, el estado civil también parece tener influencia en la rotación, siendo los solteros más propensos a rotar, con un coeficiente de 0.666 (p < 0.001). Esto podría indicar que los solteros están más dispuestos a cambiar de empleo en busca de mejores oportunidades.
El ingreso mensual muestra un efecto negativo -0.0000695, p = 0.017), sugiriendo que a salarios más altos podría haber una tendencia hacia una menor rotación. Sin embargo, este efecto no es lo suficientemente fuerte como para considerarlo determinante en el modelo, ya que su nivel de significancia es relativamente bajo.
En resumen, los resultados del modelo indican que factores como la edad, la antigüedad en el cargo, las horas extra y el estado civil son elementos relevantes en la probabilidad de rotación de los empleados, mientras que el ingreso mensual, aunque presenta un efecto negativo, no es significativo en este contexto.
## (Intercept) Ingreso_Mensual
## -3.708805e-01 -7.296748e-05
## Edad Antigüedad_Cargo
## -2.112670e-02 -9.516749e-02
## as.factor(`Viaje de Negocios`)No_Viaja as.factor(`Viaje de Negocios`)Raramente
## -1.269013e+00 -5.658138e-01
## as.factor(Estado_Civil)Divorciado as.factor(Estado_Civil)Soltero
## -3.623290e-01 6.384997e-01
## as.factor(Horas_Extra)1
## 1.137470e+00
## 1 2 3 4 5 6
## -1.7719765 -2.5763025 -1.0511823 -0.1974613 -2.3502406 -4.0055896
Con el código anterior, se generan predicciones de rotación utilizando el logaritmo de las probabilidades. Al analizar las primeras seis predicciones del modelo, observamos que todos los valores son negativos, lo que sugiere una baja probabilidad de que los empleados roten. Cuanto más negativo sea el valor, menor será la probabilidad de rotación, indicando que estos empleados tienen una tendencia a permanecer en la organización.
## 2.5 % 97.5 %
## (Intercept) -1.1405245968 3.956838e-01
## Ingreso_Mensual -0.0001314118 -1.958142e-05
## Edad -0.0414032272 -1.646715e-03
## Antigüedad_Cargo -0.1551191837 -3.820438e-02
## as.factor(`Viaje de Negocios`)No_Viaja -2.1016121087 -5.693051e-01
## as.factor(`Viaje de Negocios`)Raramente -0.9062676776 -2.116375e-01
## as.factor(Estado_Civil)Divorciado -0.8642723382 1.050591e-01
## as.factor(Estado_Civil)Soltero 0.2994952232 9.822170e-01
## as.factor(Horas_Extra)1 0.8259493222 1.449346e+00
De acuerdo con los resultados anteriores, se puede inferir que el ingreso mensual no tiene un efecto significativo sobre la rotación, ya que su coeficiente es de −0.000129, lo que indica que este factor no influye notablemente en la probabilidad de rotación. En cuanto a la edad, el coeficiente de −0.0636 sugiere que, a medida que aumenta la edad, la probabilidad de rotación disminuye, lo que implica que los empleados mayores tienden a permanecer más tiempo en la organización.
Respecto a la antigüedad en el cargo, el coeficiente de −0.1412 refuerza la idea de que a mayor antigüedad, menor es la probabilidad de rotación, indicando que los empleados con más años en su puesto son menos propensos a cambiar de trabajo.
En relación a la variable de viaje de negocios, los coeficientes de −1.8418 para aquellos que no viajan y -0.8005 para los que viajan raramente indican que las personas que viajan menos tienden a rotar menos, lo que sugiere una conexión entre el trabajo de campo y la retención del personal. Finalmente, el estado civil de soltero, con un coeficiente de 0.3224, está asociado con una mayor probabilidad de rotación, sugiriendo que los empleados solteros son más propensos a buscar nuevas oportunidades laborales.
##
## Call:
## roc.default(response = training.data$Rotación, predictor = prediccion_1, auc = TRUE, ci = TRUE)
##
## Data: prediccion_1 in 864 controls (training.data$Rotación 0) < 165 cases (training.data$Rotación 1).
## Area under the curve: 0.7692
## 95% CI: 0.7271-0.8113 (DeLong)
Teniendo en cuenta el resultado del área bajo la curva (AUC), con un valor de 0.7729, se puede afirmar que el modelo tiene un buen rendimiento al predecir correctamente a los empleados que rotan. Además, el intervalo de confianza del 95% indica que, con un nivel de seguridad del 95%, el valor real del AUC se encuentra entre 0.7292 y 0.8165. Esto reafirma que el modelo muestra un desempeño sólido y efectivo en la identificación de los empleados propensos a rotar.
El gráfico generado a partir del análisis ROC muestra un área bajo la curva (AUC) de 0.773, con un intervalo de confianza de 0.729 a 0.817. Este valor sugiere que el modelo tiene un rendimiento adecuado al diferenciar entre los empleados que rotan y los que no. Además, se destaca un punto sobre los valores predichos con un umbral de 0.174, que tiene un intervalo de confianza de 0.766 a 0.673. Este punto representa un equilibrio entre sensibilidad y especificidad, lo que indica que el modelo es eficaz en la identificación de casos positivos y negativos. En conjunto, estos resultados refuerzan la capacidad del modelo para realizar predicciones adecuadas sobre la rotación de empleados.
## Confusion Matrix and Statistics
##
## Reference
## Prediction 0 1
## 0 362 57
## 1 7 15
##
## Accuracy : 0.8549
## 95% CI : (0.8185, 0.8864)
## No Information Rate : 0.8367
## P-Value [Acc > NIR] : 0.1671
##
## Kappa : 0.2628
##
## Mcnemar's Test P-Value : 9.068e-10
##
## Sensitivity : 0.9810
## Specificity : 0.2083
## Pos Pred Value : 0.8640
## Neg Pred Value : 0.6818
## Prevalence : 0.8367
## Detection Rate : 0.8209
## Detection Prevalence : 0.9501
## Balanced Accuracy : 0.5947
##
## 'Positive' Class : 0
##
eniendo en cuenta la matriz de confusión, el modelo presenta una precisión (accuracy) del 83.9%, lo que significa que el 84.9% de las predicciones realizadas fueron correctas. Este resultado es adecuado, especialmente en términos de sensibilidad, que es notablemente alta, alcanzando el 97.8%. Esto indica que el modelo identifica correctamente a casi todos los empleados que realmente rotan. Sin embargo, hay un desafío significativo en la predicción de empleados que no rotan, con una especificidad del 19.2%, lo que sugiere que el modelo tiene dificultades para clasificar correctamente a este grupo.
El valor predictivo positivo es del 84.9%, lo que implica que cuando el modelo predice que un empleado rotará, hay una buena probabilidad de que efectivamente lo haga. Sin embargo, la tasa de predicción correcta para los empleados que no rotarán es solo del 65.2%, lo que refuerza la idea de que el modelo se inclina más hacia la identificación de sí rotaciones.
Por último, el balanced accuracy, que se sitúa en 58.5%, resalta un desbalance en la capacidad de predicción entre los empleados que rotan y los que no. Esto indica que, aunque el modelo es efectivo para detectar rotaciones, necesita mejorar en su capacidad para clasificar adecuadamente a los empleados que permanecen en la organización.
## [1] "AUC 0.791290274013851"
con un AUC de 0.7653; muestra que el modelo tiene un rendimiento moderado para distinguir entre los empleados que rotan y los que no, con una exactitud del 76.53%.
## [1] "Mejor Umbral 0.245038980804289"
El umbral óptimo resulta ser importante para modelos de clasificación, como es este el caso; para lo cual, aquellos empleados que superen un umbral de 0.2016, será clasificado como sí rotación, en cambio, aquellos que se encuentren por debajo, serán identificados como no clasificación.
En la gráfica generada, observamos dos áreas de color que representan las predicciones de rotación de empleados. La región verde, que abarca de 0 a casi 0.5, indica que hay una alta frecuencia de empleados que no rotan. El pico en esta área, situado en aproximadamente 0.1, sugiere que la mayoría de los empleados tienen una probabilidad baja de rotación, lo que indica que son más propensos a permanecer en la organización.
Por otro lado, la región roja, que se extiende de un poco más abajo de 0.5 a casi 1, representa a aquellos empleados que tienen una mayor probabilidad de rotar. Aunque esta área es menos prominente en comparación con la verde, su presencia indica que hay un grupo significativo de empleados que se están considerando más propensos a la rotación.
La rotación de personal resulta ser un desafío importante para las organizaciones, ya que les puede resultar mucho más costoso seleccionar, contratar y capacitar a una persona, que evitar que aquellos empleados que son buenos para la organización roten.
Las variables que mostraron una relación significativa con la rotación, son: antiguedad en el cargo, estado civil, horas extras y edad de los empleados.
Para el caso de la antiguedad, aquellos empleados con mayor tiempo en el cargo tienen menor probabilidad de rotación, lo que puede inferir que la experiencia y el sentido de pertenencia puede generar compromisos morales que generen menor rotación. Por otro lado, la relación positiva de las horas extras frente a la rotación, puede indicar que los empleados que se sienten sobrecargados laboralmente, buscan nuevas oportunidades en donde puedan tener una mejor calidad de vida. En cuanto al estado civil, los solteros están asociados a una mayor probabilidad de rotación.
Para poder garantizar una menor rotación de los empleados, es importante que la empresa adopte estrategias efectivas que disminuyan este indicador; es necesario que se implementen medidas desde un enfoque individual con relación a las dinámicas de la organización.
Es importante motivar y recompensar aquellos empleados con mayor antiguedad, pues esto generará un mayor sentido de pertenencia e incentiva a los empleados jóvenes.
La organización debe tomar medidas con relación a las horas extras adicionales trabajadas por los empleados, pues esto puede ser desmotivante ocasionando rotación de los empleados.
Recomendación: Realizar encuestas de salida para entender las razones de la rotación y abordar problemas específicos.