Problema: Rotación de cargo

En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.

Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.

1. Selección de variables

Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.

Debes justificar porque estas variables están relacionadas y que tipo de relación se espera entre ellas (Hipótesis).

A continuación se muestran las diferentes variables que se encuentran en el dataframe rotación:

colnames(rotacion)
##  [1] "Rotación"                    "Edad"                       
##  [3] "Viaje de Negocios"           "Departamento"               
##  [5] "Distancia_Casa"              "Educación"                  
##  [7] "Campo_Educación"             "Satisfacción_Ambiental"     
##  [9] "Genero"                      "Cargo"                      
## [11] "Satisfación_Laboral"         "Estado_Civil"               
## [13] "Ingreso_Mensual"             "Trabajos_Anteriores"        
## [15] "Horas_Extra"                 "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral"         "Años_Experiencia"           
## [19] "Capacitaciones"              "Equilibrio_Trabajo_Vida"    
## [21] "Antigüedad"                  "Antigüedad_Cargo"           
## [23] "Años_ultima_promoción"       "Años_acargo_con_mismo_jefe"

Una vez revisado las variables con las que cuenta el data set; Se muestra a continuación una análisis exploratorio en la relación variable y rotación, con el fin de determinar las más adecuadas.

1.1. Análisis exploratorio simple de las diferentes variables del DataSet

1.1.1. Gráfico de la variable “Edad” en función de “Rotación”

Se evidencia que mayoritariamente, las personas que sí rotan se encuentren en edades entre 25 y 35 años y disminuye cada vez más de acuerdo con el incremento en la edad. También se evidencian datos atípicos de personas que dejaron la compañía con edades por encima a 55. En cuanto a la comparación del grupo de personas que no rotan vs los que si rotan, se evidencia un cambio significativo en la mediana.

1.1.2. Gráfico de la variable “Viaje de Negocios” en función de “Rotación”

Se evidencia un incremento en la rotación para las personas que viajan frecuentemente. Se tiene una mayor estabilidad en las personas que viajan raramente.

1.1.3. Gráfico de la variable “Departamento” en función de “Rotación”

El departamento de Ventas es el que sufre mayor rotación en proporción a sus empleados. Recursos Humanos presenta un leve crecimiento.

1.1.4. Gráfico de la variable “Distancia Casa” en función de “Rotación”

par(mfrow = c(1, 1))

# Crear un boxplot para la distancia de casa según la rotación
boxplot(Distancia_Casa ~ Rotación, data = rotacion, 
        xlab = "Rotación", 
        ylab = "Distancia Casa", 
        main = "Distancia de Casa según Rotación", 
        col = c("darkgreen", "red"),
        names = c("No Rotación", "Sí Rotación"))

Se evidencia una mayor rotación en aquellos empleados que viven a una distancia más lejanda de la empresa; sin embargo, debido a la similitud en la mediana, esta variable resulta no ser significativa ni determinante.

1.1.5. Gráfico de la variable “Educación” en función de “Rotación”

La eduación aparentemente no es un factor determinante en la rotación, ya que tiene un comortamiento similar.

1.1.6. Gráfico de la variable “Campo Educación” en función de “Rotación”

El campo de eduación, a simple viste, no refleja un patrón determinante que influya en la rotación del personal.

1.1.7. Gráfico de la variable “Satisfacción Ambiental” en función de “Rotación”

El grupo de personas que más rota es el que le otorga la calificación más baja a satisfacción ambiental; por lo tanto podría ser considerado como un factor determinante frente a la rotación, debido a que una baja satisfacción ambiental puede generar la búsqueda de nuevas oportunidades de sus empleados.

1.1.8. Gráfico de la variable “Género” en función de “Rotación”

El género no es una variable determinante que afecte la rotación, ya que cuenta con un comportamiento similar en los diferentes grupos.

1.1.9. Gráfico de la variable “Cargo” en función de “Rotación”

Los técnicos de laboratorio cuentan con una mayor rotación, posiblemente cuenten con altas oportunidades en el mercado.

1.1.10. Gráfico de la variable “Satisfacción Laboral” en función de “Rotación”

La satisfacción laboral, a diferencia de la ambiental, no cuenta con un patrón claro sobre la rotación; puesto que para este caso, aquellas personas que más rotan son los que le dieron una calificación de 3.

1.1.11. Gráfico de la variable “Estado Civil” en función de “Rotación”

El grupo de personas con estado civil “soltero”, son los que más rotan, esto puede ser debido a que no cuentan con ciertas responsabilidades y cuentan con la posibilidad de buscar nuevas oportunidades.

1.1.12. Gráfico de la variable “Ingreso Mensual” en función de “Rotación”

El ingreso mensual se visualiza determinante en la rotación, puesto que a menor niveles de ingreso mayor incremento en la rotación; esto se puede dar ya que las personas encuentran mayores oportunidades en trabajos mejor remunerados.

1.1.13. Gráfico de la variable “Trabajos Anteriores” en función de “Rotación”

No se visualiza un patrón claro sobre la rotación del personal en función del númerod e trabajos anteriores.

1.1.14. Gráfico de la variable “Horas Extra” en función de “Rotación”

Se muestra una mayor estabilidad en las personas que NO rotan y NO realiza horas extra. En cuanto a las personas que si rotan, se ve un pequeño incremento hacia aquellas que si tienen horas extra. Por lo tanto, no necesariamente esta variable sea un factor determinante de rotación, pero sí podría estar muy relacionada a tomar la decisión de no rotan.

1.1.15. Gráfico de la variable “Porcentaje Aumento Salarial” en función de “Rotación”

# Configurar el diseño de gráficos en 1 fila y 1 columna
par(mfrow = c(1, 1))

# Crear un boxplot para el porcentaje de aumento salarial según la rotación
boxplot(Porcentaje_aumento_salarial ~ Rotación, data = rotacion, 
        xlab = "Rotación", 
        ylab = "Porcentaje de Aumento Salarial", 
        main = "Porcentaje de Aumento Salarial según Rotación", 
        col = c("darkgreen", "red"),
        names = c("No Rotación", "Sí Rotación"),
        border = "black")

No se visualiza un patrón muy claro en la relación de rotación e incremento salarial.

1.1.16. Gráfico de la variable “Rendimiento Laboral” en función de “Rotación”

En rendimiento laboral, no hay comportamiento visuble que defina la relación con la rotación.

1.1.17. Gráfico de la variable “Años Experiencia” en función de “Rotación”

# Configurar el diseño de gráficos en 1 fila y 2 columnas
par(mfrow = c(1, 2))

# Histograma para personas que NO rotan
hist(rotacion$Años_Experiencia[rotacion$Rotación == "No"], 
     main = "Personas que NO rotan", 
     xlab = "Años de Experiencia Laboral", 
     col = "darkgreen", 
     border = "black",
     breaks = 10,  # Ajusta el número de intervalos si es necesario
     xlim = range(rotacion$Años_Experiencia, na.rm = TRUE))

# Histograma para personas que SÍ rotan
hist(rotacion$Años_Experiencia[rotacion$Rotación == "Si"], 
     main = "Personas que SÍ rotan", 
     xlab = "Años de Experiencia Laboral", 
     col = "red", 
     border = "black",
     breaks = 10,  # Ajusta el número de intervalos si es necesario
     xlim = range(rotacion$Años_Experiencia, na.rm = TRUE))

Se visualiza que las personas que más rotan, son aquellas que tienen poco años de experiencia laboral.

1.1.18. Gráfico de la variable “Capacitaciones” en función de “Rotación”

En la variable capacitaciones, no se visualiza un patrón claro sobre la rotación.

1.1.19. Gráfico de la variable “Equilibrio Trabajo Vida” en función de “Rotación”

La variable equilibrio trabajo vida, cuenta con datos similares en los dos grupos; por lo tanto, no se consideraría trascendental.

1.1.20. Gráfico de la variable “Antiguedad” en función de “Rotación”

se evidencia que las personas con mayor antiguedad tienen a quedarse dentro de la compañía; a diferencia de aquellas personas que llevan poco tiempo dentro de la organización. Esto podría significar que con el paso de los años, las personas van adquiriendo mayor sentido de pertenencia con la empresa.

1.1.21. Gráfico de la variable “Antiguedad Cargo” en función de “Rotación”

Las personas con mayor antiguedad en sus cargos, tienden a quedarse mucho más tiempo dentro de la organización.

1.1.22. Gráfico de la variable “Años Ultima Promocion” en función de “Rotación”

Posiblemente esta variable esté relacionada con el grupo de personas con menos antiguedad dentro de la organización, en donde la rotación podría estar más relacionado a los años de antiguedad dentro de la organización que en cuato a la última promoción.

1.1.23. Gráfico de la variable “Años a Cargo con Mismo Jefe” en función de “Rotación”

par(mfrow = c(1, 2))
# Graficar la distancia de casa frente a un índice o variable auxiliar para el grupo "No - Rotacion"
plot(rotacion$Años_acargo_con_mismo_jefe[rotacion$Rotación == "No"], 
     ylab = "Años a Cargo con el Mismo Jefe", 
     xlab = "Índice", 
     main = "Personas que NO rotan", 
     pch = 19, 
     col = "darkgreen")

# Graficar la distancia de casa frente a un índice o variable auxiliar para el grupo "Sí - Rotacion"
plot(rotacion$Años_acargo_con_mismo_jefe[rotacion$Rotación == "Si"], 
     ylab = "Años a Cargo con el Mismo Jefe", 
     xlab = "Índice", 
     main = "Personas que SI rotan", 
     pch = 19, 
     col = "red")

1.1.24. Gráfico de correlación

Para garantizar que no se escojan datos redundantes en los diferentes variables, se realiza gráfico de correlación:

##                                    Edad Distancia_Casa Ingreso_Mensual
## Edad                        1.000000000   -0.001559109     0.497753202
## Distancia_Casa             -0.001559109    1.000000000    -0.017014445
## Ingreso_Mensual             0.497753202   -0.017014445     1.000000000
## Trabajos_Anteriores         0.299655224   -0.029250804     0.149515216
## Años_Experiencia            0.680393276    0.004628426     0.772893246
## Antigüedad                  0.311240786    0.009507720     0.514284826
## Antigüedad_Cargo            0.212842055    0.018844999     0.363817667
## Años_ultima_promoción       0.216472525    0.010028836     0.344977638
## Años_acargo_con_mismo_jefe  0.202031779    0.014406048     0.344078883
##                            Trabajos_Anteriores Años_Experiencia   Antigüedad
## Edad                               0.299655224      0.680393276  0.311240786
## Distancia_Casa                    -0.029250804      0.004628426  0.009507720
## Ingreso_Mensual                    0.149515216      0.772893246  0.514284826
## Trabajos_Anteriores                1.000000000      0.237638590 -0.118421340
## Años_Experiencia                   0.237638590      1.000000000  0.628133155
## Antigüedad                        -0.118421340      0.628133155  1.000000000
## Antigüedad_Cargo                  -0.090753934      0.460364638  0.758753737
## Años_ultima_promoción             -0.036813892      0.404857759  0.618408865
## Años_acargo_con_mismo_jefe        -0.110319155      0.459188397  0.769212425
##                            Antigüedad_Cargo Años_ultima_promoción
## Edad                            0.212842055           0.216472525
## Distancia_Casa                  0.018844999           0.010028836
## Ingreso_Mensual                 0.363817667           0.344977638
## Trabajos_Anteriores            -0.090753934          -0.036813892
## Años_Experiencia                0.460364638           0.404857759
## Antigüedad                      0.758753737           0.618408865
## Antigüedad_Cargo                1.000000000           0.548056248
## Años_ultima_promoción           0.548056248           1.000000000
## Años_acargo_con_mismo_jefe      0.714364762           0.510223636
##                            Años_acargo_con_mismo_jefe
## Edad                                      0.202031779
## Distancia_Casa                            0.014406048
## Ingreso_Mensual                           0.344078883
## Trabajos_Anteriores                      -0.110319155
## Años_Experiencia                          0.459188397
## Antigüedad                                0.769212425
## Antigüedad_Cargo                          0.714364762
## Años_ultima_promoción                     0.510223636
## Años_acargo_con_mismo_jefe                1.000000000

Con la matriz de correlación se evidencian correlaciones significativas en las siguientes variables:

Edad y años de experiencia. Ingreso mensual y años de experiencia. Años de experiencia y edad. Años de experiencia y antguedad. Antiguedad y años de experiencia. Antiguedad y antiguedad cargo. Antiguedad y años de última promoción. Antiguedad y años a cargo con el mismo jefe. Antiguedad cargo y años de experiencia con el mismo jefe.

1.3. Variables cuantitativas:

  • Ingreso mensual.

  • Edad.

  • Antiguedad cargo.

1.2. Variables categóricas:

  • Viaje de negocios.

  • Estado civil.

  • Horas extra.

1.4. Hipótesis (tipo de relación entre las variables):

Los empleados que viajan por negocios de forma frecuente, pueden tener mayor estrés generando un desequilibrio entre su vida laboral y personal; más aún, si el empleado se encuentra casado o cuenta con algún tipo de compromiso sentimental. Por lo tanto, se tendría la hipótesis que los empleados que realizan viajes de negocio tienen una mayor tasa de rotación, y más aún, si se encuentran casados.

La edad, puede generar cambios en la rotación de personal, ya que se podría asumir que entre personas más jóvenes tienden a tener más cambios de trabajo debido a mayores oportunidades.

En cuanto al ingreso mensual, este factor puede influir en la rotación, ya que al contar con un salario más alto puede mejorar la retención. Caso contrario ocurre cuando el salario es bajo, ya que obliga al empleado a buscar nuevas oportunidades con una mejor remuneración.

Con relación a las horas extras, el incremento de estas puede generar un agotamiento físico y mental de los empleados, lo que los incentiva a cambiar de empleo y más aún, cuando el empleado se encuentra casado y requiera de más tiempo para compartir en familia.

2. Realiza un análisis univariado (caracterización) de la información contenida en la base de datos (rotación).

Sugerencias: Los indicadores o gráficos se usan dependiendo del tipo de variable (cuantitativas o cualitativas). Incluir interpretaciones de la variable rotacion.

##     Rotación           Edad       Viaje de Negocios  Departamento      
##  Min.   :0.0000   Min.   :18.00   Length:1470        Length:1470       
##  1st Qu.:0.0000   1st Qu.:30.00   Class :character   Class :character  
##  Median :0.0000   Median :36.00   Mode  :character   Mode  :character  
##  Mean   :0.1612   Mean   :36.92                                        
##  3rd Qu.:0.0000   3rd Qu.:43.00                                        
##  Max.   :1.0000   Max.   :60.00                                        
##  Distancia_Casa     Educación     Campo_Educación    Satisfacción_Ambiental
##  Min.   : 1.000   Min.   :1.000   Length:1470        Min.   :1.000         
##  1st Qu.: 2.000   1st Qu.:2.000   Class :character   1st Qu.:2.000         
##  Median : 7.000   Median :3.000   Mode  :character   Median :3.000         
##  Mean   : 9.193   Mean   :2.913                      Mean   :2.722         
##  3rd Qu.:14.000   3rd Qu.:4.000                      3rd Qu.:4.000         
##  Max.   :29.000   Max.   :5.000                      Max.   :4.000         
##     Genero             Cargo           Satisfación_Laboral Estado_Civil      
##  Length:1470        Length:1470        Min.   :1.000       Length:1470       
##  Class :character   Class :character   1st Qu.:2.000       Class :character  
##  Mode  :character   Mode  :character   Median :3.000       Mode  :character  
##                                        Mean   :2.729                         
##                                        3rd Qu.:4.000                         
##                                        Max.   :4.000                         
##  Ingreso_Mensual Trabajos_Anteriores  Horas_Extra   
##  Min.   : 1009   Min.   :0.000       Min.   :0.000  
##  1st Qu.: 2911   1st Qu.:1.000       1st Qu.:0.000  
##  Median : 4919   Median :2.000       Median :0.000  
##  Mean   : 6503   Mean   :2.693       Mean   :0.283  
##  3rd Qu.: 8379   3rd Qu.:4.000       3rd Qu.:1.000  
##  Max.   :19999   Max.   :9.000       Max.   :1.000  
##  Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia
##  Min.   :11.00               Min.   :3.000       Min.   : 0.00   
##  1st Qu.:12.00               1st Qu.:3.000       1st Qu.: 6.00   
##  Median :14.00               Median :3.000       Median :10.00   
##  Mean   :15.21               Mean   :3.154       Mean   :11.28   
##  3rd Qu.:18.00               3rd Qu.:3.000       3rd Qu.:15.00   
##  Max.   :25.00               Max.   :4.000       Max.   :40.00   
##  Capacitaciones  Equilibrio_Trabajo_Vida   Antigüedad     Antigüedad_Cargo
##  Min.   :0.000   Min.   :1.000           Min.   : 0.000   Min.   : 0.000  
##  1st Qu.:2.000   1st Qu.:2.000           1st Qu.: 3.000   1st Qu.: 2.000  
##  Median :3.000   Median :3.000           Median : 5.000   Median : 3.000  
##  Mean   :2.799   Mean   :2.761           Mean   : 7.008   Mean   : 4.229  
##  3rd Qu.:3.000   3rd Qu.:3.000           3rd Qu.: 9.000   3rd Qu.: 7.000  
##  Max.   :6.000   Max.   :4.000           Max.   :40.000   Max.   :18.000  
##  Años_ultima_promoción Años_acargo_con_mismo_jefe
##  Min.   : 0.000        Min.   : 0.000            
##  1st Qu.: 0.000        1st Qu.: 2.000            
##  Median : 1.000        Median : 3.000            
##  Mean   : 2.188        Mean   : 4.123            
##  3rd Qu.: 3.000        3rd Qu.: 7.000            
##  Max.   :15.000        Max.   :17.000

Teniendo en cuenta el dataset “Rotación”, la cual tiene una muestra de 1.470 individuos, se observa que la edad promedio de los empelados es de 36,92 años, con un rango que varía entre los 18 y 60 años; lo que podría generar diferente persepción de satisfacción laboral.

Con relación a la rotación del personal, la base de datos cuenta con información del 84% correspondiente a personas que no han salido de la compañía, vs el 16% que corresponden a personas que sí se han ido, lo que representan 1.233 y 237 empleados respectivamente.

El ingreso promedio es de 6.503, con un rango entre 1.009 y 19.999; lo que puede sugerir grandes diferencias en remuneración.

Los años de experiencia es de 11.28, lo que puede indicar que se encuentra con personal competitivo en sus cargos.

## # A tibble: 6 × 24
##   Rotación  Edad `Viaje de Negocios` Departamento Distancia_Casa Educación
##      <dbl> <dbl> <chr>               <chr>                 <dbl>     <dbl>
## 1        1    41 Raramente           Ventas                    1         2
## 2        0    49 Frecuentemente      IyD                       8         1
## 3        1    37 Raramente           IyD                       2         2
## 4        0    33 Frecuentemente      IyD                       3         4
## 5        0    27 Raramente           IyD                       2         1
## 6        0    32 Frecuentemente      IyD                       2         2
## # ℹ 18 more variables: Campo_Educación <chr>, Satisfacción_Ambiental <dbl>,
## #   Genero <chr>, Cargo <chr>, Satisfación_Laboral <dbl>, Estado_Civil <chr>,
## #   Ingreso_Mensual <dbl>, Trabajos_Anteriores <dbl>, Horas_Extra <dbl>,
## #   Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
## #   Años_Experiencia <dbl>, Capacitaciones <dbl>,
## #   Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
## #   Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>
##                    Rotación                        Edad 
##                           0                           0 
##           Viaje de Negocios                Departamento 
##                           0                           0 
##              Distancia_Casa                   Educación 
##                           0                           0 
##             Campo_Educación      Satisfacción_Ambiental 
##                           0                           0 
##                      Genero                       Cargo 
##                           0                           0 
##         Satisfación_Laboral                Estado_Civil 
##                           0                           0 
##             Ingreso_Mensual         Trabajos_Anteriores 
##                           0                           0 
##                 Horas_Extra Porcentaje_aumento_salarial 
##                           0                           0 
##         Rendimiento_Laboral            Años_Experiencia 
##                           0                           0 
##              Capacitaciones     Equilibrio_Trabajo_Vida 
##                           0                           0 
##                  Antigüedad            Antigüedad_Cargo 
##                           0                           0 
##       Años_ultima_promoción  Años_acargo_con_mismo_jefe 
##                           0                           0
## tibble [1,470 × 24] (S3: tbl_df/tbl/data.frame)
##  $ Rotación                   : num [1:1470] 1 0 1 0 0 0 0 0 0 0 ...
##  $ Edad                       : num [1:1470] 41 49 37 33 27 32 59 30 38 36 ...
##  $ Viaje de Negocios          : chr [1:1470] "Raramente" "Frecuentemente" "Raramente" "Frecuentemente" ...
##  $ Departamento               : chr [1:1470] "Ventas" "IyD" "IyD" "IyD" ...
##  $ Distancia_Casa             : num [1:1470] 1 8 2 3 2 2 3 24 23 27 ...
##  $ Educación                  : num [1:1470] 2 1 2 4 1 2 3 1 3 3 ...
##  $ Campo_Educación            : chr [1:1470] "Ciencias" "Ciencias" "Otra" "Ciencias" ...
##  $ Satisfacción_Ambiental     : num [1:1470] 2 3 4 4 1 4 3 4 4 3 ...
##  $ Genero                     : chr [1:1470] "F" "M" "M" "F" ...
##  $ Cargo                      : chr [1:1470] "Ejecutivo_Ventas" "Investigador_Cientifico" "Tecnico_Laboratorio" "Investigador_Cientifico" ...
##  $ Satisfación_Laboral        : num [1:1470] 4 2 3 3 2 4 1 3 3 3 ...
##  $ Estado_Civil               : chr [1:1470] "Soltero" "Casado" "Soltero" "Casado" ...
##  $ Ingreso_Mensual            : num [1:1470] 5993 5130 2090 2909 3468 ...
##  $ Trabajos_Anteriores        : num [1:1470] 8 1 6 1 9 0 4 1 0 6 ...
##  $ Horas_Extra                : num [1:1470] 1 0 1 1 0 0 1 0 0 0 ...
##  $ Porcentaje_aumento_salarial: num [1:1470] 11 23 15 11 12 13 20 22 21 13 ...
##  $ Rendimiento_Laboral        : num [1:1470] 3 4 3 3 3 3 4 4 4 3 ...
##  $ Años_Experiencia           : num [1:1470] 8 10 7 8 6 8 12 1 10 17 ...
##  $ Capacitaciones             : num [1:1470] 0 3 3 3 3 2 3 2 2 3 ...
##  $ Equilibrio_Trabajo_Vida    : num [1:1470] 1 3 3 3 3 2 2 3 3 2 ...
##  $ Antigüedad                 : num [1:1470] 6 10 0 8 2 7 1 1 9 7 ...
##  $ Antigüedad_Cargo           : num [1:1470] 4 7 0 7 2 7 0 0 7 7 ...
##  $ Años_ultima_promoción      : num [1:1470] 0 1 0 3 2 3 0 0 1 7 ...
##  $ Años_acargo_con_mismo_jefe : num [1:1470] 5 7 0 0 2 6 0 0 8 7 ...
## Frequencies  
## rotacion$Rotación  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0   1233     83.88          83.88     83.88          83.88
##           1    237     16.12         100.00     16.12         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Viaje de Negocios  
## Type: Character  
## 
##                        Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## -------------------- ------ --------- -------------- --------- --------------
##       Frecuentemente    277     18.84          18.84     18.84          18.84
##             No_Viaja    150     10.20          29.05     10.20          29.05
##            Raramente   1043     70.95         100.00     70.95         100.00
##                 <NA>      0                               0.00         100.00
##                Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Departamento  
## Type: Character  
## 
##                Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ------------ ------ --------- -------------- --------- --------------
##          IyD    961     65.37          65.37     65.37          65.37
##           RH     63      4.29          69.66      4.29          69.66
##       Ventas    446     30.34         100.00     30.34         100.00
##         <NA>      0                               0.00         100.00
##        Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Educación  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           1    170     11.56          11.56     11.56          11.56
##           2    282     19.18          30.75     19.18          30.75
##           3    572     38.91          69.66     38.91          69.66
##           4    398     27.07          96.73     27.07          96.73
##           5     48      3.27         100.00      3.27         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Campo_Educación  
## Type: Character  
## 
##                     Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------------- ------ --------- -------------- --------- --------------
##          Ciencias    606     41.22          41.22     41.22          41.22
##       Humanidades     27      1.84          43.06      1.84          43.06
##          Mercadeo    159     10.82          53.88     10.82          53.88
##              Otra     82      5.58          59.46      5.58          59.46
##             Salud    464     31.56          91.02     31.56          91.02
##          Tecnicos    132      8.98         100.00      8.98         100.00
##              <NA>      0                               0.00         100.00
##             Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Satisfacción_Ambiental  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           1    284     19.32          19.32     19.32          19.32
##           2    287     19.52          38.84     19.52          38.84
##           3    453     30.82          69.66     30.82          69.66
##           4    446     30.34         100.00     30.34         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Genero  
## Type: Character  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           F    588     40.00          40.00     40.00          40.00
##           M    882     60.00         100.00     60.00         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Cargo  
## Type: Character  
## 
##                                 Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------------------------- ------ --------- -------------- --------- --------------
##        Director_Investigación     80      5.44           5.44      5.44           5.44
##          Director_Manofactura    145      9.86          15.31      9.86          15.31
##              Ejecutivo_Ventas    326     22.18          37.48     22.18          37.48
##                       Gerente    102      6.94          44.42      6.94          44.42
##       Investigador_Cientifico    292     19.86          64.29     19.86          64.29
##              Recursos_Humanos     52      3.54          67.82      3.54          67.82
##           Representante_Salud    131      8.91          76.73      8.91          76.73
##          Representante_Ventas     83      5.65          82.38      5.65          82.38
##           Tecnico_Laboratorio    259     17.62         100.00     17.62         100.00
##                          <NA>      0                               0.00         100.00
##                         Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Satisfación_Laboral  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           1    289     19.66          19.66     19.66          19.66
##           2    280     19.05          38.71     19.05          38.71
##           3    442     30.07          68.78     30.07          68.78
##           4    459     31.22         100.00     31.22         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Estado_Civil  
## Type: Character  
## 
##                    Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ---------------- ------ --------- -------------- --------- --------------
##           Casado    673     45.78          45.78     45.78          45.78
##       Divorciado    327     22.24          68.03     22.24          68.03
##          Soltero    470     31.97         100.00     31.97         100.00
##             <NA>      0                               0.00         100.00
##            Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Trabajos_Anteriores  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0    197     13.40          13.40     13.40          13.40
##           1    521     35.44          48.84     35.44          48.84
##           2    146      9.93          58.78      9.93          58.78
##           3    159     10.82          69.59     10.82          69.59
##           4    139      9.46          79.05      9.46          79.05
##           5     63      4.29          83.33      4.29          83.33
##           6     70      4.76          88.10      4.76          88.10
##           7     74      5.03          93.13      5.03          93.13
##           8     49      3.33          96.46      3.33          96.46
##           9     52      3.54         100.00      3.54         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Horas_Extra  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0   1054     71.70          71.70     71.70          71.70
##           1    416     28.30         100.00     28.30         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Porcentaje_aumento_salarial  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##          11    210     14.29          14.29     14.29          14.29
##          12    198     13.47          27.76     13.47          27.76
##          13    209     14.22          41.97     14.22          41.97
##          14    201     13.67          55.65     13.67          55.65
##          15    101      6.87          62.52      6.87          62.52
##          16     78      5.31          67.82      5.31          67.82
##          17     82      5.58          73.40      5.58          73.40
##          18     89      6.05          79.46      6.05          79.46
##          19     76      5.17          84.63      5.17          84.63
##          20     55      3.74          88.37      3.74          88.37
##          21     48      3.27          91.63      3.27          91.63
##          22     56      3.81          95.44      3.81          95.44
##          23     28      1.90          97.35      1.90          97.35
##          24     21      1.43          98.78      1.43          98.78
##          25     18      1.22         100.00      1.22         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Rendimiento_Laboral  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           3   1244     84.63          84.63     84.63          84.63
##           4    226     15.37         100.00     15.37         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Capacitaciones  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0     54      3.67           3.67      3.67           3.67
##           1     71      4.83           8.50      4.83           8.50
##           2    547     37.21          45.71     37.21          45.71
##           3    491     33.40          79.12     33.40          79.12
##           4    123      8.37          87.48      8.37          87.48
##           5    119      8.10          95.58      8.10          95.58
##           6     65      4.42         100.00      4.42         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Equilibrio_Trabajo_Vida  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           1     80      5.44           5.44      5.44           5.44
##           2    344     23.40          28.84     23.40          28.84
##           3    893     60.75          89.59     60.75          89.59
##           4    153     10.41         100.00     10.41         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Antigüedad_Cargo  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0    244     16.60          16.60     16.60          16.60
##           1     57      3.88          20.48      3.88          20.48
##           2    372     25.31          45.78     25.31          45.78
##           3    135      9.18          54.97      9.18          54.97
##           4    104      7.07          62.04      7.07          62.04
##           5     36      2.45          64.49      2.45          64.49
##           6     37      2.52          67.01      2.52          67.01
##           7    222     15.10          82.11     15.10          82.11
##           8     89      6.05          88.16      6.05          88.16
##           9     67      4.56          92.72      4.56          92.72
##          10     29      1.97          94.69      1.97          94.69
##          11     22      1.50          96.19      1.50          96.19
##          12     10      0.68          96.87      0.68          96.87
##          13     14      0.95          97.82      0.95          97.82
##          14     11      0.75          98.57      0.75          98.57
##          15      8      0.54          99.12      0.54          99.12
##          16      7      0.48          99.59      0.48          99.59
##          17      4      0.27          99.86      0.27          99.86
##          18      2      0.14         100.00      0.14         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Años_ultima_promoción  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0    581     39.52          39.52     39.52          39.52
##           1    357     24.29          63.81     24.29          63.81
##           2    159     10.82          74.63     10.82          74.63
##           3     52      3.54          78.16      3.54          78.16
##           4     61      4.15          82.31      4.15          82.31
##           5     45      3.06          85.37      3.06          85.37
##           6     32      2.18          87.55      2.18          87.55
##           7     76      5.17          92.72      5.17          92.72
##           8     18      1.22          93.95      1.22          93.95
##           9     17      1.16          95.10      1.16          95.10
##          10      6      0.41          95.51      0.41          95.51
##          11     24      1.63          97.14      1.63          97.14
##          12     10      0.68          97.82      0.68          97.82
##          13     10      0.68          98.50      0.68          98.50
##          14      9      0.61          99.12      0.61          99.12
##          15     13      0.88         100.00      0.88         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
## 
## rotacion$Años_acargo_con_mismo_jefe  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0    263     17.89          17.89     17.89          17.89
##           1     76      5.17          23.06      5.17          23.06
##           2    344     23.40          46.46     23.40          46.46
##           3    142      9.66          56.12      9.66          56.12
##           4     98      6.67          62.79      6.67          62.79
##           5     31      2.11          64.90      2.11          64.90
##           6     29      1.97          66.87      1.97          66.87
##           7    216     14.69          81.56     14.69          81.56
##           8    107      7.28          88.84      7.28          88.84
##           9     64      4.35          93.20      4.35          93.20
##          10     27      1.84          95.03      1.84          95.03
##          11     22      1.50          96.53      1.50          96.53
##          12     18      1.22          97.76      1.22          97.76
##          13     14      0.95          98.71      0.95          98.71
##          14      5      0.34          99.05      0.34          99.05
##          15      5      0.34          99.39      0.34          99.39
##          16      2      0.14          99.52      0.14          99.52
##          17      7      0.48         100.00      0.48         100.00
##        <NA>      0                               0.00         100.00
##       Total   1470    100.00         100.00    100.00         100.00
##  [1] "Rotación"                    "Edad"                       
##  [3] "Viaje de Negocios"           "Departamento"               
##  [5] "Distancia_Casa"              "Educación"                  
##  [7] "Campo_Educación"             "Satisfacción_Ambiental"     
##  [9] "Genero"                      "Cargo"                      
## [11] "Satisfación_Laboral"         "Estado_Civil"               
## [13] "Ingreso_Mensual"             "Trabajos_Anteriores"        
## [15] "Horas_Extra"                 "Porcentaje_aumento_salarial"
## [17] "Rendimiento_Laboral"         "Años_Experiencia"           
## [19] "Capacitaciones"              "Equilibrio_Trabajo_Vida"    
## [21] "Antigüedad"                  "Antigüedad_Cargo"           
## [23] "Años_ultima_promoción"       "Años_acargo_con_mismo_jefe"

Se evidencia que no hay datos nulos o vacíos, lo que sugiere que la base de datos se encuentra completa y libre de cualquier tipo de imputación, logrando mantener datos consistentes.

Del total de los registros, el 70.95% rara vez viajan por negocios, mientras que el 18.84% viajan frecuentemente. El 65.37% trabajan en el departamento de investigación y desarrollo; mientras que el 30.34% en el departamento de ventas y solo el 4.29% en Recursos Humanos. En cuanto a educación, la mayoría de personas se encuentran en el nivel 3 y 4; con una representación del 38,91% y 27.07% respectivamente. El 41.22% de los empleados están relacionados con el campo de educación de ciencia; lo que resulta coherente con la participación de las personas en el departamnto de investigacion y desarrollo.

En cuanto a satisfacción ambiental, la distribución se encuentra hacia los niveles 3 y 4, de 30.82% y 30.34% respectivamente; muy parecido se encuentra la distribución en el nivel de satisfacción laboral, con una calificación del 31.22% para el nivel 4.

Tan solo el 28.30% realizan horas extras.

3. Realiza un análisis de bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipótesis planteada en el punto 1.

Nota: Acá estimará el modelo regresión logística que se presenta en el punto siguiente de la guía

## 
##    0    1 
## 1233  237

3.1. Ingreso Mensual - variable cuantitativa

## rotacion$Rotación: 0
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1051    3211    5204    6833    8834   19999 
## ------------------------------------------------------------ 
## rotacion$Rotación: 1
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1009    2373    3202    4787    5916   19859
## rotacion$Rotación: 0
## [1] 5623
## ------------------------------------------------------------ 
## rotacion$Rotación: 1
## [1] 3543

## [1] 0.6877019
## 
##  Welch Two Sample t-test
## 
## data:  Ingreso_Mensual by Rotación
## t = 7.4826, df = 412.74, p-value = 4.434e-13
## alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
## 95 percent confidence interval:
##  1508.244 2583.050
## sample estimates:
## mean in group 0 mean in group 1 
##        6832.740        4787.093

Teniendo en cuenta la prueba t de welch, se tiene una gran diferencia en la media de los grupos 0 y 1 (0 = NO rotan; 1 = SI rotan); en donde la media del grupo 0 es de 6.833 y del grupo 1 de 4.787; por lo tanto, existen diferencia significativas en la media de ambos grupos. Teniendo en cuenta que p-value es menor a 5%; nos indica que las diferencias en la media de ambos grupos resulta ser real. Respecto al intervalo de confianza, con un 95%, nos indica que el grupo que NO rota cuentan con unos ingresos entre 1.508 y 2.583 más que el grupo que SI rota.

Teniendo en cuenta el resultado del coeficiente de contingencia por valor de 0.6877, representa una relación fuerte entre las dos variables; por lo tanto, el ingreso mensual puede llegar a determinar si un empleado sale o continúa en la compañía.

3.2. Edad - variable cuantitativa

##    
##     18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
##   0  4  3  5  7 11 10 19 20 27 45 34 50 51 51 50 46 68 68 63 44 56 36 52 34 44
##   1  4  6  6  6  5  4  7  6 12  3 14 18  9 18 11 12  9 10  6  6  2  6  5  6  2
##    
##     43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
##   0 30 26 40 29 21 17 22 25 17 15 17 18 19 11  4  9 10  5
##   1  2  6  2  4  3  2  2  5  2  3  2  0  3  3  0  5  0  0

chisq.test(rotacion$Rotación, rotacion$Edad)
## 
##  Pearson's Chi-squared test
## 
## data:  rotacion$Rotación and rotacion$Edad
## X-squared = 119.41, df = 42, p-value = 2.38e-09
## [1] 0.2740957
## [1] 0.2850109
## 
##  Welch Two Sample t-test
## 
## data:  Edad by Rotación
## t = 5.8291, df = 316.94, p-value = 1.371e-08
## alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
## 95 percent confidence interval:
##  2.619728 5.289170
## sample estimates:
## mean in group 0 mean in group 1 
##        37.56204        33.60759

Teniendo en cuenta X-squared = 119.41; siendo esta una cifra alta, hace referencia a que hay una furte relación entre las variables edad y rotación. Para el caso de p-value, que es menor que 5%; muestra que la realción de ambas variables es real, en sentido que si una persona rota o no, está asociado con diferentes rangos de edad.

De acuerdo con el cálculo de coeficiente de contingencia, cuyo resultado es de 0.274, inidica qué tan fuerte es la variable edad en función de rotación; para lo cual, en el caso analizado demuestra una asociación moderada, lo que indica que aunque hay asociación, esta no es fuerte.

Respecto a la función CramerV, en donde también se puede conocer la relación entre diferentes variables y teniendo en cuenta el resultado de 0.285, indica que hay asociacion moderada entre las varialbes edad y rotación.

Con lo anterior, se puede afirmar que la forma en la que las personas rotan, tiene una relación con la edad; sin embargo, no es una asociación extremadamente fuerte.

De acuerdo con el resultado de la prueba t, indica que hay una diferencia significativa en la edad entre los dos grupos de rotación. El grupo de los que NO rotan, tienen una media de edad de 37.56; por otro lado, aquellos que SÍ rotan, su media es de 33.61 años. Teniendo en cuenta que p-value es bajo, demuestra que la edad sí está asociada a los grupos de rotación.

3.3. Antiguedad Cargo - variable cuantitativa

# Histograma con Curva de Densidad
hist(rotacion$Antigüedad_Cargo[rotacion$Rotación == 1], 
     probability = TRUE, 
     main = "Distribución de Antigüedad en Cargo por Rotación",
     xlab = "Antigüedad en Cargo",
     col = rgb(1, 0, 0, 0.5),  # Color rojo con transparencia para el grupo que sí rota
     xlim = range(rotacion$Antigüedad_Cargo, na.rm = TRUE))

# Curva de Densidad para el grupo que rota
lines(density(rotacion$Antigüedad_Cargo[rotacion$Rotación == 1], na.rm = TRUE), 
      col = "red", lwd = 2)

# Añadir Histograma para el grupo que no rota
hist(rotacion$Antigüedad_Cargo[rotacion$Rotación == 0], 
     probability = TRUE, 
     add = TRUE, 
     col = rgb(0, 0.5, 0, 0.5))  # Color verde oscuro con transparencia

# Curva de Densidad para el grupo que no rota
lines(density(rotacion$Antigüedad_Cargo[rotacion$Rotación == 0], na.rm = TRUE), 
      col = "darkgreen", lwd = 2)

# Leyenda
legend("topright", 
       legend = c("Sí Rotación", "No Rotación"), 
       fill = c(rgb(1, 0, 0, 0.5), rgb(0, 0.5, 0, 0.5)))  # Colores de la leyenda

## rotacion$Rotación: 0
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.000   3.000   4.484   7.000  18.000 
## ------------------------------------------------------------ 
## rotacion$Rotación: 1
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   2.000   2.903   4.000  15.000
## [1] 0.2047168

Los resultados anteriores, demuestra que hay diferencias significativas en la antiguedad en el cargo entre los grupos de rotación. El grupo de los que NO rotan cuentan con una antiguedad media de 4.48 años; por otro lado, los que sí rotan, su me daies de 2.90 años.

Teniendo en cuenta el resultado en el coeficiente de contigencia, se tiene una relación entre la rotación y la antiguedad en el cargo.

3.4. Viaje de negocios - variable categórica

##    
##     Frecuentemente No_Viaja Raramente
##   0            208      138       887
##   1             69       12       156

## 
##  Pearson's Chi-squared test
## 
## data:  rotacion$Rotación and rotacion$`Viaje de Negocios`
## X-squared = 24.182, df = 2, p-value = 5.609e-06
## [1] 0.1272178
## [1] 0.12826

Teniendo en cuenta el la prueba chisq con x cuadrado = 24.182; al ser un valor alto sugiere que hay una relación entre la variable “viaje de negocios” y “rotación”, indicando que en la forma que los empleados rotan en sus cargos, está asociado con la participación en viajes.

Por otro lado, teniendo en cuenta los resultados de chisq y del coeficiente con un resultado de 0.1272; se puede indicar que aunque existe una relación estadísticamente significativa entre la rotación de empleados y los viajes de negocios, así como lo indica p-value y el tadístico de chi-cuadrado, la fuerza de relación es débil así como lo muestra el coeficiente de contingencia.

3.5. Estado civil - variable categórica

##    
##     Casado Divorciado Soltero
##   0    589        294     350
##   1     84         33     120

## 
##  Pearson's Chi-squared test
## 
## data:  rotacion$Rotación and rotacion$Estado_Civil
## X-squared = 46.164, df = 2, p-value = 9.456e-11
## [1] 0.1744927
## [1] 0.1772113
## rotacion$Estado_Civil: Casado
##    Length     Class      Mode 
##       673 character character 
## ------------------------------------------------------------ 
## rotacion$Estado_Civil: Divorciado
##    Length     Class      Mode 
##       327 character character 
## ------------------------------------------------------------ 
## rotacion$Estado_Civil: Soltero
##    Length     Class      Mode 
##       470 character character

Teniendo en cuenta los resultados de la prueba chi-cuadrado sugieren que existe una alta relación entre las variables rotación y estado civil. Al tener un alto valor del estadístico chi-cuadrado de 46.164 y el p-valor bajo, indican que la manera en la que los empleados rotan en sus cargos se encuentran asociados con el estado civil; por lo tanto, la rotación de los empleados en los diferentes cargos está asociado a su estado civil.

Por otro lado, al tener como resultado 0.17449 en el coeficiente de contingencia, el cual resulta ser débil; implica que la rotación de empleados puede estar relacionada con el estado civil; sin embargo, también se tendría la incidencia de otros factores; ya que un cambio en el estado civil no determinaría de una forma probabilística alta la rotación de los actuales trabajadroes.

3.6. Horas extra - variable categórica

##    
##       0   1
##   0 944 289
##   1 110 127

## rotacion$Rotación: 0
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.2344  0.0000  1.0000 
## ------------------------------------------------------------ 
## rotacion$Rotación: 1
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  1.0000  0.5359  1.0000  1.0000
## [1] 0.2389862
## [1] 0.246118
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  rotacion$Rotación and rotacion$Horas_Extra
## X-squared = 87.564, df = 1, p-value < 2.2e-16

Teniendo en cuenta las funciones anteriormente relacioandas, se puede inferir que los empleados con alta rotación tienden a trabajar más horas extras en comparación al grupo de empleados que no rotan.

El resultado de coeficiente de contingencia de 0.2389, sugiere una asociación moderada entre las variables de rotación y horas extras.

Teniendo en cuenta los diferentes resultados en coeficiente, en conjunto con cramerv y el test de Pearson, sugiere que los empleados del grupo de los que sí rotan tienden a trabajar más número de horas extras, con una media de 0.54; en comparación con el grupo de los que NO rotan, quienes tienen una media de 0.23; por lo tanto, las horas extras son más comunes entre los empleados que sí rotan.

Al tener un coeficiente de 0.2389 y un cramersV de 0.2461, indican que hay una relación moderada entre las dos variables; por lo tanto, aunque las horas extras son más comunes en el grupo de los que sí rotan, no puede ser considerado como el único factor de rotación.

4. Realice una partición en los datos de forma aleatoria donde 70% sea un set para entrenar el modelo y 30% para prueba. Estime un modelo logístico con la muestra del 70%. Muestre los resultados.

## 
## Call:
## glm(formula = Rotación ~ Ingreso_Mensual + Edad + Antigüedad_Cargo + 
##     as.factor(`Viaje de Negocios`) + as.factor(Estado_Civil) + 
##     as.factor(Horas_Extra), family = binomial(link = "cloglog"), 
##     data = training.data)
## 
## Coefficients:
##                                           Estimate Std. Error z value Pr(>|z|)
## (Intercept)                             -3.709e-01  3.804e-01  -0.975 0.329615
## Ingreso_Mensual                         -7.297e-05  2.840e-05  -2.569 0.010196
## Edad                                    -2.113e-02  1.001e-02  -2.110 0.034837
## Antigüedad_Cargo                        -9.517e-02  2.965e-02  -3.209 0.001331
## as.factor(`Viaje de Negocios`)No_Viaja  -1.269e+00  3.798e-01  -3.341 0.000835
## as.factor(`Viaje de Negocios`)Raramente -5.658e-01  1.765e-01  -3.205 0.001349
## as.factor(Estado_Civil)Divorciado       -3.623e-01  2.448e-01  -1.480 0.138907
## as.factor(Estado_Civil)Soltero           6.385e-01  1.736e-01   3.678 0.000235
## as.factor(Horas_Extra)1                  1.137e+00  1.588e-01   7.164 7.86e-13
##                                            
## (Intercept)                                
## Ingreso_Mensual                         *  
## Edad                                    *  
## Antigüedad_Cargo                        ** 
## as.factor(`Viaje de Negocios`)No_Viaja  ***
## as.factor(`Viaje de Negocios`)Raramente ** 
## as.factor(Estado_Civil)Divorciado          
## as.factor(Estado_Civil)Soltero          ***
## as.factor(Horas_Extra)1                 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 906.03  on 1028  degrees of freedom
## Residual deviance: 764.07  on 1020  degrees of freedom
## AIC: 782.07
## 
## Number of Fisher Scoring iterations: 6

Teniendo en cuenta el modelo de regresión logística anterior, se pueden identificar varios factores significativos que influyen en la rotación de empleados en la organización.

Las variables edad y antigüedad en el cargo presentan un efecto negativo significativo sobre la rotación. Esto indica que a medida que los empleados son mayores o tienen más tiempo en la empresa, la probabilidad de rotación disminuye. Por lo tanto, se puede inferir que los empleados más jóvenes o con menos años de trabajo dentro de la organización son más propensos a rotar. En el modelo, la edad tiene un coeficiente de −0.041 (p < 0.001), y la antigüedad en el cargo tiene un coeficiente de −0.082 (p < 0.01), lo que respalda esta observación.

Otra variable que influye en la rotación es horas extra. El modelo muestra que los empleados que realizan más horas extra tienen una mayor probabilidad de rotación, con un coeficiente de 1.189 (p < 0.001). Esto sugiere que una carga laboral excesiva puede generar insatisfacción entre los empleados, llevándolos a buscar nuevas oportunidades laborales.

Por otro lado, el estado civil también parece tener influencia en la rotación, siendo los solteros más propensos a rotar, con un coeficiente de 0.666 (p < 0.001). Esto podría indicar que los solteros están más dispuestos a cambiar de empleo en busca de mejores oportunidades.

El ingreso mensual muestra un efecto negativo -0.0000695, p = 0.017), sugiriendo que a salarios más altos podría haber una tendencia hacia una menor rotación. Sin embargo, este efecto no es lo suficientemente fuerte como para considerarlo determinante en el modelo, ya que su nivel de significancia es relativamente bajo.

En resumen, los resultados del modelo indican que factores como la edad, la antigüedad en el cargo, las horas extra y el estado civil son elementos relevantes en la probabilidad de rotación de los empleados, mientras que el ingreso mensual, aunque presenta un efecto negativo, no es significativo en este contexto.

5. Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC en el set de datos de prueba.

##                             (Intercept)                         Ingreso_Mensual 
##                           -3.708805e-01                           -7.296748e-05 
##                                    Edad                        Antigüedad_Cargo 
##                           -2.112670e-02                           -9.516749e-02 
##  as.factor(`Viaje de Negocios`)No_Viaja as.factor(`Viaje de Negocios`)Raramente 
##                           -1.269013e+00                           -5.658138e-01 
##       as.factor(Estado_Civil)Divorciado          as.factor(Estado_Civil)Soltero 
##                           -3.623290e-01                            6.384997e-01 
##                 as.factor(Horas_Extra)1 
##                            1.137470e+00
##          1          2          3          4          5          6 
## -1.7719765 -2.5763025 -1.0511823 -0.1974613 -2.3502406 -4.0055896

Con el código anterior, se generan predicciones de rotación utilizando el logaritmo de las probabilidades. Al analizar las primeras seis predicciones del modelo, observamos que todos los valores son negativos, lo que sugiere una baja probabilidad de que los empleados roten. Cuanto más negativo sea el valor, menor será la probabilidad de rotación, indicando que estos empleados tienen una tendencia a permanecer en la organización.

##                                                 2.5 %        97.5 %
## (Intercept)                             -1.1405245968  3.956838e-01
## Ingreso_Mensual                         -0.0001314118 -1.958142e-05
## Edad                                    -0.0414032272 -1.646715e-03
## Antigüedad_Cargo                        -0.1551191837 -3.820438e-02
## as.factor(`Viaje de Negocios`)No_Viaja  -2.1016121087 -5.693051e-01
## as.factor(`Viaje de Negocios`)Raramente -0.9062676776 -2.116375e-01
## as.factor(Estado_Civil)Divorciado       -0.8642723382  1.050591e-01
## as.factor(Estado_Civil)Soltero           0.2994952232  9.822170e-01
## as.factor(Horas_Extra)1                  0.8259493222  1.449346e+00

De acuerdo con los resultados anteriores, se puede inferir que el ingreso mensual no tiene un efecto significativo sobre la rotación, ya que su coeficiente es de −0.000129, lo que indica que este factor no influye notablemente en la probabilidad de rotación. En cuanto a la edad, el coeficiente de −0.0636 sugiere que, a medida que aumenta la edad, la probabilidad de rotación disminuye, lo que implica que los empleados mayores tienden a permanecer más tiempo en la organización.

Respecto a la antigüedad en el cargo, el coeficiente de −0.1412 refuerza la idea de que a mayor antigüedad, menor es la probabilidad de rotación, indicando que los empleados con más años en su puesto son menos propensos a cambiar de trabajo.

En relación a la variable de viaje de negocios, los coeficientes de −1.8418 para aquellos que no viajan y -0.8005 para los que viajan raramente indican que las personas que viajan menos tienden a rotar menos, lo que sugiere una conexión entre el trabajo de campo y la retención del personal. Finalmente, el estado civil de soltero, con un coeficiente de 0.3224, está asociado con una mayor probabilidad de rotación, sugiriendo que los empleados solteros son más propensos a buscar nuevas oportunidades laborales.

## 
## Call:
## roc.default(response = training.data$Rotación, predictor = prediccion_1,     auc = TRUE, ci = TRUE)
## 
## Data: prediccion_1 in 864 controls (training.data$Rotación 0) < 165 cases (training.data$Rotación 1).
## Area under the curve: 0.7692
## 95% CI: 0.7271-0.8113 (DeLong)

Teniendo en cuenta el resultado del área bajo la curva (AUC), con un valor de 0.7729, se puede afirmar que el modelo tiene un buen rendimiento al predecir correctamente a los empleados que rotan. Además, el intervalo de confianza del 95% indica que, con un nivel de seguridad del 95%, el valor real del AUC se encuentra entre 0.7292 y 0.8165. Esto reafirma que el modelo muestra un desempeño sólido y efectivo en la identificación de los empleados propensos a rotar.

El gráfico generado a partir del análisis ROC muestra un área bajo la curva (AUC) de 0.773, con un intervalo de confianza de 0.729 a 0.817. Este valor sugiere que el modelo tiene un rendimiento adecuado al diferenciar entre los empleados que rotan y los que no. Además, se destaca un punto sobre los valores predichos con un umbral de 0.174, que tiene un intervalo de confianza de 0.766 a 0.673. Este punto representa un equilibrio entre sensibilidad y especificidad, lo que indica que el modelo es eficaz en la identificación de casos positivos y negativos. En conjunto, estos resultados refuerzan la capacidad del modelo para realizar predicciones adecuadas sobre la rotación de empleados.

6. Realiza una predicción la probabilidad de que un individuo (hipotético) rote y defina un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado).

## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   0   1
##          0 362  57
##          1   7  15
##                                           
##                Accuracy : 0.8549          
##                  95% CI : (0.8185, 0.8864)
##     No Information Rate : 0.8367          
##     P-Value [Acc > NIR] : 0.1671          
##                                           
##                   Kappa : 0.2628          
##                                           
##  Mcnemar's Test P-Value : 9.068e-10       
##                                           
##             Sensitivity : 0.9810          
##             Specificity : 0.2083          
##          Pos Pred Value : 0.8640          
##          Neg Pred Value : 0.6818          
##              Prevalence : 0.8367          
##          Detection Rate : 0.8209          
##    Detection Prevalence : 0.9501          
##       Balanced Accuracy : 0.5947          
##                                           
##        'Positive' Class : 0               
## 

eniendo en cuenta la matriz de confusión, el modelo presenta una precisión (accuracy) del 83.9%, lo que significa que el 84.9% de las predicciones realizadas fueron correctas. Este resultado es adecuado, especialmente en términos de sensibilidad, que es notablemente alta, alcanzando el 97.8%. Esto indica que el modelo identifica correctamente a casi todos los empleados que realmente rotan. Sin embargo, hay un desafío significativo en la predicción de empleados que no rotan, con una especificidad del 19.2%, lo que sugiere que el modelo tiene dificultades para clasificar correctamente a este grupo.

El valor predictivo positivo es del 84.9%, lo que implica que cuando el modelo predice que un empleado rotará, hay una buena probabilidad de que efectivamente lo haga. Sin embargo, la tasa de predicción correcta para los empleados que no rotarán es solo del 65.2%, lo que refuerza la idea de que el modelo se inclina más hacia la identificación de sí rotaciones.

Por último, el balanced accuracy, que se sitúa en 58.5%, resalta un desbalance en la capacidad de predicción entre los empleados que rotan y los que no. Esto indica que, aunque el modelo es efectivo para detectar rotaciones, necesita mejorar en su capacidad para clasificar adecuadamente a los empleados que permanecen en la organización.

## [1] "AUC 0.791290274013851"

con un AUC de 0.7653; muestra que el modelo tiene un rendimiento moderado para distinguir entre los empleados que rotan y los que no, con una exactitud del 76.53%.

## [1] "Mejor Umbral 0.245038980804289"

El umbral óptimo resulta ser importante para modelos de clasificación, como es este el caso; para lo cual, aquellos empleados que superen un umbral de 0.2016, será clasificado como sí rotación, en cambio, aquellos que se encuentren por debajo, serán identificados como no clasificación.

En la gráfica generada, observamos dos áreas de color que representan las predicciones de rotación de empleados. La región verde, que abarca de 0 a casi 0.5, indica que hay una alta frecuencia de empleados que no rotan. El pico en esta área, situado en aproximadamente 0.1, sugiere que la mayoría de los empleados tienen una probabilidad baja de rotación, lo que indica que son más propensos a permanecer en la organización.

Por otro lado, la región roja, que se extiende de un poco más abajo de 0.5 a casi 1, representa a aquellos empleados que tienen una mayor probabilidad de rotar. Aunque esta área es menos prominente en comparación con la verde, su presencia indica que hay un grupo significativo de empleados que se están considerando más propensos a la rotación.

7. En las conclusiones adicione una discusión sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).

La rotación de personal resulta ser un desafío importante para las organizaciones, ya que les puede resultar mucho más costoso seleccionar, contratar y capacitar a una persona, que evitar que aquellos empleados que son buenos para la organización roten.

Las variables que mostraron una relación significativa con la rotación, son: antiguedad en el cargo, estado civil, horas extras y edad de los empleados.

Para el caso de la antiguedad, aquellos empleados con mayor tiempo en el cargo tienen menor probabilidad de rotación, lo que puede inferir que la experiencia y el sentido de pertenencia puede generar compromisos morales que generen menor rotación. Por otro lado, la relación positiva de las horas extras frente a la rotación, puede indicar que los empleados que se sienten sobrecargados laboralmente, buscan nuevas oportunidades en donde puedan tener una mejor calidad de vida. En cuanto al estado civil, los solteros están asociados a una mayor probabilidad de rotación.

Para poder garantizar una menor rotación de los empleados, es importante que la empresa adopte estrategias efectivas que disminuyan este indicador; es necesario que se implementen medidas desde un enfoque individual con relación a las dinámicas de la organización.

Es importante motivar y recompensar aquellos empleados con mayor antiguedad, pues esto generará un mayor sentido de pertenencia e incentiva a los empleados jóvenes.

La organización debe tomar medidas con relación a las horas extras adicionales trabajadas por los empleados, pues esto puede ser desmotivante ocasionando rotación de los empleados.

Recomendación: Realizar encuestas de salida para entender las razones de la rotación y abordar problemas específicos.