Preparación Data

El primer paso para desarrollar este análisis, se llevó a cabo con la carga de las librerías necesarias para realizar este informe.

Posteriormente, se cargaron los datos proporcionados por la organización; los cuales constan de el cargo, genero,departamento, departamento, satisfacción laboral y otras características que brinda la organización.

data("rotacion")
glimpse(rotacion)

Rows: 1,470
Columns: 24
$ Rotación                    <chr> "Si", "No", "Si", "No", "No", "No", "No", …
$ Edad                        <dbl> 41, 49, 37, 33, 27, 32, 59, 30, 38, 36, 35…
$ `Viaje de Negocios`         <chr> "Raramente", "Frecuentemente", "Raramente"…
$ Departamento                <chr> "Ventas", "IyD", "IyD", "IyD", "IyD", "IyD…
$ Distancia_Casa              <dbl> 1, 8, 2, 3, 2, 2, 3, 24, 23, 27, 16, 15, 2…
$ Educación                   <dbl> 2, 1, 2, 4, 1, 2, 3, 1, 3, 3, 3, 2, 1, 2, …
$ Campo_Educación             <chr> "Ciencias", "Ciencias", "Otra", "Ciencias"…
$ Satisfacción_Ambiental      <dbl> 2, 3, 4, 4, 1, 4, 3, 4, 4, 3, 1, 4, 1, 2, …
$ Genero                      <chr> "F", "M", "M", "F", "M", "M", "F", "M", "M…
$ Cargo                       <chr> "Ejecutivo_Ventas", "Investigador_Cientifi…
$ Satisfación_Laboral         <dbl> 4, 2, 3, 3, 2, 4, 1, 3, 3, 3, 2, 3, 3, 4, …
$ Estado_Civil                <chr> "Soltero", "Casado", "Soltero", "Casado", …
$ Ingreso_Mensual             <dbl> 5993, 5130, 2090, 2909, 3468, 3068, 2670, …
$ Trabajos_Anteriores         <dbl> 8, 1, 6, 1, 9, 0, 4, 1, 0, 6, 0, 0, 1, 0, …
$ Horas_Extra                 <chr> "Si", "No", "Si", "Si", "No", "No", "Si", …
$ Porcentaje_aumento_salarial <dbl> 11, 23, 15, 11, 12, 13, 20, 22, 21, 13, 13…
$ Rendimiento_Laboral         <dbl> 3, 4, 3, 3, 3, 3, 4, 4, 4, 3, 3, 3, 3, 3, …
$ Años_Experiencia            <dbl> 8, 10, 7, 8, 6, 8, 12, 1, 10, 17, 6, 10, 5…
$ Capacitaciones              <dbl> 0, 3, 3, 3, 3, 2, 3, 2, 2, 3, 5, 3, 1, 2, …
$ Equilibrio_Trabajo_Vida     <dbl> 1, 3, 3, 3, 3, 2, 2, 3, 3, 2, 3, 3, 2, 3, …
$ Antigüedad                  <dbl> 6, 10, 0, 8, 2, 7, 1, 1, 9, 7, 5, 9, 5, 2,…
$ Antigüedad_Cargo            <dbl> 4, 7, 0, 7, 2, 7, 0, 0, 7, 7, 4, 5, 2, 2, …
$ Años_ultima_promoción       <dbl> 0, 1, 0, 3, 2, 3, 0, 0, 1, 7, 0, 0, 4, 1, …
$ Años_acargo_con_mismo_jefe  <dbl> 5, 7, 0, 0, 2, 6, 0, 0, 8, 7, 3, 8, 3, 2, …

1. Selección de variables

Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.

1.1 Variables cuantitativas:

Edad: Se espera que la edad de los empleados se relacione con la rotación , Se espera que los empleados más jóvenes puedan rotar más en busca de oportunidades de crecimiento, mientras que los empleados mayores pueden buscar estabilidad laboral.

Antigüedad: La antiguedad esta relacionada con la rotación, ya que los empleados con mayor tiempo en la empresa acumulan beneficios, conocimiento institucional y lealtad, lo que les permite desempeñarse mejor en sus tareas, actuar como mentores para empleados más nuevos, y tener mayor resiliencia ante cambios organizacionales. Además, tienden a tener tasas de rotación más bajas y mayores oportunidades de promoción interna, contribuyendo así a la estabilidad y productividad general de la empresa.

Ingreso mensual: El ingreso mensual de un empleado afecta la rotación y se asocia, ya que A medida que el ingreso mensual de un empleado aumenta, es probable que su satisfacción laboral y compromiso con la empresa también crezcan, lo que reduce la probabilidad de rotación.Además, mayores ingresos suelen estar vinculados con incentivos y beneficios adicionales, lo que refuerza la lealtad hacia la empresa y disminuye la tentación de buscar oportunidades laborales en otras organizaciones.

1.2 Variables categoricas:

Estado civil: Los empleados que están casados o en una relación estable tienen una menor probabilidad de rotación laboral en comparación con los solteros, ya que tienden a buscar mayor estabilidad y seguridad económica para su familia, lo que los hace más propensos a permanecer en su empleo actual.

Horas Extra: Los empleados que realizan regularmente horas extra tienen una mayor probabilidad de rotación laboral, ya que la sobrecarga de trabajo y el desequilibrio entre la vida personal y profesional pueden generar insatisfacción, agotamiento y búsqueda de nuevas oportunidades con mejores condiciones laborales..

Satisfacción laboral: A mayor nivel de satisfacción laboral, menor es la probabilidad de rotación de los empleados, ya que la satisfacción con el ambiente de trabajo, las tareas asignadas y las oportunidades de desarrollo profesional fomenta la lealtad y el compromiso con la empresa, reduciendo el interés por buscar otras oportunidades.

2. Analisis Univariado

Realiza un análisis univariado (caracterización) de la información contenida en la base de datos rotacion.

Procedemos a realizar un análisis univariado para examinar cada variable en un conjunto de datos de manera individual, sin tener en cuenta otras variables.

2.1 Variables cuantitativas:

Analísis variable Cuantitativa Edad

summary(rotacion$Edad)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  18.00   30.00   36.00   36.92   43.00   60.00

ggplot(rotacion, aes(x = Edad)) + 
  geom_histogram(binwidth = 5, fill = "#91C7FA", color = "#000000", alpha = 0.7) +
  labs(title = "Distribución de Edad", x = "Edad", y = "Frecuencia") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    axis.title = element_text(size = 14),
    axis.text = element_text(size = 12)
  )

La exploración de las edades dentro de la organización revela una concentración significativa de empleados en los tramos de 30 y 40 años, con un promedio de edad de 36 años. Este dato indica una población laboral relativamente joven, donde la experiencia de los colaboradores con más de 60 años y la energía de los más jóvenes de 18 se complementan para conformar un equipo diverso en cuanto a edad y, potencialmente, en cuanto a perspectivas.

Analísis variable Cuantitativa Antigüedad

summary(rotacion$Antigüedad)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.000   3.000   5.000   7.008   9.000  40.000

ggplot(rotacion, aes(x = Antigüedad)) + 
  geom_histogram(binwidth = 5, fill = "#91C7FA", color = "#000000", alpha = 0.7) +
  labs(title = "Distribución de Antigüedad", x = "Antigüedad", y = "Frecuencia") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    axis.title = element_text(size = 14),
    axis.text = element_text(size = 12)
  )

El histograma de antigüedad muestra una concentración significativa de empleados con pocos años de servicio en la empresa. La mayoría de los trabajadores tienen menos de 10 años de antigüedad, lo que sugiere una alta rotación de personal. A medida que aumenta la antigüedad, la cantidad de empleados disminuye de forma progresiva, indicando una menor permanencia en los puestos de trabajo.

Analísis variable Cuantitativa ingreso mensual

summary(rotacion$Ingreso_Mensual)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1009    2911    4919    6503    8379   19999

ggplot(rotacion, aes(x = Ingreso_Mensual)) + 
  geom_histogram(binwidth = 500, fill = "#91C7FA", color = "#000000", alpha = 0.7) +
  labs(title = "Distribución de Ingreso Mensual", x = "Ingreso Mensual", y = "Frecuencia") +
  scale_x_continuous(labels = scales::comma) +  # Añadir comas en los números grandes del eje x
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    axis.title = element_text(size = 14),
    axis.text = element_text(size = 12)
  )

El histograma de ingresos mensuales revela una distribución donde la mayoría de las personas tienen ingresos moderados o bajos. La frecuencia de los ingresos disminuye a medida que aumenta su valor, lo que indica una menor concentración de personas con altos ingresos.

2.2 Variables categoricas:

Analísis variable Categorica Estado Civil

# Crear gráfico de barras para una variable categórica
ggplot(rotacion, aes(x = Estado_Civil)) + 
  geom_bar(fill = "#91C7FA", color = "#000000", alpha = 0.7) +
  labs(title = "Distribución de Estado Civil", x = "Estado Civil", y = "Frecuencia") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    axis.title = element_text(size = 14),
    axis.text = element_text(size = 12)
  )

El gráfico muestra que la mayoría de las personas en el grupo analizado están casadas. El estado civil “casado” presenta la frecuencia más alta, seguido por “soltero” y, por último, “divorciado”. Esto indica una tendencia hacia la unión matrimonial dentro de este grupo. Sin embargo, es importante considerar que estos resultados pueden variar dependiendo de factores como la edad, el género y el contexto sociocultural del grupo en cuestión.

Analísis variable Categorica Horas Extra

# Crear gráfico de barras para una variable categórica
ggplot(rotacion, aes(y = Horas_Extra)) + 
  geom_bar(fill = "#91C7FA", color = "#000000", alpha = 0.7) +
  labs(title = "Distribución de Horas Extra", x = "Frecuencia", y = "Horas Extra") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    axis.title = element_text(size = 14),
    axis.text = element_text(size = 12)
  )

El gráfico indica que la mayoría de los empleados no realizan horas extras, lo cual podría sugerir una efectiva gestión de la carga de trabajo por parte de la empresa. Esta situación podría ser resultado de una adecuada planificación de tareas, una distribución equitativa del trabajo o políticas que desalientan las horas extras excesivas

Analísis variable Categorica Satisfacción Laboral

# Crear gráfico de barras para una variable categórica
ggplot(rotacion, aes(x = Satisfación_Laboral)) + 
  geom_bar(fill = "#91C7FA", color = "#000000", alpha = 0.7) +
  labs(title = "Distribución de Satisfaciión Laboral", x = "Satisfacción Laboral", y = "Frecuencia") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    axis.title = element_text(size = 14),
    axis.text = element_text(size = 12)
  )

El gráfico revela que la mayoría de los empleados encuestados se sienten moderadamente satisfechos o muy satisfechos con su trabajo. Los niveles de satisfacción más altos predominan. Sin embargo, es importante notar que existe una minoría de empleados que expresan niveles de satisfacción más bajos. Para comprender mejor estos resultados, sería útil analizar factores como las condiciones laborales, las oportunidades de crecimiento, las relaciones interpersonales y la compensación.

3. Análisis bivariado

Realiza un análisis de bivariado en donde la variable respuesta sea rotacion codificada de la siguiente manera (y=1 es si rotación, y=0 es no rotación). Con base en estos resultados identifique cuales son las variables determinantes de la rotación e interpretar el signo del coeficiente estimado. Compare estos resultados con la hipotesis planteada en el punto 2.

3.1 Variables cuantitativas:

Analísis bivariada de la variable Cuantitativa Edad

ggplot(rotacion, aes(x = Rotación, y = Edad, color = Rotación)) +
  geom_boxplot() +
  geom_jitter(width = 0.3) +
  labs(x = "Rotación", y = "Edad",
       title = "Distribución de Edad por Rotación")

El gráfico muestra que la edad no parece ser un factor determinante principal para que un empleado decida dejar una empresa. Tanto los empleados que se quedan como los que se van tienen una edad promedio similar. Sin embargo, se observa una mayor diversidad de edades entre aquellos que deciden permanecer en la compañía. Esto sugiere que otros factores, como la satisfacción laboral, las oportunidades de crecimiento o las condiciones laborales, podrían estar influyendo más en la decisión de un empleado de permanecer o abandonar su puesto.

Analísis variable Cuantitativa Antigüedad

ggplot(rotacion, aes(x = Rotación, y = Antigüedad, color = Rotación)) +
  geom_boxplot() +
  geom_jitter(width = 0.3) +
  labs(x = "Rotación", y = "Antigüedad",
       title = "Distribución de Antigüedad por Rotación")

El gráfico muestra una clara relación entre la antigüedad en la empresa y la probabilidad de que un empleado se vaya. Aquellos empleados con menos tiempo en la compañía tienen una mayor tendencia a renunciar. Esto sugiere que los primeros años en una empresa son críticos para retener al talento. Es decir, mientras más tiempo lleva un empleado en la empresa, es más probable que se sienta más integrado y comprometido con ella, lo que disminuye las posibilidades de que busque nuevas oportunidades laborales.

Analísis variable Cuantitativa ingreso mensual

ggplot(rotacion, aes(x = Rotación, y = Ingreso_Mensual, color = Rotación)) +
  geom_boxplot() +
  geom_jitter(width = 0.3) +
  labs(x = "Rotación", y = "Ingreso Mensual",
       title = "Distribución de Ingreso Mensual por Rotación")

El gráfico muestra una clara relación entre el ingreso mensual de un empleado y su decisión de permanecer o dejar la empresa. Aquellos empleados con salarios más bajos tienden a abandonar la compañía con mayor frecuencia. Sin embargo, es crucial tener en cuenta que el salario no es el único factor determinante, ya que otros elementos como la satisfacción laboral, las oportunidades de crecimiento y las condiciones de trabajo también influyen en la decisión de un empleado de permanecer o buscar nuevas oportunidades.

3.2 Variables categoricas:

Analísis variable Categorica Estado Civil

m = table(rotacion$Rotación, rotacion$Estado_Civil)

m

    
     Casado Divorciado Soltero
  No    589        294     350
  Si     84         33     120

barplot(m)

chisq.test(m)


    Pearson's Chi-squared test

data:  m
X-squared = 46.164, df = 2, p-value = 9.456e-11

El gráfico muestra la distribución de tres estados civiles (casado, divorciado y soltero), y sugiere que la mayoría de las personas en el conjunto de datos son casadas. Además, la prueba de chi-cuadrado indica que existe una relación estadísticamente significativa entre el estado civil y Rotación.

Analísis variable Categorica Horas Extra

m = table(rotacion$Rotación, rotacion$Horas_Extra)

m

barplot(m)

chisq.test(m)


    Pearson's Chi-squared test with Yates' continuity correction

data:  m
X-squared = 87.564, df = 1, p-value < 2.2e-16

Esto indica una relación significativa entre la realización de horas extras y la rotación de personal. La prueba de chi-cuadrado, con un valor p muy bajo. Esto sugiere que los empleados que realizan horas extras tienen una mayor probabilidad de dejar la empresa.

Analísis variable Categorica Satisfacción Laboral

m = table(rotacion$Rotación, rotacion$Satisfación_Laboral)

m

    
       1   2   3   4
  No 223 234 369 407
  Si  66  46  73  52

barplot(m)

chisq.test(m)


    Pearson's Chi-squared test

data:  m
X-squared = 17.505, df = 3, p-value = 0.0005563

Los resultados indican que existe una asociación significativa entre ambas variables: los empleados menos satisfechos tienen una mayor probabilidad de dejar la empresa. La prueba de chi-cuadrado, con un valor p muy bajo, esto dice que los empleados que tienen satisfacción laboral baja pueden rotar.

4. Estimación del modelo

Realiza la estimación de un modelo de regresión logístico en el cual la variable respuesta es rotacion (y=1 es si rotación, y=0 es no rotación) y las covariables las 6 seleccionadas en el punto 1. Interprete los coeficientes del modelo y la significancia de los parámetros.

data("rotacion")

#rotacion$Rotación<- factor(rotacion$Rotación, levels = c("No","Si"),labels = c(0,1))
rotacion$Rotación<- as.numeric(rotacion$Rotación=="Si")


#rotacion$Estado_Civil <- as.factor(rotacion$Estado_Civil)
rotacion$Horas_Extra <- as.factor(rotacion$Horas_Extra)
rotacion$Cargo <- as.factor(rotacion$Cargo)
#rotacion$Satisfación_Laboral <- as.factor(rotacion$Satisfación_Laboral)

modelo<- glm(Rotación ~ Edad + Antigüedad + Ingreso_Mensual + Horas_Extra + Cargo + Satisfación_Laboral, data = rotacion, family = binomial(link = "logit"))

summary(modelo)


Call:
glm(formula = Rotación ~ Edad + Antigüedad + Ingreso_Mensual + 
    Horas_Extra + Cargo + Satisfación_Laboral, family = binomial(link = "logit"), 
    data = rotacion)

Coefficients:
                               Estimate Std. Error z value Pr(>|z|)    
(Intercept)                  -2.391e+00  1.033e+00  -2.315 0.020596 *  
Edad                         -3.349e-02  1.031e-02  -3.248 0.001162 ** 
Antigüedad                   -3.791e-02  1.873e-02  -2.024 0.042964 *  
Ingreso_Mensual               4.083e-05  4.689e-05   0.871 0.383842    
Horas_ExtraSi                 1.536e+00  1.603e-01   9.584  < 2e-16 ***
CargoDirector_Manofactura     1.193e+00  8.844e-01   1.348 0.177505    
CargoEjecutivo_Ventas         2.269e+00  8.394e-01   2.703 0.006878 ** 
CargoGerente                  9.470e-01  8.675e-01   1.092 0.274985    
CargoInvestigador_Cientifico  2.032e+00  9.259e-01   2.194 0.028215 *  
CargoRecursos_Humanos         2.659e+00  9.532e-01   2.790 0.005276 ** 
CargoRepresentante_Salud      1.237e+00  8.900e-01   1.390 0.164575    
CargoRepresentante_Ventas     3.348e+00  9.530e-01   3.513 0.000443 ***
CargoTecnico_Laboratorio      2.745e+00  9.235e-01   2.972 0.002959 ** 
Satisfación_Laboral          -3.075e-01  6.923e-02  -4.442  8.9e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 1298.6  on 1469  degrees of freedom
Residual deviance: 1083.0  on 1456  degrees of freedom
AIC: 1111

Number of Fisher Scoring iterations: 6

En este modelo las variables significativas son las p- value que estan menor al 0,05:

-Horas_Extra: Un aumento en las horas extras parece estar asociado con una mayor probabilidad de rotación.

-Satisfacción_Laboral: Una menor satisfacción laboral se asocia con una mayor probabilidad de rotación.

-Estado_ Civil: El estado civil soltero , parecen tener una mayor probabilidad de rotación en comparación a el divorciado .

5. Evaluación

Evaluar el poder predictivo del modelo con base en la curva ROC y el AUC.

# Dividir la base de datos en conjuntos de entrenamiento y prueba
set.seed(123)# Para reproducibilidad
indice_particion <- createDataPartition(rotacion$Rotación, p = 0.7, list = FALSE)
datos_entrenamiento <- rotacion[indice_particion, ]
datos_prueba <- rotacion[-indice_particion, ]

# Entrenar el modelo
modelo<- glm(Rotación ~ Edad + Antigüedad + Ingreso_Mensual + Estado_Civil + Horas_Extra + Satisfación_Laboral, data = datos_entrenamiento, family = binomial(link = "logit"))

summary(modelo)


Call:
glm(formula = Rotación ~ Edad + Antigüedad + Ingreso_Mensual + 
    Estado_Civil + Horas_Extra + Satisfación_Laboral, family = binomial(link = "logit"), 
    data = datos_entrenamiento)

Coefficients:
                         Estimate Std. Error z value Pr(>|z|)    
(Intercept)             4.755e-01  4.842e-01   0.982  0.32615    
Edad                   -3.881e-02  1.291e-02  -3.007  0.00264 ** 
Antigüedad             -2.582e-02  2.223e-02  -1.162  0.24532    
Ingreso_Mensual        -9.440e-05  3.479e-05  -2.714  0.00665 ** 
Estado_CivilDivorciado -4.536e-01  2.872e-01  -1.579  0.11424    
Estado_CivilSoltero     8.925e-01  2.063e-01   4.325 1.52e-05 ***
Horas_ExtraSi           1.421e+00  1.931e-01   7.360 1.83e-13 ***
Satisfación_Laboral    -3.316e-01  8.359e-02  -3.967 7.27e-05 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 896.03  on 1028  degrees of freedom
Residual deviance: 738.86  on 1021  degrees of freedom
AIC: 754.86

Number of Fisher Scoring iterations: 6

valor_pronosticado <- predict(modelo, newdata = datos_prueba, type = "response")
curva_ROC <- roc(datos_prueba$Rotación, valor_pronosticado)

Setting levels: control = 0, case = 1

Setting direction: controls < cases

auc<- round(auc(curva_ROC, levels =c(0,1), direction = "<"),4) # 0.9177

ggroc(curva_ROC, colour = "#FF7F00", size=1)+
  ggtitle(paste0("Curva ROC ", "(AUC = ", auc, ")"))+
  xlab("Especificidad")+
  ylab("Sensibilidad")

En este paso se dividio la base para entrenar el modelo en 70/30, las variables Horas extra SI, Satisfacción laboral y el estado civil soltero son muy significativas en este nuevo modelo, ahora vamos a revisar las variables:

-Horas Extra: Este es uno de los factores más importantes del modelo, con un coeficiente positivo (1.421) y altamente significativo (p = 1.83e-13). Los empleados que realizan horas extra tienen una probabilidad significativamente mayor de rotar.

-Satisfacción Laboral: Tiene un coeficiente negativo (-0.3316) y es muy significativo (p = 7.27e-05), lo que significa que a medida que la satisfacción laboral aumenta, la probabilidad de rotación disminuye.

-Estado Civil - Soltero: Tiene un coeficiente positivo (0.8925) y es altamente significativo (p = 1.52e-05), lo que indica que los empleados solteros tienen una mayor probabilidad de rotar.

-AUC: La curva representa la relación entre la sensibilidad (verdaderos positivos) y la especificidad (verdaderos negativos) en diferentes umbrales de decisión. El área bajo la curva (AUC) es de 0.726, lo que indica que el modelo tiene una capacidad moderada para distinguir entre empleados que rotarán y los que no lo harán. Un AUC más cercano a 1 representa un mejor desempeño, mientras que un valor de 0.5 indicaría un modelo sin capacidad predictiva.

6. Predicciones

Realiza una predicción la probabilidad de que un individuo (hipotético) rote y defina un corte para decidir si se debe intervenir a este empleado o no (posible estrategia para motivar al empleado).

data_Juan= rotacion[15,]

data_Juan

# A tibble: 1 × 24
  Rotación  Edad `Viaje de Negocios` Departamento Distancia_Casa Educación
     <dbl> <dbl> <chr>               <chr>                 <dbl>     <dbl>
1        1    28 Raramente           IyD                      24         3
# ℹ 18 more variables: Campo_Educación <chr>, Satisfacción_Ambiental <dbl>,
#   Genero <chr>, Cargo <fct>, Satisfación_Laboral <dbl>, Estado_Civil <chr>,
#   Ingreso_Mensual <dbl>, Trabajos_Anteriores <dbl>, Horas_Extra <fct>,
#   Porcentaje_aumento_salarial <dbl>, Rendimiento_Laboral <dbl>,
#   Años_Experiencia <dbl>, Capacitaciones <dbl>,
#   Equilibrio_Trabajo_Vida <dbl>, Antigüedad <dbl>, Antigüedad_Cargo <dbl>,
#   Años_ultima_promoción <dbl>, Años_acargo_con_mismo_jefe <dbl>

# Obtener las predicciones del modelo en los datos de prueba
predicciones1 <- predict(modelo, newdata = data_Juan, type = "response")

exp(predicciones1)

       1 
1.825252

# Obtener las predicciones del modelo en los datos de prueba
predicciones1 <- predict(modelo, newdata = data_Juan, type = "response")
clases_predichas <- ifelse(predicciones1 > 0.5, 1, 0)

En este punto, se eligio la fila 15 de la data como caso hipotetico para predecir la probabilidad de rotación. Para esto, se nombro la fila elegida como ” data_Juan” Obteniendo como resultado un valor de 1.825 de probabilidad de rotación; demostrando asi que es casi el doble de lo que normalmente rota un trabajador en la empresa.

7. Conclusiones

En las conclusiones adicione una discución sobre cuál sería la estrategia para disminuir la rotación en la empresa (con base en las variables que resultaron significativas en el punto 3).

Para disminuir la rotación en la empresa, es fundamental centrarse en los factores significativos que influyen en la decisión de los empleados de permanecer o dejar su trabajo, según los resultados del modelo de regresión logística. Los factores más influyentes incluyen:

-Edad: Los empleados más jóvenes tienen una mayor tendencia a rotar, lo que sugiere que estrategias específicas de retención, como programas de desarrollo profesional o planes de carrera a largo plazo, pueden ser efectivos para mantener a este grupo comprometido.

-Ingreso Mensual: Aunque el efecto es negativo y significativo, sugiere que una leve variación en los salarios podría influir en la rotación. Revisar la estructura salarial para asegurar que los sueldos sean competitivos en la industria puede ayudar a retener talento.

-Estado Civil (Soltero): Los empleados solteros parecen tener una mayor tendencia a rotar. Crear iniciativas que promuevan un equilibrio entre vida laboral y personal, como horarios flexibles o teletrabajo, podría reducir este riesgo.

-Horas Extra: Los empleados que trabajan horas extras tienen una mayor probabilidad de rotar. Reducción de la carga de trabajo o compensaciones más atractivas por las horas extras trabajadas puede ayudar a minimizar la rotación relacionada con este factor.

-Satisfacción Laboral: La satisfacción laboral es un predictor clave de la rotación. Es crucial mejorar el ambiente de trabajo mediante políticas de bienestar, evaluaciones periódicas de satisfacción y programas de reconocimiento de los empleados para aumentar el compromiso y reducir la rotación.

Problema: Rotación de cargo

Juan Camilo González Victoria y Sergio Rueda