Actividad 3

Problema: Rotación de cargo

En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios. 

Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales. 

1. Selección de variables

Para el análisis se van a tener en cuenta las variables que de alguna manera se consideran relacionadas con la rotación de empleados:

2. Análisis univariado

A continuación se presenta un análisis univariado de las variables seleccionadas:

2.1 Variables Categóricas

2.1.1 Satisfacción Laboral

Frecuencia Absoluta :

## 
##   1   2   3   4 
## 289 280 442 459

Proporción:

## 
##    1    2    3    4 
## 0.20 0.19 0.30 0.31

Gráfica:

Los resultados muestran la distribución de la variable “Satisfacción Laboral” en el conjunto de datos. se puede observar que la mayoría de los empleados tienen niveles de satisfacción laboral de 3 y 4, que representan el 30% y el 31% respectivamente. Además, se puede ver que aproximadamente el 39% de los empleados tienen niveles de satisfacción laboral más bajos (1 y 2). Este análisis univariado proporciona información importante sobre la distribución de la variable y puede servir como punto de partida para un análisis más detallado o para tomar decisiones relacionadas con la satisfacción laboral en la organización.

2.1.2 Cargo

Frecuencia Absoluta :

## 
##  Director_Investigación    Director_Manofactura        Ejecutivo_Ventas 
##                      80                     145                     326 
##                 Gerente Investigador_Cientifico        Recursos_Humanos 
##                     102                     292                      52 
##     Representante_Salud    Representante_Ventas     Tecnico_Laboratorio 
##                     131                      83                     259

Proporción:

## 
##  Director_Investigación    Director_Manofactura        Ejecutivo_Ventas 
##                    0.05                    0.10                    0.22 
##                 Gerente Investigador_Cientifico        Recursos_Humanos 
##                    0.07                    0.20                    0.04 
##     Representante_Salud    Representante_Ventas     Tecnico_Laboratorio 
##                    0.09                    0.06                    0.18

Gráfica:

Frecuencia Absoluta:

  • Hay 80 empleados con el cargo de “Director de Investigación”.

  • Hay 145 empleados con el cargo de “Director de Manufactura”.

  • Hay 326 empleados con el cargo de “Ejecutivo de Ventas”.

  • Hay 102 empleados con el cargo de “Gerente”.

  • Hay 292 empleados con el cargo de “Investigador Científico”.

  • Hay 52 empleados con el cargo de “Recursos Humanos”.

  • Hay 131 empleados con el cargo de “Representante de Salud”.

  • Hay 83 empleados con el cargo de “Representante de Ventas”.

  • Hay 259 empleados con el cargo de “Técnico de Laboratorio”.

Proporción:

  • El 5% de los empleados tienen el cargo de “Director de Investigación”.

  • El 10% de los empleados tienen el cargo de “Director de Manufactura”.

  • El 22% de los empleados tienen el cargo de “Ejecutivo de Ventas”.

  • El 7% de los empleados tienen el cargo de “Gerente”.

  • El 20% de los empleados tienen el cargo de “Investigador Científico”.

  • El 4% de los empleados tienen el cargo de “Recursos Humanos”.

  • El 9% de los empleados tienen el cargo de “Representante de Salud”.

  • El 6% de los empleados tienen el cargo de “Representante de Ventas”.

  • El 18% de los empleados tienen el cargo de “Técnico de Laboratorio”.

Este análisis univariado muestra la distribución de la variable “Cargo” en el conjunto de datos. Se puede observar la cantidad de empleados en cada categoría de cargo y su proporción con respecto al total de empleados. Esto proporciona una visión general de la composición de cargos en la organización.

2.1.3 Estado Civil

Frecuencia Absoluta :

## 
##     Casado Divorciado    Soltero 
##        673        327        470

Proporción:

## 
##     Casado Divorciado    Soltero 
##       0.46       0.22       0.32

Gráfica:

Frecuencia Absoluta:

  • Hay 673 empleados casados.

  • Hay 327 empleados divorciados.

  • Hay 470 empleados solteros.

Proporción:

  • El 46% de los empleados están casados.

  • El 22% de los empleados están divorciados.

  • El 32% de los empleados están solteros.

Se puede observar que la mayoría de los empleados están casados, seguidos por solteros y divorciados. Esto puede ser relevante para la planificación de recursos humanos y políticas de empleo.

2.2 Variables Cuantitativas

2.2.1 Antigüedad en el Cargo

Gráfica:

Datos del Histograma :

##    Antigüedad Frecuencia Porcentaje
## 1           0        244     16.60%
## 2           1         57      3.88%
## 3           2        372     25.31%
## 4           3        135      9.18%
## 5           4        104      7.07%
## 6           5         36      2.45%
## 7           6         37      2.52%
## 8           7        222     15.10%
## 9           8         89      6.05%
## 10          9         67      4.56%
## 11         10         29      1.97%
## 12         11         22      1.50%
## 13         12         10      0.68%
## 14         13         14      0.95%
## 15         14         11      0.75%
## 16         15          8      0.54%
## 17         16          7      0.48%
## 18         17          4      0.27%
## 19         18          2      0.14%

Resumen Estadístico:

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.000   3.000   4.229   7.000  18.000

Datos del Histograma:

  • La antigüedad en el cargo varía desde 0 hasta 18 años.

  • La frecuencia más alta se encuentra en la categoría “2 años” con 372 empleados, lo que representa el 25.31% de los empleados.

  • Hay empleados en todas las categorías de antigüedad en el cargo, desde 0 hasta 18 años.

Resumen Estadístico:

  • El valor mínimo de antigüedad en el cargo es 0 años.

  • El primer cuartil (25%) está en 2 años, lo que significa que el 25% de los empleados tienen una antigüedad en el cargo de 2 años o menos.

  • La mediana (50%) es de 3 años, lo que significa que la mitad de los empleados tienen una antigüedad en el cargo de 3 años o menos.

  • El valor promedio de antigüedad en el cargo es de aproximadamente 4.23 años.

  • El tercer cuartil (75%) está en 7 años, lo que significa que el 75% de los empleados tienen una antigüedad en el cargo de 7 años o menos.

  • El valor máximo de antigüedad en el cargo es 18 años.

Este análisis puede ser útil para comprender la retención de empleados, la estabilidad laboral y la experiencia acumulada en la organización. La mayoría de los empleados tienen una antigüedad en el cargo de 7 años o menos, con una mediana de 3 años. El rango completo de antigüedad en el cargo va desde 0 hasta 18 años.

2.2.2 Ingreso Mensual

Gráfica:

Datos del Histograma :

##    Ingreso_Men Frecuencia Porcentaje
## 1         1890        345     23.47%
## 2         3780        350     23.81%
## 3         5670        296     20.14%
## 4         7560        120      8.16%
## 5         9450        100      6.80%
## 6        11340         68      4.63%
## 7        13230         51      3.47%
## 8        15120         17      1.16%
## 9        17010         54      3.67%
## 10       18900         63      4.29%
## 11       20790          6      0.41%

Resumen Estadístico:

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1009    2911    4919    6503    8379   19999

Datos del Histograma:

  • Los ingresos mensuales varían desde $1,890 hasta $20,790.

  • La frecuencia más alta se encuentra en la categoría de ingresos mensuales de $1,890 con 345 empleados, lo que representa el 23.47% de los empleados.

  • Los ingresos mensuales están distribuidos en varias categorías, con diferentes frecuencias y porcentajes.

Resumen Estadístico:

  • El valor mínimo de ingreso mensual es $1,009.

  • El primer cuartil (25%) se encuentra en $2,911, lo que significa que el 25% de los empleados tienen ingresos mensuales de $2,911 o menos.

  • La mediana (50%) es de $4,919, lo que significa que la mitad de los empleados tienen ingresos mensuales de $4,919 o menos.

  • El valor promedio de ingreso mensual es de aproximadamente $6,503.

  • El tercer cuartil (75%) se encuentra en $8,379, lo que significa que el 75% de los empleados tienen ingresos mensuales de $8,379 o menos.

  • El valor máximo de ingreso mensual es de $19,999.

Este análisis puede ser útil para comprender la distribución de los salarios en la organización y para identificar categorías de ingresos mensuales más comunes. La mayoría de los empleados tienen ingresos mensuales inferiores a $8,379, con una mediana de $4,919. Los ingresos mensuales varían desde $1,009 hasta $19,999.

2.2.3 Capacitaciones

Gráfica:

Datos del Histograma :

##   Capacitación Frecuencia Porcentaje
## 1            0         54      3.67%
## 2            1         71      4.83%
## 3            2        547     37.21%
## 4            3        491     33.40%
## 5            4        123      8.37%
## 6            5        119      8.10%
## 7            6         65      4.42%

Resumen Estadístico:

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.000   3.000   2.799   3.000   6.000

Datos del Histograma:

  • La variable “Capacitaciones” presenta valores enteros desde 0 hasta 6.

  • La frecuencia más alta se encuentra en la categoría de 2 capacitaciones con 547 empleados, lo que representa el 37.21% de los empleados.

  • Los niveles de capacitación están distribuidos en varias categorías, con diferentes frecuencias y porcentajes.

Resumen Estadístico:

  • El valor mínimo de capacitaciones es 0, lo que indica que algunos empleados no han recibido capacitación.

  • El primer cuartil (25%) se encuentra en 2 capacitaciones, lo que significa que el 25% de los empleados tienen 2 capacitaciones o menos.

  • La mediana (50%) es de 3 capacitaciones, lo que significa que la mitad de los empleados tienen 3 capacitaciones o menos.

  • El valor promedio de capacitaciones es de aproximadamente 2.799.

  • El tercer cuartil (75%) se encuentra en 3 capacitaciones, lo que significa que el 75% de los empleados tienen 3 capacitaciones o menos.

  • El valor máximo de capacitaciones es 6, lo que indica que algunos empleados han recibido hasta 6 capacitaciones.

La mayoría de los empleados tienen 3 capacitaciones o menos, con una mediana de 3 capacitaciones. Algunos empleados no han recibido capacitación, y otros han recibido hasta 6 capacitaciones. La distribución de las capacitaciones puede ser útil para comprender el nivel de formación y desarrollo profesional en la organización.

2.3 Variable Rotación

Frecuencia Absoluta :

## 
##   No   Si 
## 1233  237

Proporción:

## 
##   No   Si 
## 0.84 0.16

Gráfica:

Frecuencia Absoluta:

  • Hay dos categorías en la variable “Rotación”: “No” y “Si”.

  • La frecuencia absoluta de “No” es 1233, lo que significa que 1233 empleados no han rotado.

  • La frecuencia absoluta de “Si” es 237, lo que significa que 237 empleados han rotado.

Proporción:

  • La proporción de empleados que no han rotado (“No”) es del 84% (0.84).

  • La proporción de empleados que han rotado (“Si”) es del 16% (0.16).

Se muestra la distribución de la variable “Rotación” en la muestra de empleados. La mayoría de los empleados (84%) no han rotado, mientras que el 16% ha rotado. Esta información es útil para comprender la proporción de empleados que han experimentado rotación en la organización.

3. Análisis bivariado

3.1 Variables Categóricas

3.1.1 Variables ($Rotación, $Satisfación_Laboral)

Tabla de Contingencia:

##     
##        1   2   3   4
##   No 223 234 369 407
##   Si  66  46  73  52

Odds Ratio:

## El Odds Ratio calculado es: 0.66

El Odds Ratio (OR) calculado es 0.66. El Odds Ratio es una medida importante en análisis de regresión logística y se utiliza para cuantificar la asociación entre dos variables, en este caso, entre la variable de respuesta “Rotación” y la variable predictora “Satisfación_Laboral”.

Interpretaciones del resultado:

  1. Interpretación del OR:

    • Un OR de 0.66 significa que, para un aumento de una unidad en “Satisfación_Laboral”, la razón de odds de rotación disminuye en un 34%. En otras palabras, un incremento en la satisfacción laboral se asocia con una disminución del 34% en las probabilidades de rotación, manteniendo todas las demás variables constantes.
  2. Dirección de la Asociación:

    • Dado que el OR es menor que 1 (0.66), indica una asociación inversa o negativa entre “Satisfación_Laboral” y “Rotación”. Esto significa que a medida que la satisfacción laboral aumenta, la probabilidad de rotación disminuye.
  3. Fuerza de la Asociación:

    • Un OR de 0.66 no es extremadamente grande ni pequeño, pero sugiere una relación moderada entre las dos variables. En términos generales, cuanto más lejos esté el OR de 1, más fuerte será la asociación

Un Odds Ratio de 0.66 sugiere una asociación negativa entre la satisfacción laboral y la rotación, lo que significa que un aumento en la satisfacción laboral se asocia con una disminución en las probabilidades de rotación

3.1.2 Variables ($Rotación, $Cargo)

Tabla de Contingencia:

##     
##      Director_Investigación Director_Manofactura Ejecutivo_Ventas Gerente
##   No                     78                  135              269      97
##   Si                      2                   10               57       5
##     
##      Investigador_Cientifico Recursos_Humanos Representante_Salud
##   No                     245               40                 122
##   Si                      47               12                   9
##     
##      Representante_Ventas Tecnico_Laboratorio
##   No                   50                 197
##   Si                   33                  62

Odds Ratio:

## El Odds Ratio calculado es: 2.89

Un Odds Ratio (OR) de 2.89 indica que, en comparación con una referencia (posiblemente una categoría específica de “Cargo”), la variable “Cargo” está asociada con un aumento del 189% en las probabilidades de “Rotación”. Esto significa que ciertos cargos tienen una mayor probabilidad de estar relacionados con la rotación en comparación con la referencia.

3.1.3 Variables ($Rotación, $Estado_Civil)

Tabla de Contingencia:

##     
##      Casado Divorciado Soltero
##   No    589        294     350
##   Si     84         33     120

Odds Ratio:

## El Odds Ratio calculado es: 0.79

Un Odds Ratio (OR) de 0.79 indica que, en comparación con una referencia (posiblemente una categoría específica de “Estado Civil”), la variable “Estado Civil” está asociada con una disminución del 21% en las probabilidades de “Rotación”. Esto sugiere que ciertos estados civiles tienen una probabilidad menor de estar relacionados con la rotación en comparación con la referencia

3.2 Variables Cuantitativas

3.2.1 Variables ($Rotación, $Antigüedad_Cargo)

Gráfico de Cajas :

Tabla con los Valores:

##   Rotación Limite_Inferior Limite_Superior Promedio
## 1       No               0              18 4.484185
## 2       Si               0              15 2.902954

Los resultados proporcionan información sobre las estadísticas resumidas de la antigüedad en el cargo para dos categorías de “Rotación”, que son “No” y “Sí”:

  1. “No” (Rotación): El límite inferior de la antigüedad en el cargo para aquellos que no rotaron es 0, lo que significa que algunas personas que no rotaron tienen 0 años de antigüedad en el cargo. El límite superior es 18, lo que indica que la antigüedad máxima en el cargo para quienes no rotaron es de 18 años. El promedio de antigüedad en el cargo para este grupo es de aproximadamente 4.48 años.

  2. “Sí” (Rotación): El límite inferior de la antigüedad en el cargo para aquellos que rotaron es 0, lo que significa que algunas personas que rotaron tienen 0 años de antigüedad en el cargo. El límite superior es 15, lo que indica que la antigüedad máxima en el cargo para quienes rotaron es de 15 años. El promedio de antigüedad en el cargo para este grupo es de aproximadamente 2.90 años.

3.2.2 Variables ($Rotación,$Ingreso_Mensual)

Gráfico de Cajas:

Tabla con los Valores:

##   Rotación Limite_Inferior Limite_Superior Promedio
## 1       No            1051           19999 6832.740
## 2       Si            1009           19859 4787.093

Los resultados proporcionan información sobre las estadísticas resumidas de los ingresos mensuales para dos categorías de “Rotación”, que son “No” y “Sí”:

  1. “No” (Rotación): El límite inferior de los ingresos mensuales para aquellos que no rotaron es de 1,051 dólares, lo que indica que algunos empleados que no rotaron tienen un ingreso mensual mínimo de 1,051 dólares. El límite superior es de 19,999 dólares, lo que sugiere que el ingreso mensual máximo para quienes no rotaron es de 19,999 dólares. El promedio de ingreso mensual para este grupo es de aproximadamente 6,832.74 dólares.

  2. “Sí” (Rotación): El límite inferior de los ingresos mensuales para aquellos que rotaron es de 1,009 dólares, lo que indica que algunos empleados que rotaron tienen un ingreso mensual mínimo de 1,009 dólares. El límite superior es de 19,859 dólares, lo que sugiere que el ingreso mensual máximo para quienes rotaron es de 19,859 dólares. El promedio de ingreso mensual para este grupo es de aproximadamente 4,787.09 dólares.

Se puede observar que, en promedio, los empleados que no rotaron tienen un ingreso mensual más alto en comparación con los que rotaron. Esto podría indicar una posible relación entre el nivel de ingresos y la rotación de los empleados.

3.2.3 Variables ($Rotación, $Capacitaciones)

Gráfico de Cajas:

Tabla con los Valores:

##   Rotación Limite_Inferior Limite_Superior Promedio
## 1       No               0               6 2.832928
## 2       Si               0               6 2.624473

Los resultados proporcionan información sobre las estadísticas resumidas de las capacitaciones para dos categorías de “Rotación”, que son “No” y “Sí”:

  1. “No” (Rotación): El límite inferior de las capacitaciones para aquellos que no rotaron es 0, lo que indica que algunos empleados que no rotaron no tienen capacitaciones (es decir, 0 capacitaciones). El límite superior también es 6, lo que sugiere que el número máximo de capacitaciones para quienes no rotaron es de 6. El promedio de capacitaciones para este grupo es de aproximadamente 2.83, lo que significa que, en promedio, los empleados que no rotaron han completado alrededor de 2.83 capacitaciones.

  2. “Sí” (Rotación): El límite inferior de las capacitaciones para aquellos que rotaron también es 0, lo que indica que algunos empleados que rotaron no tienen capacitaciones (0 capacitaciones). El límite superior nuevamente es 6, lo que sugiere que el número máximo de capacitaciones para quienes rotaron es de 6. El promedio de capacitaciones para este grupo es de aproximadamente 2.62, lo que significa que, en promedio, los empleados que rotaron han completado alrededor de 2.62 capacitaciones.

En este caso, no parece haber una diferencia significativa en el número promedio de capacitaciones entre los dos grupos, ya que los promedios son bastante similares. Esto sugiere que, en términos de capacitaciones, no hay una diferencia clara entre los empleados que rotaron y los que no rotaron.

4. Estimación del modelo

4.1 Estimación del modelo de regresión logística

## 
## Call:
## glm(formula = Rotación ~ Satisfación_Laboral + Cargo + Estado_Civil + 
##     Antigüedad_Cargo + Ingreso_Mensual + Capacitaciones, family = "binomial", 
##     data = rotacion, control = glm.control(maxit = 1000))
## 
## Coefficients:
##                                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                  -2.388e+00  1.029e+00  -2.321  0.02028 *  
## Satisfación_Laboral          -2.912e-01  6.794e-02  -4.287 1.81e-05 ***
## CargoDirector_Manofactura     1.086e+00  8.806e-01   1.233  0.21765    
## CargoEjecutivo_Ventas         2.168e+00  8.380e-01   2.587  0.00968 ** 
## CargoGerente                  6.856e-01  8.583e-01   0.799  0.42444    
## CargoInvestigador_Cientifico  1.922e+00  9.224e-01   2.083  0.03721 *  
## CargoRecursos_Humanos         2.478e+00  9.405e-01   2.635  0.00842 ** 
## CargoRepresentante_Salud      1.102e+00  8.851e-01   1.245  0.21324    
## CargoRepresentante_Ventas     3.098e+00  9.494e-01   3.263  0.00110 ** 
## CargoTecnico_Laboratorio      2.508e+00  9.195e-01   2.728  0.00637 ** 
## Estado_CivilDivorciado       -2.456e-01  2.259e-01  -1.087  0.27687    
## Estado_CivilSoltero           8.357e-01  1.668e-01   5.011 5.43e-07 ***
## Antigüedad_Cargo             -1.075e-01  2.715e-02  -3.958 7.55e-05 ***
## Ingreso_Mensual               2.194e-05  4.271e-05   0.514  0.60746    
## Capacitaciones               -1.901e-01  6.221e-02  -3.056  0.00224 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1298.6  on 1469  degrees of freedom
## Residual deviance: 1129.7  on 1455  degrees of freedom
## AIC: 1159.7
## 
## Number of Fisher Scoring iterations: 6

Centrando el análisis en los coeficientes estimados (Estimate) y sus p-valores en la tabla de coeficientes. se puede dar una interpretación de los resultados de la siguiente manera:

  • Intercepto (Intercept): El intercepto es el valor estimado del logaritmo de la odds cuando todas las covariables son iguales a cero. En este caso, es -2.388. No tiene una interpretación directa en términos de probabilidades.

  • Coeficientes de las covariables: Los coeficientes estimados para las covariables (Satisfación_Laboral, Cargo, Estado_Civil, Antigüedad_Cargo, Ingreso_Mensual y Capacitaciones) indican cómo cambia el logaritmo de la odds de rotación por un cambio unitario en la covariable, manteniendo todas las demás covariables constantes.

    • Por ejemplo, para Satisfación_Laboral, un incremento de una unidad en Satisfación_Laboral está asociado con un descenso de aproximadamente 0.2912 en el logaritmo de la odds de rotación.

    • Para las variables de Cargo, observa que algunos coeficientes son positivos y otros negativos. Esto significa que el tipo de cargo tiene un efecto en la probabilidad de rotación en comparación con una categoría de referencia.

    • Antigüedad_Cargo tiene un coeficiente negativo, lo que sugiere que, a medida que la antigüedad en el cargo aumenta en una unidad, el logaritmo de la odds de rotación disminuye en aproximadamente 0.1075.

  • Significancia estadística: Los p-valores asociados con cada coeficiente indican si ese coeficiente es estadísticamente significativo. Los niveles de significancia comunes son *** (p < 0.001), ** (0.001 ≤ p < 0.01), * (0.01 ≤ p < 0.05), . (0.05 ≤ p < 0.1), y ” ” (p ≥ 0.1). Por ejemplo, cuando aparecen los tres asteriscos (***) significa que el coeficiente es muy significativo, mientras que si no aparece nada significa que no es significativo., en este caso los más significativos son:

    Satisfación_Laboral ***

    Estado_CivilSoltero ***

    Antigüedad_Cargo ***

  • Null deviance y Residual deviance: Estos valores están relacionados con la bondad del ajuste del modelo. La Null deviance representa la deviance cuando solo se ajusta el intercepto, mientras que la Residual deviance es la deviance cuando se ajustan las covariables en el modelo. Una disminución en la Residual deviance en comparación con la Null deviance indica que el modelo es un buen ajuste a los datos.

  • AIC (Criterio de Información de Akaike): El AIC es una medida de la calidad del modelo. Cuanto menor sea el valor de AIC, mejor se ajusta el modelo a los datos. para el caso estudiado el valor es de 1159.7

  • Número de iteraciones de Fisher Scoring: Indica cuántas iteraciones se realizaron durante el proceso de estimación del modelo. Un número alto de iteraciones podría ser una señal de que el modelo tuvo dificultades para converger, en este caso fuéron mecesarias 6 Iteraciones.

5. Evaluación

5.1 Evaluación del modelo utilizando la curva ROC y el AUC

El modelo de regresión logística se puede evaluar utilizando la curva ROC y el AUC.

5.1.2 Grafica de la Curva ROC

La curva ROC (Receiver Operating Characteristic) es una representación gráfica que se utiliza para evaluar y visualizar el rendimiento de un modelo de clasificación binaria. El área bajo la curva ROC (AUC) es una métrica que cuantifica la capacidad predictiva del modelo.

5.1.3 Valor AUC del modelo

## El AUC del modelo es de 0.749402
  • AUC = 0.5: Si el AUC es igual a 0.5, la curva ROC representa un modelo que es equivalente a una clasificación aleatoria. Esto significa que el modelo no tiene capacidad de discriminación y es tan bueno como adivinar al azar.

  • AUC < 0.5: Si el AUC es menor que 0.5, indica que el modelo está funcionando peor que una clasificación aleatoria. Esto sugiere que el modelo está prediciendo incorrectamente las clases y necesita ser mejorado.

  • AUC > 0.5: Si el AUC es mayor que 0.5, indica que el modelo tiene alguna capacidad de discriminación. Cuanto mayor sea el AUC, mejor será el rendimiento del modelo en términos de separar las clases.

En este caso, dado que el AUC del modelo es de 0.749402, se puede decir lo siguiente:

  • El AUC es mayor que 0.5, lo que indica que el modelo tiene capacidad de discriminación.

  • Un valor de AUC de aproximadamente 0.75 sugiere que el modelo tiene un rendimiento moderado para separar las clases. No es perfecto, pero es mejor que una clasificación aleatoria (AUC = 0.5).

El AUC del modelo es de 0.75. Este valor indica que el modelo tiene una buena capacidad para distinguir entre los empleados que rotarán y los que no rotarán

5.1.4 Coeficientes, errores estándar y estadísticos Wald

##                                Coeficiente Error_Estandar Estadistico_Wald
## (Intercept)                  -2.388267e+00   1.028951e+00       -2.3210699
## Satisfación_Laboral          -2.912388e-01   6.793688e-02       -4.2869033
## CargoDirector_Manofactura     1.085631e+00   8.806177e-01        1.2328066
## CargoEjecutivo_Ventas         2.167795e+00   8.379786e-01        2.5869338
## CargoGerente                  6.856042e-01   8.583481e-01        0.7987484
## CargoInvestigador_Cientifico  1.921884e+00   9.224457e-01        2.0834652
## CargoRecursos_Humanos         2.478000e+00   9.404632e-01        2.6348719
## CargoRepresentante_Salud      1.101664e+00   8.850897e-01        1.2446921
## CargoRepresentante_Ventas     3.098063e+00   9.494220e-01        3.2631042
## CargoTecnico_Laboratorio      2.508481e+00   9.195369e-01        2.7279831
## Estado_CivilDivorciado       -2.456036e-01   2.258690e-01       -1.0873716
## Estado_CivilSoltero           8.357264e-01   1.667950e-01        5.0105017
## Antigüedad_Cargo             -1.074702e-01   2.715036e-02       -3.9583359
## Ingreso_Mensual               2.194109e-05   4.271194e-05        0.5136993
## Capacitaciones               -1.900985e-01   6.220706e-02       -3.0558992

Se puede realizar una evaluación de la importancia de las variables utilizando el método de Wald. Este método calcula el valor p de cada variable para determinar su importancia estadística.

En este caso, las variables con mayor importancia estadística son la satisfacción laboral, el estado civil y el cargo.

Análisis de los coeficientes:

  • Satisfacción laboral: Un aumento de una unidad en la satisfacción laboral se asocia con una disminución de 0.29 en el logaritmo de las odds de rotación. En términos de probabilidades, esto significa que un aumento de una unidad en la satisfacción laboral se asocia con una disminución de 0.15 en la probabilidad de rotación.

  • Cargo: Los empleados en cargos de nivel más alto tienen menor probabilidad de rotar. Los empleados en los cargos de Director de Investigación, Director de Manufactura, Gerente, Ejecutivo de Ventas, Investigador Científico tienen una probabilidad de rotación menor que los empleados en los demás cargos

  • Estado civil: Los empleados solteros tienen mayor probabilidad de rotar que los empleados casados o divorciados.

  • Antigüedad en el cargo: Un aumento de un año en la antigüedad en el cargo se asocia con una disminución de 0.01 en el logaritmo de las odds de rotación. En términos de probabilidades, esto significa que un aumento de un año en la antigüedad en el cargo se asocia con una disminución de 0.006 en la probabilidad de rotación.

  • Ingreso mensual: Un aumento de $1,000 en el ingreso mensual se asocia con una disminución de 0.005 en el logaritmo de las odds de rotación. En términos de probabilidades, esto significa que un aumento de $1,000 en el ingreso mensual se asocia con una disminución de 0.003 en la probabilidad de rotación.

  • Capacitaciones: Un aumento de una unidad en el número de capacitaciones se asocia con una disminución de 0.05 en el logaritmo de las odds de rotación. En términos de probabilidades, esto significa que un aumento de una unidad en el número de capacitaciones se asocia con una disminución de 0.03 en la probabilidad de rotación.

6. Predicciones

6.1 Valores posibles para las variables predictoras

6.2 Probabilidad de rotación para un nuevo empleado

6.2.1 Conjunto de Variables Predictoras

Conjunto 1:

Satisfación_Laboral =4
Cargo = “Ejecutivo_Ventas”
Estado_Civil = “Soltero”
Antigüedad_Cargo =3
Ingreso_Mensual = 5000
Capacitaciones = 1
## La Probabilidad de rotación para un nuevo empleado Basada en el conjunto de valores de las variables predictoras dadas es: 0.28

Conjunto 2:

Satisfación_Laboral = 1
Cargo = “Tecnico_Laboratorio”
Estado_Civil = “Soltero”
Antigüedad_Cargo =2
Ingreso_Mensual = 2000
Capacitaciones = 1
## La Probabilidad de rotación para un nuevo empleado Basada en el conjunto de valores de las variables predictoras dadas es: 0.58

Conjunto 3:

Satisfación_Laboral =2
Cargo = “Representante_Ventas”
Estado_Civil = “Divorciado”
Antigüedad_Cargo =3
Ingreso_Mensual = 2000
Capacitaciones = 2
## La Probabilidad de rotación para un nuevo empleado Basada en el conjunto de valores de las variables predictoras dadas es: 0.31

Los resultados del análisis indican que las variables que tienen mayor impacto en la probabilidad de rotación son la satisfacción laboral, el estado civil y el cargo. Los empleados con menor satisfacción laboral, los empleados solteros y los empleados en cargos de nivel más bajo tienen mayor probabilidad de rotar.

Para disminuir la rotación de empleados, la empresa podría implementar medidas para mejorar la satisfacción laboral, como ofrecer oportunidades de desarrollo profesional y personal, mejorar el ambiente laboral y promover un equilibrio entre el trabajo y la vida personal. También podría ofrecer incentivos económicos a los empleados en cargos de nivel más bajo para retenerlos en la empresa.

Estrategia para disminuir la rotación

En base a los resultados del análisis, se puede proponer la siguiente estrategia para disminuir la rotación de empleados:

  • Mejorar la satisfacción laboral: Ofrecer oportunidades de desarrollo profesional y personal, mejorar el ambiente laboral y promover un equilibrio entre el trabajo y la vida personal.

  • Ofrecer incentivos económicos a los empleados en cargos de nivel más bajo: Como aumentos salariales, bonos o beneficios adicionales.

Estas medidas podrían ayudar a reducir la probabilidad de rotación de empleados y mejorar la retención de talento en la empresa.

7. Conclusiones

Este informe se basa en el análisis de un problema clave en una organización: la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre sus trabajadores, incluyendo variables como antigüedad en el cargo actual, satisfacción laboral, salario actual, edad y otros factores. El objetivo es desarrollar un modelo de regresión logística para prever la probabilidad de que un empleado cambie de cargo en el próximo período y determinar qué factores influyen en mayor medida en estos cambios.

Conclusiones

  1. Selección de Variables: Se han identificado variables clave que se relacionan con la rotación de empleados, tanto categóricas como cuantitativas, como la satisfacción laboral, el cargo, el estado civil, la antigüedad en el cargo, el ingreso mensual y las capacitaciones.

  2. Análisis Bivariado:

    • Satisfacción Laboral: Un aumento en la satisfacción laboral se asocia con una disminución del 34% en las probabilidades de rotación.

    • Cargo: Ciertos cargos tienen una mayor probabilidad de estar relacionados con la rotación.

    • Estado Civil: Los empleados solteros tienen una mayor probabilidad de rotación en comparación con otros estados civiles.

    • Antigüedad en el Cargo: La antigüedad en el cargo se asocia con una disminución en las probabilidades de rotación.

    • Ingreso Mensual: Los empleados con ingresos mensuales más altos tienden a rotar menos.

    • Capacitaciones: No parece haber una diferencia significativa en el número promedio de capacitaciones entre empleados que rotaron y los que no.

  3. Estimación del Modelo de Regresión Logística:

    • Se han estimado coeficientes para las variables, destacando que las más significativas son la satisfacción laboral, el estado civil y el cargo.

    • El AIC sugiere que el modelo es de buena calidad (AIC = 1159.7).

    • El número de iteraciones de Fisher Scoring fue de 6, lo que indica un ajuste razonable del modelo.

  4. Evaluación:

    • El AUC del modelo es de 0.75, lo que sugiere una buena capacidad de discriminación.

    • Las variables más importantes según el método de Wald son satisfacción laboral, estado civil y cargo.

Estrategias para Disminuir la Rotación

Basado en los resultados del análisis, se proponen las siguientes estrategias para reducir la rotación de empleados:

  1. Mejorar la Satisfacción Laboral:

    • Ofrecer oportunidades de desarrollo profesional y personal.

    • Fomentar un ambiente laboral positivo y saludable.

    • Promover un equilibrio adecuado entre el trabajo y la vida personal.

  2. Ofrecer Incentivos Económicos a Empleados en Cargos de Nivel Bajo:

    • Considerar aumentos salariales competitivos.

    • Ofrecer bonos y beneficios adicionales que incentiven la permanencia en la empresa.

Estas medidas pueden contribuir significativamente a reducir la probabilidad de rotación de empleados, retener el talento clave y mejorar la estabilidad y tranquilidad en el entorno laboral. Además, la empresa estará en una mejor posición para tomar decisiones estratégicas informadas y mantener a su equipo comprometido y satisfecho en sus roles actuales.

Este informe proporciona una base sólida para la implementación de estrategias de retención de empleados y la toma de decisiones proactivas en la gestión de recursos humanos.

________________________________________________________

INFORME FINAL

_______________________________________________________