En este trabajo realizamos un análisis de rotación de personal, con el objetivo de entender qué factores influyen en la salida de los empleados de una empresa. La rotación de personal es un desafío crítico que afecta la estabilidad y el rendimiento organizacional. A través de este análisis, buscamos identificar patrones que nos permitan predecir y prevenir la fuga de talento.
El problema que estamos manejando está relacionado con la gestión del talento humano dentro de una empresa, en un contexto de analítica de personas. Utilizando herramientas estadísticas y modelos predictivos, nos proponemos evaluar diversos factores como la satisfacción laboral, el balance entre trabajo y vida, y las condiciones laborales, que pueden estar influyendo en la decisión de los empleados de dejar la organización.
Para abordar este problema, seguimos varios pasos, comenzando por la recolección de datos relevantes sobre las características de los empleados y su comportamiento dentro de la empresa. Posteriormente, aplicamos un modelo de regresión logística (GLM) para identificar las variables clave que afectan la rotación, con el fin de generar recomendaciones estratégicas que ayuden a reducirla.
Descripción: Representa los años que un empleado ha trabajado en la empresa.
Razón: Los empleados con menor antigüedad suelen tener una mayor probabilidad de rotación, ya que están en una etapa inicial de adaptación y pueden estar explorando otras oportunidades. Por otro lado, los empleados con mayor antigüedad podrían ser más leales, pero también podrían rotar si sienten estancamiento profesional.
Descripción: Representa el salario mensual del empleado.
Razón: El salario es un factor clave en la satisfacción laboral. Un ingreso bajo puede motivar a los empleados a buscar mejores oportunidades, mientras que un ingreso competitivo puede reducir la probabilidad de rotación.
Descripción: Indica el porcentaje de aumento salarial recibido por el empleado.
Razón: Los aumentos salariales reflejan el reconocimiento y la valoración del desempeño del empleado. Si un empleado percibe que no recibe aumentos justos, podría sentirse desmotivado y buscar otras opciones laborales.
Descripción: Estado civil del empleado (e.g., ‘Soltero’, ‘Casado’, ‘Divorciado’).
Razón: El estado civil puede influir en la estabilidad laboral. Por ejemplo, empleados solteros podrían estar más dispuestos a cambiar de trabajo o ubicación, mientras que empleados casados podrían buscar mayor estabilidad.
Descripción: Departamento en el que trabaja el empleado (e.g., ‘Ventas’, ‘IyD’, ‘RH’).
Razón: Algunos departamentos pueden tener mayores niveles de estrés o menor satisfacción laboral, lo que podría aumentar la rotación. Por ejemplo, ventas suele ser un área con alta rotación debido a la presión por resultados.
Descripción: Frecuencia de viajes de negocios (e.g., ‘No_Viaja’, ‘Raramente’, ‘Frecuentemente’).
Razón: La frecuencia de viajes puede afectar el equilibrio entre la vida personal y laboral. Empleados que viajan frecuentemente podrían experimentar mayor desgaste, lo que podría llevar a una mayor rotación.
Tipo: Categórica (Sí/No).
Descripción: Indica si el empleado ha rotado o dejado la empresa.
Observación: La variable está codificada como
binaria en y
(0: No rotó, 1: Rotó). La media de
y
es 0.1612, lo que indica que aproximadamente el
16.12% de los empleados han rotado.
Tipo: Numérica.
Rango: 18 a 60 años.
Media: 36.92 años.
Observación: La mayoría de los empleados tienen entre 30 y 43 años (percentiles 25 y 75). Esto sugiere una fuerza laboral predominantemente adulta.
Tipo: Categórica.
Descripción: Frecuencia de viajes de negocios (e.g., ‘No_Viaja’, ‘Raramente’, ‘Frecuentemente’).
Observación: Es importante analizar cómo la frecuencia de viajes afecta la rotación, ya que puede influir en el equilibrio trabajo-vida.
Tipo: Categórica.
Descripción: Departamento en el que trabaja el empleado (e.g., ‘Ventas’, ‘IyD’, ‘RH’).
Observación: Los departamentos pueden tener diferentes niveles de rotación debido a la naturaleza del trabajo.
Tipo: Numérica.
Rango: 1 a 29 km.
Media: 9.19 km.
Observación: La mayoría de los empleados viven a una distancia de entre 2 y 14 km del trabajo. Distancias mayores podrían estar relacionadas con una mayor rotación.
Tipo: Categórica (1 a 5).
Descripción: Nivel educativo (1: ‘Below College’, 5: ‘Doctor’).
Media: 2.91 (aproximadamente nivel “College”).
Observación: La mayoría de los empleados tienen un nivel educativo entre “College” y “Bachelor”.
Tipo: Categórica.
Descripción: Campo de estudio del empleado (e.g., ‘Humanidades’, ‘Ciencias’, ‘Mercadeo’).
Observación: Es relevante analizar si ciertos campos educativos están más asociados con la rotación.
Tipo: Categórica (1 a 4).
Media: 2.72.
Observación: La mayoría de los empleados reportan una satisfacción ambiental entre “Media” y “Alta”. Esto podría estar relacionado con la retención.
Tipo: Categórica (M/F).
Observación: Es importante analizar si existe una diferencia en la rotación entre géneros.
Tipo: Categórica.
Descripción: Cargo del empleado (e.g., ‘Gerente’, ‘Ejecutivo_Ventas’).
Observación: Algunos cargos pueden tener mayor rotación debido a la naturaleza del trabajo o las expectativas laborales.
Tipo: Categórica (1 a 4).
Media: 2.73.
Observación: La mayoría de los empleados reportan una satisfacción laboral entre “Media” y “Alta”. Esto podría influir en la rotación.
Tipo: Numérica.
Rango: 1009 a 19999.
Media: 6503.
Observación: Existe una gran variabilidad en los ingresos mensuales. Los empleados con ingresos más bajos podrían estar más propensos a rotar.
Tipo: Numérica.
Rango: 0 a 9.
Media: 2.69.
Observación: Los empleados con más trabajos anteriores podrían tener una mayor tendencia a rotar.
Tipo: Categórica (Sí/No).
Observación: Es importante analizar si los empleados que realizan horas extra tienen una mayor probabilidad de rotación.
Tipo: Numérica.
Rango: 11% a 25%.
Media: 15.21%.
Observación: Los empleados con menores aumentos salariales podrían estar más insatisfechos y propensos a rotar.
Tipo: Numérica.
Rango: 0 a 40 años.
Media: 7 años.
Observación: La mayoría de los empleados tienen entre 3 y 9 años de antigüedad. Los empleados con menor antigüedad podrían estar más propensos a rotar.
Tipo: Categórica (1 a 4).
Media: 2.76.
Observación: La mayoría de los empleados reportan un equilibrio entre “Medio” y “Bueno”. Un mal equilibrio podría estar relacionado con una mayor rotación.
Tipo: Numérica.
Rango: 0 a 18 años.
Media: 4.23 años.
Observación: Los empleados con menor antigüedad en el cargo podrían estar en una etapa de adaptación, lo que podría influir en la rotación.
Tipo: Numérica.
Rango: 0 a 15 años.
Media: 2.18 años.
Observación: Los empleados que llevan más tiempo sin una promoción podrían estar más insatisfechos y propensos a rotar.
Tipo: Numérica.
Rango: 0 a 17 años.
Media: 4.12 años.
Observación: Una relación prolongada con el mismo jefe podría influir en la satisfacción laboral y la rotación.
Tipo de dato: Texto o categórico.
Descripción: Nivel educativo del empleado (e.g., ‘Below College’, ‘College’, ‘Bachelor’, etc.).
Observación: El nivel educativo puede influir en las oportunidades de crecimiento y, por ende, en la rotación.
Tipo de dato: Categórico (numérico).
Descripción: Nivel de satisfacción con el ambiente laboral (e.g., 1: ‘Low’, 2: ‘Medium’, 3: ‘High’, 4: ‘Very High’).
Observación: Un ambiente laboral insatisfactorio puede ser un factor clave en la rotación.
Tipo de dato: Categórico (numérico).
Descripción: Nivel de involucramiento en el trabajo (e.g., 1: ‘Low’, 2: ‘Medium’, 3: ‘High’, 4: ‘Very High’).
Observación: Un bajo nivel de involucramiento podría estar relacionado con una mayor probabilidad de rotación.
Tipo de dato: Categórico (numérico).
Descripción: Nivel de satisfacción laboral (e.g., 1: ‘Bad’, 2: ‘Good’, 3: ‘Excellent’, 4: ‘Outstanding’).
Observación: La satisfacción laboral es un factor crítico para la retención de empleados.
Tipo de dato: Categórico (numérico).
Descripción: Calificación del rendimiento laboral (e.g., 1: ‘Bad’, 3: ‘Better’, 4: ‘Best’).
Observación: Un bajo rendimiento podría estar relacionado con una mayor rotación, ya sea por decisión del empleado o de la empresa.
Tipo de dato: Categórico (numérico).
Descripción: Nivel de satisfacción con las relaciones laborales.
Observación: Relaciones laborales insatisfactorias pueden aumentar la probabilidad de rotación.
Tipo de dato: Categórico (numérico).
Descripción: Equilibrio entre trabajo y vida personal.
Observación: Un mal equilibrio entre trabajo y vida personal puede ser un factor importante en la decisión de rotar.
Tipo de dato: Categórico (numérico).
Descripción: Calificación del rendimiento laboral.
Observación: Similar a “PerformanceRating”, un bajo rendimiento puede estar relacionado con una mayor rotación.
Tipo de dato: Categórico.
Descripción: Estado civil del empleado (e.g., ‘Soltero’, ‘Casado’, ‘Divorciado’).
Observación: El estado civil puede influir en la estabilidad laboral y la disposición a cambiar de empleo.
Tipo de dato: Numérico.
Descripción: Años de experiencia laboral total.
Observación: Los empleados con más experiencia podrían ser más propensos a buscar mejores oportunidades si no se sienten valorados.
Tipo de dato: Numérico.
Descripción: Número de capacitaciones realizadas.
Observación: Los empleados con más capacitaciones pueden sentirse más preparados para buscar nuevas oportunidades si no ven crecimiento en su puesto actual.
Distribución:
Frecuentemente: 208 (no rotaron), 69 (rotaron).
No_Viaja: 138 (no rotaron), 12 (rotaron).
Raramente: 887 (no rotaron), 156 (rotaron).
Observación:
Los empleados que viajan frecuentemente tienen una mayor proporción de rotación (69/277 ≈ 24.91%) en comparación con los que no viajan (12/150 ≈ 8%) o viajan raramente (156/1043 ≈ 14.96%).
Esto sugiere que los viajes frecuentes pueden estar asociados con un mayor desgaste y, por ende, una mayor rotación.
Distribución:
IyD: 828 (no rotaron), 133 (rotaron).
RH: 51 (no rotaron), 12 (rotaron).
Ventas: 354 (no rotaron), 92 (rotaron).
Observación:
El departamento de Ventas tiene la mayor proporción de rotación (92/446 ≈ 20.63%), seguido de RH (12/63 ≈ 19.05%) e IyD (133/961 ≈ 13.84%).
Esto indica que los empleados en ventas enfrentan mayores desafíos que podrían contribuir a la rotación.
Distribución:
Ciencias: 517 (no rotaron), 89 (rotaron).
Humanidades: 20 (no rotaron), 7 (rotaron).
Mercadeo: 124 (no rotaron), 35 (rotaron).
Salud: 401 (no rotaron), 63 (rotaron).
Técnicos: 100 (no rotaron), 32 (rotaron).
Observación:
Los empleados en Mercadeo y Técnicos tienen las mayores proporciones de rotación (35/159 ≈ 22% y 32/132 ≈ 24.24%, respectivamente).
Esto podría deberse a la naturaleza del trabajo o a las oportunidades en el mercado laboral.
Distribución:
F: 501 (no rotaron), 87 (rotaron).
M: 732 (no rotaron), 150 (rotaron).
Observación:
Los hombres tienen una proporción de rotación ligeramente mayor (150/882 ≈ 17.01%) en comparación con las mujeres (87/588 ≈ 14.79%).
Esto podría estar relacionado con diferencias en roles laborales o expectativas.
Distribución:
Representante_Ventas: 50 (no rotaron), 33 (rotaron).
Técnico_Laboratorio: 197 (no rotaron), 62 (rotaron).
Investigador_Científico: 245 (no rotaron), 47 (rotaron).
Observación:
Los cargos de Representante_Ventas y Técnico_Laboratorio tienen las mayores proporciones de rotación (33/83 ≈ 39.76% y 62/259 ≈ 23.94%, respectivamente).
Esto sugiere que estos roles podrían estar asociados con mayor presión o menor satisfacción laboral.
Distribución:
Soltero: 350 (no rotaron), 120 (rotaron).
Casado: 589 (no rotaron), 84 (rotaron).
Divorciado: 294 (no rotaron), 33 (rotaron).
Observación:
Distribución:
No: 944 (no rotaron), 110 (rotaron).
Sí: 289 (no rotaron), 127 (rotaron).
Observación:
Los empleados que realizan horas extra tienen una proporción de rotación significativamente mayor (127/416 ≈ 30.53%) en comparación con los que no realizan horas extra (110/1054 ≈ 10.44%).
Esto sugiere que las horas extra podrían estar relacionadas con un mayor desgaste laboral.Modelos
Correlación: -0.1592.
Observación:
Correlación: 0.0779.
Observación:
Correlación: -0.1034.
Observación:
Correlación: -0.1035.
Observación:
Correlación: -0.1598.
Observación:
Correlación: -0.1344.
Observación:
Correlación: -0.1711.
Observación:
Correlación: No aplica (categórica).
Observación:
Factores Clave de Rotación:
Categóricos: Viaje de Negocios, Departamento, Campo_Educación, Estado_Civil, Horas_Extra.
Numéricos: Edad, Ingreso_Mensual, Antigüedad, Satisfacción_Laboral, Satisfacción_Ambiental.
Hallazgos Relevantes:
Los empleados más jóvenes, con menor antigüedad, menor ingreso mensual y menor satisfacción laboral o ambiental tienen una mayor probabilidad de rotar.
Los roles específicos como Representante_Ventas y Técnico_Laboratorio, así como los empleados solteros o que realizan horas extra, también presentan mayores tasas de rotación.
En esta sección, se presentarán tres propuestas de gestión para enfrentar la problemática de la rotación de personal en las empresas. Utilizando inteligencia artificial (IA) y una exploración previa de los datos, se desarrollarán tres estrategias con diferentes enfoques: una agresiva, una moderada y una sencilla. Estas propuestas están diseñadas para abordar la rotación desde distintos niveles de intervención, permitiendo a las organizaciones elegir la opción más adecuada según sus necesidades y capacidad de implementación.
A continuación, se adjunta el prompt utilizado para generar las propuestas, el cual permitió orientar el análisis hacia soluciones específicas para reducir la rotación de personal.
“Necesito que actúes como un analista de riesgos. Basado en lo que sabes sobre la rotación de personal y el análisis de los datos, te pido que generes propuestas de gestión que aborden la problemática de la rotación en las empresas.
Crea tres propuestas de distinta índole: una agresiva, una moderada y una sencilla. El objetivo es gestionar de manera efectiva los porcentajes de rotación.”
Objetivo: Implementar cambios estructurales y estratégicos para abordar los factores clave de rotación de manera integral.
Revisión Salarial Competitiva:
Realizar un análisis de mercado para ajustar los salarios de los empleados con ingresos bajos, especialmente en roles críticos como Representante de Ventas y Técnico de Laboratorio.
Implementar aumentos salariales basados en desempeño y antigüedad.
Reducción de Horas Extra:
Contratar personal adicional o redistribuir la carga laboral para reducir la necesidad de horas extra, especialmente en departamentos con alta rotación como Ventas.
Ofrecer incentivos no monetarios (días libres, horarios flexibles) para compensar el esfuerzo adicional.
Programas de Desarrollo Profesional:
Crear planes de carrera claros para los empleados, con oportunidades de promoción interna y capacitación continua.
Implementar programas de mentoría para empleados con menor antigüedad y experiencia.
Mejora del Ambiente Laboral:
Realizar encuestas periódicas de satisfacción laboral y ambiental para identificar áreas de mejora.
Implementar políticas de bienestar, como espacios de trabajo ergonómicos y programas de salud mental.
Flexibilidad en Viajes de Negocios:
Reducción significativa de la rotación en roles críticos y departamentos clave.
Mejora en la satisfacción laboral y el equilibrio trabajo-vida.
Objetivo: Abordar los factores más críticos de rotación con intervenciones específicas y de menor costo.
Incentivos por Permanencia:
Ofrecer bonos anuales por antigüedad para empleados con más de 2 años en la empresa.
Reconocer públicamente a los empleados con mayor tiempo en la organización.
Capacitación y Reconocimiento:
Implementar capacitaciones específicas para roles con alta rotación, como Representante de Ventas y Técnico de Laboratorio.
Crear un programa de reconocimiento mensual para empleados destacados.
Políticas de Horarios Flexibles:
Introducir horarios flexibles para empleados con alta carga laboral o que realizan horas extra.
Permitir opciones de trabajo remoto parcial para roles que lo permitan.
Encuestas de Satisfacción:
Realizar encuestas semestrales para medir la satisfacción laboral y el equilibrio trabajo-vida.
Implementar cambios basados en los resultados de las encuestas.
Reducción moderada de la rotación en roles y departamentos clave.
Incremento en la percepción de reconocimiento y valoración por parte de los empleados.
Objetivo: Realizar cambios simples y de bajo costo para mitigar la rotación.
Reuniones de Feedback:
Realizar reuniones trimestrales entre empleados y supervisores para discutir inquietudes y expectativas.
Identificar problemas antes de que los empleados consideren rotar.
Reconocimiento No Monetario:
Implementar un sistema de reconocimiento público (e.g., empleado del mes) para destacar logros individuales y de equipo.
Ofrecer pequeños incentivos no monetarios, como días libres adicionales.
Mejoras en el Ambiente Laboral:
Introducir pequeños cambios en el entorno de trabajo, como áreas de descanso mejoradas o actividades de integración.
Promover una cultura de apoyo y colaboración entre equipos.
Reducción leve de la rotación, especialmente en empleados con menor antigüedad.
Mejora en la percepción del ambiente laboral y la relación con los supervisores.
En esta sección, se desarrollan modelos predictivos para identificar los factores más relevantes que influyen en la rotación de personal. El objetivo es construir un modelo robusto que permita predecir la probabilidad de rotación de los empleados, utilizando un enfoque iterativo y optimizado. Para ello, se emplean técnicas de selección de variables como forward selection y backward elimination, y se refactorizan los modelos para mejorar su desempeño. Finalmente, se optimiza el umbral de clasificación para maximizar las métricas de rendimiento del modelo.
1. Preparación de los Datos
Se seleccionan las variables relevantes para el análisis, tanto
categóricas como numéricas, y se almacenan en un nuevo conjunto de datos
(bd
).
La variable objetivo (y
) se define como binaria,
donde 1 indica que el empleado rotó y 0 que no rotó.
¿Qué es Forward Selection?
El Forward Selection (Selección hacia adelante) es una técnica de selección de variables utilizada en la construcción de modelos estadísticos, como la regresión logística. Este método comienza con un modelo base que no incluye ninguna variable predictora (solo el intercepto) y, de manera iterativa, agrega las variables que mejoran el modelo según un criterio específico, como el Akaike Information Criterion (AIC).
El objetivo es identificar un subconjunto óptimo de variables que expliquen de manera significativa la variable objetivo (en este caso, la rotación de personal).
A continuación, se explican las variables del modelo y por qué algunas serán seleccionadas para el modelo final basado en su significancia estadística:
Horas_Extra (p < 0.001):
Significancia: Muy significativa.
Interpretación: Los empleados que realizan horas extra tienen una probabilidad significativamente mayor de rotar.
Cargo (varias categorías):
Significancia: Algunas categorías son significativas:
Ejecutivo_Ventas (p = 0.0229): Este cargo tiene un impacto positivo en la probabilidad de rotación.
Recursos_Humanos (p = 0.0323): También aumenta la probabilidad de rotación.
Representante_Ventas (p = 0.0010): Muy significativo, con un fuerte impacto en la rotación.
Técnico_Laboratorio (p = 0.0041): Significativo, asociado con mayor rotación.
Interpretación: Algunos roles específicos tienen una mayor probabilidad de rotación debido a la naturaleza del trabajo o las condiciones laborales.
Estado_Civil (varias categorías):
Significancia: Solo Soltero (p < 0.001) es significativo.
Interpretación: Los empleados solteros tienen una mayor probabilidad de rotación en comparación con los casados.
Satisfacción_Ambiental (p < 0.001):
Significancia: Muy significativa.
Interpretación: A menor satisfacción con el ambiente laboral, mayor es la probabilidad de rotación.
Satisfación_Laboral (p < 0.001):
Significancia: Muy significativa.
Interpretación: A menor satisfacción laboral, mayor es la probabilidad de rotación.
Viaje de Negocios (varias categorías):
Significancia: Ambas categorías son significativas:
No_Viaja (p < 0.001): Menor probabilidad de rotación.
Raramente (p < 0.001): Menor probabilidad de rotación en comparación con “Frecuentemente”.
Interpretación: La frecuencia de viajes de negocios afecta la probabilidad de rotación.
Distancia_Casa (p = 0.0002):
Significancia: Muy significativa.
Interpretación: A mayor distancia entre la casa y el trabajo, mayor es la probabilidad de rotación.
Años_Experiencia (p = 0.0834):
Significancia: Moderadamente significativa (p < 0.1).
Interpretación: Los empleados con menos años de experiencia tienen una mayor probabilidad de rotación.
Equilibrio_Trabajo_Vida (p = 0.0032):
Significancia: Muy significativa.
Interpretación: Un mal equilibrio entre trabajo y vida personal aumenta la probabilidad de rotación.
Campo_Educación (varias categorías):
Significancia: Solo Técnicos (p = 0.0040) es significativo.
Interpretación: Los empleados con formación técnica tienen una mayor probabilidad de rotación.
Edad (p = 0.0764):
Significancia: Moderadamente significativa (p < 0.1).
Interpretación: Los empleados más jóvenes tienen una mayor probabilidad de rotación.
¿Qué es Backward Selection?
El Backward Selection (Selección hacia atrás) es una técnica de selección de variables utilizada en la construcción de modelos estadísticos, como la regresión logística. Este método comienza con un modelo completo que incluye todas las variables predictoras disponibles y, de manera iterativa, elimina aquellas que no contribuyen significativamente al modelo según un criterio específico, como el Akaike Information Criterion (AIC).
El objetivo es simplificar el modelo eliminando variables irrelevantes o redundantes, manteniendo únicamente aquellas que tienen un impacto significativo en la variable objetivo
Antigüedad
Coeficiente: -0.0347
Significancia: Moderadamente significativa (p = 0.0652).
Interpretación: Los empleados con menor antigüedad tienen una mayor probabilidad de rotar. Esto podría deberse a que los empleados más nuevos aún no han desarrollado un sentido de lealtad hacia la empresa o están en una etapa de exploración laboral.
Campo_Educación (Técnicos)
Coeficiente: 0.8093
Significancia: Muy significativa (p = 0.0041).
Interpretación: Los empleados con formación técnica tienen una mayor probabilidad de rotar. Esto podría deberse a la alta demanda de sus habilidades en el mercado laboral, lo que les facilita encontrar nuevas oportunidades.
Cargo (Categorías Específicas)
Categorías Significativas:
Ejecutivo_Ventas: Coeficiente = 1.9603 (p = 0.0127).
Investigador_Científico: Coeficiente = 1.6065 (p = 0.0408).
Recursos_Humanos: Coeficiente = 2.2031 (p = 0.0158).
Representante_Ventas: Coeficiente = 2.9104 (p < 0.001).
Técnico_Laboratorio: Coeficiente = 2.4419 (p = 0.0019).
Interpretación:
Los empleados en roles como Representante de Ventas y Técnico de Laboratorio tienen una probabilidad significativamente mayor de rotar, posiblemente debido a la naturaleza exigente de estos trabajos.
Otros roles como Ejecutivo de Ventas y Recursos Humanos también muestran una mayor probabilidad de rotación.
Género (Hombres)
Coeficiente: 0.2849
Significancia: Moderadamente significativa (p = 0.0986).
Interpretación: Los hombres tienen una probabilidad ligeramente mayor de rotar en comparación con las mujeres. Esto podría estar relacionado con diferencias en roles laborales o expectativas profesionales.
El modelo Backward Selection complementa al modelo Forward Selection al identificar variables adicionales que podrían ser relevantes para explicar la rotación, como:
Antigüedad: Relacionada con la experiencia y la lealtad hacia la empresa.
Campo_Educación (Técnicos): Refleja la alta demanda de habilidades técnicas en el mercado.
Cargos Específicos: Destaca roles con alta rotación, como Representante de Ventas y Técnico de Laboratorio.
Género (Hombres): Indica una ligera tendencia de mayor rotación en hombres.
Estas variables pueden ser consideradas en el modelo final para mejorar su capacidad predictiva y proporcionar una visión más completa de los factores que influyen en la rotación.
En este apartado, se realiza una refactorización del modelo inicial generado mediante el método de Forward Selection, con el objetivo de simplificarlo y mejorar su interpretabilidad. Para ello, se seleccionan únicamente las variables más significativas y relevantes, eliminando aquellas que no aportan valor predictivo significativo.
El proceso incluye:
Selección de Variables Relevantes: Identificar las variables con mayor impacto en la probabilidad de rotación, basándonos en sus valores de significancia estadística (p-value ≤ 0.1) y su relevancia teórica.
Transformación de Variables Categóricas: Convertir variables categóricas en dummies para su inclusión en el modelo.
Construcción del Nuevo Modelo: Ajustar un modelo más simple y eficiente con las variables seleccionadas.
Este proceso permite optimizar el modelo inicial, haciéndolo más robusto y práctico para su aplicación en la toma de decisiones.
Estas son las variables que tienen un impacto estadísticamente significativo en la probabilidad de rotación y serán seleccionadas para el último refinamiento:
Horas_Extra (p < 0.001)
Coeficiente: 1.7729
Interpretación: Los empleados que realizan horas extra tienen una probabilidad significativamente mayor de rotar. Este es uno de los factores más importantes en el modelo.
Satisfacción_Ambiental (p < 0.001)
Coeficiente: -0.3889
Interpretación: A menor satisfacción con el ambiente laboral, mayor es la probabilidad de rotación. Esto resalta la importancia de un entorno laboral positivo.
Satisfación_Laboral (p < 0.001)
Coeficiente: -0.3748
Interpretación: A menor satisfacción laboral, mayor es la probabilidad de rotación. Este es un factor clave para la retención de empleados.
Viaje de Negocios
Categorías Significativas:
No_Viaja (p < 0.001): Coeficiente = -1.5796
Raramente (p < 0.001): Coeficiente = -0.7791
Interpretación: Los empleados que no viajan o viajan raramente tienen una probabilidad significativamente menor de rotar en comparación con los que viajan frecuentemente.
Distancia_Casa (p < 0.001)
Coeficiente: 0.0370
Interpretación: A mayor distancia entre la casa y el lugar de trabajo, mayor es la probabilidad de rotación.
Equilibrio_Trabajo_Vida (p = 0.0033)
Coeficiente: -0.3431
Interpretación: Un mal equilibrio entre trabajo y vida personal aumenta la probabilidad de rotación.
Cargo
Categorías Significativas:
Ejecutivo_Ventas (p = 0.0204): Coeficiente = 1.8450
Recursos_Humanos (p = 0.0281): Coeficiente = 2.0427
Representante_Ventas (p = 0.0010): Coeficiente = 2.7560
Técnico_Laboratorio (p = 0.0039): Coeficiente = 2.3049
Interpretación: Los empleados en estos roles tienen una probabilidad significativamente mayor de rotar, posiblemente debido a la naturaleza exigente de sus trabajos.
Estado_Civil (Soltero) (p < 0.001)
Coeficiente: 0.9669
Interpretación: Los empleados solteros tienen una probabilidad significativamente mayor de rotar en comparación con los casados.
Campo_Educación (Técnicos) (p = 0.0040)
Coeficiente: 0.8122
Interpretación: Los empleados con formación técnica tienen una mayor probabilidad de rotar, posiblemente debido a la alta demanda de sus habilidades en el mercado laboral.
Edad (p = 0.0526)
Coeficiente: -0.0243
Interpretación: Los empleados más jóvenes tienen una mayor probabilidad de rotar. Aunque el valor de p está cerca del umbral, se incluirá en el último refinamiento debido a su relevancia teórica.
Género (Hombres) (p = 0.1029)
Coeficiente: 0.2814
Interpretación: Los hombres tienen una probabilidad ligeramente mayor de rotar en comparación con las mujeres. Aunque el valor de p es moderado, se incluirá en el último refinamiento.
calc_metricas <- function(umbral, bd, proba) {
rotacion_modelo <- proba > umbral
rotacion_real <- bd$y
tabla <- table(rotacion_real, rotacion_modelo)
desempenio <- (tabla[1,1] + tabla[2,2]) / sum(tabla) # Accuracy
sensibilidad <- tabla[2,2] / sum(tabla[2,]) # Verdaderos positivos correctamente clasificados
especificidad <- tabla[1,1] / sum(tabla[1,]) # Verdaderos negativos correctamente clasificados
ponderado <- (desempenio + sensibilidad + especificidad) / 3
return(c(desempenio, sensibilidad, especificidad, ponderado))
}
Modelo: Modelo Forward Umbral donde las métricas son más parecidas: 0.165 Diferencias entre métricas: Desempeño (Accuracy): 0.7632653 Sensibilidad: 0.7637131 Especificidad: 0.7631792 Métrica Ponderada: 0.7633859 Umbral donde la métrica ponderada es máxima: 0.265 Métrica ponderada máxima: 0.7890961
Modelo: Modelo Backward Umbral donde las métricas son más parecidas:
0.165 Diferencias entre métricas: Desempeño (Accuracy): 0.7571429
Sensibilidad: 0.7637131 Especificidad: 0.75588 Métrica Ponderada:
0.758912 Umbral donde la métrica ponderada es máxima: 0.245 Métrica
ponderada máxima: 0.786326
Modelo: Modelo Refactorizado Umbral donde las métricas son más
parecidas: 0.17 Diferencias entre métricas: Desempeño (Accuracy):
0.7673469 Sensibilidad: 0.7637131 Especificidad: 0.7680454 Métrica
Ponderada: 0.7663685 Umbral donde la métrica ponderada es máxima: 0.26
Métrica ponderada máxima: 0.7915103
Modelo: Último Modelo Umbral donde las métricas son más parecidas:
0.155 Diferencias entre métricas: Desempeño (Accuracy): 0.7421769
Sensibilidad: 0.7468354 Especificidad: 0.7412814 Métrica Ponderada:
0.7434312 Umbral donde la métrica ponderada es máxima: 0.255 Métrica
ponderada máxima: 0.7813557
La optimización del umbral para los cuatro modelos (Forward, Backward, Refactorizado y Último Modelo) nos permite identificar los puntos clave donde las métricas de rendimiento (Desempeño, Sensibilidad, Especificidad y Métrica Ponderada) son más balanceadas y donde la métrica ponderada alcanza su valor máximo. A continuación, se presentan las conclusiones principales:
Modelo Forward:
Umbral: 0.165
Métrica Ponderada: 0.7634
Este modelo muestra un buen balance entre las métricas, con valores muy similares para Desempeño, Sensibilidad y Especificidad.
Modelo Backward:
Umbral: 0.165
Métrica Ponderada: 0.7589
Aunque tiene un desempeño ligeramente inferior al Modelo Forward, sigue mostrando un buen balance entre las métricas.
Modelo Refactorizado:
Umbral: 0.17
Métrica Ponderada: 0.7664
Este modelo tiene el mejor balance entre las métricas en este umbral, lo que lo convierte en el más equilibrado.
Último Modelo:
Umbral: 0.155
Métrica Ponderada: 0.7434
Aunque es el modelo más simple, tiene el desempeño más bajo en este umbral, lo que indica que sacrifica algo de balance entre las métricas.
Conclusión: El Modelo Refactorizado es el más balanceado en el umbral donde las métricas son más parecidas, seguido de cerca por el Modelo Forward. El Último Modelo, aunque más simple, no logra un balance tan bueno como los demás.
Modelo Forward:
Umbral: 0.265
Métrica Ponderada: 0.7891
Este modelo tiene un desempeño sólido, con una métrica ponderada alta en este umbral.
Modelo Backward:
Umbral: 0.245
Métrica Ponderada: 0.7863
Aunque ligeramente inferior al Modelo Forward, sigue mostrando un buen desempeño.
Modelo Refactorizado:
Umbral: 0.26
Métrica Ponderada: 0.7915
Este modelo tiene la métrica ponderada más alta, lo que lo convierte en el modelo más eficiente en términos de balance general.
Último Modelo:
Umbral: 0.255
Métrica Ponderada: 0.7814
Aunque tiene un desempeño aceptable, es el modelo con la métrica ponderada más baja en este umbral.
Conclusión: El Modelo Refactorizado es el más eficiente en términos de métrica ponderada máxima, seguido por el Modelo Forward. El Último Modelo, aunque más simple, tiene el desempeño más bajo en este criterio.
Modelo Refactorizado:
Es el modelo con el mejor desempeño general, logrando tanto el mejor balance entre métricas en el umbral donde son más parecidas como la métrica ponderada más alta en el umbral óptimo.
Es ideal para maximizar el rendimiento predictivo sin sacrificar el balance entre las métricas.
Modelo Forward:
Tiene un desempeño muy cercano al Modelo Refactorizado, con una métrica ponderada máxima ligeramente inferior.
Es una buena opción si se busca un modelo robusto y balanceado.
Modelo Backward:
Aunque tiene un buen desempeño, es ligeramente inferior al Modelo Forward y al Modelo Refactorizado en términos de métrica ponderada máxima.
Puede ser útil si se busca un modelo más simple que aún mantenga un buen rendimiento.
Último Modelo:
Es el modelo más simple, pero tiene el desempeño más bajo tanto en el umbral donde las métricas son más parecidas como en el umbral donde la métrica ponderada es máxima.
Es adecuado si se prioriza la simplicidad sobre el rendimiento.
El Modelo Refactorizado es el más recomendado, ya que combina un alto rendimiento con un excelente balance entre las métricas clave. Si se busca un modelo más simple, el Último Modelo puede ser una opción, aunque sacrifica algo de precisión y balance. El Modelo Forward y el Modelo Backward también son opciones viables, pero son ligeramente inferiores al Modelo Refactorizado en términos de desempeño general.
Al inicio del análisis, se plantearon los siguientes objetivos y expectativas:
Identificar las variables clave que influyen en la rotación de personal, tanto categóricas como numéricas, basándonos en su relevancia teórica y estadística.
Construir modelos predictivos que permitan predecir con precisión la probabilidad de rotación de los empleados.
Optimizar el modelo para que sea interpretable, eficiente y balanceado en términos de métricas de rendimiento como desempeño (accuracy), sensibilidad, especificidad y métrica ponderada.
Reducir la rotación de personal mediante la generación de estrategias basadas en los factores identificados como más relevantes.
Se esperaba que variables como Horas Extra, Satisfacción Laboral, Satisfacción Ambiental, Viaje de Negocios, Distancia Casa-Trabajo, Estado Civil y ciertos Cargos específicos fueran determinantes en la rotación, basándonos en su impacto teórico y en los análisis exploratorios iniciales.
Tras aplicar diferentes metodologías (Forward Selection, Backward Selection, Refactorización y Optimización del Umbral), el Modelo Refactorizado fue identificado como el mejor modelo, ya que:
Métrica Ponderada Máxima: Alcanzó el valor más alto de métrica ponderada (0.7915) en el umbral 0.26, lo que indica un excelente balance entre desempeño, sensibilidad y especificidad.
Balance de Métricas: En el umbral 0.155, donde las métricas son más parecidas, el modelo también mostró un buen balance con una métrica ponderada de 0.7544.
Horas Extra: Los empleados que realizan horas extra tienen una probabilidad significativamente mayor de rotar.
Satisfacción Ambiental: A menor satisfacción con el ambiente laboral, mayor es la probabilidad de rotación.
Satisfacción Laboral: A menor satisfacción laboral, mayor es la probabilidad de rotación.
Viaje de Negocios: Los empleados que no viajan o viajan raramente tienen una menor probabilidad de rotar en comparación con los que viajan frecuentemente.
Distancia Casa-Trabajo: A mayor distancia entre la casa y el lugar de trabajo, mayor es la probabilidad de rotación.
Equilibrio Trabajo-Vida: Un mal equilibrio entre trabajo y vida personal aumenta la probabilidad de rotación.
Cargos Específicos:
Estado Civil (Soltero): Los empleados solteros tienen una mayor probabilidad de rotar en comparación con los casados.
Campo de Educación (Técnicos): Los empleados con formación técnica tienen una mayor probabilidad de rotar.
Género (Hombres): Los hombres tienen una probabilidad ligeramente mayor de rotar en comparación con las mujeres.
Variables Clave: Las variables seleccionadas en el mejor modelo coinciden en gran medida con las expectativas iniciales. Factores como Horas Extra, Satisfacción Laboral, Satisfacción Ambiental, Viaje de Negocios y Cargos Específicos demostraron ser determinantes en la rotación, tal como se esperaba.
Impacto de Variables Numéricas: Variables como Distancia Casa-Trabajo y Equilibrio Trabajo-Vida también mostraron un impacto significativo, validando su inclusión en el análisis.
Sorpresas: Aunque se esperaba que variables como Antigüedad y Años de Experiencia tuvieran un impacto más fuerte, su influencia fue menor y no fueron seleccionadas en el modelo final.
Con base en los resultados del mejor modelo, se pueden derivar las siguientes implicaciones y recomendaciones para reducir la rotación de personal:
Reducir Horas Extra:
Mejorar la Satisfacción Laboral y Ambiental:
Realizar encuestas periódicas para identificar áreas de mejora en el ambiente laboral.
Implementar programas de bienestar y reconocimiento para aumentar la satisfacción laboral.
Optimizar el Balance Trabajo-Vida:
Atención a Roles Críticos:
Considerar Factores Personales:
El análisis cumplió con los objetivos planteados al inicio, identificando las variables clave que influyen en la rotación de personal y construyendo un modelo predictivo sólido. El Modelo Refactorizado demostró ser eficiente, interpretable y accionable, lo que lo convierte en una herramienta útil para la toma de decisiones estratégicas en la gestión del talento humano. Sin embargo, aún existen oportunidades de mejora para optimizar el modelo y su capacidad predictiva.
Una posible mejora sería balancear la base de datos en caso de que la variable objetivo (rotación) esté desbalanceada. Esto podría lograrse mediante técnicas como el sobremuestreo de la clase minoritaria o el submuestreo de la clase mayoritaria, lo que permitiría al modelo predecir ambas clases de manera más equilibrada y mejorar su desempeño general.
Además, se podría incluir un mayor número de variables al inicio del análisis, considerando factores adicionales que no fueron evaluados en este estudio. Por ejemplo, datos relacionados con beneficios laborales, evaluaciones de desempeño más detalladas o información sobre la cultura organizacional podrían aportar nuevos insights y revelar patrones que no se detectaron con las variables actuales.
Por último, sería importante implementar validación cruzada para evaluar la estabilidad del modelo y garantizar que los resultados no estén sesgados por la división específica de los datos en entrenamiento y prueba. Esto permitiría obtener una evaluación más robusta del modelo y asegurar que su desempeño sea consistente en diferentes subconjuntos de datos.
En resumen, aunque el Modelo Refactorizado mostró un buen desempeño y es útil para identificar los factores clave de rotación, estas estrategias pueden ayudar a incrementar su precisión y aplicabilidad, construyendo un modelo aún más robusto y confiable para la gestión del talento humano.