1 Introducción

En el entorno organizacional actual, comprender los factores que influyen en la rotación de empleados se ha convertido en un aspecto fundamental para la gestión estratégica del talento humano (chiavenato2019?). La empresa en estudio ha recopilado información histórica sobre sus colaboradores, considerando variables como la antigüedad en el cargo, el nivel de satisfacción laboral, el salario mensual y la edad, entre otros factores potencialmente determinantes.

El presente estudio tiene como objetivo desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período, así como determinar cuáles variables ejercen mayor influencia en dicha probabilidad. La regresión logística resulta particularmente adecuada para este propósito, dado que permite modelar una variable dependiente binaria (Hosmer, Lemeshow, and Sturdivant 2013).

Los resultados obtenidos proporcionarán a la gerencia insumos fundamentales para la toma de decisiones estratégicas orientadas a la retención del talento clave, la optimización de políticas de compensación y el fomento de un ambiente laboral que promueva la estabilidad y el compromiso de los colaboradores.

2 Objetivos

2.1 Objetivo general

Desarrollar un modelo de regresión logística que permita identificar los factores determinantes en la rotación de empleados y estimar la probabilidad de ocurrencia de este evento en la organización.

2.2 Objetivos específicos

  1. Seleccionar y justificar tres variables categóricas y tres variables cuantitativas potencialmente relacionadas con la rotación de empleados, estableciendo hipótesis sobre la dirección de dicha relación.

  2. Caracterizar el comportamiento univariado de las variables seleccionadas y de la variable respuesta, mediante estadísticos descriptivos y representaciones gráficas apropiadas según la naturaleza de cada variable.

  3. Evaluar la relación bivariada entre cada variable predictora y la rotación, identificando la dirección y significancia de dichas asociaciones, y contrastar los hallazgos con las hipótesis planteadas inicialmente.

  4. Estimar un modelo de regresión logística multivariante que cuantifique el efecto conjunto de las variables seleccionadas sobre la probabilidad de rotación, interpretando la magnitud, dirección y significancia de los coeficientes obtenidos.

  5. Evaluar la capacidad predictiva del modelo mediante la curva ROC y el área bajo la curva (AUC), determinando su utilidad para la clasificación de empleados con probabilidad de rotación.

  6. Realizar predicciones para un caso hipotético y establecer un punto de corte que permita tomar decisiones estratégicas para la retención del talento humano.

  7. Formular conclusiones y recomendaciones orientadas al diseño de estrategias organizacionales que contribuyan a disminuir la rotación de empleados en la empresa.

3 3. Selección de variables predictoras y su justificación

La selección de las variables predictoras constituye una etapa fundamental en la construcción del modelo de regresión logística, ya que de ella depende tanto la capacidad explicativa como la parsimonia del mismo. Para el presente estudio, se han seleccionado seis variables (tres categóricas y tres cuantitativas) con base en su relevancia teórica, la literatura especializada en rotación de personal y el peso otorgado en la tabla de valoración preliminar.

Tabla 1: Variables predictoras seleccionadas, marco teórico y justificación
Variable Tipo Dirección esperada Relación con rotación Marco teórico Justificación
Satisfacción_Laboral Categórica (1-4) Inversa Menor satisfacción → mayor rotación Teoría de la Equidad (Adams, 1963) La Teoría de la Equidad (adams1965?) sostiene que los empleados comparan sus aportaciones con los resultados obtenidos. Cuando perciben inequidad (baja satisfacción), buscan alternativas externas. Estudios confirman que a menor satisfacción, mayor rotación (chung2020?).
Horas_Extra Categórica (Sí/No) Directa Trabajar horas extra → mayor rotación Teoría del Intercambio Social (Homans, 1958) La Teoría del Intercambio Social (homans1958?) postula que las relaciones laborales se basan en un análisis costo-beneficio. Las horas extras no compensadas generan desequilibrio, incrementando la intención de rotación (cheng2016?).
Equilibrio_Trabajo_Vida Categórica (1-4) Inversa Menor equilibrio → mayor rotación Teoría de la Conservación de Recursos (Hobfoll, 1989) La Teoría de la Conservación de Recursos (hobfoll1989?) indica que el desequilibrio trabajo-vida agota recursos personales, generando estrés y agotamiento, antecedentes directos de la rotación (dhingra2021?).
Ingreso_Mensual Cuantitativa Inversa Menor ingreso → mayor rotación Teoría de la Equidad y economía laboral Desde la Teoría de la Equidad (adams1965?), salarios bajos percibidos como inequitativos generan tensión. Adicionalmente, la teoría económica establece que el salario de reserva determina en gran medida la decisión de permanencia (coreecon2025?).
Años_ultima_promoción Cuantitativa Directa Más años sin promoción → mayor rotación Teoría de las Expectativas (Vroom, 1964) La Teoría de las Expectativas (vroom1964?) sostiene que cuando el desempeño no conduce a promociones (baja instrumentalidad), se reduce la motivación y aumenta la búsqueda de oportunidades externas.
Distancia_Casa Cuantitativa Directa Mayor distancia → mayor rotación Teoría de la Compensación Salarial (Rosen, 1986) La Teoría de la Compensación Salarial (rosen1986?) documenta que los empleados aceptan salarios menores por trabajos cercanos. Mayores distancias implican costos de transacción que incentivan la búsqueda de opciones más cercanas (collewet2017?).
Nota: Elaboración propia con base en la revisión de literatura especializada. Las referencias completas se encuentran en la sección de bibliografía.

4 Carga y análisis exploratorio de datos

Una vez definidas las variables predictoras que formarán parte del modelo, se procede a la carga de la base de datos y a la exploración inicial de la información. Esta etapa permite familiarizarse con la estructura de los datos, identificar posibles valores atípicos o faltantes, y comprender el comportamiento preliminar de las variables seleccionadas. A continuación se presenta el proceso de carga, la verificación de la calidad de los datos y la construcción del dataframe reducido que contendrá únicamente la variable respuesta (Rotación) y las seis variables predictoras seleccionadas en la sección anterior.

4.1 Verificación de calidad de datos

Previo a cualquier análisis, es fundamental verificar la integridad de la información contenida en el dataframe de trabajo, el cual está compuesto por 1,470 registros correspondientes a los empleados de la muestra. Esta verificación permite identificar la presencia de valores faltantes que podrían comprometer la validez de los resultados o requerir técnicas de imputación. En la siguiente tabla se resume la calidad de la información del conjunto de datos que ha sido seleccionado para su análisis:

Verificación de valores faltantes en el dataframe de trabajo
Variable Valores faltantes Porcentaje
Rotación Rotación 0 0%
Satisfacción_Laboral Satisfacción_Laboral 0 0%
Horas_Extra Horas_Extra 0 0%
Equilibrio_Trabajo_Vida Equilibrio_Trabajo_Vida 0 0%
Ingreso_Mensual Ingreso_Mensual 0 0%
Años_ultima_promoción Años_ultima_promoción 0 0%
Distancia_Casa Distancia_Casa 0 0%
Nota:
Ninguna variable presenta valores faltantes. La base está completa para las 7 variables seleccionadas.

4.2 Dataframe de trabajo

Una vez confirmada la calidad de los datos, se procede a visualizar la estructura del dataframe reducido. En la Tabla 2 se presentan los primeros 10 registros del conjunto de datos que será utilizado para la estimación del modelo, el cual está compuesto por la variable respuesta (Rotación) y las seis variables predictoras seleccionadas. Esta visualización preliminar permite observar la naturaleza de los datos y verificar la correcta selección y codificación de las variables.

Primeros 10 registros del dataframe de trabajo
Rotación Satisfacción_Laboral Horas_Extra Equilibrio_Trabajo_Vida Ingreso_Mensual Años_ultima_promoción Distancia_Casa
Si 4 Si 1 5,993 0 1
No 2 No 3 5,130 1 8
Si 3 Si 3 2,090 0 2
No 3 Si 3 2,909 3 3
No 2 No 3 3,468 2 2
No 4 No 2 3,068 3 2
No 1 Si 2 2,670 0 3
No 3 No 3 2,693 0 24
No 3 No 3 9,526 1 23
No 3 No 2 5,237 7 27

5 Recodificación de variables

La transformación de variables categóricas para su inclusión en modelos de regresión logística constituye un paso metodológico fundamental en el análisis de datos. Como señalan Hosmer, Lemeshow y Sturdivant (2013), los modelos de regresión requieren que todas las variables predictoras sean representadas numéricamente antes de proceder con la estimación. En el caso particular de la regresión logística, las variables categóricas deben ser codificadas adecuadamente mediante la creación de variables dummy o indicadoras que permitan capturar el efecto diferencial de cada categoría sobre la variable respuesta (Agresti, 2018).

Para las variables ordinales, como la satisfacción laboral y el equilibrio trabajo-vida, la literatura especializada recomienda evaluar cuidadosamente si deben tratarse como factores ordenados o como variables numéricas continuas. La decisión depende de si se asume que los intervalos entre categorías tienen un efecto lineal sobre el logaritmo de odds de la variable respuesta (Gelman & Hill, 2007). En el presente estudio, se opta por mantenerlas como factores ordenados, lo que permite que cada categoría tenga un impacto único sobre la probabilidad de rotación sin imponer una relación lineal.

A continuación se presentan las recodificaciones aplicadas al dataframe de trabajo:

  • Rotación: Variable respuesta dicotómica. Se crea Rotación como factor con etiquetas “No” y “Sí”, y Rotación_num como variable dummy (0 = No, 1 = Sí) para el modelo, siguiendo la codificación estándar para variables binarias en regresión logística (Hosmer et al., 2013).
  • Satisfacción_Laboral: Variable ordinal (1-4). Se conserva la versión numérica original (1, 2, 3, 4) para el modelo. Las etiquetas correspondientes son: 1 = “Muy insatisfecho”, 2 = “Insatisfecho”, 3 = “Satisfecho”, 4 = “Muy satisfecho”.
  • Horas_Extra: Variable binaria. Se crea Horas_Extra como factor con etiquetas “No” y “Sí”, y Horas_Extra_num como variable dummy (0 = No, 1 = Sí) para el modelo.
  • Equilibrio_Trabajo_Vida: Variable ordinal (1-4). Se conserva la versión numérica original (1, 2, 3, 4) para el modelo. Las etiquetas correspondientes son: 1 = “Muy bajo”, 2 = “Bajo”, 3 = “Medio”, 4 = “Alto”.
  • Variables cuantitativas: Ingreso_Mensual, Años_ultima_promoción y Distancia_Casa se mantienen en su escala original, ya que la regresión logística no requiere transformación adicional para este tipo de variables (Fox, 2015).

Es importante señalar que, en el caso de variables con más de dos categorías, la función glm() de R implementa automáticamente la codificación dummy necesaria cuando las variables son declaradas como factores, utilizando una categoría como referencia. Esta codificación genera (k-1) variables dummy para cada variable con k categorías, evitando problemas de multicolinealidad perfecta (Fox, 2015).

Primeros 10 registros del dataframe de trabajo (variables recodificadas)
Rotación Satisfacción_Laboral Horas_Extra Equilibrio Trabajo-Vida Ingreso_Mensual Años_ultima_promoción Distancia_Casa
1 4 1 1 5,993 0 1
0 2 0 3 5,130 1 8
1 3 1 3 2,090 0 2
0 3 1 3 2,909 3 3
0 2 0 3 3,468 2 2
0 4 0 2 3,068 3 2
0 1 1 2 2,670 0 3
0 3 0 3 2,693 0 24
0 3 0 3 9,526 1 23
0 3 0 2 5,237 7 27
Nota:
Codificación: Rotación (1 = Sí, 0 = No); Horas Extra (1 = Sí, 0 = No); Satisfacción Laboral (1 = Muy insatisfecho, 2 = Insatisfecho, 3 = Satisfecho, 4 = Muy satisfecho); Equilibrio Trabajo-Vida (1 = Muy bajo, 2 = Bajo, 3 = Medio, 4 = Alto). Las variables cuantitativas se mantienen en su escala original.

6 Análisis univariado de variables categóricas

El análisis univariado permite examinar el comportamiento individual de cada variable, identificando patrones de distribución, frecuencias y posibles desbalances en las categorías. Para las variables categóricas seleccionadas, resulta particularmente útil visualizar la proporción de empleados en cada nivel, lo que proporciona una primera aproximación a la estructura de los datos y orienta la interpretación posterior de los resultados del modelo. A continuación se presentan los gráficos de barras para la variable respuesta (Rotación) y las tres variables categóricas predictoras: Satisfacción Laboral, Horas Extra y Equilibrio Trabajo-Vida.

Gráficos de barras con porcentajes para variables categóricas

Gráficos de barras con porcentajes para variables categóricas

6.1 Interpretación del análisis univariado de variables categóricas

A partir de los gráficos de barras presentados, se destacan los siguientes hallazgos:

  • Rotación: La mayoría de los empleados (83.9%) no han presentado rotación, mientras que el 16.1% sí lo ha hecho. Esta proporción, aunque minoritaria, es suficientemente relevante para justificar la modelación del fenómeno mediante regresión logística.

  • Satisfacción Laboral: Se observa una distribución heterogénea en los niveles de satisfacción. El 30.1% de los empleados se encuentra “Muy satisfecho”, seguido por un 19.7% en la categoría “Satisfecho”. En los niveles más bajos, el 19.0% reporta estar “Insatisfecho” y el 31.2% restante se ubica en “Muy insatisfecho”. Esta distribución sugiere que existe un porcentaje considerable de empleados con bajos niveles de satisfacción, lo que podría asociarse con mayor probabilidad de rotación.

  • Horas Extra: El 71.7% de los empleados no trabaja horas extra, mientras que el 28.3% sí lo hace. Esta variable será de especial interés en el análisis bivariado para determinar si la realización de horas extra se asocia con una mayor probabilidad de rotación.

  • Equilibrio Trabajo-Vida: La distribución muestra que el 60.7% de los empleados percibe un nivel “Alto” de equilibrio, el 23.4% un nivel “Medio”, el 10.4% un nivel “Bajo” y el 5.5% restante un nivel “Muy bajo”. Aunque la mayoría reporta un equilibrio adecuado, existe un segmento de riesgo (15.9% en niveles bajo y muy bajo) que podría estar asociado con mayor intención de rotación.

Estos hallazgos descriptivos sientan las bases para el análisis bivariado, donde se explorará la relación de cada variable predictora con la rotación, contrastando las distribuciones observadas con la variable respuesta.

7 Análisis univariado de variables cuantitativas

El análisis de las variables cuantitativas permite examinar su distribución, identificar valores atípicos y comprender su comportamiento antes de incluirlas en el modelo de regresión logística. Para las tres variables cuantitativas seleccionadas (Ingreso Mensual, Años desde última promoción y Distancia a casa), los diagramas de caja y bigotes resultan particularmente útiles al proporcionar una visualización simultánea de la mediana, los cuartiles, la dispersión y la presencia de valores extremos. A continuación se presentan estos gráficos, que complementan los estadísticos descriptivos previamente mostrados.

Diagramas de caja y bigotes para variables cuantitativas

Diagramas de caja y bigotes para variables cuantitativas

7.1 Interpretación del análisis univariado de variables cuantitativas

A partir de los diagramas de caja y bigotes presentados, se obtienen las siguientes observaciones:

  • Ingreso Mensual: La mediana se ubica aproximadamente en 5,000 unidades monetarias, con un rango intercuartil (Q1-Q3) que abarca desde 3,500 hasta 7,500 unidades aproximadamente. Se observa una dispersión considerable, con presencia de múltiples valores atípicos superiores que superan las 15,000 unidades, correspondientes a empleados con ingresos excepcionalmente altos. La distribución presenta una marcada asimetría positiva, indicando que la mayoría de los empleados se concentra en ingresos medios y bajos, mientras que una minoría percibe salarios muy elevados.

  • Años desde Última Promoción: La mediana se encuentra en 0 años, lo que indica que al menos la mitad de los empleados ha sido promovida en el año actual o no lleva más de un año sin promoción. El rango intercuartil abarca desde 0 hasta 3 años. Sin embargo, se observan numerosos valores atípicos que se extienden hasta 15 años sin promoción, identificando un segmento crítico de empleados con estancamiento profesional prolongado que podrían presentar mayor probabilidad de rotación.

  • Distancia al Trabajo: La mediana es de 7 km, con un rango intercuartil que va desde 3 hasta 14 km. La distribución muestra valores atípicos superiores que alcanzan hasta 29 km, evidenciando un grupo de empleados que enfrentan desplazamientos considerablemente largos. Este factor podría incidir negativamente en su calidad de vida y, potencialmente, aumentar su intención de rotación.

Estos hallazgos complementan el análisis de las variables categóricas y serán contrastados en el modelo multivariado para determinar su contribución específica en la probabilidad de rotación.

8 Análisis bivariado

El análisis bivariado examina la relación entre cada variable predictora y la variable respuesta (Rotación) de forma independiente. Para variables categóricas se utilizan tablas de contingencia y la prueba chi-cuadrado, mientras que para variables cuantitativas se emplea la prueba t de Student. El objetivo es identificar qué variables muestran una asociación estadísticamente significativa con la rotación y determinar la dirección de dicha relación (positiva o negativa), lo que permitirá contrastar las hipótesis planteadas en la sección de selección de variables.

8.1 Variables categóricas

8.1.1 1. Satisfacción Laboral

Tabla de contingencia: Satisfacción Laboral vs Rotación
Satisfacción Laboral
Frecuencias
No rotación Rotación Total % Rotación
Muy insatisfecho 223 66 289 22.8
Insatisfecho 234 46 280 16.4
Satisfecho 369 73 442 16.5
Muy satisfecho 407 52 459 11.3
Interpretación:
Prueba chi-cuadrado: χ² = 17.51, gl = 3, p = 0.000556. La asociación es estadísticamente significativa (p < 0.001).

Interpretación: Existe una asociación estadísticamente significativa entre la satisfacción laboral y la rotación (p < 0.001). Se observa una relación inversa: a medida que aumenta la satisfacción, disminuye el porcentaje de rotación. Los empleados “Muy insatisfechos” presentan la tasa más alta de rotación (22.8%), seguidos por los “Insatisfechos” (16.4%) y “Satisfechos” (16.5%), mientras que los “Muy satisfechos” presentan la más baja (11.3%). Este resultado confirma la hipótesis planteada de que a menor satisfacción laboral, mayor probabilidad de rotación.

8.1.2 2. Horas Extra

Tabla de contingencia: Horas Extra vs Rotación
Horas Extra
Frecuencias
No rotación Rotación Total % Rotación
No 944 110 1054 10.4
289 127 416 30.5
Interpretación:
Prueba chi-cuadrado: χ² = 87.56, gl = 1, p = <2e-16

Interpretación: La asociación entre horas extra y rotación es estadísticamente significativa (p < 0.001). La dirección de la relación es positiva: los empleados que trabajan horas extra presentan una tasa de rotación (30.5%) tres veces superior a aquellos que no trabajan horas extra (10.4%). Este resultado confirma la hipótesis planteada de que trabajar horas extra se asocia con mayor probabilidad de rotación.

8.1.3 3. Equilibrio Trabajo-Vida

Tabla de contingencia: Equilibrio Trabajo-Vida vs Rotación
Equilibrio
Frecuencias
No rotación Rotación Total % Rotación
Muy bajo 55 25 80 31.2
Bajo 286 58 344 16.9
Medio 766 127 893 14.2
Alto 126 27 153 17.6
Interpretación:
Prueba chi-cuadrado: χ² = 16.33, gl = 3, p = 0.000973

Interpretación: Existe una asociación estadísticamente significativa entre el equilibrio trabajo-vida y la rotación (p < 0.001). Se observa que los empleados con nivel “Muy bajo” de equilibrio presentan la tasa más alta de rotación (31.2%), mientras que los niveles “Bajo” (16.9%), “Medio” (14.2%) y “Alto” (17.6%) muestran tasas inferiores. Sin embargo, la relación no es estrictamente lineal, ya que el nivel “Alto” presenta una tasa ligeramente superior al nivel “Medio”. Este resultado confirma parcialmente la hipótesis planteada, pues aunque el desequilibrio extremo se asocia con mayor rotación, la relación no es perfectamente inversa en todos los niveles.

Por lo anterior, en su lugar, se propone incorporar la variable Satisfacción Ambiental, la cual refleja la percepción del empleado sobre el entorno físico y social de trabajo. Esta variable resulta teóricamente relevante, ya que un ambiente laboral positivo es un factor conocido de retención en la literatura organizacional. Además, presenta una relación más directa con la rotación: entornos percibidos como hostiles, poco colaborativos o carentes de recursos adecuados generan insatisfacción y aumentan la intención de abandono. Esta variable, por tanto, ofrece una interpretación más clara y alineada con el marco teórico del estudio, manteniendo el equilibrio del modelo con tres variables categóricas y tres cuantitativas.

8.1.3.1 Satisfacción Ambiental
Tabla de contingencia: Satisfacción Ambiental vs Rotación
Satisfacción Ambiental
Frecuencias
No rotación Rotación Total % Rotación
Muy insatisfecho 212 72 284 25.4
Insatisfecho 244 43 287 15.0
Satisfecho 391 62 453 13.7
Muy satisfecho 386 60 446 13.5
Interpretación:
Prueba chi-cuadrado: χ² = 22.5, gl = 3, p = 5.12e-05

Interpretación: Existe una asociación estadísticamente significativa entre la satisfacción ambiental y la rotación (p < 0.001). Se observa una relación inversa: a medida que aumenta la satisfacción con el ambiente laboral, disminuye el porcentaje de rotación. Los empleados “Muy insatisfechos” con el ambiente presentan la tasa más alta de rotación (25.4%), seguidos por los “Insatisfechos” (15.0%), los “Satisfechos” (13.7%) y finalmente los “Muy satisfechos” (13.5%). Este resultado confirma la hipótesis de que a menor satisfacción ambiental, mayor probabilidad de rotación.

8.2 Variables cuantitativas

Prueba t para variables cuantitativas
Variable No rotación Rotación Diferencia t p-valor
t Ingreso Mensual 6833 (4818) 4787 (3640) -2046 -7.48 4.43e-13
t1 Años sin promoción 2 (3) 2 (3) 0 -1.29 0.199
t2 Distancia a casa (km) 9 (8) 11 (8) 2 2.89 0.00414
Nota:
Los valores muestran Media (Desviación Estándar). La prueba t compara el grupo con rotación vs sin rotación.

Interpretación:

  • Ingreso Mensual: Existe una diferencia estadísticamente significativa en el ingreso mensual entre los empleados que rotan y los que no (p < 0.001). Los empleados que rotan tienen un ingreso promedio menor. La relación es inversa: a menor ingreso, mayor probabilidad de rotación. Este resultado confirma la hipótesis planteada.

  • Años desde Última Promoción: No se encuentra una diferencia estadísticamente significativa entre ambos grupos (p = 0.199). Aunque los empleados que rotan presentan un promedio ligeramente mayor de años sin promoción, esta diferencia no es estadísticamente significativa. Este resultado no confirma la hipótesis planteada; el tiempo sin promoción no parece ser un factor determinante en la rotación en esta muestra.

  • Distancia a Casa: Se encuentra una diferencia estadísticamente significativa (p = 0.004). Los empleados que rotan viven, en promedio, más lejos que aquellos que no rotan. La relación es directa: a mayor distancia, mayor probabilidad de rotación. Este resultado confirma la hipótesis planteada.

A partir de los resultados obtenidos, se observa que la variable “Años desde última promoción” no presentó una asociación estadísticamente significativa con la rotación (p = 0.199), lo que sugiere que, en esta muestra, el tiempo sin ascenso no constituye un factor determinante para explicar la probabilidad de rotación. En consecuencia, y con el objetivo de fortalecer el poder explicativo del modelo, se propone reemplazar esta variable por “Edad”, una variable ampliamente reconocida en la literatura como un factor relevante en los procesos de retención laboral. La edad permite capturar efectos asociados a la etapa del ciclo de vida del empleado, su nivel de madurez profesional y sus expectativas de estabilidad, aspectos que resultan pertinentes para el análisis de rotación. Este ajuste será incorporado en la estimación del modelo multivariado.

Primeros 10 registros del dataset final
Rotación Satisfacción Laboral Satisfacción Ambiental Horas Extra Edad Ingreso_Mensual Distancia (km)
1 4 2 1 41 5,993 1
0 2 3 0 49 5,130 8
1 3 4 1 37 2,090 2
0 3 4 1 33 2,909 3
0 2 1 0 27 3,468 2
0 4 4 0 32 3,068 2
0 1 3 1 59 2,670 3
0 3 4 0 30 2,693 24
0 3 4 0 38 9,526 23
0 3 3 0 36 5,237 27
Nota:
Rotación (1 = Sí, 0 = No); Horas Extra (1 = Sí, 0 = No); Satisfacción Laboral y Ambiental (1 = Muy insatisfecho, 2 = Insatisfecho, 3 = Satisfecho, 4 = Muy satisfecho); Edad en años; Distancia en kilómetros; Ingreso en unidades monetarias.

Se presenta la siguiente tabla para ver los nuevos resultados.

Prueba t para variables cuantitativas
Variable No rotación Rotación Diferencia t p-valor
t Ingreso Mensual 6833 (4818) 4787 (3640) -2046 -7.48 4.43e-13
t1 Edad 38 (9) 34 (10) -4 -5.83 1.37e-08
t2 Distancia a casa (km) 9 (8) 11 (8) 2 2.89 0.00414
Nota:
Los valores muestran Media (Desviación Estándar). La prueba t compara el grupo con rotación vs sin rotación.

Interpretación:

  • Edad: Se encuentra una diferencia estadísticamente significativa en la edad entre ambos grupos (p < 0.05). Los empleados que rotan son, en promedio, más jóvenes que aquellos que no rotan. La relación es inversa: a menor edad, mayor probabilidad de rotación. Este resultado confirma la hipótesis planteada de que los empleados más jóvenes tienden a rotar con mayor frecuencia.

9 Estimación del modelo

Una vez seleccionadas y validadas las variables predictoras a través del análisis bivariado, se procede a la estimación del modelo de regresión logística múltiple. Este modelo permite evaluar el efecto conjunto de las seis variables predictoras sobre la probabilidad de rotación, controlando por la influencia de cada una de ellas. La variable respuesta es Rotación_num, codificada como 1 para los empleados que presentaron rotación y 0 para aquellos que no. Las variables predictoras incluidas son: Satisfacción Laboral, Satisfacción Ambiental, Horas Extra (categóricas) e Ingreso Mensual, Edad y Distancia a Casa (cuantitativas). La estimación se realiza mediante el método de máxima verosimilitud, utilizando la función glm() del paquete base de R.

Coeficientes estimados del modelo de regresión logística
Variable Estimador Error estándar Estadístico z p-valor OR IC 95%
(Intercept) Constante 1.181 0.4276 2.76 0.0057 3.259 (1.41; 7.534)
Satisfacción_Laboral_num Satisfacción Laboral -0.311 0.0688 -4.52 < 0.001 0.733 (0.64; 0.838)
Satisfacción_Ambiental_num Satisfacción Ambiental -0.349 0.0711 -4.91 < 0.001 0.705 (0.613; 0.811)
Horas_Extra_num Horas Extra 1.555 0.1588 9.80 < 0.001 4.737 (3.47; 6.466)
Ingreso_Mensual Ingreso Mensual 0.000 0.0000 -4.22 < 0.001 1.000 (1; 1)
Edad Edad -0.038 0.0101 -3.80 < 0.001 0.962 (0.944; 0.982)
Distancia_Casa Distancia a casa 0.028 0.0092 3.06 0.0022 1.028 (1.01; 1.047)
Nota:
Variable dependiente: Rotación (1 = Sí, 0 = No). IC 95%: Intervalo de confianza al 95% para el Odds Ratio.

9.1 Interpretación de los coeficientes del modelo

A partir de los resultados obtenidos en la Tabla 9, se presentan las siguientes interpretaciones para cada variable predictora, considerando la significancia estadística (p < 0.05) y el sentido de la relación con la probabilidad de rotación.


Constante (\(\beta_0 = 1.181\), p = 0.0057):
El término constante representa el logaritmo de la odds de rotación cuando todas las variables predictoras son iguales a cero. Su significancia indica que existe un nivel basal de probabilidad de rotación incluso en ausencia de los factores considerados.


Satisfacción Laboral (\(\beta = -0.311\), OR = 0.733, p < 0.001):
Por cada aumento de una unidad en la escala de satisfacción laboral (de 1 a 4), la odds de rotación se reduce en un 26.7% (OR = 0.733), manteniendo constantes las demás variables. Este hallazgo es consistente con la Teoría de la Equidad de Adams (adams1965?), que sostiene que los empleados que perciben un desbalance entre sus aportes y los resultados obtenidos (baja satisfacción) desarrollan intenciones de abandono. La significancia estadística (\(p < 0.001\)) respalda la robustez de esta relación.


Satisfacción Ambiental (\(\beta = -0.349\), OR = 0.705, p < 0.001):
El aumento de una unidad en la percepción del ambiente laboral reduce la odds de rotación en un 29.5% (OR = 0.705). Este resultado confirma que el entorno físico y social del trabajo es un factor determinante en la retención, como lo señalan estudios previos sobre clima organizacional (Schneider, Ehrhart, and Macey 2013). Un ambiente percibido como positivo actúa como un ancla que favorece la permanencia.


Horas Extra (\(\beta = 1.555\), OR = 4.737, p < 0.001):
Los empleados que trabajan horas extra tienen 4.74 veces más probabilidad de rotar que aquellos que no lo hacen, controlando por el resto de variables. Este es el efecto más pronunciado del modelo. La Teoría del Intercambio Social (blau1964?) explica este fenómeno: cuando los empleados perciben que sus contribuciones adicionales no son adecuadamente compensadas (ya sea económica o emocionalmente), se genera un desequilibrio que incrementa la intención de abandono.


Ingreso Mensual (\(\beta \approx -0.0001\), OR ≈ 1.000, p < 0.001):
Aunque el coeficiente es cercano a cero debido a la escala de la variable, la significancia estadística indica que existe una relación inversa entre ingreso y rotación. Para una interpretación más intuitiva, puede considerarse que por cada aumento de 1,000 unidades monetarias en el ingreso mensual, la odds de rotación se reduce aproximadamente en un 11% (exp(\(-0.0001 \times 1000\)) = 0.89). Este resultado confirma la relevancia del factor económico en la retención laboral, respaldado por la teoría económica del salario de reserva (coreecon2025?).


Edad (\(\beta = -0.038\), OR = 0.962, p < 0.001):
Por cada año adicional de edad, la odds de rotación se reduce en un 3.8% (OR = 0.962). Este resultado es consistente con la literatura que señala que los empleados más jóvenes tienden a rotar con mayor frecuencia debido a su mayor disposición al cambio y menor arraigo organizacional, mientras que los empleados de mayor edad valoran la estabilidad (Ng and Feldman 2009).


Distancia a Casa (\(\beta = 0.028\), OR = 1.028, p = 0.0022):
Por cada kilómetro adicional de distancia entre el hogar y el lugar de trabajo, la odds de rotación aumenta en un 2.8% (OR = 1.028). Este hallazgo confirma que el desplazamiento diario representa un costo de transacción significativo que incide en la decisión de permanencia, como lo documenta la Teoría de la Compensación Salarial (rosen1986?).


9.2 Resumen de hallazgos

Variable Dirección OR p-valor Interpretación
Satisfacción Laboral Inversa 0.733 < 0.001 Mayor satisfacción reduce rotación
Satisfacción Ambiental Inversa 0.705 < 0.001 Mejor ambiente reduce rotación
Horas Extra Directa 4.737 < 0.001 Trabajar horas extra aumenta rotación
Ingreso Mensual Inversa ≈ 0.999 < 0.001 Mayor ingreso reduce rotación
Edad Inversa 0.962 < 0.001 Mayor edad reduce rotación
Distancia a Casa Directa 1.028 0.0022 Mayor distancia aumenta rotación

Todas las variables incluidas en el modelo resultaron estadísticamente significativas (\(p < 0.05\)), lo que indica que el modelo logra capturar adecuadamente los factores asociados a la rotación de empleados en esta organización.

10 Evaluación del modelo

La evaluación del poder predictivo de un modelo de regresión logística se realiza mediante el análisis de su capacidad para discriminar correctamente entre los casos que presentan el evento de interés (rotación) y aquellos que no. Para ello, se emplea la curva ROC (Receiver Operating Characteristic) y el área bajo la curva (AUC, por sus siglas en inglés). El AUC representa la probabilidad de que el modelo asigne una probabilidad más alta a un empleado que efectivamente rotó que a uno que no rotó. Valores de AUC superiores a 0.7 indican un poder discriminativo aceptable, mientras que valores superiores a 0.8 se consideran excelentes.

10.1 Área bajo la curva (AUC)

El área bajo la curva ROC (AUC) obtenida es de ** 0.767 **.

10.2 Interpretación del poder predictivo

La curva ROC presentada muestra el desempeño del modelo en términos de sensibilidad (capacidad de identificar correctamente a los empleados que rotaron) y especificidad (capacidad de identificar correctamente a los que no rotaron). La línea diagonal representa un modelo sin poder predictivo (AUC = 0.5), mientras que una curva más desplazada hacia la esquina superior izquierda indica un mejor desempeño.

El área bajo la curva (AUC) obtenida es de ** 0.767 , lo que se considera un poder predictivo aceptable (0.7 - 0.8) ** según los criterios de clasificación estándar en la literatura (Hosmer, Lemeshow, and Sturdivant 2013). Este valor indica que el modelo tiene una capacidad discriminatoria satisfactoria, siendo capaz de distinguir correctamente entre empleados que rotan y aquellos que no en aproximadamente el 76.7 % de los casos.

La calidad predictiva del modelo respalda su utilidad para la toma de decisiones organizacionales, permitiendo identificar a los empleados con mayor riesgo de rotación y, en consecuencia, focalizar las estrategias de retención en aquellos perfiles que presentan mayor vulnerabilidad.

10.3 Matriz de confusión

La matriz de confusión presentada muestra el desempeño del modelo al clasificar a los empleados según su probabilidad de rotación, utilizando un umbral de clasificación de 0.173 (punto de corte óptimo calculado mediante el Índice de Youden). Esta matriz cruza los valores reales observados en la muestra con las predicciones generadas por el modelo.

Matriz de confusión (umbral de clasificación = 0.173)
Predicho: No (0) Predicho: Sí (1)
0 No rotación (0) 904 329
1 Rotación (1) 67 170

Interpretación de la matriz:

  • Verdaderos negativos (904): Empleados que realmente no rotaron y el modelo predijo correctamente que no rotarían. Representan el 73.3% de los casos que efectivamente permanecieron en la organización. Este grupo no requiere intervención prioritaria.

  • Falsos positivos (329): Empleados que realmente no rotaron, pero el modelo predijo incorrectamente que sí rotarían. Este tipo de error (error tipo I) implica que la organización destinaría recursos a retener a 329 empleados que, en realidad, no estaban en riesgo de abandonar. Aunque representa un costo operativo, es un error menos grave que no intervenir sobre quienes realmente rotan.

  • Falsos negativos (67): Empleados que realmente rotaron, pero el modelo predijo incorrectamente que no rotarían. Este es el error más crítico desde una perspectiva de gestión (error tipo II), ya que representa al 28.3% de los empleados que efectivamente abandonaron la organización (67 de 237) y que no serían identificados como prioritarios para las estrategias de retención.

  • Verdaderos positivos (170): Empleados que realmente rotaron y el modelo predijo correctamente que rotarían. Representan el 71.7% de los empleados que efectivamente abandonaron. Estos son los casos que el modelo logra identificar como riesgo real y sobre los cuales se pueden focalizar las intervenciones.

10.4 10.4 Métricas de desempeño

Métrica Valor Interpretación
Sensibilidad 71.7% De los 237 empleados que efectivamente rotaron, el modelo identificó correctamente al 71.7% (170 casos). Esto significa que 67 empleados en riesgo (28.3%) no fueron detectados.
Especificidad 73.3% De los 1,233 empleados que permanecieron en la organización, el modelo clasificó correctamente al 73.3% (904 casos). Los 329 casos restantes (26.7%) fueron señalados como riesgo cuando no lo eran.
Precisión 34.1% De los 499 casos que el modelo predijo como “rotación” (329 falsos positivos + 170 verdaderos positivos), solo el 34.1% (170) realmente rotaron. Esta métrica refleja que el modelo tiende a sobreestimar el riesgo, generando una alta tasa de falsas alarmas.
Exactitud 73.1% El modelo clasificó correctamente el 73.1% de los casos (904 verdaderos negativos + 170 verdaderos positivos = 1,074 sobre un total de 1,470). Este valor indica un desempeño aceptable, aunque no sobresaliente.
Umbral óptimo 0.173 Punto de corte que maximiza la suma de sensibilidad y especificidad (Índice de Youden). Cualquier empleado con probabilidad predicha superior a este valor debe ser considerado en riesgo.

10.5 10.5 Interpretación estratégica del modelo

El umbral óptimo de 0.173 tiene una implicación práctica directa: los empleados cuya probabilidad predicha de rotación supere este valor deben ser priorizados por el área de recursos humanos para implementar estrategias de retención.

Análisis de la precisión del modelo:

La precisión del 34.1% indica que, de cada 100 empleados señalados por el modelo como “en riesgo”, solo 34 rotarán efectivamente. Esto genera una tasa de falsas alarmas del 65.9%, lo que implica un uso ineficiente de recursos si se actúa sobre todas las predicciones positivas sin un análisis complementario.

Recomendaciones para la aplicación del modelo:

  1. Uso como herramienta de tamizaje: El modelo no debe utilizarse como único criterio de decisión. Su valor radica en identificar un grupo prioritario (499 empleados con probabilidad > 0.173) sobre el cual el área de recursos humanos puede focalizar entrevistas, evaluaciones cualitativas o encuestas de clima para confirmar el riesgo real.

  2. Atención a falsos negativos: Los 67 casos de empleados que rotaron y no fueron detectados representan el mayor desafío. Para mitigar este riesgo, se recomienda complementar el modelo con análisis cualitativos (entrevistas de salida, focus groups) que permitan identificar factores no capturados por las variables cuantitativas.

  3. Optimización de recursos: Si la organización tiene recursos limitados para intervenciones de retención, puede priorizar a los empleados con probabilidades más altas (por ejemplo, percentil 90 o superior), reduciendo el número de falsos positivos a costa de perder sensibilidad.

Conclusión sobre el poder predictivo:

El modelo logra un equilibrio aceptable entre sensibilidad (71.7%) y especificidad (73.3%), con un AUC de 0.767 que confirma su capacidad discriminatoria. Su utilidad práctica reside en orientar estratégicamente las intervenciones de retención hacia grupos de riesgo, optimizando la asignación de recursos organizacionales. Sin embargo, su precisión moderada (34.1%) recomienda su uso como herramienta complementaria al juicio profesional, no como sustituto del mismo.

11 Predicciones

Una vez estimado y validado el modelo de regresión logística, se procede a su aplicación práctica mediante la predicción de la probabilidad de rotación para un empleado hipotético. Esta herramienta permite a la organización anticipar comportamientos y diseñar intervenciones preventivas focalizadas en aquellos colaboradores con mayor riesgo de abandonar la organización (Hosmer, Lemeshow, and Sturdivant 2013).

11.1 Definición del perfil del empleado hipotético

Para ejemplificar la aplicación del modelo, se define un perfil de empleado con las siguientes características, seleccionadas con base en los factores que resultaron significativos en el modelo:

Variable Valor Justificación
Satisfacción Laboral 2 (Insatisfecho) Nivel bajo, asociado a mayor riesgo de rotación
Satisfacción Ambiental 2 (Insatisfecho) Percepción negativa del entorno laboral
Horas Extra 1 (Sí) Factor de riesgo con OR más alto (4.74)
Ingreso Mensual 3,500 unidades Por debajo del promedio (6,833)
Edad 28 años Empleado joven, grupo con mayor tendencia a rotar
Distancia a Casa 25 km Desplazamiento largo, por encima del promedio (9 km)

Este perfil corresponde a un empleado joven, con bajos niveles de satisfacción laboral y ambiental, que trabaja horas extra, tiene un ingreso inferior al promedio y enfrenta un desplazamiento prolongado para llegar a su lugar de trabajo.

11.2 Resultado de la predicción

La probabilidad estimada de rotación para el empleado con el perfil descrito es de 66.2%.

11.3 Definición del punto de corte para intervención

El modelo establece un umbral óptimo de clasificación de 17.34%, calculado mediante el Índice de Youden (Youden 1950), que maximiza la suma de sensibilidad y especificidad. Este valor representa el punto de corte a partir del cual un empleado debe ser considerado en riesgo de rotación.

Comparación con el umbral:

  • Probabilidad del empleado hipotético: 66.2%
  • Umbral óptimo: 17.34%

Dado que la probabilidad estimada (66.2%) supera el umbral óptimo (17.34%), el empleado hipotético clasifica como en riesgo de rotación según los criterios establecidos por el modelo (Hosmer, Lemeshow, and Sturdivant 2013).

11.4 Estrategia de intervención recomendada

La organización cuenta con un modelo que no solo identifica el riesgo, sino que también señala los factores específicos que lo determinan. Con base en el perfil analizado, se recomienda una intervención multicomponente alineada con los hallazgos de la literatura especializada (blau1964?; adams1965?; rosen1986?).

11.5 Plan de intervención

A continuación se presentan las estrategias sugeridas para mitigar el riesgo de rotación en el empleado hipotético, alineadas con los factores que el modelo identificó como significativos:

Factor de riesgo Estrategia de intervención Fundamento
Baja satisfacción laboral Realizar entrevista de profundidad para identificar causas específicas de insatisfacción. Explorar posibilidad de rotación interna o reasignación de funciones que se alineen mejor con sus intereses y habilidades. La Teoría de la Equidad (adams1965?) sugiere que la insatisfacción se origina en desbalances percibidos entre aportes y recompensas.
Baja satisfacción ambiental Evaluar condiciones físicas del puesto de trabajo y relaciones interpersonales con el equipo. Implementar mejoras en el entorno físico y promover dinámicas de cohesión grupal. La literatura sobre clima organizacional (Schneider, Ehrhart, and Macey 2013) establece que el ambiente laboral es un predictor clave del compromiso y la permanencia.
Horas extra Revisar la carga laboral y la distribución de tareas. Evaluar si las horas extra responden a picos de trabajo estacionales o a ineficiencias en los procesos. Considerar compensación adicional o días de descanso compensatorios. La Teoría del Intercambio Social (blau1964?) explica que el esfuerzo no compensado genera desequilibrio y aumenta la intención de abandono.
Bajo ingreso Evaluar la competitividad salarial frente al mercado. Considerar ajustes salariales o beneficios complementarios (bonos, beneficios flexibles) que mejoren la percepción de compensación total. La teoría económica del salario de reserva (rosen1986?) establece que salarios por debajo del umbral de aceptación incentivan la búsqueda de alternativas laborales.
Edad joven (28 años) Diseñar programas de desarrollo profesional que ofrezcan oportunidades de crecimiento y aprendizaje. Implementar esquemas de mentoría que vinculen a empleados jóvenes con líderes experimentados. La evidencia empírica (Ng and Feldman 2009) muestra que los empleados jóvenes valoran especialmente las oportunidades de desarrollo y crecimiento.
Larga distancia al trabajo Evaluar opciones de trabajo híbrido o remoto que reduzcan la frecuencia de desplazamientos. Considerar horarios flexibles que permitan evitar horas pico de tráfico. La Teoría de la Compensación Salarial (rosen1986?) documenta que los costos de desplazamiento son un factor relevante en la decisión de permanencia.

11.6 Algoritmo de decisión para intervención

Con base en el modelo desarrollado, se propone el siguiente algoritmo de decisión para la gestión del talento, siguiendo las recomendaciones metodológicas de la literatura (Hosmer, Lemeshow, and Sturdivant 2013):

  1. Calcular probabilidad de rotación para cada empleado utilizando el modelo estimado.
  2. Comparar con el umbral óptimo de 17.34%:
    • Si probabilidad < 17.34%: Empleado clasificado como bajo riesgo. Monitoreo periódico sin intervención inmediata.
    • Si probabilidad ≥ 17.34%: Empleado clasificado como en riesgo. Activar protocolo de intervención prioritaria.
  3. Analizar factores específicos que contribuyen al riesgo en cada caso (coeficientes del modelo).
  4. Diseñar intervención personalizada atendiendo los factores identificados.
  5. Realizar seguimiento para evaluar efectividad de la intervención y actualizar el modelo con nueva información.

11.7 Limitaciones y recomendaciones para la implementación

Si bien el modelo ofrece una herramienta valiosa para la gestión del talento, es importante considerar sus limitaciones:

  • Precisión moderada (34.1%): El modelo genera una alta tasa de falsos positivos (329 casos). Por tanto, las predicciones deben ser validadas mediante juicio profesional y no utilizarse como único criterio de decisión (Hosmer, Lemeshow, and Sturdivant 2013).
  • Falsos negativos (28.3%): El 28.3% de los empleados que rotaron no fueron detectados. Esto sugiere la existencia de factores no capturados por el modelo que también influyen en la rotación.
  • Contextualidad: El modelo fue estimado con datos de una organización específica en un período determinado. Su aplicación en otros contextos requiere validación previa (Gelman and Hill 2007).

Recomendaciones:

  1. Implementación gradual: Iniciar con un piloto en un área específica para calibrar la estrategia de intervención.
  2. Retroalimentación continua: Registrar los resultados de las intervenciones para ajustar el modelo y mejorar su precisión.
  3. Complementariedad: Utilizar el modelo junto con otras herramientas como entrevistas de salida, encuestas de clima y evaluaciones de desempeño.
  4. Ética y transparencia: Comunicar a los empleados que los datos son utilizados con fines de retención y bienestar, no como mecanismo de control punitivo.

12 Conclusiones

El presente estudio tuvo como objetivo desarrollar un modelo de regresión logística para identificar los factores determinantes en la rotación de empleados y estimar la probabilidad de ocurrencia de este evento en la organización. A partir del análisis de 1,470 registros de empleados y la evaluación de seis variables predictoras (Satisfacción Laboral, Satisfacción Ambiental, Horas Extra, Ingreso Mensual, Edad y Distancia a Casa), se obtuvieron hallazgos con importantes implicaciones para la gestión del talento humano.

12.1 Principales hallazgos

El modelo de regresión logística estimado mostró que las seis variables incluidas resultaron estadísticamente significativas (p < 0.05), confirmando su relevancia como predictores de la rotación. Los resultados más destacados fueron:

  1. Horas Extra se constituye como el factor de mayor peso (OR = 4.737), indicando que los empleados que trabajan horas extra tienen casi cinco veces más probabilidad de rotar que aquellos que no lo hacen. Este hallazgo sugiere una problemática estructural relacionada con la carga laboral y la distribución del tiempo de trabajo.

  2. Satisfacción Laboral (OR = 0.733) y Satisfacción Ambiental (OR = 0.705) confirman la importancia del bienestar subjetivo y el entorno de trabajo como factores protectores frente a la rotación.

  3. Ingreso Mensual (OR ≈ 0.999) y Edad (OR = 0.962) muestran una relación inversa con la rotación, mientras que Distancia a Casa (OR = 1.028) evidencia que los desplazamientos prolongados incrementan el riesgo de abandono.

El poder predictivo del modelo, evaluado mediante el área bajo la curva ROC (AUC = 0.767), se considera aceptable según los criterios de Hosmer, Lemeshow y Sturdivant (2013), lo que respalda su utilidad para la identificación de grupos de riesgo.

12.2 Estrategias para disminuir la rotación

Con base en los resultados obtenidos, se proponen las siguientes estrategias orientadas a reducir la rotación de empleados, focalizadas en los factores que resultaron significativos en el modelo:

12.2.1 1. Gestión de horas extra y carga laboral

Dado que trabajar horas extra es el factor con mayor impacto en la probabilidad de rotación (OR = 4.737), se recomienda:

  • Revisar la distribución de la carga laboral: Evaluar si las horas extra responden a picos estacionales, a ineficiencias en los procesos o a una asignación inequitativa de tareas. En caso de picos estacionales, considerar la contratación de personal temporal o la redistribución del trabajo entre equipos.
  • Aumentar la dotación de personal: En áreas con sobrecarga crónica, incrementar el número de colaboradores para reducir la necesidad de horas extra.
  • Compensar adecuadamente: Cuando las horas extra sean inevitables, garantizar una compensación justa, ya sea económica o mediante días de descanso compensatorios, reconociendo el esfuerzo adicional del empleado.

12.2.2 2. Mejora de la satisfacción laboral

La satisfacción laboral mostró un efecto protector significativo (OR = 0.733). Para fortalecerla, se sugiere:

  • Implementar planes de desarrollo profesional: Establecer rutas de carrera claras que permitan a los empleados visualizar su crecimiento dentro de la organización.
  • Reconocimiento y retroalimentación: Diseñar programas de reconocimiento periódico que valoren el desempeño y la contribución de los colaboradores.
  • Fomentar la autonomía: Delegar responsabilidades y permitir mayor participación en la toma de decisiones, lo que incrementa el sentido de pertenencia.

12.2.3 3. Fortalecimiento del ambiente laboral

La satisfacción ambiental resultó el factor con mayor efecto protector (OR = 0.705). Para mejorarla, se recomienda:

  • Evaluar las condiciones físicas del trabajo: Asegurar que los espacios de trabajo sean cómodos, seguros y estén dotados de los recursos necesarios.
  • Promover un clima organizacional positivo: Implementar dinámicas de cohesión grupal, espacios de comunicación abierta y liderazgo basado en la confianza.
  • Atender conflictos interpersonales: Establecer canales efectivos para la resolución de conflictos que puedan afectar el ambiente de trabajo.

12.2.4 4. Políticas salariales competitivas

El ingreso mensual, aunque con un OR cercano a 1, mostró significancia estadística. Se recomienda:

  • Realizar estudios de mercado salarial: Evaluar periódicamente la competitividad de las remuneraciones frente al sector de referencia.
  • Implementar beneficios flexibles: Complementar el salario base con beneficios adaptados a las necesidades de los empleados (bonos, seguro médico, horarios flexibles, entre otros).
  • Revisar la equidad interna: Asegurar que exista coherencia salarial entre empleados con roles y responsabilidades similares.

12.2.5 5. Atención a empleados jóvenes y con larga distancia al trabajo

La edad (OR = 0.962) y la distancia al trabajo (OR = 1.028) también resultaron significativas. Para abordarlas:

  • Programas de mentoría para jóvenes talentos: Vincular a empleados jóvenes con líderes experimentados que faciliten su adaptación y desarrollo profesional.
  • Opciones de trabajo flexible: Para empleados con larga distancia al trabajo, evaluar esquemas de trabajo híbrido o remoto que reduzcan los desplazamientos.
  • Horarios flexibles: Permitir horarios que eviten las horas pico de tráfico, disminuyendo el estrés asociado al desplazamiento.

12.3 Limitaciones y líneas de investigación futura

El presente estudio presenta limitaciones que deben considerarse al interpretar los resultados:

  • Diseño transversal: Los datos corresponden a un único momento en el tiempo, lo que impide establecer relaciones causales definitivas.
  • Muestra de conveniencia: Los participantes fueron reclutados a través de redes sociales, lo que podría introducir sesgos de selección.
  • Variables no consideradas: Factores como el liderazgo, la cultura organizacional o las condiciones del mercado laboral externo no fueron incluidos en el modelo.

Futuras investigaciones podrían ampliar el modelo incorporando variables adicionales, utilizando diseños longitudinales que permitan establecer relaciones causales, y validando el modelo en diferentes contextos organizacionales.

12.4 Conclusión final

El modelo de regresión logística desarrollado constituye una herramienta valiosa para la gestión del talento, al permitir identificar empleados en riesgo de rotación y focalizar las estrategias de retención en los factores que realmente inciden en este fenómeno. La implementación de las estrategias propuestas —orientadas a reducir las horas extra, mejorar la satisfacción laboral y ambiental, fortalecer las políticas salariales y atender las necesidades específicas de empleados jóvenes y con largos desplazamientos— contribuirá no solo a disminuir la rotación, sino también a construir un entorno laboral más estable, equitativo y favorable para el desarrollo profesional de los colaboradores.

Bibliografía

Gelman, Andrew, and Jennifer Hill. 2007. “Data Analysis Using Regression and Multilevel/Hierarchical Models.” Cambridge University Press.
Hosmer, David W., Stanley Lemeshow, and Rodney X. Sturdivant. 2013. Applied Logistic Regression. 3rd ed. Hoboken, NJ: John Wiley & Sons.
Ng, Thomas WH, and Daniel C. Feldman. 2009. “The Relationship Between Age and Job Attitudes: A Meta-Analysis.” Personnel Psychology 62 (1): 1–35.
Schneider, Benjamin, Mark G. Ehrhart, and William H. Macey. 2013. Organizational Climate and Culture. American Psychological Association.
Youden, William J. 1950. “Index for Rating Diagnostic Tests.” Cancer 3 (1): 32–35.