Fuente de Datos: OECD Data Explorer
Variable: Población Desempleada (Total Personas)
Periodo Analizado: 2007 - 2025
La tasa de desempleo es uno de los indicadores que más refleja cómo está funcionando la economía de un país. Cuando sube, significa que hay menos oportunidades laborales y más presión social; cuando baja, usualmente hay crecimiento o mayor actividad productiva. En Colombia, este indicador siempre ha sido bastante sensible a las crisis económicas, los cambios en política pública y las condiciones externas.
En este trabajo analizamos la serie de Población Desempleada en Colombia (Total Personas), tomada del OECD Data Explorer, con el fin de estudiar cómo se ha comportado la variable a lo largo del tiempo y realizar un pronóstico usando la metodología ARIMA. La idea es entender si la serie tiene tendencia, estacionalidad, ciclos o variaciones fuertes, y con eso identificar el modelo que mejor se ajusta para predecir el comportamiento futuro del mercado laboral.
El gráfico muestra la evolución completa del número de desempleados en Colombia. Se pueden observar claramente los períodos de crisis y recuperación que marcan la historia económica reciente del país, destacando la ruptura estructural ocurrida en 2020.
La base de datos incluye observaciones mensuales de la población desempleada colombiana. Esto permite ver cómo ha cambiado el indicador durante años marcados por eventos económicos claves.
A simple vista, algunos periodos sobresalen:
Hacia finales de 2008 e inicios de 2009 se observa un aumento claro del desempleo. Este comportamiento coincide con la crisis financiera internacional, que afectó la actividad económica de casi todos los países, incluyendo Colombia.
Según el Banco de la República, esta crisis redujo la inversión, el comercio internacional y el crédito, lo que terminó afectando la contratación en el país. Las empresas tuvieron menor capacidad de generar empleo, y por eso la cifra de desempleados subió.
Después del choque de 2009, se ve una tendencia a la baja durante varios años. Esto se debe principalmente a:
Las cifras del DANE muestran que durante estos años la economía colombiana creció por encima del 4% anual, lo que favoreció la creación de empleo. Por eso en la serie se nota una reducción estable y prolongada del desempleo.
Durante este periodo no hay una caída fuerte, pero tampoco un aumento agresivo. Es un tramo donde el desempleo se mantiene relativamente estable, aunque con pequeñas subidas y bajadas.
Esto tiene explicación:
En general, fue una etapa de crecimiento más suave pero sin llegar a crisis profundas.
⚠️ EVENTO CRÍTICO
Este es el punto más
evidente de toda la serie. El desempleo pega un salto
abrupto, llegando a niveles históricos nunca antes vistos en
Colombia (superando los 4 millones de personas).
Esto se debe a:
Según el DANE, en el peor momento de 2020, el desempleo urbano llegó a tasas superiores al 20%. Esto se refleja de inmediato en la serie: es una ruptura total del patrón que venía desde años atrás. La pandemia es el evento que más impacta la serie completa.
Luego del shock de 2020, el desempleo empieza a caer otra vez. Esta recuperación se explica por:
No fue una caída inmediata, pero sí constante. Eso es evidente en la gráfica: el desempleo va regresando poco a poco a niveles más “normales”, estabilizándose hacia el final de la serie (2024) en valores cercanos a los 2.5 millones de personas.
Además de los grandes cambios, la serie muestra un patrón repetitivo todos los años, especialmente visible si hacemos zoom en la gráfica:
Esta estacionalidad es una característica estructural del mercado laboral colombiano y es fundamental capturarla con el modelo matemático adecuado (SARIMA).
| Estadística | Valor | Unidad |
|---|---|---|
| Media Histórica | 2,479 | Personas |
| Mediana | 2,369 | Personas |
| Desviación Estándar | 444 | Personas |
| Mínimo | 1,981 | Personas |
| Máximo (Pandemia) | 4,480 | Personas |
| Rango | 2,499 | Personas |
| Coeficiente de Variación | 17.9% | Porcentaje |
Interpretación Profunda de las Estadísticas:
Tendencia Central (Media vs Mediana): La media histórica se ubica alrededor de los 2.5 millones de desempleados. Es interesante notar que la media es ligeramente superior a la mediana, lo cual sugiere un sesgo positivo causado por los valores extremadamente altos registrados durante la pandemia de 2020, que “jalan” el promedio hacia arriba.
Dispersión (Desviación y Rango): La desviación estándar es considerablemente alta, y el rango entre el mínimo y el máximo supera los 2 millones de personas. Esto confirma matemáticamente la inestabilidad del periodo analizado: el mercado laboral colombiano no es estático, sino que sufre oscilaciones violentas ante choques externos.
Volatilidad (Coeficiente de Variación): Un CV cercano al 18% indica una volatilidad media-alta. Aunque hay periodos de calma, la serie no es “plana”. La presencia de estacionalidad marcada (picos anuales) y choques estructurales (COVID) explican esta variabilidad, lo que justifica la necesidad de usar modelos robustos que incluyan diferenciación y componentes estacionales para poder pronosticar correctamente.
Resultado Test ADF: p-value = 0.3917 (>
0.05).
Conclusión: La serie NO es estacionaria.
Requiere diferenciación.
Dado el fuerte componente estacional (picos en enero), comparamos modelos SARIMA (que incluyen estacionalidad) contra modelos simples.
# 1. Auto SARIMA (Búsqueda automática con estacionalidad activada)
modelo_auto <- auto.arima(ventana, seasonal = TRUE)
# 2. SARIMA Manual (Estructura clásica "Airline": (0,1,1)(0,1,1)[12])
modelo_sarima <- Arima(ventana, order=c(0,1,1), seasonal=c(0,1,1))
# 3. ARIMA Simple (Sin estacionalidad - Solo para comparar y descartar)
modelo_simple <- Arima(ventana, order=c(2,1,2))
# Tabla de Comparación
comparacion <- data.frame(
Modelo = c("Auto SARIMA", "SARIMA Manual (Airline)", "ARIMA Simple (No Estacional)"),
AICc = c(modelo_auto$aicc, modelo_sarima$aicc, modelo_simple$aicc),
BIC = c(modelo_auto$bic, modelo_sarima$bic, modelo_simple$bic)
)
mejor_indice <- which.min(comparacion$AICc)
modelos_lista <- list(modelo_auto, modelo_sarima, modelo_simple)
modelo_ganador <- modelos_lista[[mejor_indice]]| Modelo | AICc | BIC |
|---|---|---|
| Auto SARIMA | 2726.037 | 2729.389 |
| SARIMA Manual (Airline) | 2622.963 | 2632.782 |
| ARIMA Simple (No Estacional) | 2722.888 | 2739.454 |
Análisis del Ganador: El modelo seleccionado es el SARIMA Manual (Airline). Este modelo superó ampliamente al ARIMA simple (que tuvo un AICc mucho más alto), demostrando que capturar la estacionalidad es obligatorio para predecir el desempleo correctamente.
Con el modelo validado (residuos ruido blanco), proyectamos el comportamiento para los 12 meses de 2025.
El gráfico muestra claramente el pico estacional esperado en Enero 2025, seguido de una corrección a la baja, respetando el ciclo histórico de la serie.
| Mes | Pronostico | Minimo | Maximo |
|---|---|---|---|
| 1 | 2,539 | 2,255 | 2,822 |
| 2 | 2,540 | 2,137 | 2,944 |
| 3 | 2,542 | 2,046 | 3,038 |
| 4 | 2,576 | 2,003 | 3,149 |
| 5 | 2,584 | 1,943 | 3,225 |
| 6 | 2,585 | 1,883 | 3,288 |
| 7 | 2,573 | 1,815 | 3,332 |
| 8 | 2,565 | 1,754 | 3,377 |
| 9 | 2,564 | 1,703 | 3,425 |
| 10 | 2,569 | 1,662 | 3,477 |
| 11 | 2,567 | 1,615 | 3,519 |
| 12 | 2,560 | 1,566 | 3,555 |
## ========== RESUMEN FINAL ==========
## Modelos evaluados: 3
## Modelo seleccionado: SARIMA Manual (Airline)
## AICc del modelo: 2622.96
## Horizonte de pronóstico: 12 meses
## ===================================
Dinámica de la Serie: Al observar la historia de los datos, es evidente que el desempleo en Colombia es muy sensible a lo que pasa en la economía. Se ven variaciones fuertes cuando hay crisis, siendo la pandemia de 2020 el ejemplo más extremo que rompió la tendencia que traíamos.
Estacionariedad: Al principio, la serie tenía una tendencia marcada (no era estacionaria), lo cual es normal en datos económicos. Tuvimos que aplicar una diferenciación (restar el dato actual con el anterior) para estabilizarla y poder aplicar los modelos matemáticos correctamente.
Patrón Cíclico: Los gráficos de autocorrelación (ACF) nos confirmaron lo que sospechábamos: el desempleo tiene memoria y es estacional. Se repite un ciclo donde el desempleo sube a inicio de año y baja a mitad de año.
Selección del Modelo: En el “torneo” que realizamos, el modelo SARIMA le ganó a los modelos simples. Esto demuestra que para pronosticar desempleo en Colombia es obligatorio tener en cuenta el ciclo anual; si usamos un modelo que ignora esto (como un ARIMA simple), los resultados son deficientes.
Validación: El modelo ganador (r comparacion$Modelo[mejor_indice]) pasó las pruebas de diagnóstico (sus errores son aleatorios o “ruido blanco”), lo que significa que es matemáticamente válido y confiable para proyectar el futuro.
Pronóstico 2025: Para el próximo año, el modelo predice un comportamiento estable. Esperamos el repunte habitual de enero (por factores estacionales), pero luego la cifra debería bajar y mantenerse alrededor del promedio histórico, sin prever crisis graves inmediatas.
Los resultados de este análisis son relevantes para:
DANE - Mercado Laboral: https://www.dane.gov.co/index.php/estadisticas-por-tema/mercado-laboral/empleo-y-desempleo
Banco de la República - Series Históricas: https://www.banrep.gov.co/es/estadisticas-economicas/series-historicas/mercado-laboral
Portafolio - Desempleo 2009: https://www.portafolio.co/economia/finanzas/desempleo-colombia-termino-2009-comenzo-aumentando-190606
Infobae - Desempleo Colombia 2024: https://www.infobae.com/colombia/2025/09/30/desempleo-en-colombia-bajo-a-86-en-agosto-revelo-el-dane/
Portafolio - Crisis en Perspectiva: https://www.portafolio.co/economia/finanzas/crisis-perspectiva-293104
El País - Desempleo 2020: https://www.elpais.com.co/economia/tasa-de-desempleo-en-colombia-en-2020-fue-de-15-9-dane.html
Portafolio - Mercado Laboral: https://www.portafolio.co/economia/dane-entrega-datos-del-mercado-laboral-en-colombia-551519
Universidad del Valle
Facultad de Ingeniería - Gestión de Datos
2025