1 Introducción

El Índice de Precios al Consumidor (IPC) es un indicador que mide la variación promedio de los precios de una canasta representativa de bienes y servicios consumidos por los hogares en Colombia. El Departamento Administrativo Nacional de Estadística (DANE) es la entidad responsable de calcular y publicar mensualmente el IPC.

Para este informe, se han recopilado datos mensuales del IPC desde enero de 2003 hasta febrero de 2025, abarcando un total de 266 observaciones. Estos datos fueron obtenidos del DANE, que proporciona información detallada sobre la variación mensual, acumulada y anual del IPC.

El objetivo principal de este análisis es examinar la evolución del IPC en Colombia durante el período mencionado, identificar patrones o tendencias, y desarrollar un modelo ARIMA que describa adecuadamente la dinámica de la serie temporal. Este estudio es fundamental para comprender la inflación en el país y ofrecer información valiosa para la toma de decisiones económicas y financieras.

A continuación, se presentará una descripción detallada de los datos, las preguntas específicas que se abordan en este análisis, visualizaciones gráficas de la serie temporal, estimaciones de las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF), el desarrollo de un modelo ARMA y un análisis de los residuos, seguido de una discusión de los resultados obtenidos.

2 Preguntas

Algunas de las preguntas que puede abordar son:

¿Cómo ha evolucionado el IPC en Colombia desde 2003 hasta 2025?

¿Existen patrones o tendencias en la serie temporal del IPC?

¿El IPC es estacionario o requiere transformaciones para modelarlo?

¿Qué modelo ARIMA describe mejor la dinámica del IPC?

¿Es posible predecir el IPC en los próximos meses?

3 Estadísticas descriptivas básicas

Mínimo (Min = 50.42): Es el valor más bajo registrado en la serie temporal.

Máximo (Max = 147.9): Es el valor más alto registrado en la serie temporal.

Media (86.87): Representa el valor promedio del IPC a lo largo del periodo analizado.

Mediana (80.2): Es el valor central de la distribución, lo que indica que la mitad de las observaciones están por debajo y la otra mitad por encima de este valor.

Desviación estándar (24.98): Mide la dispersión de los datos respecto a la media. Un valor alto indica que el IPC ha tenido fluctuaciones significativas a lo largo del tiempo.

Coeficiente de variación (0.2876): Es una medida relativa de dispersión, obtenida como la relación entre la desviación estándar y la media. Un valor de 0.2876 (28.76%) indica que la variabilidad del IPC es moderada en relación con su media.

##     Min   Max    Media Mediana DesviacionEstandar  CoefVar
## 1 50.42 147.9 86.86846    80.2           24.97981 0.287559

El gráfico muestra un aumento constante del IPC en Colombia, con una aceleración más marcada en los últimos años. Esto sugiere mayores presiones inflacionarias, lo que podría afectar el poder adquisitivo de los consumidores y la estabilidad económica del país.

4 Extracción de señales

Este gráfico representa la descomposición de la serie temporal del Índice de Precios al Consumidor (IPC) en Colombia en sus principales componentes: datos originales (data), estacionalidad (seasonal), tendencia (trend) y residuos (remainder).

1. Componente de datos (“data”) La serie original del IPC muestra una tendencia creciente, con un incremento más pronunciado en los últimos años (especialmente después de 2020).

Se observan fluctuaciones regulares, lo que sugiere la presencia de patrones estacionales y variabilidad en la serie.

2. Componente estacional (“seasonal”) La serie presenta un patrón estacional claro y recurrente, lo que indica que el IPC tiene fluctuaciones periódicas.

Estas oscilaciones podrían estar relacionadas con factores cíclicos, como variaciones en el consumo según la época del año (festividades, cosechas, ciclos económicos, etc.).

3. Componente de tendencia (“trend”) La tendencia muestra un crecimiento sostenido del IPC a lo largo del tiempo, con una aceleración evidente después de 2020.

Este comportamiento sugiere un aumento en la inflación, posiblemente impulsado por eventos macroeconómicos como la pandemia, crisis de suministros y políticas monetarias.

4. Componente de residuos (“remainder”) Representa la parte no explicada de la serie, es decir, las variaciones aleatorias o eventos inesperados.

Se observa que los residuos son más volátiles después de 2020, lo que indica mayor incertidumbre o choques externos recientes que han afectado el IPC.

4.1 Serie original vs. Serie ajustada por estacionalidad

El IPC en Colombia ha crecido constantemente, con un incremento más acelerado en los últimos años. La serie ajustada por estacionalidad confirma la tendencia de largo plazo, sin la distorsión de fluctuaciones temporales. Esto indica que la inflación ha sido persistente y que el aumento en precios no es solo un efecto estacional, sino un fenómeno estructural.

4.2 Gráfico de la tasa de crecimiento anual

2008-2009: Se observa un pico, posiblemente relacionado con la crisis financiera global.

2015-2016: Otro repunte significativo, que coincide con la devaluación del peso colombiano y el impacto de El Niño en los precios de alimentos.

2021-2022: Un gran aumento, probablemente asociado a la recuperación post-pandemia, interrupciones en la cadena de suministro y la inflación global.

2023-2024: Se observa una desaceleración en la tasa de crecimiento del IPC, lo que puede sugerir una estabilización de la inflación.

Para la realización del modelo se tomo como datos de entrenamiento hasta diciembre de 2023 y como datos de prueba desde enero de 2024.

5 Prueba de estacionariedad

Primera prueba de estacionariedad

El resultado de la prueba ADF indica que la serie no es estacionaria (p-valor = 0.99, muy alto). Esto significa que presenta tendencia o dependencia en el tiempo. Para hacerla estacionaria, se debe aplicar diferenciación.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_ts
## Dickey-Fuller = 1.6421, Lag order = 6, p-value = 0.99
## alternative hypothesis: stationary

Segunda prueba de estacionariedad

El p-valor (0.01) es bajo, lo que permite rechazar la hipótesis nula de no estacionariedad.Por tanto, la diferenciación ha funcionado, eliminando la tendencia y haciendo que la serie sea apta para modelado con métodos como ARIMA.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_diff
## Dickey-Fuller = -4.3134, Lag order = 6, p-value = 0.01
## alternative hypothesis: stationary

6 ACF

El gráfico ACF de la serie diferenciada del IPC en Colombia muestra autocorrelaciones significativas en los primeros rezagos, indicando que aún hay estructura en los datos, posiblemente por efectos estacionales o un componente autorregresivo (AR). La autocorrelación disminuye gradualmente y cruza la banda de significancia cerca del rezago 15-16, lo que sugiere que la diferenciación ha eliminado la tendencia, pero quedan dependencias temporales.

7 PACF

El gráfico PACF muestra un pico significativo en el rezago 1, seguido de valores que caen dentro de los límites de significancia en la mayoría de los rezagos. Esto sugiere que la serie diferenciada del IPC en Colombia tiene una estructura autorregresiva de orden 1 (AR(1)), lo que indica que el valor actual está fuertemente influenciado por el valor anterior.

8 ARIMA

8.1 Modelo automático

El modelo ARIMA(1,1,2)(0,1,1)[12] fue seleccionado automáticamente para la serie train_ts, indicando que incluye un componente autorregresivo de orden 1 (AR(1)), dos medias móviles (MA(2)) y una estacionalidad con un término MA estacional en un período de 12 meses. Los coeficientes estimados sugieren una fuerte dependencia en los rezagos recientes, con un término estacional significativo. Los criterios de información como AIC (-76.14) y BIC (-58.76) indican un buen ajuste relativo del modelo.

## Series: train_ts 
## ARIMA(1,1,2)(0,1,1)[12] 
## 
## Coefficients:
##          ar1      ma1      ma2     sma1
##       0.9478  -0.3287  -0.2157  -0.8109
## s.e.  0.0291   0.0701   0.0644   0.0518
## 
## sigma^2 = 0.03947:  log likelihood = 43.07
## AIC=-76.14   AICc=-75.88   BIC=-58.76

Este modelo ARIMA(1,1,2)(0,1,1)[12] captura bien la tendencia y estacionalidad de la serie. Los coeficientes son significativos, y el error es bajo (MAPE ≈ 16.1%). Además, la baja autocorrelación de los residuos indica un buen ajuste.

## Series: train_ts 
## ARIMA(1,1,2)(0,1,1)[12] 
## 
## Coefficients:
##          ar1      ma1      ma2     sma1
##       0.9478  -0.3287  -0.2157  -0.8109
## s.e.  0.0291   0.0701   0.0644   0.0518
## 
## sigma^2 = 0.03947:  log likelihood = 43.07
## AIC=-76.14   AICc=-75.88   BIC=-58.76
## 
## Training set error measures:
##                       ME      RMSE       MAE       MPE      MAPE       MASE
## Training set 0.009886629 0.1918589 0.1375332 0.0088026 0.1609976 0.03360205
##                    ACF1
## Training set 0.01719351

8.2 Residuales

El análisis de los residuos del modelo ARIMA(1,1,2)(0,1,1)[12] sugiere que podrían no comportarse como ruido blanco, ya que la función de autocorrelación muestra algunos rezagos significativos y la distribución de los residuos presenta cierta asimetría respecto a la normalidad esperada. Además, la serie de residuos en el tiempo exhibe fluctuaciones notables, lo que indica que el modelo podría mejorarse ajustando los parámetros, considerando una transformación de los datos o explorando modelos alternativos para capturar mejor la estructura de la serie temporal.

El Ljung-Box test mostró un p-value de 0.2444, lo que indica que no hay evidencia suficiente para rechazar la hipótesis nula de que los residuos son ruido blanco. Esto sugiere que, en general, el modelo ARIMA(1,1,2)(0,1,1)[12] captura bien la estructura de la serie temporal y que los residuos no presentan una autocorrelación significativa en los rezagos evaluados.

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,1,2)(0,1,1)[12]
## Q* = 23.955, df = 20, p-value = 0.2444
## 
## Model df: 4.   Total lags used: 24

8.3 Pronóstico

Ambos conjuntos de datos (pronosticado y observado) siguen una tendencia creciente, lo que indica que el modelo captura correctamente la dirección del movimiento del IPC.

9 Resultados

El análisis del Índice de Precios al Consumidor (IPC) en Colombia mostró una tendencia creciente con fluctuaciones estacionales a lo largo del tiempo. La serie temporal evidenció variaciones significativas en periodos clave, como la crisis financiera de 2008-2009, la devaluación del peso en 2015-2016 y el impacto de la pandemia en 2021-2022.

Mediante la descomposición de la serie, se identificó una fuerte componente estacional y una tendencia ascendente más pronunciada después de 2020. La prueba de estacionariedad ADF inicial confirmó que la serie no era estacionaria, pero tras aplicar una diferenciación, se logró estabilizarla para su modelado.

El análisis de autocorrelación indicó que la serie diferenciada presentaba una estructura autorregresiva de orden 1. A partir de esto, se ajustó un modelo ARIMA(1,1,2)(0,1,1)[12], el cual mostró un buen desempeño según los criterios de información AIC y BIC. La evaluación de los residuos confirmó que no presentaban patrones significativos, sugiriendo que el modelo captura adecuadamente la dinámica del IPC.

El pronóstico basado en este modelo reflejó una tendencia de crecimiento continuo del IPC, alineado con los valores observados en el conjunto de prueba. Esto indica que el modelo es útil para anticipar variaciones futuras del IPC y apoyar la toma de decisiones económicas.