Análisis y Modelación de Series Temporales: Producción y Precio del Queso Campesino en Antioquia y el IPC de Colombia
El estudio se encuentra dividido en dos partes principales. En la primera, se analiza la producción de queso campesino en Antioquia, tomando como referencia dos series mensuales: el volumen de producción y el precio del producto, con el fin de identificar su comportamiento en el tiempo, sus patrones estacionales y su posible relación. En la segunda parte, se estudian dos componentes del Índice de Precios al Consumidor (IPC) en Colombia: el IPC Núcleo 15 y el IPC sin alimentos, series que permiten evaluar la dinámica inflacionaria del país y su estructura subyacente.
Esta primera parte tiene como propósito realizar un análisis estadístico y temporal de la producción mensual de queso campesino en Colombia, durante el periodo comprendido entre enero de 2007 y diciembre de 2015. Este tipo de estudios resulta fundamental para comprender el comportamiento de la industria alimentaria en el tiempo, identificar patrones de producción, reconocer posibles estacionalidades y ofrecer herramientas que apoyen la toma de decisiones en el sector agroindustrial y económico del país.
El queso campesino es un producto tradicional de alto consumo en los hogares colombianos. Su producción, aunque artesanal en muchos casos, refleja la dinámica de los pequeños y medianos productores lácteos, quienes dependen de factores como la disponibilidad de leche, las condiciones climáticas, la demanda del mercado y las políticas de precios en el sector agropecuario. Por tanto, analizar estadísticamente su volumen de producción no solo permite describir la evolución de un alimento representativo de la cultura alimentaria nacional, sino también entender cómo se comporta una variable económica de relevancia para la seguridad alimentaria y el desarrollo rural.
La base de datos utilizada, fue tomada de: (https://www.agronet.gov.co/estadistica/Paginas/home.aspx?cod=9) contiene 108 registros mensuales, correspondientes a los nueve años del periodo de estudio.
La base está compuesta por las siguientes variables:
Departamento: Departamento de Colombia donde se registra la información. En este caso, Antioquia.
Producto: Tipo de producto lácteo (Queso campesino)
Fecha: Compuesta por el mes y año
Año: variable de tipo numérico que identifica el año de observación, comprendido entre 2007 y 2015.
Mes: variable categórica que indica el mes correspondiente a cada registro, desde enero hasta diciembre, en orden cronológico.
Precio: variable cuantitativa continua que representa costo de venta de queso campesino producido durante cada mes del periodo analizado.
Unidad Precio: Unidad de medida del precio ($/Kg).
Volúmen: variable cuantitativa continua que representa la cantidad de queso campesino producido durante cada mes del periodo analizado.
Unidad Volúmen: Unidad de medida del volumen (kilogramos).
Variación Precio:(%) Cambio porcentual del precio respecto al periodo anterior.
Variación Volúmen:(%) Cambio porcentual del volumen respecto al periodo anterior.
El análisis que se desarrolla a continuación tiene como objetivo principal describir, modelar y entender el comportamiento del volumen y precio de producción de queso campesino a lo largo del tiempo. Para ello, se implementan diversas herramientas estadísticas y gráficas que incluyen el análisis descriptivo, la exploración de la distribución de los datos, la descomposición de las series , posteriormente, identificar el modelo que mejor se ajusta a las series.
Analisis de la base de datos de Antioquia
Analisis de la variable volumen en Antioquia
## vars n mean sd median trimmed mad min max range
## X1 1 108 773055.7 178364.6 710487.1 757503.4 122371.7 513289 1219494 706205
## skew kurtosis se
## X1 0.85 -0.44 17163.15
La base de datos cuenta con 108 registros, correspondientes a los 108 meses entre enero de 2007 y diciembre de 2015, lo cual garantiza una secuencia completa y continua de observaciones mensuales.
El volumen promedio de producción de queso campesino durante el periodo fue de aproximadamente 773.056kg. Este valor representa el nivel medio de producción mensual en los nueve años de estudio, lo que puede interpretarse como una medida representativa del comportamiento general del sector durante ese tiempo.
La mediana es de 710.487 se encuentra por debajo de la media, lo que indica una asimetría positiva en la distribución. Esto sugiere que existen algunos meses con valores de producción considerablemente altos que elevan el promedio general, aunque la mayoría de los meses presentan volúmenes más cercanos a la mediana.
La desviación estándar de 178.364 unidades refleja una variación significativa alrededor del promedio, lo que implica que la producción de queso campesino no se mantiene constante mes a mes, sino que experimenta fluctuaciones importantes.
El mínimo registrado fue de 513.289 unidades y el máximo alcanzó 1.219.494 unidades, lo que da un rango de aproximadamente 706.205 unidades. Esta amplitud confirma que la producción puede duplicarse entre los periodos de menor y mayor actividad, mostrando la existencia de picos productivos significativos.
En resumen, la producción mensual de queso campesino entre 2007 y 2015 muestra un comportamiento moderadamente variable, con una tendencia central alta y presencia de meses atípicos de gran producción. Estos hallazgos justifican el uso de herramientas de análisis de series de tiempo para profundizar en la identificación de patrones sistemáticos y aleatorios que expliquen la dinámica de este producto tradicional en el contexto colombiano.
Boxplot general del volumen en Antioquia
La producción de Queso Campesino fue moderadamente variable entre 2007 y 2015, La mayoría de los valores se concentran entre 700,000 y 850,000kilogramos, hubo algunos años con valores excepcionalmente altos, como muestra el punto atípico, la distribución parece ligeramente asimétrica hacia arriba, lo que indica que hubo algunos años con producciones mayores a la media habitual, la mediana está alrededor de 700 000 kg, esto indica que la mitad de las observaciones están por debajo de ese valor y la otra mitad por encima.
Boxplot año a año del volumen en Antioquia
Esta gráfica muestra la distribución del volumen de Queso Campesino por año, desde 2007 hasta 2015, mediante una serie de diagramas de caja (boxplots), cada caja representa la variabilidad del volumen en un año específico. Se observa una tendencia creciente en el volumen de producción de Queso Campesino a lo largo de los años, la mediana aumenta lo que indica un crecimineto progresivo en la produccion.
Histograma del Volumen de Queso Campesino en Antioquia (2007–2015)
El histograma del volumen de producción de queso campesino en Antioquia muestra una distribución ligeramente asimétrica hacia la derecha, donde la mayoría de los valores se concentran entre 600.000 y 800.000 kg, mientras que existen algunos meses con volúmenes significativamente mayores que generan una cola prolongada. La comparación entre la media y la mediana evidencia esta asimetría, pues la media resulta más alta debido a esos valores extremos. En general, la gráfica sugiere que la producción presenta una variabilidad moderada, con una mayor frecuencia de volúmenes en torno al nivel central y pocos meses con producciones excepcionalmente altas.
Analisis de la variable precio en Antioquia
## vars n mean sd median trimmed mad min max range skew
## X1 1 108 8584.34 520.14 8604.21 8620.24 297.21 6615.2 9979.75 3364.55 -1
## kurtosis se
## X1 2.83 50.05
El precio promedio del Queso Campesino fue de aproximadamente 8,584 pesos, la desviación estándar 520 muestra que los precios variaron alrededor de un 6% del valor medio, lo que indica una variabilidad moderada y controlada en el tiempo, la media son muy cercanas, lo que sugiere que la distribución de precios es aproximadamente simétrica, sin grandes sesgos hacia valores muy altos o bajos, los precios oscilaron entre 6,615 y 9,980, mostrando una diferencia total de más de 3,300 pesos, lo cual indica que hubo periodos de precios más bajos pero sin valores extremos fuera de lo razonable.
Boxplot general del precio en Antioquia
La mediana del precio está cerca de los 8,500 pesos, lo cual indica que la mayoría de los precios se concentraron alrededor de este valor durante el periodo analizado, la caja es relativamente estrecha, lo que significa que los precios no variaron de forma muy grande entre los años, hay varios puntos fuera de los bigotes del boxplot, tanto por encima como por debajo valores altos por encima de 9,000 pesos indican años o meses donde el precio fue excepcionalmente alto y valores bajos por debajo de 7,500 pesos, incluso cerca de 6,500 reflejan caídas inusuales en el precio.
Boxplot año a año del volumen en Antioquia
El boxplot del precio del queso campesino en Antioquia entre 2007 y 2015 muestra un incremento progresivo y sostenido en los valores a lo largo de los años, lo que refleja una tendencia general al alza en el costo del producto. En 2007 se observan los precios más bajos y también la mayor variabilidad, mientras que a partir de 2008 los precios se estabilizan gradualmente, aunque con ligeras fluctuaciones anuales. Hacia 2012 y 2015 se alcanzan las medianas más altas, indicando un aumento importante en el valor del queso en esos periodos. La presencia de algunos valores atípicos en ciertos años evidencia momentos específicos de comportamiento irregular del mercado, pero sin alterar la tendencia ascendente general. En conjunto, el gráfico sugiere un encarecimiento continuo del producto, posiblemente asociado a cambios en los costos de producción, la demanda o factores macroeconómicos del sector lácteo.
Histograma del Precio del Queso Campesino en Antioquia (2007–2015)
El análisis del histograma del precio del queso campesino entre los años 2007 y 2015 muestra que los precios se concentraron principalmente entre 8,000 y 9,000 pesos, lo que indica una relativa estabilidad en el valor de este producto durante el periodo analizado. La media (8,584.34 pesos) y la mediana (8,604.21 pesos) son muy similares, lo cual sugiere una distribución casi simétrica con un leve sesgo negativo, evidenciando la presencia de algunos valores ligeramente más bajos que reducen el promedio.
Correlacion
## [1] 0.4541047
Existe una correlación positiva moderada r = 0.45 entre el precio y el volumen del queso campesino. Esto sugiere que en general, cuando el precio aumenta, la producción también tiende a incrementarse, aunque no de manera proporcional ni constante.
Grafica de la correlacion
La gráfica de dispersión entre el volumen y el precio muestra una relación positiva, aunque moderada, evidenciada tanto por el valor del coeficiente de correlación r (≈ 0.45) como por la inclinación ascendente de la línea de tendencia. Esto indica que, en general, a medida que aumenta el volumen, también tiende a aumentar el precio, aunque la relación no es perfectamente lineal.
Se observa que los puntos se agrupan con cierta dispersión alrededor de la línea de tendencia, lo que sugiere que existen otros factores que podrían estar influyendo en el comportamiento del precio además del volumen. Sin embargo, el patrón general indica que los datos tienden a seguir la dirección de la línea, reforzando la idea de una relación positiva entre ambas variables.
Ajuste de distribuciones al conjunto de datos
Ajuste de distribuciones para volumen
## Distribución AIC BIC
## 2 Log-normal 1411.403 1416.767
## 3 Gamma 1416.224 1421.588
## 1 Normal 1429.193 1434.558
## 4 Weibull 1437.905 1443.269
La distribución log-normal tiene los valores más bajos de AIC y BIC, por lo tanto es el modelo que mejor describe el comportamiento del volumen de producción, esto es coherente con lo onservado anteriormente en el grafico del histograma.
Los gráficos indican que la distribución log-normal describe adecuadamente los datos del volumen de producción, esto concuerda con los valores de AIC y BIC, que también fueron los más bajos, indicando el mejor ajuste, dicho esto el comportamiento del volumen de producción del Queso Campesino sigue una distribución log-norma
Ajuste de distribuciones para precio en Antioquia
## Distribución AIC BIC
## 4 Weibull 162.4305 167.7947
## 1 Normal 168.2979 173.6622
## 3 Gamma 173.5587 178.9230
## 2 Log-normal 176.5500 181.9143
La curva teórica sigue de manera bastante cercana la forma general del histograma, especialmente en la zona central donde están la mayoría de los datos. Esto indica que la Weibull modela adecuadamente la forma general de la distribución de precios, capturando su tendencia central y dispersión. El grafico de Q–Q plot muestra que los puntos siguen relativamente bien la línea recta, con pequeñas desviaciones en las colas, esto sugiere que la distribución Weibull representa adecuadamente la zona central de los datos. En el grafico Empirical and theoretical CDF se ve que ambas curvas son muy similares en casi todo el rango de los datos. Esto significa que la Weibull captura bien la acumulación de probabilidades, es decir, la proporción de datos por debajo de cada valor. Finalmente la grafica de P-P plot muestra que los puntos siguen bastante bien la diagonal, con pequeñas desviaciones.
a continucaion se toman las variables de interes del trabajo (voluemen y precio) y se convierten a serie
Serie volumen en Antioquia
La gráfica presenta la evolución temporal del volumen de producción de Queso Campesino durante el período 2007–2015. Se observa un comportamiento no estacionario, con una tendencia creciente a lo largo de los año, los datos con mayores registro en produccion estan al final de esta serie.
Descomposición de la serie volumen
La producción de queso campesino entre 2007 y 2015 muestra un comportamiento claramente creciente, acompañado de un patrón estacional que se repite de forma consistente cada año. La mayor variabilidad se explica por la tendencia y la estacionalidad, mientras que el componente aleatorio tiene poca influencia. Esto indica que la serie es adecuada para modelar y predecir, aunque requiere diferenciación para cumplir con la estacionariedad.
Test de Dickey-Fuller aumentado (ADF)
\[ \begin{cases} H_0: \quad &\text{la serie no es estacionaria, tiene raíz unitaria} \\ H_1: \quad &\text{la serie es estacionaria, no tiene raíz unitaria} \end{cases} \]
##
## Augmented Dickey-Fuller Test
##
## data: serie_volumen
## Dickey-Fuller = -1.6168, Lag order = 4, p-value = 0.7356
## alternative hypothesis: stationary
Dado que el p-value es mucho mayor que 0.05, no se rechaza la hipótesis nula, que establece que la serie presenta raíz unitaria. Esto significa que la serie no es estacionaria en su forma original. En consecuencia, el comportamiento del volumen de producción está dominado por tendencias y variaciones sistemáticas que hacen que su promedio, varianza y autocorrelación cambien con el tiempo.
Ndiffs
La función ndiffs muetra el numero diferencias necesaria para que la serie sea estacionaria
## [1] 1
Tras comprobar mediante el test ADF que la serie original no es estacionaria, fue necesario determinar cuántas diferencias debían aplicarse para estabilizarla. Para ello, se empleó la función ndiffs(), la cual indicó que la serie requiere una única diferenciación, ste resultado confirma que, con una diferencia de primer orden, la serie debería eliminar su tendencia y acercarse a un comportamiento estacionario.
A continuacion se aplica una diferencia a la serie tiempo para convertirla estacionaria.
Aplicación de diferencia
##
## Augmented Dickey-Fuller Test
##
## data: convertir_a_estacionario_volumen
## Dickey-Fuller = -6.0975, Lag order = 4, p-value = 0.01
## alternative hypothesis: stationary
Se aplica nuevamente el test de Dickey-Fuller y se evidencia que puesto que el p-value = 0.01 < 0.05, se rechaza la hipótesis nula del test de Dickey-Fuller, por lo tanto, la serie es estacionaria.
Luego de aplicar una primera diferencia a la serie original de producción de queso campesino, la nueva serie muestra un comportamiento claramente estacionario, esto se confirma tanto de forma visual, ya que la serie diferenciada oscila alrededor de una media constante y sin tendencia aparente, como de manera estadística, mediante el test de Dickey-Fuller aumentado (ADF), que arrojó un valor de p = 0.01, menor al nivel de significancia de 0.05.
ACF y PACF de serie estacionaria de volumento en Antioquia
Según los gráficos de autocorrelación (ACF) y autocorrelación parcial (PACF) de la serie correspondiente a la producción de queso campesino entre los años 2007 y 2015, se observa que la mayoría de los valores se encuentran dentro de los límites de confianza, lo que indica una baja autocorrelación entre los rezagos, esto sugiere que la serie no presenta una tendencia ni una estacionalidad marcada, por lo que puede considerarse estacionaria después de la transformación aplicada. Además, el comportamiento del primer rezago en la PACF muestra una influencia significativa, lo que indica que los valores actuales de la producción dependen principalmente del valor del año anterior.
Elección del mejor modelo
Segun Hyndman, R. J. (2023), auto.arima devuelve el mejor modelo ARIMA según los valores AIC, AICc o BIC. La función realiza una búsqueda entre los modelos posibles dentro de las restricciones de orden proporcionadas.
## Series: serie_volumen
## ARIMA(0,1,2)(1,0,0)[12]
##
## Coefficients:
## ma1 ma2 sar1
## -0.8468 0.2186 0.4099
## s.e. 0.0928 0.0968 0.0895
##
## sigma^2 = 4768460847: log likelihood = -1344.05
## AIC=2696.1 AICc=2696.49 BIC=2706.79
El modelo identificado corresponde a un ARIMA(0,1,2)(1,0,0) 12
En la parte no estacional, el modelo incorpora una diferenciación de primer orden, necesaria para eliminar la tendencia previamente detectada, junto con dos términos de media móvil (MA1 y MA2) que capturan la dependencia de los errores recientes.
En cuanto a la componente estacional, el modelo incluye un término autorregresivo estacional AR(1) con una periodicidad de 12, lo que indica que la serie presenta un efecto significativo asociado al valor observado doce meses atrás, propio de patrones mensuales. No se requiere aplicar diferenciación estacional ni términos de media móvil estacional, lo cual sugiere que la estacionalidad presente en la serie puede ser capturada adecuadamente mediante este único componente AR estacional.
Residuos del Modelo 1
La gráfica de los residuos muestra que éstos oscilan de manera natural alrededor de cero, sin evidenciar tendencias marcadas ni un patrón sistemático a lo largo del tiempo, lo cual sugiere que el modelo captura adecuadamente la dinámica general de la serie. Aunque se observan algunos picos aislados propios de eventos atípicos que el modelo no logra explicar del todo la variabilidad permanece relativamente estable, indicando ausencia de heterocedasticidad evidente. En conjunto, el comportamiento de los residuos se asemeja al de un ruido blanco, lo que respalda que el modelo es, en términos generales, apropiado para describir la serie temporal analizada.
Al analizar los residuos del modelo 1 para el volumen de queso campesino, se observa primero que la serie de residuos oscila alrededor de cero y no presenta tendencia ni patrones visibles, lo cual indica que el modelo logró capturar adecuadamente la estructura principal de la serie original. Tanto la función de autocorrelación (ACF) como la autocorrelación parcial (PACF) muestran que la mayoría de los rezagos se encuentran dentro de los límites de significancia, lo que sugiere que no quedan dependencias temporales importantes sin modelar. Esto es consistente con el comportamiento esperado de un proceso que se aproxima a ruido blanco. El gráfico Q–Q plot muestra que los residuos siguen aproximadamente una distribución normal, aunque se observan algunas desviaciones en las colas, algo habitual en datos reales y que no compromete en gran medida la validez del modelo.
KPSS Test El test KPSS evalúa si la serie es estacionaria alrededor de una media o tendencia. Los residuos deben ser estacionarios, porque un modelo bien ajustado ya extrajo tendencia y estacionalidad.
\[ \begin{cases} H_0: \quad &\text{ La serie es estacionaria} \\ H_1: \quad &\text{La serie NO es estacionaria} \end{cases} \]
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod1
## KPSS Level = 0.15291, Truncation lag parameter = 4, p-value = 0.1
un p-value de 0.1. Dado que este valor p es superior al nivel de significancia habitual (0.05), no existe evidencia suficiente para rechazar la hipótesis nula de estacionariedad. Por lo tanto, se concluye que los residuos del modelo son estacionarios, lo cual es consistente con el comportamiento esperado en un modelo ARIMA correctamente especificado, ya que la tendencia y la estacionalidad deberían haber sido removidas en el proceso de modelado.
Ljung–Box Test
La prueba Ljung–Box evalúa si los residuos están libres de autocorrelación, es decir, si parecen ruido blanco.
\[ \begin{cases} H_0: \quad &\text{ No hay autocorrelación → los residuos son ruido blanco} \\ H_1: \quad &\text{Sí hay autocorrelación → el modelo no es adecuado} \end{cases} \]
##
## Box-Ljung test
##
## data: residuo_mod1
## X-squared = 8.6415, df = 8, p-value = 0.3734
El test da un p-value de 0.3734. Dado que este valor p es considerablemente mayor que el nivel de significancia, no se rechaza la hipótesis nula de ausencia de autocorrelación. En consecuencia, se concluye que los residuos no presentan autocorrelación significativa y por tanto, pueden considerarse como ruido blanco.
Shapiro–Wilk TestShapiro–Wilk Test
Evalúa si los residuos siguen una distribución normal.
\[ \begin{cases} H_0: \quad &\text{Los residuos son normales} \\ H_1: \quad &\text{Los residuos NO son normales} \end{cases} \]
##
## Shapiro-Wilk normality test
##
## data: residuo_mod1
## W = 0.95914, p-value = 0.00217
Finalmente, la prueba de normalidad de Shapiro–Wilk mostró un p-value que, aunque puede no ser elevado, no afecta de manera crítica la validez del modelo, dado que la normalidad estricta de los residuos no es un requisito indispensable en modelos ARIMA. En conjunto, los resultados permiten concluir que el modelo seleccionado cumple de manera satisfactoria con los supuestos necesarios y es adecuado para representar la dinámica de la serie analizada.
Modelo 2
## Series: serie_volumen
## ARIMA(3,0,0) with non-zero mean
##
## Coefficients:
## ar1 ar2 ar3 mean
## 0.1951 0.3594 0.4147 849564.7
## s.e. 0.0868 0.0827 0.0882 158303.1
##
## sigma^2 = 5825731307: log likelihood = -1366.82
## AIC=2743.64 AICc=2744.22 BIC=2757.05
Analisis de residuos del modelo 2
El gráfico de residuos muestra que estos oscilan alrededor de cero sin mostrar patrones claros ni tendencias, con una varianza relativamente constante a lo largo del tiempo, lo que indica que el modelo captura bien la estructura de la serie y que los errores se comportan como ruido blanco; sin embargo, algunos picos sugieren la posible presencia de valores atípicos o eventos puntuales no explicados, por lo que se recomienda complementar este análisis visual con pruebas estadísticas para validar completamente la adecuación del modelo.
el gráfico de la serie de residuos muestra fluctuaciones sin tendencia clara ni patrones evidentes, lo que sugiere que los residuos son aproximadamente estacionarios. El gráfico de autocorrelación (ACF) no presenta autocorrelaciones significativas fuera de los límites de confianza, indicando que no hay dependencia serial en los residuos, lo que es deseable para un buen ajuste del modelo. El gráfico de autocorrelación parcial (PACF) confirma esta ausencia de autocorrelación significativa. Finalmente, el gráfico Q-Q muestra que los residuos se ajustan razonablemente bien a una distribución normal, con ligeras desviaciones en los extremos, lo que es común en datos reales. En conjunto, estos gráficos sugieren que el modelo captura adecuadamente la estructura temporal de los datos y que los residuos se comportan como ruido blanco, cumpliendo con los supuestos de un buen modelo ARIMA.
KPSS Test
El test KPSS evalúa si la serie es estacionaria alrededor de una media o tendencia. Los residuos deben ser estacionarios, porque un modelo bien ajustado ya extrajo tendencia y estacionalidad.
\[ \begin{cases} H_0: \quad &\text{ La serie es estacionaria} \\ H_1: \quad &\text{La serie NO es estacionaria} \end{cases} \]
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod2
## KPSS Level = 0.56061, Truncation lag parameter = 4, p-value = 0.02801
Dado que el p‑valor (0.028) es menor que un nivel de significancia 0.05, se rechaza la hipótesis nula del test KPSS; por lo tanto, existe evidencia estadística para afirmar que los residuos no son estacionarios en nivel.
Ljung–Box Test
La prueba Ljung–Box evalúa si los residuos están libres de autocorrelación, es decir, si parecen ruido blanco.
\[ \begin{cases} H_0: \quad &\text{ No hay autocorrelación → los residuos son ruido blanco} \\ H_1: \quad &\text{Sí hay autocorrelación → el modelo no es adecuado} \end{cases} \]
##
## Box-Ljung test
##
## data: residuo_mod2
## X-squared = 32.098, df = 12, p-value = 0.001337
El test da un p‑valor de 0.001337, que es mucho menor que el nivel de significancia convencional (0.05), por lo que se rechaza la hipótesis nula de ausencia de autocorrelación. En consecuencia, los residuos presentan autocorrelación significativa, lo que implica que no pueden considerarse completamente como ruido blanco.
Shapiro–Wilk TestShapiro–Wilk Test
Evalúa si los residuos siguen una distribución normal.
\[ \begin{cases} H_0: \quad &\text{Los residuos son normales} \\ H_1: \quad &\text{Los residuos NO son normales} \end{cases} \]
##
## Shapiro-Wilk normality test
##
## data: residuo_mod2
## W = 0.9677, p-value = 0.009946
El test de Shapiro‑Wilk da un p‑valor = 0.009946, que es menor que el nivel de significancia común (0.05). Por lo tanto, se rechaza la hipótesis nula de normalidad, lo que implica que los residuos no vienen de una distribucion nromal, dado que los residuos no satisfacen los requisitos fundamentales, se descarta el modelo 2 como el mejor modelo para la serie de volumen de queso campesino en Antioquia.
Modelo 3
## Series: serie_volumen
## ARIMA(0,1,2) with drift
##
## Coefficients:
## ma1 ma2 drift
## -0.8986 0.2083 4501.055
## s.e. 0.0916 0.1014 2251.520
##
## sigma^2 = 5602151977: log likelihood = -1351.64
## AIC=2711.27 AICc=2711.66 BIC=2721.96
Finalmente, el modelo 3 ARIMA(0,1,2) con drift y Su AIC de 2711.27
A continuacoin se analisan sus resisduos.
Análisis a los residuos del modelo 3
los residuos del modelo 3 se comportan de manera muy similar a los errores de los modelos anteriores, puede concluirse que visualmente también oscilan alrededor de cero sin tendencias aparentes y con varianza relativamente constante. Por lo tanto, es adecuado aplicar los mismos tests estadísticos (KPSS para estacionariedad, Ljung‑Box para autocorrelación y Shapiro‑Wilk para normalidad) para validar formalmente si los residuos cumplen con los supuestos y determinar si el modelo 3 es realmente adecuado.
KPSS Test
El test KPSS evalúa si la serie es estacionaria alrededor de una media o tendencia. Los residuos deben ser estacionarios, porque un modelo bien ajustado ya extrajo tendencia y estacionalidad.
\[ \begin{cases} H_0: \quad &\text{ La serie es estacionaria} \\ H_1: \quad &\text{La serie NO es estacionaria} \end{cases} \]
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod3
## KPSS Level = 0.40198, Truncation lag parameter = 4, p-value = 0.0763
Dado que el p‑valor del test KPSS para los residuos del modelo 3 es 0.0763, el cual es mayor que un nivel de significancia 0.05, no se rechaza la hipótesis nula de estacionariedad; por lo tanto, se puede concluir que no hay evidencia estadística suficiente para afirmar que los residuos no son estacionarios, lo que sugiere que podrían cumplir este requisito clave para considerar que el modelo es adecuado.
Ljung–Box Test
La prueba Ljung–Box evalúa si los residuos están libres de autocorrelación, es decir, si parecen ruido blanco.
\[ \begin{cases} H_0: \quad &\text{ No hay autocorrelación → los residuos son ruido blanco} \\ H_1: \quad &\text{Sí hay autocorrelación → el modelo no es adecuado} \end{cases} \]
##
## Box-Ljung test
##
## data: residuo_mod3
## X-squared = 31.484, df = 13, p-value = 0.002863
Este da un p-valor = 0.002863. Como ese p‑valor es mucho menor que 0.05, se rechaza la hipótesis nula de no autocorrelación. En consecuencia, existe evidencia estadística de que los residuos presentan autocorrelación significativa, lo que indica que no se pueden considerar completamente como ruido blanco.
Shapiro–Wilk TestShapiro–Wilk Test
Evalúa si los residuos siguen una distribución normal.
\[ \begin{cases} H_0: \quad &\text{Los residuos son normales} \\ H_1: \quad &\text{Los residuos NO son normales} \end{cases} \]
##
## Shapiro-Wilk normality test
##
## data: residuo_mod3
## W = 0.97153, p-value = 0.02032
El test de Shapiro‑Wilk da un p-valor = 0.02032, que es menor que 0.05, por lo que se rechaza la hipótesis nula de normalidad. En consecuencia, los residuos no se distribuyen normalmente.
En conclusión, de los tres modelos evaluados, el modelo 1 SARIMA (0,1,2)(1,0,0) [12] es claramente el más adecuado para la serie de volumen de queso campesino en Antioquia, presentó el AIC más bajo, lo que indica un mejor balance entre ajuste y parsimonia, y sus residuos cumplieron de manera más satisfactoria con los supuestos básicos estacionariedad, independencia y normalidad comparado con los otros modelos. Por tanto, el modelo 1 no solo ofrece un ajuste estadístico sólido sino también residuals que se comportan de forma cercana a ruido blanco, lo que refuerza su solidez como herramienta predictiva para esta serie.
La previsión del volumen de queso campesino en Antioquia muestra que la tendencia creciente observada en los últimos años continuará en el futuro, reflejando un mercado en expansión sostenida. El modelo incorpora la estacionalidad propia del comportamiento anual del producto, y aunque las estimaciones son más precisas en el corto plazo, los intervalos de confianza del 80% y 95% revelan que la incertidumbre aumenta gradualmente a medida que se proyectan más meses, la proyección indica un panorama positivo, con incrementos esperados en la producción o comercialización del queso, pero también invita a tomar decisiones considerando la variabilidad natural del mercado.
Problema para serie de volumen en Antioquia
Aunque la producción de queso campesino en Antioquia ha aumentado año tras año según los datos, se observa que siempre hay algunos meses en los que la producción tiende a bajar, estos meses coinciden con la temporada de menos lluvias y podrían estar relacionados con factores climáticos,en particular, los meses de junio, julio y agosto han sido identificados por autoridades como parte de una “temporada de menos lluvias”, demás, el SIATA, a través de sus registros históricos, señala que entre junio, julio y agosto hay acumulados de precipitación más bajos que en otros trimestres del año.
Dado que la caída de producción ocurre sistemáticamente en esos mismos meses, se podría preparar una estrategia anticipada para mitigar su impacto. Por ejemplo:
Planificar una alimentación adicional para las vacas durante esos meses secos, asegurando reservas de estoz o suplementos nutritivos, almacenar agua o garantizar sistemas de riego para esos períodos más secos,desarrollar planes de contingencia climática basados en pronósticos de lluvia para anticipar reducciones de producción.
Serie precio en Antioquia
## Jan Feb Mar Apr May Jun Jul Aug Sep
## 2007 6615.20 6615.20 7298.27 7692.77 7989.92 7766.22 7861.47 7852.99 7640.41
## 2008 8084.08 8063.15 7990.88 8547.99 8632.29 8062.61 7934.25 8236.24 8219.35
## 2009 8649.16 8407.43 8565.58 8634.20 8478.58 8531.28 8776.26 8583.15 8553.56
## 2010 8442.26 8451.95 8238.18 8673.18 8511.60 8599.77 8584.40 8385.77 8587.47
## 2011 8402.56 8547.80 8563.22 8475.14 8555.91 8783.33 8537.54 8720.46 9047.40
## 2012 9077.65 9290.97 9252.44 8661.60 9318.76 8710.36 8987.77 9110.83 8914.40
## 2013 9135.00 9124.65 8957.26 9080.14 9318.76 8803.49 8772.52 8561.76 8608.65
## 2014 8741.80 8785.49 8553.64 9979.75 8651.37 8543.49 8737.96 8430.20 8517.00
## 2015 8785.00 8762.00 8669.00 8875.00 8865.00 8865.00 9078.00 9078.00 9172.00
## Oct Nov Dec
## 2007 7397.00 7991.61 8197.86
## 2008 8478.26 8328.81 8777.21
## 2009 8734.65 8359.05 8071.15
## 2010 8545.16 8136.12 8562.53
## 2011 8621.87 8793.26 9138.23
## 2012 9043.69 9146.81 8585.00
## 2013 8908.67 8701.83 9078.15
## 2014 8628.00 8579.00 8763.00
## 2015 9654.00 9420.00 9301.00
La gráfica presenta la evolución temporal del precio del queso Campesino durante el período 2007–2015 muestra que el precio del queso campesino aumentó de manera sostenida entre 2007 y 2015, con variaciones cíclicas y un evento extraordinario alrededor de 2014, a continuacion se descmpone la serire de precio y se da su posterior analisis.
La descomposición de la serie de precios del queso campesino en Antioquia muestra un comportamiento claro y bien estructurado: en el gráfico observed se aprecia que los precios han presentado variaciones moderadas a lo largo del tiempo, mientras que el componente trend revela una tendencia general creciente con algunas fases de estabilización, lo que indica un aumento paulatino del precio a través de los años. El componente seasonal exhibe un patrón repetitivo y bien definido, lo que significa que existen fluctuaciones estacionales que se repiten cada año, posiblemente asociadas a ciclos de producción, demanda o factores propios del mercado local. Finalmente, el componente random refleja las variaciones irregulares no explicadas por la tendencia ni por la estacionalidad, mostrando que aunque hay cierta volatilidad, ésta no opaca la estructura principal de la serie. En conjunto, la serie presenta una tendencia ascendente, estacionalidad marcada y un ruido relativamente controlado.
Test de Dickey-Fuller aumentado (ADF)
Se muestrará si la serie es estacionaria.
\[ \begin{cases} H_0: \quad &\text{la serie no es estacionaria, tiene raíz unitaria} \\ H_1: \quad &\text{la serie es estacionaria} \end{cases} \]
##
## Augmented Dickey-Fuller Test
##
## data: serie_precio
## Dickey-Fuller = -2.8398, Lag order = 4, p-value = 0.2283
## alternative hypothesis: stationary
Luego de aplicar el test se tiene un p-valor de 0.2283, lo cual es mayor que un nivel de significancia= 0.05; por lo tanto, no se rechaza la hipótesis nula de que la serie tiene una raíz unitaria es decir, no es estacionaria. En otras palabras, no hay evidencia estadística suficiente para afirmar que la serie de precios de queso campesino en Antioquia sea estacionaria, lo que sugiere que podría presentar una tendencia persistente o una componente no estacionaria que debe abordarse antes de modelarla correctamente con ARIMA u otro tipo de modelo de series de tiempo.
La función ndiffs muetra el numero diferencias necesaria para que la serie sea estacionaria
## [1] 1
Tras aplicar el test de Augmented Dickey‑Fuller (ADF) y obtener un p‑valor de 0.2283, se evidencia que la serie de precios de queso campesino no es estacionaria es decir, parece tener una raíz unitaria y posiblemente una tendencia persistente. Ante este resultado, recurrimos a la función ndiffs para determinar cuántas diferenciaciones son necesarias para estabilizar la serie. El análisis revela que una sola diferencia es suficiente para transformar la serie en algo más parecido a un proceso estacionario
Aplicacion de la diferencia para la serie precio
Aqui se aplica una diferencia a la serie tiempo para convertirla estacionaria.
##
## Augmented Dickey-Fuller Test
##
## data: convertir_a_estacionario_precio
## Dickey-Fuller = -6.9417, Lag order = 4, p-value = 0.01
## alternative hypothesis: stationary
Tras aplicar una diferencia a la serie de precios, el test ADF sobre la serie transformada arroja un p-valor= 0.01, lo que es significativamente menor que un nivel de significancia 0.05. Esto permite rechazar la hipótesis nula de no estacionariedad, lo que evidencia que la serie diferenciada es estacionaria. Gracias a esta transformación, ahora contamos con una base adecuada para modelar la serie con un ARIMA u otro método.
La serie estacionaria del precio del queso campesino muestra un comportamiento claramente fluctuante alrededor de cero, sin una tendencia definida hacia arriba o hacia abajo, lo que confirma que el proceso de diferenciación logró estabilizar la media. Visualmente, la gráfica presenta picos positivos pronunciados en algunos meses como en 2014 o en varios meses de 2007 y 2013 acompañados de caídas igualmente fuertes en otros periodos, como en mayo de 2014, junio de 2012 o noviembre de 2009.
La gráfica ACF muestra que, tras la conversión a estacionaria, la mayoría de los valores caen dentro de las bandas de confianza, indicando que la autocorrelación se redujo notablemente y que no persisten patrones fuertes de dependencia temporal; solo aparecen algunos picos pequeños que no representan una estructura significativa. Por su parte, la PACF presenta uno o dos rezagos ligeramente sobresalientes, lo que sugiere que la serie podría estar bien representada con un modelo AR de bajo orden o que la estacionarización fue efectiva, eliminando gran parte de la estructura previa. En conjunto, ambas gráficas confirman que la serie transformada es estacionaria y lista para modelarse con un ARIMA simple, pues ya no exhibe tendencias ni estacionalidades claras.
Modelo 1 precio
## Series: serie_precio
## ARIMA(0,1,1)(2,0,0)[12] with drift
##
## Coefficients:
## ma1 sar1 sar2 drift
## -0.5885 0.0856 -0.3555 20.8755
## s.e. 0.0959 0.1038 0.1158 9.2510
##
## sigma^2 = 75585: log likelihood = -752.61
## AIC=1515.22 AICc=1515.82 BIC=1528.59
El modelo propuesto es un SARIMA(0,1,1)(2,0,0)[12] con drift, el cual combina una parte no estacional con un componente de promedio móvil y una diferenciación, junto con un componente estacional de orden anual que incluye dos términos autorregresivos.
Residuos del Modelo 1 precio
Los residuos del modelo ARIMA para la serie de precios del queso campesino se comportan de manera adecuada: oscilan alrededor de cero con varianza constante, y los gráficos ACF y PACF muestran que no hay autocorrelaciones significativas, indicando que el modelo ha capturado correctamente la estructura temporal de la serie. El QQ-plot sugiere que los residuos siguen aproximadamente una distribución normal, aunque con algunas colas ligeramente más pesadas, lo que apunta a la presencia ocasional de valores extremos. Además, los criterios de información del modelo AIC = 1515.22,
KPSS Test El test KPSS evalúa si la serie es estacionaria alrededor de una media o tendencia. Los residuos deben ser estacionarios, porque un modelo bien ajustado ya extrajo tendencia y estacionalidad.
\[ \begin{cases} H_0: \quad &\text{ La serie es estacionaria} \\ H_1: \quad &\text{La serie NO es estacionaria} \end{cases} \]
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod1_pre
## KPSS Level = 0.42291, Truncation lag parameter = 4, p-value = 0.06728
La prueba de KPSS confirma que los residuos son estacionarios, ya que el p-valor obtenido 0.06728es mayor a 0.05, lo que implica que no se rechaza la hipótesis nula de estacionariedad.
Ljung–Box Test
La prueba Ljung–Box evalúa si los residuos están libres de autocorrelación, es decir, si parecen ruido blanco.
\[ \begin{cases} H_0: \quad &\text{ No hay autocorrelación → los residuos son ruido blanco} \\ H_1: \quad &\text{Sí hay autocorrelación → el modelo no es adecuado} \end{cases} \]
##
## Box-Ljung test
##
## data: residuo_mod1_pre
## X-squared = 4.7121, df = 8, p-value = 0.7879
Los residuos no presentan autocorrelación significativa, como lo confirma el Box-Ljung test p-valor = 0.7879, y se comportan como ruido blanco. Esto indica que el modelo ha capturado correctamente la dinámica de la serie, eliminando cualquier patrón temporal preexistente.
Shapiro–Wilk TestShapiro–Wilk Test
Evalúa si los residuos siguen una distribución normal.
\[ \begin{cases} H_0: \quad &\text{Los residuos son normales} \\ H_1: \quad &\text{Los residuos NO son normales} \end{cases} \]
##
## Shapiro-Wilk normality test
##
## data: residuo_mod1_pre
## W = 0.97184, p-value = 0.02152
Puesto que el p-valor es menor que 0.05, se concluye que los residuos no siguen estrictamente una distribución normal, lo que indica la presencia de algunas desviaciones o valores extremos, aunque el modelo sigue siendo adecuado para la predicción y captura correctamente la dinámica principal de la serie
Modelo 2 Precio
## Series: serie_precio
## ARIMA(0,1,1) with drift
##
## Coefficients:
## ma1 drift
## -0.5864 22.8650
## s.e. 0.0889 11.6264
##
## sigma^2 = 83026: log likelihood = -757.02
## AIC=1520.03 AICc=1520.27 BIC=1528.05
El segundo modelo propuesto es un ARIMA(0,1,1) con deriva (drift), que utiliza una diferenciación para eliminar tendencias y un componente de promedio móvil (MA1) para capturar la estructura de dependencia en los errores. Además, incluye un término de drift que introduce una tendencia lineal en la serie ya diferenciada, permitiendo modelar un crecimiento sostenido a lo largo del tiempo sin incorporar componentes estacionales.
Residuos del Modelo 2 precio
Los residuos del modelo ARIMA(0,1,1) para la serie de precios muestran un comportamiento consistente con un buen ajuste: la serie de residuos oscila alrededor de cero, sugiriendo que la media es finita y la varianza se mantiene relativamente constante. Los gráficos de ACF y PACF indican que todas las autocorrelaciones se encuentran dentro de las bandas de confianza, lo que confirma la ausencia de dependencia temporal significativa y respalda que los residuos se comportan como ruido blanco. Aunque el QQ-plot no se ajusta perfectamente a la línea diagonal debido a la cantidad limitada de puntos fuera de la línea, visto esto y a fin de confimar el buen comportamiento de los residuos de le aplicarán los siguintes test.
KPSS Test El test KPSS evalúa si la serie es estacionaria alrededor de una media o tendencia. Los residuos deben ser estacionarios, porque un modelo bien ajustado ya extrajo tendencia y estacionalidad.
\[ \begin{cases} H_0: \quad &\text{ La serie es estacionaria} \\ H_1: \quad &\text{La serie NO es estacionaria} \end{cases} \]
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod2_pre
## KPSS Level = 0.34394, Truncation lag parameter = 4, p-value = 0.1
La prueba de KPSS confirma que los residuos son estacionarios, ya que el p-valor obtenido 0.01 es mayor a 0.05, lo que implica que no se rechaza la hipótesis nula de estacionariedad, dicho de otro modo los residuos son estacioarios.
Ljung–Box Test
La prueba Ljung–Box evalúa si los residuos están libres de autocorrelación, es decir, si parecen ruido blanco.
\[ \begin{cases} H_0: \quad &\text{ No hay autocorrelación → los residuos son ruido blanco} \\ H_1: \quad &\text{Sí hay autocorrelación → el modelo no es adecuado} \end{cases} \]
##
## Box-Ljung test
##
## data: residuo_mod2_pre
## X-squared = 9.6996, df = 8, p-value = 0.2867
arroja un p-valor de 0.2867, mayor a 0.05, lo que indica que no se rechaza la hipótesis nula de independencia. Esto significa que los residuos no presentan autocorrelación significativa y, por lo tanto, se comportan como ruido blanco. En conjunto con el análisis gráfico, estos resultados refuerzan que el modelo captura adecuadamente la dinámica de la serie y que los residuos presentan el comportamiento esperado de un modelo confiable.
Shapiro–Wilk TestShapiro–Wilk Test
Evalúa si los residuos siguen una distribución normal.
\[ \begin{cases} H_0: \quad &\text{Los residuos son normales} \\ H_1: \quad &\text{Los residuos NO son normales} \end{cases} \]
##
## Shapiro-Wilk normality test
##
## data: residuo_mod2_pre
## W = 0.95333, p-value = 0.0008202
La prueba Shapiro-Wilk aplicada a los residuos del segundo modelo ARIMA(0,1,1) arroja un p-valor de 0.00082, menor a 0.05, lo que indica que los residuos no provienen de una distribución normal.
Modelo 3 Precio
## Series: serie_precio
## ARIMA(0,1,1)(0,0,2)[12] with drift
##
## Coefficients:
## ma1 sma1 sma2 drift
## -0.5750 0.1343 -0.3641 22.083
## s.e. 0.0926 0.1107 0.1290 9.653
##
## sigma^2 = 74950: log likelihood = -752.48
## AIC=1514.97 AICc=1515.56 BIC=1528.33
El tercer modelo propuesto es un ARIMA,(0,1,1)(0,0,2)[12] con drift, que combina un componente no estacional de promedio móvil junto con un componente estacional compuesto por dos términos de promedio móvil estacional con periodicidad de 12 meses.
Residuos del Modelo 3 precio
los residuos del tercer modelo muestran un comportamiento generalmente adecuado, la serie de residuos se mantiene alrededor de cero, indicando que la media es finita y la varianza es constante, aunque se observan algunos picos exagerados que representan valores atípicos. Los gráficos de ACF y PACF muestran que todas las autocorrelaciones se encuentran dentro de las bandas de confianza, confirmando que los residuos no presentan dependencia temporal significativa. El QQ-plot revela que, aunque la mayoría de los puntos se ajustan a la línea diagonal, algunas desviaciones en las colas indican ligeras desviaciones de la normalidad.
KPSS Test El test KPSS evalúa si la serie es estacionaria alrededor de una media o tendencia. Los residuos deben ser estacionarios, porque un modelo bien ajustado ya extrajo tendencia y estacionalidad.
\[ \begin{cases} H_0: \quad &\text{ La serie es estacionaria} \\ H_1: \quad &\text{La serie NO es estacionaria} \end{cases} \]
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod3_pre
## KPSS Level = 0.34394, Truncation lag parameter = 4, p-value = 0.1
La prueba de KPSS confirma que los residuos son estacionarios, ya que el p-valor obtenido 0.01 es mayor a 0.05, lo que implica que no se rechaza la hipótesis nula de estacionariedad, dicho de otro modo los residuos son estacioarios.
Ljung–Box Test
La prueba Ljung–Box evalúa si los residuos están libres de autocorrelación, es decir, si parecen ruido blanco.
\[ \begin{cases} H_0: \quad &\text{ No hay autocorrelación → los residuos son ruido blanco} \\ H_1: \quad &\text{Sí hay autocorrelación → el modelo no es adecuado} \end{cases} \]
##
## Box-Ljung test
##
## data: residuo_mod3_pre
## X-squared = 9.6996, df = 9, p-value = 0.3753
arroja un p-valor de 0.3753, mayor a 0.05, lo que indica que no se rechaza la hipótesis nula de independencia, esto significa que los residuos no presentan autocorrelación significativa y, por lo tanto, se comportan como ruido blanco. En conjunto con el análisis gráfico, estos resultados refuerzan que el modelo captura adecuadamente la dinámica de la serie y que los residuos presentan el comportamiento esperado de un modelo confiable.
Shapiro–Wilk TestShapiro–Wilk Test
Evalúa si los residuos siguen una distribución normal.
\[ \begin{cases} H_0: \quad &\text{Los residuos son normales} \\ H_1: \quad &\text{Los residuos NO son normales} \end{cases} \]
##
## Shapiro-Wilk normality test
##
## data: residuo_mod3_pre
## W = 0.95333, p-value = 0.0008202
La prueba Shapiro-Wilk aplicada a los residuos del tecer modelo arroja un p-valor de 0.00082, menor a 0.05, lo que indica que los residuos no provienen de una distribución normal.
Aunque los tres modelos propuestos para la serie de precios del queso campesino en Antioquia mostraron un buen comportamiento gráfico y cumplieron con dos de los tres tests de diagnóstico, el criterio de información AIC indica que el mejor ajuste lo ofrece el tercer modelo. Este modelo presentó un AIC de 1514.97, ligeramente inferior al del primer modelo AIC de 1515.22, lo que sugiere que captura de manera más eficiente la dinámica de la serie. Por lo tanto, se puede concluir que el modelo 3 es el que se ajusta mejor a la serie de precios y es el más adecuado para realizar pronósticos confiables
Prevision para serie precio
Basado en el modelo ARIMA(0,1,1)(0,0,2)[12] con drift que resultó ser el más eficiente según el criterio de AIC, el pronóstico para los precios del queso campesino en Antioquia indica una tendencia al alza durante los próximos meses. Las predicciones muestran un incremento gradual, con una incertidumbre creciente reflejada en los intervalos de predicción más amplios hacia el final del horizonte, lo que es habitual en pronósticos de series de tiempo.
Según el pronóstico del modelo ARIMA, se espera que el precio del queso campesino en Antioquia continúe aumentando en los próximos meses, aunque con una creciente incertidumbre reflejada en intervalos de predicción más amplios hacia adelante. Dado que los residuos no son completamente normales, estos rangos deben interpretarse con cautela: ofrecen estimaciones útiles para planificación, pero no garantías exactas.
Problema
Aunque los precios del queso campesino han aumentado año a año entre 2007 y 2015, parte de esa subida podría explicarse no solo por una mayor demanda o mejor calidad, sino también por la inflación general en Colombia en esos años. Si el poder adquisitivo del peso se reduce debido a la inflación, los costos de producción (insumos, transporte, salarios) también suben, lo que se traslada al precio final del queso. Esto significa que no todo el aumento del precio es ganancia real para los productores, sino una compensación por la pérdida de valor de la moneda.
Reducir costos operativos mediante mejoras en procesos, uso más eficiente de insumos, energía, transporte e invertir en tecnologías o prácticas agrícolas que permitan producir con menor costo relativo por ejemplo ahorro de energía, mejor riego, mejora genética del ganado para que produzca más leche, serian mejoras que se pudran hacer en bsuca de solucinar este problema.
Esta seccion corresponde a la segunda parte del proyecto del curso de Series de Tiempo. En esta fase, el propósito es realizar un análisis estadístico y temporal del Índice de Precios al Consumidor (IPC) para Colombia, específicamente de dos de sus componentes: el IPC Núcleo 15 y el IPC sin alimentos, durante el periodo observado en la base de datos suministrada. El estudio de estas series constituye una herramienta fundamental para comprender el comportamiento inflacionario del país y evaluar las tendencias subyacentes del costo de vida en los hogares colombianos.
A diferencia del IPC general, el IPC Núcleo 15 excluye los quince rubros con mayor variabilidad, lo que permite obtener una medida más estable y menos influenciada por choques transitorios o perturbaciones externas. Por su parte, el IPC sin alimentos elimina uno de los grupos más volátiles del índice, puesto que los precios de los alimentos están fuertemente afectados por la estacionalidad, las condiciones climáticas, los costos de producción y fenómenos externos que pueden generar fluctuaciones significativas. Estos dos indicadores son ampliamente utilizados para analizar la inflación básica y para apoyar la formulación de políticas económicas orientadas a la estabilidad de precios
La base de datos utilizada contiene información mensual y está compuesta únicamente por tres variables fundamentales, a partir de las cuales se desarrolla todo el análisis temporal:
Fecha: Variable de tipo fecha (día/mes/año) que identifica el periodo mensual de la observación.
IPC_nucleo_15: Índice de Precios al Consumidor excluyendo 15 rubros altamente volátiles, considerado un indicador de inflación subyacente.
IPC_sin_alimentos: Índice de Precios al Consumidor excluyendo el grupo de alimentos, utilizado para observar el comportamiento de los precios sin la influencia de uno de los componentes más inestables del IPC general.
Esta fue tomada de: (https://uba.banrep.gov.co/htmlcommons/SeriesHistoricas/precios-inflacion.html)
A lo largo de este trabajo se emplean diversas técnicas estadísticas y herramientas de análisis de series de tiempo, incluyendo análisis descriptivo, visualización gráfica, descomposición de series, pruebas de estacionariedad y métodos de modelamiento. El objetivo principal es describir, comparar y comprender la dinámica temporal de ambas series, así como sus patrones estructurales, estacionalidades y tendencias, para finalmente identificar modelos adecuados que permitan explicar su comportamiento y evaluar su posible evolución futura.
Analisis de la base de datos de IPC
## vars n mean sd median trimmed mad min max range
## fecha 1 204 NaN NA NA NaN NA Inf -Inf -Inf
## IPC_nucleo_15 2 204 94.39 20.52 91.46 92.25 20.65 66.27 142.15 75.88
## IPC_sin_alimentos 3 204 93.37 19.38 90.75 91.44 20.15 66.42 138.62 72.20
## skew kurtosis se
## fecha NA NA NA
## IPC_nucleo_15 0.72 -0.41 1.44
## IPC_sin_alimentos 0.67 -0.46 1.36
El comportamiento del IPC Núcleo 15 muestra un nivel promedio de 94.39 unidades a lo largo del periodo analizado, acompañado de una desviación estándar de 20.52, lo que indica una variabilidad moderada en la inflación subyacente durante los meses observados. El valor mediano 91.46 es ligeramente inferior al promedio, lo cual sugiere una distribución levemente sesgada hacia valores altos, coherente con los cambios inflacionarios graduales del país. En general, los valores del índice se mantienen dentro de un rango relativamente estable minimo de 66.27 lo que refleja que los precios de los bienes y servicios menos volátiles—excluyendo 15 categorías de alta variabilidad—presentaron un comportamiento controlado en el tiempo.
En cuanto al IPC sin alimentos, este presenta un promedio de 93.37 unidades, con una desviación estándar de 19.38, lo que evidencia una variación similar a la del IPC Núcleo 15, aunque ligeramente más moderada. La mediana 90.75 y el valor mínimo 66.42 indican un nivel de inflación estable cuando se excluye el componente de alimentos, uno de los más sensibles a choques de oferta y condiciones externas. La cercanía entre la media y la mediana sugiere una distribución aproximadamente simétrica, lo cual confirma que el comportamiento de los precios no alimentarios ha sido más regular a lo largo del tiempo, sin grandes fluctuaciones extremas.
Boxplot general Distribución del IPC Núcleo 15
El diagrama de cajas del IPC Núcleo 15 muestra una distribución relativamente estable, con la mayoría de los valores concentrados alrededor de la mediana, lo que indica que la inflación subyacente en Colombia ha mantenido un comportamiento moderado y consistente durante el periodo analizado. La amplitud de la caja refleja una variabilidad controlada, sin presencia marcada de valores atípicos, lo cual sugiere que los precios excluyendo los componentes más volátiles han evolucionado de manera gradual y sin cambios abruptos. Este patrón es coherente con la naturaleza del IPC Núcleo 15, que busca capturar tendencias inflacionarias más estructurales y menos sensibles a choques temporales, proporcionando así una visión más estable del comportamiento general de los precios en la economía.
Boxplot año a año de Distribución del IPC Núcleo 15
En vista que son muchos datos se graficó tanto de manera horizontal como vertical la Distribución del IPC Núcleo 15 por Año.
El gráfico evidencia un incremento sostenido y casi ininterrumpido del IPC Núcleo 15 a lo largo del periodo analizado, lo cual refleja que la inflación en Colombia presenta una tendencia estructural al alza. Año tras año, las cajas del boxplot se desplazan hacia valores más altos, señal de que los precios excluyendo los componentes volátiles tienden a aumentar de manera persistente, incluso en ausencia de choques temporales. Se observan algunos valores atípicos en ciertos años, lo que indica meses con presiones de precios más fuertes de lo habitual; sin embargo, estos no alteran la tendencia general.
Histograma del IPC Núcleo 15
El histograma del IPC Núcleo 15 muestra una distribución que no es completamente simétrica, sino que presenta una ligera asimetría hacia la derecha, evidenciada por la presencia de valores relativamente altos que se alejan de la concentración principal. La mayor parte de las observaciones se agrupan entre valores cercanos a 75 y 105, lo que indica que durante la mayor parte del periodo estudiado la inflación subyacente se mantuvo en niveles moderados. La curva de densidad refuerza esta idea, mostrando dos zonas de mayor concentración, reflejo de etapas con diferentes ritmos inflacionarios. Además, la media 94.39 se ubica por encima de la mediana 91.46, lo que confirma la asimetría positiva producto de algunos valores elevados en los años recientes.
Boxplot general Distribución del IPC sin alimentos
El diagrama de cajas del IPC sin alimentos muestra que esta serie mantiene una variabilidad moderada, concentrándose principalmente entre valores medios cercanos a 80 y 105. La mediana se ubica alrededor del centro del rango intercuartílico, lo que indica que los valores no están fuertemente sesgados hacia arriba o hacia abajo. Los bigotes reflejan que, aunque existen meses con niveles de inflación sin alimentos relativamente más altos, estos no se consideran valores atípicos extremos dentro del comportamiento histórico de la serie.
Boxplot por año Distribución del IPC sin alimentos
En vista que son muchos datos se graficó tanto de manera horizontal como vertical la Distribución del IPC sin alimentos por Año.
El boxplot por año del IPC sin alimentos revela una trayectoria claramente ascendente en el nivel general de precios excluyendo alimentos, lo cual es coherente con el comportamiento natural de los índices de precios que, al acumular variaciones positivas mes a mes, tienden a crecer de forma sostenida en el tiempo. En casi todos los años se observa un incremento gradual en la mediana y en el rango intercuartílico, mostrando que el nivel de inflación de los bienes y servicios no alimentarios se ha elevado de manera casi constante.
Histograma del IPC IPC sin Alimentos
El histograma del IPC sin alimentos muestra una distribución asimétrica hacia la derecha, donde la mayor concentración de valores se encuentra entre aproximadamente 75 y 100 puntos. Esto indica que, durante la mayor parte del periodo 2007–2015, el índice se mantuvo en niveles moderados. La presencia de una cola más larga hacia valores altos sugiere algunos meses con incrementos relativamente más fuertes, aunque poco frecuentes, además, se observa que la media 93.36 es ligeramente mayor que la mediana 90.87, lo que refuerza la presencia de valores atípicos o poco comunes en el extremo superior que están empujando la media hacia arriba.
Correlacion
## [1] 0.9994159
Grafica de la correlacion
El coeficiente de correlación obtenido r= 0.9994 indica una relación prácticamente perfecta y positiva entre el IPC Núcleo 15 y el IPC sin Alimentos. Esto significa que ambas series se mueven casi exactamente en la misma dirección a lo largo del tiempo.
Este nivel tan alto de asociación no suele ocurrir por casualidad; más bien refleja que ambas variables capturan tendencias muy similares de la inflación subyacente en Colombia. Aunque cada una excluye grupos diferentes del gasto el IPC sin alimentos excluye únicamente alimentos, mientras que el IPC núcleo 15 excluye un conjunto más amplio de rubros volátiles, ambas terminan midiendo el comportamiento de los precios estables y menos afectados por choques temporales, como servicios, arriendos, transporte, salud y otros bienes no perecederos.
Ajuste de distribuciones al conjunto de datos
Ajuste de distribuciones para IPC Núcleo 15
## Distribución AIC BIC
## 2 Log-normal 1045.278 1050.836
## 3 Gamma 1049.092 1054.650
## 1 Normal 1060.223 1065.781
## 4 Weibull 1069.972 1075.531
Al comparar los ajustes de las distribuciones mediante los criterios AIC y BIC, se observa que la distribución Log-normal presenta los valores más bajos en ambos indicadores AIC = 1045.28 y BIC = 1050.84. Esto indica que es el modelo que mejor captura el comportamiento estadístico del IPC Núcleo 15.
Las gráficas diagnósticas del modelo Log-normal muestran un ajuste altamente satisfactorio para la variable IPC Núcleo 15. En el QQ-plot, los puntos se alinean de manera muy cercana a la diagonal roja, lo que indica que los cuantiles teóricos y empíricos coinciden casi perfectamente, evidenciando un sesgo mínimo. De manera similar, en el PP-plot, los puntos siguen de forma estable la línea de referencia, lo que confirma que las probabilidades acumuladas teóricas describen con precisión el comportamiento empírico de los datos. Además, en la gráfica de densidad la curva teórica se superpone de forma armónica sobre el histograma, reflejando que la forma general de la distribución observada responde bien al patrón Log-norma.
Ajuste de distribuciones al conjunto de datos
Ajuste de distribuciones para IPC sin alimentos
## Distribución AIC BIC
## 2 Log-normal 1033.561 1039.119
## 3 Gamma 1036.854 1042.412
## 1 Normal 1046.679 1052.237
## 4 Weibull 1056.805 1062.363
Los resultados del análisis comparativo entre las distribuciones evaluadas indican que la Log-normal es nuevamente la que mejor se ajusta al comportamiento del IPC sin alimentos, ya que presenta los valores más bajos de AIC y BIC frente a las demás alternativas (Normal, Gamma y Weibull). Esto sugiere que los datos de esta variable tienen una estructura asimétrica positiva suave, típica de procesos económicos en los que los valores no pueden ser negativos y tienden a crecer de manera acumulativa en el tiempo.
Serie IPC Núcleo 15 en Colombia
La serie del IPC Núcleo 15 muestra un comportamiento claramente creciente y sostenido desde 2008 hasta 2025, con muy pocas oscilaciones a lo largo del tiempo. Esta suavidad en el movimiento refleja que los precios incluidos en este indicador al excluir los bienes más volátiles responden principalmente a factores estructurales y persistentes, lo que genera una inflación estable pero continuamente ascendente, entre 2010 y 2019 el aumento es moderado y constante, mientras que a partir de 2021 la serie exhibe un crecimiento más pronunciado, evidenciando una aceleración inflacionaria asociada a choques recientes como la pandemia, costos de producción y presiones globales. Hacia 2025 el índice alcanza sus niveles máximos, sin presentar descensos importantes en ningún periodo, lo que confirma la fuerte inercia inflacionaria propia del núcleo 15.
La descomposición del IPC Núcleo 15 revela que su comportamiento está dominado por una tendencia claramente creciente, que avanza de forma estable en los primeros años y luego se acelera notablemente después de 2020, reflejando presiones inflacionarias más persistentes en los componentes subyacentes. La estacionalidad muestra un patrón anual estable y repetitivo, lo que indica que los movimientos mensuales del índice responden a ciclos regulares de la economía, típicos de precios menos volátiles como servicios, arriendos y otros componentes no transitorios. Por su parte, el componente aleatorio permanece suave y de baja variabilidad antes de 2020, pero se vuelve más disperso e irregular en los años posteriores, señal de choques económicos más fuertes o frecuentes.
Test de Dickey-Fuller aumentado (ADF)
\[ \begin{cases} H_0: \quad &\text{la serie no es estacionaria, tiene raíz unitaria} \\ H_1: \quad &\text{la serie es estacionaria, no tiene raíz unitaria} \end{cases} \]
##
## Augmented Dickey-Fuller Test
##
## data: serie_ipc_n15
## Dickey-Fuller = -0.16444, Lag order = 5, p-value = 0.99
## alternative hypothesis: stationary
El test muestra un p-value = 0.99, muy superior al nivel usual de significancia, esto indica que no existe evidencia estadística para rechazar la hipótesis nula de raíz unitaria, por lo que la serie no es estacionaria
Ndiffs
La función ndiffs muetra el numero diferencias necesaria para que la serie sea estacionaria
## [1] 2
Según el análisis de diferenciación (ndiffs), la serie del IPC Núcleo 15 requiere dos diferencias para volverse estacionaria. Esto confirma que la serie presenta una fuerte tendencia integrada y que solo después de aplicar d = 2 logra cumplir las condiciones de estacionariedad necesarias para modelación temporal.
Aplicacion de diferencia
##
## Augmented Dickey-Fuller Test
##
## data: segunda_diferencia
## Dickey-Fuller = -8.4054, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary
Tras aplicar las dos diferencias necesarias, la serie del IPC Núcleo 15 finalmente se comporta como estacionaria, eliminando la tendencia y estabilizando la varianza. Esto permite avanzar a la siguiente etapa del análisis, donde se procederá a graficar la serie diferenciada y evaluar su comportamiento, así como a explorar posibles modelos ARIMA adecuados para su estructura temporal.
Serie diferenciada
ACF y PACF de serie estacionaria de IPC nucleo 5
La segunda diferencia logró volver la serie estacionaria, como se
observa en que tanto el ACF como el PACF muestran la mayoría de los
rezagos dentro de las bandas de significancia, sin patrones
persistentes; ambos gráficos presentan un único pico notable en el
rezago 1, lo que sugiere la presencia de componentes AR(1) y MA(1) en la
serie ya diferenciada. En conjunto, esto indica que la estructura
remanente es simple y compatible con un modelo ARIMA de bajo orden,
típicamente un ARIMA(1,2,1), evidenciando que la tendencia y cualquier
estacionalidad fueron removidas adecuadamente y que la dinámica restante
es estable y poco autocorrelacionada.
Elección del mejor modelo
Segun Hyndman, R. J. (2023), auto.arima devuelve el mejor modelo ARIMA según los valores AIC, AICc o BIC. La función realiza una búsqueda entre los modelos posibles dentro de las restricciones de orden proporcionadas.
## Series: serie_ipc_n15
## ARIMA(1,1,2)(0,1,2)[12]
##
## Coefficients:
## ar1 ma1 ma2 sma1 sma2
## 0.9368 -0.2808 -0.1805 -0.5232 -0.2235
## s.e. 0.0356 0.0823 0.0849 0.0804 0.0819
##
## sigma^2 = 0.02531: log likelihood = 79.21
## AIC=-146.42 AICc=-145.96 BIC=-126.9
El modelo identificado corresponde a un ARIMA(1,1,2)(0,1,2)[12]. En la parte no estacional, incorpora una diferenciación de primer orden para eliminar la tendencia observada en la serie,un termino de proceso autorregresivo y dos términos de media móvil (MA(1) y MA(2)) que capturan la dependencia de los errores recientes y permiten modelar la correlación a corto plazo en los rezagos inmediatos. En la componente estacional, el modelo incluye un dos terminos de medias moviles estacional con periodicidad 12, el modelo puede expresarse como
\[ X_t = 0.9368 X_{t-1} -0.2808 \varepsilon_{t-1} -01805\varepsilon_{t-2} - 0.5232 \varepsilon_{t-12} - 0.2235 \varepsilon_{t-24} + \varepsilon_{t} \]
Residuos del Modelo 1 de IPC nucleo 15
Los residuos del modelo aplicado al IPC muestran un comportamiento adecuado: presentan media finita y varianza estable, y tanto el ACF como el PACF indican ausencia de autocorrelación, pues todos los rezagos caen dentro de las bandas de significancia; esto confirma que los residuos se comportan como ruido blanco. Sin embargo, el gráfico Q–Q revela desviaciones respecto a la línea diagonal, lo que indica que, aunque el modelo captura bien la dinámica temporal, los residuos no siguen una distribución normal perfecta, mostrando colas más pesadas o algunos valores atípicos; aun así, desde el punto de vista de autocorrelación, el modelo está bien especificado.
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod1_ipc_15
## KPSS Level = 0.14891, Truncation lag parameter = 4, p-value = 0.1
##
## Box-Ljung test
##
## data: residuo_mod1_ipc_15
## X-squared = 12.716, df = 9, p-value = 0.1759
##
## Shapiro-Wilk normality test
##
## data: residuo_mod1_ipc_15
## W = 0.92677, p-value = 0.00000001457
Los resultados de los tres tests indican que los residuos del modelo presentan estacionariedad, pues el test KPSS no rechaza la hipótesis nula de estacionariedad p-value = 0.1; además, el test de Box-Ljung muestra un p-value alto 0.1759, lo que implica que no hay autocorrelación significativa en los residuos y, por tanto, estos se comportan como ruido blanco; sin embargo, el test de Shapiro-Wilk arroja un p-value extremadamente bajo, lo que lleva a rechazar la normalidad, indicando que los residuos no provienen de una distribución normal, probablemente debido a colas pesadas o valores atípicos, aunque esto no afecta la validez general del modelo en términos de independencia y estacionariedad.
Modelo 2
## Series: serie_ipc_n15
## ARIMA(2,1,1)(0,1,2)[12]
##
## Coefficients:
## ar1 ar2 ma1 sma1 sma2
## 1.3657 -0.3978 -0.7147 -0.5255 -0.2294
## s.e. 0.1413 0.1270 0.1098 0.0805 0.0822
##
## sigma^2 = 0.02521: log likelihood = 79.49
## AIC=-146.99 AICc=-146.53 BIC=-127.48
El modelo seleccionado corresponde a un ARIMA(2,1,1)(0,1,2)[12], el cual aplica una diferenciación no estacional de primer orden para eliminar la tendencia propia de la serie IPC, mientras que en la parte no estacional incorpora dos términos autorregresivos (AR(1) y AR(2)) y un término de media móvil (MA(1)) que capturan la dependencia dinámica de corto plazo mediante los rezagos de la serie y de los errores. En la componente estacional, el modelo incluye dos términos de media móvil estacional con periodicidad 12. Con los coeficientes estimados, el modelo puede expresarse de manera aproximada como:
Residuos del Modelo 2 de IPC nucleo 15
En comparación con los gráficos de los residuos del primer modelo, los residuos del segundo modelo ARIMA(2,1,1)(0,1,2)[12] muestran un comportamiento claramente superior: la serie residual se observa más estable alrededor de cero, tanto el ACF como el PACF presentan todos sus rezagos dentro de las bandas de significancia sin patrones persistentes, lo que indica ausencia de autocorrelación y un ajuste más adecuado, y el Q–Q plot, aunque no perfecto, exhibe una alineación más cercana a la diagonal, sugiriendo una aproximación más consistente a la normalidad.
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod2_ipc_15
## KPSS Level = 0.14864, Truncation lag parameter = 4, p-value = 0.1
##
## Box-Ljung test
##
## data: residuo_mod2_ipc_15
## X-squared = 15.036, df = 12, p-value = 0.2395
##
## Shapiro-Wilk normality test
##
## data: residuo_mod2_ipc_15
## W = 0.93255, p-value = 0.00000004226
Los resultados de los tests aplicados a los residuos del segundo modelo ARIMA(2,1,1)(0,1,2)[12] indican que, al igual que con el primer modelo, los residuos son estacionarios, ya que el test KPSS no rechaza la hipótesis nula de estacionariedad p-value = 0.1; el test de Box-Ljung arroja un p-value alto 0.2395, confirmando que no existe autocorrelación significativa y que los residuos se comportan como ruido blanco. Por otro lado, el test de Shapiro-Wilk sigue indicando un p-value extremadamente bajo, lo que significa que los residuos no siguen una distribución normal, probablemente debido a colas pesadas o valores atípicos, aunque esto no afecta la validez del modelo para capturar la dinámica temporal de la serie.
modelo 3
## Series: serie_ipc_n15
## ARIMA(2,2,3)
##
## Coefficients:
## ar1 ar2 ma1 ma2 ma3
## 1.5519 -0.7646 -1.7985 0.8381 0.0477
## s.e. 0.0796 0.1199 0.1071 0.2522 0.1452
##
## sigma^2 = 0.04611: log likelihood = 25.48
## AIC=-38.97 AICc=-38.54 BIC=-19.12
El modelo seleccionado corresponde a un ARIMA(2,2,3), el cual aplica una doble diferenciación (d = 2) para eliminar la tendencia determinística y estabilizar la media de la serie IPC analizada. En la parte no estacional, el modelo incorpora dos términos autorregresivos (AR(1) y AR(2)) y tres términos de media móvil (MA(1), MA(2) y MA(3)), que permiten capturar la dependencia dinámica tanto de valores pasados como de los errores recientes en diferentes rezagos.Sin embargo, a pesar de que el ARIMA(2,2,3) presenta un ajuste razonable, su valor de AIC resulta más alto en comparación con los modelos previamente propuestos, lo que indica que no es el modelo más eficiente según este criterio de información. Dado que un AIC menor refleja un mejor compromiso entre ajuste y complejidad, este modelo sería descartado como opción óptima dentro del proceso de selección. No obstante, se procederá igualmente a realizar el análisis de sus residuos.
Residuos del Modelo 3 de IPC nucleo 15
A partir de la inspección gráfica de los residuos del modelo ARIMA(2,2,3), en general el comportamiento residual parece adecuado, aunque con algunos matices importantes. En el primer gráfico, correspondiente a la serie de residuos, se observa que estos fluctúan alrededor de una media cercana a cero y mantienen una varianza relativamente constante, lo cual es consistente con la estacionariedad requerida para los errores. No obstante, se aprecian algunos picos puntuales de mayor magnitud, que podrían indicar episodios aislados de perturbaciones atípicas en la serie En las gráficas de ACF y PACF, los residuos se mantienen mayoritariamente dentro de las bandas de significancia, lo que sugiere la ausencia de autocorrelación relevante y, en consecuencia, que el modelo logra capturar adecuadamente la estructura temporal de la serie sin dejar patrones sistemáticos en los errores. Por otro lado, el QQ-plot evidencia que los residuos no siguen una distribución normal, presentando colas pesadas que se desvían notablemente de la línea teórica. Esto indica la presencia de valores extremos más frecuentes de lo esperado bajo normalidad, lo cual no invalida necesariamente el modelo, pero sí señala que el supuesto de normalidad no se cumple plenamente.
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod3_ipc_15
## KPSS Level = 0.14864, Truncation lag parameter = 4, p-value = 0.1
##
## Box-Ljung test
##
## data: residuo_mod3_ipc_15
## X-squared = 10.975, df = 7, p-value = 0.1397
##
## Shapiro-Wilk normality test
##
## data: residuo_mod3_ipc_15
## W = 0.93255, p-value = 0.00000004226
Los resultados de las pruebas aplicadas a los residuos del modelo ARIMA(2,2,3) indican que el comportamiento residual es adecuado en términos de estacionariedad y ausencia de autocorrelación. En primer lugar, el test KPSS no rechaza la hipótesis nula de estacionariedad (p-value = 0.1), por lo que los residuos pueden considerarse estacionarios en nivel. Por su parte, el test de Box–Ljung arroja un p-value alto 0.1397, lo que confirma que no existe autocorrelación significativa en los residuos y que estos se comportan como ruido blanco, coherente con las expectativas de un modelo ARIMA bien especificado.
Sin embargo, el test de Shapiro–Wilk muestra un p-value extremadamente bajo (≈ 4.2e-8), indicando que los residuos no siguen una distribución normal, posiblemente debido a la presencia de colas pesadas o valores atípicos, tal como también se observó en el QQ-plot.
Mejor modelo para IPC nucleo 15
En conclusión, tras evaluar diferentes especificaciones ARIMA y SARIMA para la serie del IPC Núcleo 15, el modelo que mostró el mejor desempeño fue el ARIMA(2,1,1)(0,1,2)[12], debido principalmente a que presentó el menor AIC, evidenciando el mejor equilibrio entre ajuste y simplicidad. Además, el análisis de sus residuos confirmó la adecuación del modelo: estos se comportaron como ruido blanco, sin autocorrelación y con comportamiento estacionario según las pruebas KPSS y Ljung–Box, aunque el test de Shapiro–Wilk indicó falta de normalidad por la presencia de colas pesadas, lo cual no afecta su validez para capturar la dinámica temporal de la serie. Por estas razones, este modelo se considera el que mejor representa el comportamiento del IPC Núcleo 15 en el periodo analizado.
Prevision para para IPC nucleo 15
Núcleo 15, el pronóstico indica una tendencia creciente en los valores del índice durante los próximos meses. Las predicciones reflejan un aumento gradual con una incertidumbre creciente, visible en los intervalos de confianza que se amplían conforme avanza el horizonte de pronóstico, lo cual es común en modelos de series de tiempo.
Este comportamiento es consistente con la naturaleza del IPC Núcleo 15, que mide la inflación subyacente excluyendo los rubros más volátiles, mostrando una inflación estructural y sostenida. Aunque los residuos del modelo no cumplen completamente con la normalidad, lo que implica que los intervalos de predicción deben interpretarse con cierta cautela, el modelo sigue siendo una herramienta valiosa para la planificación y evaluación del comportamiento inflacionario en Colombia.
Problema
La serie del IPC Núcleo 15 muestra un crecimiento sostenido año tras año, lo cual refleja que existe una inflación estructural persistente en Colombia. Este incremento no solo responde a choques temporales, sino a una subida continua de precios de bienes y servicios como vivienda, educación, salud, transporte, etc. lo que sugiere que parte de la inflación es de fondo y no fácilmente eliminable. Solucionar esto es realmentecomplejo solo puede lograr con politicas manetaria mas activa en busca de anticipar esto problema o minimizarlos.
La serie presenta una tendencia clara y sostenida al alza a lo largo del tiempo, indicando que los precios sin alimentos han ido aumentando progresivamente durante el periodo analizado, el componente estacional revela un patrón repetitivo muy definido con periodicidad anual, lo que sugiere que hay fluctuaciones regulares relacionadas con factores estacionales que afectan esta serie. Esta estacionalidad puede deberse a factores económicos, sociales o climáticos que impactan los precios de los bienes y servicios excluyendo alimentos, Componente aleatorio residual estacionario: La parte de ruido o componente aleatorio parece no mostrar tendencias ni patrones sistemáticos, lo que indica que, una vez descontada la tendencia y estacionalidad, los residuos podrían ser considerados estacionarios.
Test de Dickey-Fuller aumentado (ADF)
Se muestrará si la serie es estacionaria.
\[ \begin{cases} H_0: \quad &\text{la serie no es estacionaria, tiene raíz unitaria} \\ H_1: \quad &\text{la serie es estacionaria} \end{cases} \]
##
## Augmented Dickey-Fuller Test
##
## data: serie_ipc_sin_alimentos
## Dickey-Fuller = -0.06124, Lag order = 5, p-value = 0.99
## alternative hypothesis: stationary
Luego de aplicar el test de Dickey-Fuller aumentado (ADF) sobre la serie IPC sin alimentos, se obtuvo un valor p de aproximadamente 0.99, que es mucho mayor que un nivel de significancia típico de 0.05. Por lo tanto, no se rechaza la hipótesis nula de que la serie posee una raíz unitaria, es decir, que no es estacionaria. Esto indica que la serie presenta una tendencia o comportamiento no estacionario, y que es necesario realizar transformaciones como diferenciación para eliminar esa no estacionariedad antes de ajustar modelos ARIMA u otros modelos de series de tiempo.
La función ndiffs muetra el numero diferencias necesaria para que la serie sea estacionaria
## [1] 2
El resulatado ndiffs a la serie feu 2 indicando que se necesitan 2 diferencias significa que para lograr que la serie sea estacionaria es necesario aplicar la diferenciación dos veces. Esto confirma que la serie tiene una fuerte componente de tendencia o raíz unitaria.
serie diferanciada
##
## Augmented Dickey-Fuller Test
##
## data: segunda_diferencia_sin_alimento
## Dickey-Fuller = -8.3422, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary
Luego de aplicar la segunda diferenciación a la serie IPC sin alimentos y realizar nuevamente el test de Dickey-Fuller aumentado (ADF), se obtuvo un valor de p menor a 0.01. Esto indica que ahora se rechaza la hipótesis nula de raíz unitaria, es decir, la serie diferenciada es estacionaria.
Modelo 1 IPC sin alimentos
## Series: serie_ipc_sin_alimentos
## ARIMA(2,1,1)(0,1,2)[12]
##
## Coefficients:
## ar1 ar2 ma1 sma1 sma2
## 1.2033 -0.2433 -0.6585 -0.5615 -0.1787
## s.e. 0.1518 0.1346 0.1213 0.0762 0.0752
##
## sigma^2 = 0.02763: log likelihood = 70.95
## AIC=-129.91 AICc=-129.45 BIC=-110.39
El primer modelo propuesto para la serie IPC sin alimentos corresponde a un ARIMA(2,1,1)(0,1,2)[12], el cual incluye dos términos autorregresivos (AR1 y AR2) y un término de media móvil (MA1) en la parte no estacional, además de dos términos de media móvil estacional (SMA1 y SMA2) con periodicidad 12 meses. Este modelo aplica una diferenciación simple en la parte no estacional y una diferenciación estacional para eliminar la tendencia y la estacionalidad presentes en la serie. Los coeficientes estimados sugieren una dinámica compleja que captura tanto las dependencias a corto plazo como las influencias estacionales en los datos. Con un AIC de -129.91, este modelo se presenta como una opción sólida para representar el comportamiento temporal del IPC sin alimentos.
Residuos del Modelo 1 IPC sin alimentos
Gráficamente, los residuos del modelo muestran un comportamiento adecuado en general. En la ACF, todos los valores se mantienen dentro de las bandas de confianza, indicando ausencia de autocorrelación significativa. Sin embargo, en la PACF se observa un valor que sobresale claramente de las bandas, lo que sugiere una posible dependencia a corto plazo no capturada completamente por el modelo. En el QQ-plot, los residuos se alinean aproximadamente sobre la diagonal, aunque se observan algunas desviaciones en las colas, indicando que no son completamente normales. La serie de residuos parece centrada en cero y con varianza constante, aunque hacia el final se detectan algunos picos altos y bajos. Para confirmar formalmente la validez de los residuos como ruido blanco estacionario y evaluar su normalidad, se procederá a realizar tests estadísticos como KPSS, Box-Ljung y Shapiro-Wilk.
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod1_ipcsinalimentos
## KPSS Level = 0.13006, Truncation lag parameter = 4, p-value = 0.1
##
## Box-Ljung test
##
## data: residuo_mod1_ipcsinalimentos
## X-squared = 9.0084, df = 9, p-value = 0.4365
##
## Shapiro-Wilk normality test
##
## data: residuo_mod1_ipcsinalimentos
## W = 0.94022, p-value = 0.0000001895
Luego de aplicar los tests estadísticos a los residuos del modelo ARIMA(2,1,1)(0,1,2)[12] para la serie IPC sin alimentos, se pueden hacer las siguientes conclusiones:
Estacionariedad (KPSS test): El valor p = 0.1 es mayor que 0.05, por lo que no se rechaza la hipótesis nula de que los residuos son estacionarios. Esto confirma que, una vez descontada la tendencia y estacionalidad, la serie de residuos se comporta como un proceso estable en torno a media cero.
Ausencia de autocorrelación (Box-Ljung test): El test arroja un p-valor de 0.4365, lo que indica que no existe autocorrelación significativa en los residuos. Esto sugiere que los residuos se comportan como ruido blanco, sin dependencias temporales no modeladas.
Normalidad (Shapiro-Wilk test): El valor p extremadamente bajo (≈ 1.9e-7) indica que los residuos no siguen una distribución normal, probablemente debido a colas pesadas o algunos valores atípicos. Aunque no cumplen con la normalidad, esto no compromete la validez del modelo para capturar la dinámica de la serie.
## Series: serie_ipc_sin_alimentos
## ARIMA(2,2,3)
##
## Coefficients:
## ar1 ar2 ma1 ma2 ma3
## 1.6328 -0.8739 -1.9775 1.2267 -0.1544
## s.e. 0.0582 0.0613 0.1206 0.2318 0.1196
##
## sigma^2 = 0.04619: log likelihood = 25.19
## AIC=-38.37 AICc=-37.94 BIC=-18.52
El segundo modelo propuesto es un ARIMA(2,2,3) sin componente estacional, que incluye dos términos autorregresivos (AR1 y AR2) y tres términos de media móvil (MA1, MA2 y MA3), aplicando una diferenciación de segundo orden para eliminar la tendencia acumulada en la serie. Aunque captura la dinámica no estacional de la serie, su AIC es -38.37, considerablemente más alto que el primer modelo ARIMA(2,1,1)(0,1,2)[12] (-129.91). Esto indica que, comparado con el primer modelo, su ajuste no representa adecuadamente la estacionalidad presente en los datos.
Residuos del Modelo 2 IPC sin alimentos
Al analizar gráficamente los residuos del modelo, se observa que la serie presenta problemas de ajuste. En las gráficas de ACF y PACF, muchos valores se encuentran fuera de las bandas de confianza, lo que indica autocorrelación significativa no capturada por el modelo. En el QQ-plot, una gran cantidad de puntos se aleja de la diagonal, mostrando que los residuos no siguen una distribución normal y presentan colas pesadas. Estos resultados sugieren que el modelo, aunque captura la dinámica general y la estacionalidad de la serie, no logra representar completamente todas las dependencias temporales ni la distribución de los errores, por lo que los pronósticos deben interpretarse con cautela y podrían mejorarse ajustando otros parámetros o considerando modelos alternativos.
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod2_ipcsinalimentos
## KPSS Level = 0.078144, Truncation lag parameter = 4, p-value = 0.1
##
## Box-Ljung test
##
## data: residuo_mod2_ipcsinalimentos
## X-squared = 81.108, df = 7, p-value = 0.000000000000008216
##
## Shapiro-Wilk normality test
##
## data: residuo_mod2_ipcsinalimentos
## W = 0.96955, p-value = 0.0002115
Estacionariedad (KPSS test): El valor p = 0.1 es mayor que 0.05, por lo que la hipótesis nula de estacionariedad no se rechaza. Esto indica que, al menos en cuanto a nivel de estacionariedad, los residuos se comportan de manera adecuada.
Autocorrelación (Box-Ljung test): El valor p ≈ 8.2e-12 es extremadamente bajo, lo que indica que sí existe autocorrelación significativa en los residuos. Esto confirma lo que se observó en las gráficas de ACF y PACF, donde muchos valores estaban fuera de las bandas de confianza.
Normalidad (Shapiro-Wilk test): El p-valor = 0.0002115 indica que los residuos no son normales, lo cual también coincide con las desviaciones observadas en el QQ-plot.
## Series: serie_ipc_sin_alimentos
## ARIMA(1,2,1)(0,1,2)[12]
##
## Coefficients:
## ar1 ma1 sma1 sma2
## 0.2857 -0.7102 -0.5677 -0.1763
## s.e. 0.1228 0.0872 0.0765 0.0763
##
## sigma^2 = 0.02829: log likelihood = 64.1
## AIC=-118.19 AICc=-117.86 BIC=-101.96
Aunque el tercer modelo SARIMA(1,2,1)(0,1,2)[12] mostró un ajuste razonable para la serie de IPC sin alimentos, con AIC=-118.19 y coeficientes que capturan la dinámica estacional, al comparar con los modelos anteriores se observa que el primer modelo es el más adecuado, ya que presenta un menor AIC y mejor balance entre ajuste y parsimonia, por lo que se perfila como el candidato más sólido para describir la serie y realizar pronósticos.
Residuos del Modelo 3 IPC sin alimentos
Al analizar gráficamente los residuos del tercer modelo SARIMA(1,2,1)(0,1,2)[12] mediante el gráfico de residuos, ACF, PACF y QQ-plot, se observa un buen comportamiento general: las series de autocorrelación (ACF y PACF) permanecen dentro de las bandas de confianza, los residuos parecen centrados en cero y con varianza constante a lo largo del tiempo, lo que sugiere ausencia de autocorrelación y homocedasticidad; sin embargo, en el QQ-plot se aprecia que varios puntos se alejan de la diagonal, indicando que los residuos no siguen perfectamente una distribución normal, por lo que será necesario corroborar esta conclusión con pruebas estadísticas formales como el test de normalidad.
##
## KPSS Test for Level Stationarity
##
## data: residuo_mod3_ipcsinalimentos
## KPSS Level = 0.070359, Truncation lag parameter = 4, p-value = 0.1
##
## Box-Ljung test
##
## data: residuo_mod3_ipcsinalimentos
## X-squared = 8.522, df = 10, p-value = 0.578
##
## Shapiro-Wilk normality test
##
## data: residuo_mod3_ipcsinalimentos
## W = 0.9464, p-value = 0.0000006893
Los resultados de las pruebas estadísticas sobre los residuos del tercer modelo SARIMA(1,2,1)(0,1,2)[12] muestran que son aproximadamente estacionarios (KPSS p=0.1) e independientes (Box-Ljung p=0.578), con media cercana a cero y varianza constante, lo que indica un buen ajuste en términos de autocorrelación y homocedasticidad; sin embargo, el test de Shapiro-Wilk (p ≈ 0) evidencia que los residuos no siguen una distribución normal, por lo que los intervalos de predicción basados en normalidad podrían no ser completamente precisos
Con base en el análisis realizado, se puede concluir que el modelo que mejor se comporta para la serie de IPC sin alimentos es un ARIMA(2,1,1)(0,1,2)[12], con coeficientes AR(1)=1.2033, AR(2)=-0.2433, MA(1)=-0.6585, SMA(1)=-0.5615 y SMA(2)=-0.1787, varianza del error σ²=0.02763 y log-likelihood=70.95. Este modelo se destaca principalmente por tener un AIC de -129.91, menor que el de los modelos anteriores, lo que indica un mejor equilibrio entre ajuste y parsimonia, y además los residuos presentan un comportamiento más adecuado, siendo aproximadamente estacionarios, independientes, centrados en cero y con varianza constante, lo que confirma que captura de manera más confiable la dinámica de la serie, incluyendo tendencia y estacionalidad, para la realización de pronósticos.
Prevision para para IPC sin alimentos
El pronóstico de la serie IPC sin alimentos indica que la tendencia de
crecimiento se mantendrá en los próximos meses. Esto significa que la
inflación subyacente continuará aumentando, reflejando presiones
estructurales en los precios de bienes y servicios no alimentarios.
Problema
La serie del IPC sin alimentos muestra un crecimiento sostenido año tras año, reflejando que la inflación subyacente en Colombia también es persistente y no transitoria. Esto implica que los precios de bienes y servicios no alimentarios, tienden a subir constantemente, lo que afecta el poder adquisitivo de los hogares y aumenta los costos para las empresas. A diferencia del IPC general, este índice filtra la alta volatilidad de los alimentos, por lo que el aumento continuo se interpreta como una presión inflacionaria estructural, como solucion se debe aplicar Política monetaria proactiva mantener tasas de interés consistentes con la meta de inflación para evitar que la inflación subyacente se acelere.
Bibliografia
Modelos Arima. (s. f.). Recuperado de (https://gc.scalahed.com/recursos/files/r161r/w24503w/Box-Jenkins.PDF)
Cuéllar, J. L. G. (c.a.). [Prueba de Raíz Unitaria de Dickey & Fuller] Recuperado de: (https://rpubs.com/JessicaCuellar/843574)
Hy nmn J. L. (2025). ndiffs: Number of differences required for a stationary series [Function documentation]. In forecast (version 8.24.0). Recuperado de [https://www.rdocumentation.org/packages/forecast/versions/8.24.0/topics/ndiffs] (https://www.rdocumentation.org/packages/forecast/versions/8.24.0/topics/ndiffs)
IndexMundi. (s. f.). Colombia — Inflación (precios al consumidor, % anual). Obtenido
(https://www.indexmundi.com/es/datos/colombia/inflaci%C3%B3n?utm_source)
Díaz Rubio, M. M. (31 de julio de 2025). Agosto será más caluroso de lo normal, aunque con algunas lluvias. Alerta Paisa. Sistema Integrado de Información. Obtenido de Alerta Paisa: (https://www.alertapaisa.com/noticias/valle-de-aburra/agosto-sera-mas-caluroso-de-lo-normal-aunque-con-algunas-lluvias?utm_source)
Hyndman, R. J. (2023). auto.arima: Fit best ARIMA model to univariate time series (Versión 8.24.0) [Función del paquete forecast para R]. RDocumentation. Recuperado de (https://www.rdocumentation.org/packages/forecast/versions/8.24.0/topics/auto.arima)
Villar‑Gómez, L. (3 de diciembre de 2024). Notas del Gerente general en el Foro Perspectivas Económicas Corficolombiana. Banco de la República. Obtenido de(https://www.banrep.gov.co/es/publicaciones-investigaciones/palabras-foro-perspectivas-economicas-corficolombiana?utm_source)