Se estudia el precio histórico del oro, en dólares, entre enero del año 2008 a marzo de 2021, en total son 159 meses. La Figura (1) corresponde a la gráfica de la serie de tiempo.
Precio del oro.
Precio del oro con una diferencia y sin media.
La gráfica no se parece a la de un proceso estacionario, se realizó el test Augmented Dickey-Fuller de raíz unitaria para ver si es estacionario o no. El resultado fue un p-value igual a 0.7835, por lo tanto no se rechaza que el proceso no es estacionario. Entonces, se le aplicó una diferencia \(Y_t=\Delta X_{t}=X_{t}-X_{t-1}\) y se le restó su media \(Z_t = Y_t - \bar{Y}\), el resultado se encuentra graficado en la Figura (2).
La nueva serie de tiempo ya se observa estacionaria, al realizar nuevamente el test de raíz unitaria se obtiene que p-value=0.017, con una significancia de 0.05 se rechaza que el proceso no es estacionario.
Una vez que se tiene la serie estacionaria, se grafica la autocorrelación y la autocorrelación parcial para elegir modelos tentativos que se ajusten bien a los datos. Las Figuras (3) y (4) muestran las gráficas de las sucesiones.
Autocorrelación.
Autocorrelación parcial.
Lo que se observa en el caso de la autocorrelación es que hay dos modelos tentativos MA(1) y MA(6), y en el caso de la autocorrelación parcial: AR(1) y AR(6). En la atucorrelación se observa que el primer lag está fuera de las bandas así como el sexto, sin embargo los lags 2-5 están dentro de la banda, esto mismo ocurre con la autocorrelación parcial. Debido a esto fue que se eligieron los cuatro modelos tentativos.
En la Tabla (1) se muestran los resultados obtenidos después de ajustar los modelos MA(1), MA(6), AR(1) y AR(6). El modelo con menor AIC es el MA(6).
| Modelos | Coeficientes (SE) | AIC |
|---|---|---|
| MA(1) | -0.1477 (0.0805) | 1787.31 |
| MA(6) | -0.0949 (0.0769) 0.0662 (0.0812) 0.0950 (0.0835) -0.1518 (0.0888) 0.0597 (0.0851) 0.2993 (0.0841) | 1782.2 |
| AR(1) | -0.1358 (0.0788) | 1787.59 |
| AR(6) | -0.1442 (0.0768) -0.0291 (0.0779) 0.0375 (0.0770) -0.0840 (0.0778) 0.1110 (0.0786) 0.2689 (0.0779) | 1782.4 |
Para elegir un modelo ARMA(p,q) utilicé un grid de siete valores para p y q, y con ellos ajusté modelos ARMA(p,q), finalmente seleccioné a los tres modelos con menor AIC, estos modelos fueron ARMA(4,6), ARMA(4,7) y ARMA(6,6), con AIC iguales a: 1779.089, 1779.4 y 1779.768, respectivamente.
Para cada modelo ajustado realicé una prueba de Anderson-Darling para ver si los residuales tienen una distribución normal, en la Tabla (2) se encuentra el test y el cuantil a nivel 0.05 %, todos los modelos pasaron el test. Además, en la misma tabla se muestra el AIC de cada modelo, el menor AIC corresponde al modelo ARMA(4,6)
| Modelos | AD | 95 % | AIC |
|---|---|---|---|
| MA(1) | 0.6602 | 0.7496 | 1787.31 |
| MA(6) | 0.5234 | 0.7471 | 1782.2 |
| AR(1) | 0.633 | 0.7496 | 1787.59 |
| AR(6) | 0.4526 | 0.7474 | 1782.4 |
| ARMA(4,6) | 0.4282 | 0.7492 | 1779.09 |
| ARMA(4,7) | 0.3949 | 0.7513 | 1779.4 |
| ARMA(6,6) | 0.4776 | 0.7469 | 1779.77 |
Aunque teóricamente el modelo con menor AIC es el que va a predecir mejor, la realidad fue otra. En la Tabla (3) se muestran las predicciones hechas por cada modelo para el precio del oro de los siguientes cuatro meses: abril, mayo, junio y julio de 2021; así como el MSE:
\[\begin{equation} MSE = \frac{1}{4}\sum_{i=1}^4 (y_i - \hat{y}_i)^2 \end{equation}\]
| Mes | Verdadero | MA(1) | MA(6) | AR(1) | AR(6) | ARMA(4,6) | ARMA(4,7) | ARMA(6,6) |
|---|---|---|---|---|---|---|---|---|
| Abril | 1767.7 | 1701.411 | 1643.219 | 1698.135 | 1676.107 | 1671.945 | 1664.003 | 1665.271 |
| Mayo | 1900 | 1701.411 | 1608.509 | 1697.180 | 1659.026 | 1657.693 | 1646.555 | 1656.874 |
| Junio | 1763.2 | 1701.411 | 1650.875 | 1697.310 | 1701.112 | 1728.603 | 1711.530 | 1738.481 |
| Julio | 1825.8 | 1701.411 | 1633.693 | 1697.292 | 1679.518 | 1723.035 | 1706.401 | 1741.545 |
| MSE | NA | 15780.63 | 37496.05 | 16707.77 | 22927.72 | 19909.81 | 22978.38 | 19328.04 |
Los tres modelos con menor MSE son: MA(1), AR(1) y ARMA(6,6), así que prosigo a ver la bondad de ajuste de estos modelos.
Como muestra la Tabla (2), todos los modelos pasaron la prueba de normalidad, así que falta ver la homoscedasticidad. Sin embargo, me gustaría mostrar las gráficas cuantil-cuantil así como el histograma de los residuales para este modelo. Para los siguientes modelos no incluyo estas gráficas ya que son casi idénticas.
En el histograma se observa que hay normalidad, mientras que en el gráfico de los cuantiles se observa que los puntos en los extremos son los que se alejan de la recta pero los puntos del centro sí están sobre la recta.
Lo que se observa en el gráfico de diganósticos es que la autocorrelación de los residuales se sale de las bandas en el lag 6 lo cual significa que tienen una correlación distinta de cero en el lag 6.
Finalmente, se muestran las predicciones así como los valores reales. Las predicciones del modelo MA(1) son todas el mismo valor 1701.411.
Ahora sigue el modelo AR(1), los residuales del modelo pasaron la prueba de normalidad y su gráfica cuantil cuantil, así como su histograma, también muestran normalidad. En cuanto a la homoscedasticidad, nuevamente el lag 6 se sale de las bandas de confianza.
Finalmente, las predicciones. Hay que recordar que las predicciones del modelo AR(1) son todas casi el mismo valor (ver Tabla(3)).
Por último, se muestra el modelo ARMA(6,6). Para la homoscedasticidad, esta vez el lag 6 no se salió de las bandas de confianza.
Las predicciones del modelo ARMA(6,6) no fueron todas el mismo valor, sin embargo difieren más que las predicciones de los modelos MA(1) y AR(1).
En esta sección analizo el precio del índice SP500 el cual sigue a las 500 mejores empresas de EEUU. En la siguiente gráfica se muestra el precio histórico de este índice desde enero del año 2010 a enero del año 2019
Al hacer la prueba de raíz unitaria no se rechaza que los datos no sean estacionarios.
##
## Augmented Dickey-Fuller Test
##
## data: sp500_window[, 2]
## Dickey-Fuller = -2.4606, Lag order = 4, p-value = 0.3856
## alternative hypothesis: stationary
Así que procedí a aplicar una diferencia de primer orden a los datos y a restarles su media, la siguiente gráfica muestra esta serie diferenciada.
Nuevamente realicé una prueba de raíz unitaria la cual rechaza que los datos no son estacionarios con un p-value menor que 0.01
## Warning in adf.test(y): p-value smaller than printed p-value
##
## Augmented Dickey-Fuller Test
##
## data: y
## Dickey-Fuller = -5.6514, Lag order = 4, p-value = 0.01
## alternative hypothesis: stationary
Así que procedí a graficar la autocorrelación y la autocorrelación parcial. En la gráfica de la autocorrelación solo el lag 1 se sale de las bandas, lo mismo ocurre con la autocorrelación parcial, por lo tanto, los modelos tentativos son MA(1) y AR(1).
Para elegir los parámetros del modelo ARMA(p,q) utilicé un grid de 4 posibles valores, del 1-4. En total ajusté 16 modelos y elegí a los dos modelos con menor AIC. Sin embargo, los modelos ARMA(4,3) y ARMA(4,4) no se ajustaron pues hubo problemas de convergencia.
Los modelos con menor AIC fueron ARMA(4,2) y ARMA(1,1), en la siguiente tabla se muestran los coeficientes de cada modelo así como su AIC.
| Modelos | Coeficientes (SE) | AIC |
|---|---|---|
| MA(1) | -0.1401 (0.0915) | 723.82 |
| AR(1) | -0.1599 (0.0987) | 723.5 |
| ARMA(4,2) | 1.6707 (0.0979) -0.5271 (0.2014) -0.2981 (0.2143) 0.1210 (0.1129) -1.9433 (0.2473) 0.9992 (0.2532) | 723.62 |
| ARMA(1,1) | -0.9496 (0.1010) 0.8505 (0.1481) | 724.15 |
El modelo con menor AIC es el modelo autorregresivo de primer orden AR(1). Una vez que se tienen los modelos ajustados, prosigo a ver la bondad de ajuste, en la siguiente Tabla se muestra la estadística de Anderson-Darling así como su cuantil a nivel 0.05 %. Se rechazó la prueba de normalidad de todos los modelos.
| Modelos | AD | 95 % |
|---|---|---|
| MA(1) | 1.590884 | 0.7466896 |
| AR(1) | 1.650209 | 0.7458494 |
| ARMA(4,2) | 1.474188 | 0.7459802 |
| ARMA(1,1) | 1.103574 | 0.7479967 |
Los modelos no pasaron la prueba de normalidad, sin embargo quiero ver qué tan bien predicen. La siguiente tabla muestra las predicciones de cada modelo así como el MSE.
| Mes | Verdadero | MA(1) | AR(1) | ARMA(1,1) | ARMA(4,2) |
|---|---|---|---|---|---|
| Febrero | 278.68 | 267.6261 | 266.7297 | 263.7761 | 265.5899 |
| Marzo | 282.48 | 267.6261 | 267.2415 | 269.6200 | 268.6060 |
| Abril | 294.02 | 267.6261 | 267.1596 | 264.0705 | 266.8556 |
| Mayo | 275.27 | 267.6261 | 267.1727 | 269.3404 | 266.0558 |
| MSE | NA | 274.4739 | 290.5167 | 329.9104 | 296.6603 |
El modelo con menor MSE es el MA(1) y el que tiene mayor MSE es el ARMA(1,1).
Ahora voy a mostrar las predicciones en la serie de tiempo. Las cuatro predicciones de este modelo fueron 267.6261.
También sus gráficos de diagnóstico, estos muestran que no hay problemas con la homoscedasticidad.
Para este modelo las predicciones son casi idénticas.
Sus gráficos de diagnóstico no muestran problemas con la homoscedasticidad.
Ahora sigue el modelo ARMA(1,1), este modelo fue el menos preciso de los cuatro que se ajustaron.
No se observan problemas en la homoscedasticidad.
El último modelo es el ARMA(4,2).
Sus gráficas de diagnóstico fueron similares a los modelos anteriores así que se omitió.
Ambos conjuntos de datos corresponden a precios reales, y debido a esto es que no se observan cosas como en ejemplos bonitos diseñados especialmente para estudiar los modelos ARMA(p,q). En ambos conjuntos el modelo que mejor predijo fue el MA(1), pero sus predicciones no fueron satisfactorias pues son las mismas para cada mes.
Por lo tanto, los modelos ARMA(p,q) para estos conjuntos no arrojan predicciones tan buenas pero ofrecen una manera de estudiar el precio histórico del oro y del índice SP500.