Análisis de Series de Tiempo
Oro En Sudáfrica
“Tomar una decisión de inversión es como formular una hipótesis científica y someterla después a una prueba práctica”
George Soros
Para realizar este proyecto, utilizamos los datos de ventas del libro de Box & Jenkins (1976) con un indicador principal. En general la base de datos BJ sales emplea la Metodología de Box-Jenkins para pronosticar las ventas de oro en Sudáfrica. Para una economía de recursos como Sudáfrica, donde los metales y los minerales representan una alta proporción del PIB y los ingresos de exportación, la disminución en las ventas de oro es muy preocupante. La técnica de series de tiempo de Box-Jenkins se usó para realizar un análisis de las series de tiempo de las ventas mensuales de oro durante el período de enero de 2000 a junio de 2013.
Sin embargo, nosotros analizaremos la base BJsales.Lead que contiene los valores del índice principal de ventas de BJ. Durante este análisis se realizará el procedimiento habitual utilizado para series de tiempo los cuales son:
Se espera que el estudio ayude a los sectores público y privado a comprender el escenario de ventas o producción de oro y el plan posterior a ejecutar para que se maximicen las ganancias así como para reducir las pérdidas que se puedan generar.
A continuación se presenta la gráfica del comportamiento de las actividades mineras de oro en Sudáfrica, específicamente las ventas mensuales realizadas durante el periodo comprendido entre Enero de 2000 a Junio de 2013 comprendiendo un total de 150 observaciones. La base de datos a analizar lleva por nombre BJsales.lead
Comportamiento del Índice de Ventas de Oro BJ
Procediendo con el análisis de la base de datos, primero se observará el comportamiento a lo largo del tiempo del índice.
En la gráfica se observa que tanto las ventas del oro como el índice BJ tienen un comportamiento parecido en cuanto a tendencia, ya que durante los primeros 25 meses se observa un comportamiento a la alza, después se observa una caída abrupta en los 12 meses siguientes para recuperar valor del tiempo 37 al 44. Sin embargo se observa de nuevo una tendencia negativa para los meses posteriores y hasta llegar al mes 72 donde se nota una clara tendencia positiva que se mantuvo hasta el final del periodo de observación.
Otro aspecto importante es que no existe una variación que impacte de forma importante a los datos, por lo que se considera la variación casi constante.
En cuanto a la estacionalidad de la serie, de manera general no se observa algún ciclo que resalte.
Identificación del Modelo
Continuando con el análisis de la serie se procede a obtener la autocorrelación y autocorrelación parcial de los datos sin realizar alguna transformación de los mismos.
## AR/MA
## 0 1 2 3 4 5 6 7 8 9 10 11 12 13
## 0 x x x x x x x x x x x x x x
## 1 x o o o o o o o o o x o o o
## 2 x x o o o o o o o o x o o o
## 3 x o x o o o o o o o x o o o
## 4 x x x o o o o o o o o o o o
## 5 x x x o o o o o o o o o o o
## 6 x x o x o o o o o o o o o o
## 7 o x o o o o o o o o o o o o
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | x | x | x | x | x | x | x | x | x | x | x | x | x | x |
| 1 | x | o | o | o | o | o | o | o | o | o | x | o | o | o |
| 2 | x | x | o | o | o | o | o | o | o | o | x | o | o | o |
| 3 | x | o | x | o | o | o | o | o | o | o | x | o | o | o |
| 4 | x | x | x | o | o | o | o | o | o | o | o | o | o | o |
| 5 | x | x | x | o | o | o | o | o | o | o | o | o | o | o |
| 6 | x | x | o | x | o | o | o | o | o | o | o | o | o | o |
| 7 | o | x | o | o | o | o | o | o | o | o | o | o | o | o |
Notemos que las gráficas AFC y PAFC nos podrían indicar que un buen ajuste para los datos es utilizar un modelo de Medias Móviles Integrado con parámetro para MA 2. Sin embargo, primero realicemos una transformación a nuestros datos para ver qué valor podría ser el indicado para el parámetro de la parte integrada.
Iniciemos realizando una diferencia con un rezago de 1 y analicemos cómo se comportan tanto la ACF y la PACF
Al observar la autocorrelación y la autocorrelación parcial, podemos ver que es casi idéntica a la de un modelo de Medias Móviles de parámetro ya sea 1 o 2 por lo que procedemos a ajustar ambos modelos y estimar los valores de los coeficientes relacionados a cada uno de ellos.
##
## Call:
## arima(x = diff(bjs), order = c(0, 0, 1))
##
## Coefficients:
## ma1 intercept
## -0.4744 0.0235
## s.e. 0.0639 0.0121
##
## sigma^2 estimated as 0.07794: log likelihood = -21.43, aic = 46.87
##
## Call:
## arima(x = diff(bjs), order = c(0, 0, 2))
##
## Coefficients:
## ma1 ma2 intercept
## -0.5315 0.0990 0.0235
## s.e. 0.0838 0.0789 0.0130
##
## sigma^2 estimated as 0.0771: log likelihood = -20.65, aic = 47.3
## MA(1) MA(2)
## 1 46.86952 47.29512
Observamos que los valores del AIC obtenido al realizar los ajustes para los modelos MA(1) y MA(2) son muy parecidos. No obstante, utilizando el criterio del AIC podemos concluir que el modelo MA(1) propuesto se ajusta mejor a la serie de tiempo de nuestros datos. A continuación se presenta la comparación de los datos con simulaciones del modelo propuesto:
Así pues, al realizar la diferencia con sólo un rezago y ajustar un modelo MA a los datos transformados, podemos proponer cuatro modelos para ajustar a la información de índice de ventas:
- Modelo Integrado Medias Móviles con parámetros (1,1) ARIMA(0,1,1)
- Modelo Integrado Medias Móviles con parámetros (1,2) ARIMA(0,1,2)
- Modelo Auto Regresivo Integrado Medias Móviles con parámetros (1,1,1) ARIMA(1,1,1)
- Modelo Auto Regresivo Integrado Medias Móviles con parámetros (1,1,2) ARIMA(1,1,2)
Estimación de Parámetros del Modelo
Teniendo los modelos propuestos para los datos de la base BJsales.Lead, realizamos de nuevo el procedimiento de ajustar dichos modelos y estimar los valores de los coeficientes relacionados a cada uno de ellos.
## IMA(1,1) IMA(1,2) ARIMA(1,1,1) ARIMA(1,1,2)
## 1 48.40592 48.37324 48.62901 48.88313
Al realizar los ajustes de los modelos, son casi idénticos, ya que la variación más grande es de 0.51. Sin embargo, utilizando el criterio del AIC podemos concluir que el modelo IMA(1,2) propuesto se ajusta mejor a la serie de tiempo de nuestros datos.
Es por lo anterior que los parámetros asociados al modelo IMA(1,2)son:
\(\phi_1\)= -0.5129519 y \(\phi_2\)= 0.1114128
Obteniendo así un modelo de la siguiente forma:
\(X_t\) = 0 0.5129519 \(\varepsilon_{t-1}\) -0.1114128 \(\varepsilon_{t-2}\) - \(\varepsilon_{t}\)
Verificación de diagnóstico
Ya que tenemos los parámetros del modelo IMA(1,2) estimados, es necesario corroborar que cumpla con las hipótesis de estacionariedad, independencia y normalidad de los residuales.
##
## Augmented Dickey-Fuller Test
##
## data: fit3$residuals
## Dickey-Fuller = -4.3966, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary
##
## Box-Ljung test
##
## data: fit3$residuals
## X-squared = 0.050349, df = 1, p-value = 0.8225
##
## Box-Pierce test
##
## data: fit3$residuals
## X-squared = 0.049355, df = 1, p-value = 0.8242
##
## Shapiro-Wilk normality test
##
## data: fit3$residuals
## W = 0.9958, p-value = 0.9476
En cuanto a la comprobación de estacionariedad, se realizó la prueba de Dickey-Fuller, en la cual teniendo un 95% de confianza y al obtener un p-value menor al .01, existen pruebas suficientes para rechazar H0 en favor de H1, que en este caso indica la estacionariedad de los residuales del modelo.Por lo que se cumple con la esacionariedad de los residuales del modelo.
Mientras que para corroborar independencia se realizaron dos pruebas, Ljung-Box y Box-Pierce, en ambas la hipótesis nula es que los residuales son independientes versus no son independientes. Por lo que con un nivel de confianza al 95% en ambos test no se encontraron pruebas suficientes para rechazar H0, por lo tanto los residuales cumplen con independencia.
Por otro lado, para probar la normalidad de los residuales, se optó por utilizar el Test de Shapiro-Wilk, el cual se usa para contrastar la normalidad de un conjunto de datos.Cuya hipótesis nula es que la población está distribuida normalmente.
Así pues, con un nivel de confianza al 95%, se obtuvo un p-value igual a , po ende no se encontraron pruebas suficientes para rechazar H0 y por lo tanto los residuales cumplen con el supuesto de normalidad.
A continuación se muestran la gráfica de los residuales, así como del ACF y la gráfica cuantil- cuantil de la comparación con una distribución normal.
Entonces, la comparación gráfica del modelo propuesto con nuestros datos muestrales se ve de la siguiente manera:
Pronóstico
Al tener un modelo ARIMA estacional que pasa las comprobaciones requeridas, ya se está listo para el pronóstico. Las proyecciones del modelo para los próximos 12 meses se muestran a continuación.
Los pronósticos siguen la tendencia reciente en los datos, debido a la diferenciación. Los grandes intervalos de predicción que aumentan rápidamente muestran que el índice de ventas del oro en Sudáfrica podría comenzar a aumentar o disminuir en cualquier momento, mientras que los pronósticos puntuales tienden a un valor constante igual a 13.5, los intervalos de predicción permiten que los datos tengan una tendencia ascendente durante el período de pronóstico.
Con lo anterior podemos predecir que al menos en los dos meses siguietes al tiempo de observación el índice tiene un alza de .1 para después disminuir .03 con respecto al mes anterior. No obstante podemos concluir que a pesar de que el análisis con este tipo de series de tiempo fue exitoso, creemos que existen otros modelos que resultarían mejores a la hora de analizar esta serie, ya que se observan inconvenientes a la hora de la predicción, pues sólo se tiene certeza del valor inmediato al final del horizonte de observación, mientras que para tiempos posteriores el pronóstico no ayuda mucho pues todos los valores tienden a un número en particular.
Finalmente, recordemos que hacer pronósticos sobre tendencias futuras y los posibles inconveniente está muy bien, pero servirá de poco si no se tiene un Plan B para actuar llegado el caso. Pues es cierto que:
“Predecir la lluvia no cuenta. Construir arcas sí”
Warrent Buffet