13/3/2021
En procesos reales, uno esperaría tener mejores intervalos de pronóstico si se presentara que la información adicional del pasado afectara la variación del pronóstico. Bajo este argumento pareciera deseable una clase más general de modelos.
Crisis financiera de 2008
Se utilizaron modelos ARMA para modelar la media condicional de un proceso cuando la varianza condicional era constante. La popularidad de los modelos GARCH se debe al fracaso de éstas prácticas estándar basadas en un análisis estático de fenómenos como el financiero. Bajo esta dinámica la literatura distingue las dos clases principales de aplicaciones potenciales:
> El primero implica probar varias teorías económicas o financieras sobre los mercados de acciones, bonos y divisas, o estudiar los vínculos entre el corto y el largo plazo (por ejemplo, la estructura temporal de las tasas de interés).
> El segundo es básicamente operativo y relacionado con las intervenciones de los bancos en los mercados [elección de carteras óptimas, carteras de cobertura, valores en riesgo (VaR), tamaño y tiempos de negociación en bloque] (Gouriéroux (2012)).
El proceso ARCH introducido por Engle (1982) reconoce explícitamente la diferencia entre la varianza incondicional y la condicional, lo que permite que esta última cambie con el tiempo en función de errores pasados.
Los modelos ARMA se utilizaron para modelar la media condicional de un proceso cuando la varianza condicional era constante, es decir, para un modelo AR(1)
\[V(x_t | x_{t-1},x_{t-2},...)=V(w_t)=\sigma_w^2 \]
En muchos casos, puede ser violado este supuesto, siendo necesario implementar un modelo que tenga en cuenta que la varianza condicional puede no ser constante. Para ello Engle (1982) propone el modelo ARCH (autoregressive conditionally heteroscedastic) desarrollados para modelar cambios en la volatilidad.
Dentro de los problemas donde puede ser útil su aplicación, es en la modelación retornos o tasas de crecimiento de una serie, como:
Normalmente, para las series financieras, el retorno \(r_{t}\) no tiene una varianza condicional constante y los períodos muy volátiles tienden a agruparse.
En la figura mostrada anteriormente, note la fuerte dependencia de cambios repentinos de variabilidad de un retorno sobre el propio pasado de la serie (Shumway and Stoffer (2017)).
Retornos diarios del promedio industrial Dow Jones (DJIA) desde el 20 de abril de 2006 al 20 de abril de 2016
Un modelo que permite que la varianza condicional dependa de la realización pasada de la serie es el modelo:
\(r_{t}=\varepsilon_{t} \sigma_{t}\)
y
\(\sigma^{2}_{t}=\alpha_{0} + \alpha_{1}r^{2}_{t-1}\)con \(var(\varepsilon_{t})=1\)
Agregando el supuesto de normalidad, se puede expresar más directamente en términos de \(r_{t}\), el conjunto de información disponible en el tiempo \(t\). Usando densidades condicionales,
1.) \(r_{t}|r_{t-1} \sim N(0,\sigma^{2}_{t})\)
2.) \(\sigma^{2}_{t}=\alpha_{0} + \alpha_{1}r^{2}_{t-1}\)
La función de varianza puede ser expresada más generalmente como:
3.) \(\sigma^{2}_{t}=\sigma^{2}(r_{t-1},r_{t-2},...,r_{t-p},\alpha)\)
donde \(p\) es el orden del proceso ARCH y \(\alpha\) es un vector desconcido de parámetros.
En este caso, como es típico, el retorno \(r_{t}\) es bastante estable, excepto por ráfagas a corto plazo de alta volatilidad.
El modelo ARCH más simple, el ARCH (1), modela el retorno como
\(r_{t}=\varepsilon_{t} \sigma_{t}\)
y
\(\sigma^{2}_{t}=\alpha_{0} + \alpha_{1}r^{2}_{t-1}\)donde \(\varepsilon_{t}\) es el ruido blanco gaussiano estándar, \(\varepsilon_{t} \sim iid N (0, 1)\). La suposición normal puede relajarse. Al igual que con los modelos ARMA, debemos imponer algunas restricciones a los parámetros del modelo para obtener propiedades deseables. Una restricción obvia es que \(\alpha_0\), \(\alpha_{1} ≥ 0\) porque \(σ^{2}_t\) es una varianza.
Se conserva la expresión para los retornos del modelo ARCH(1)
Pero \(\sigma_t^2\) se generaliza de la siguiente forma, ARCH(p)
Si la varianza de \(v_{t}\) es finita y constante con respecto al tiempo, y \(0 ≤ \alpha_{1} <1\), entonces con base en la propiedad de causalidad de un modelo ARMA, \(r^2_{t}\) especifica un proceso \(AR (1)\) causal.
La estimación por ML de \(\vec\alpha=[\alpha_0,...,\alpha_p]\) es dada por
recordemos que bajo normalidad
La funcion de verosimilitud suele ser maximizada por métodos númericos.
Otro punto importante, es que se puede mezclar un modelo ARMA para la media con un modelo ARCH para los errores.
Por ejemplo, un modelo \(AR(1)\) para datos \(x_{t}\) que contienen errores \(ARCH(1)\) sería
Donde \(y_{t}\) es un ruido \(ARCH(1)\), \(x_{t}\) es una función lineal del predictor \(x_{t}\). Ver mas modelos, en los presentados por Weiss (1984).
Se introduce una nueva clase de procesos más general, GARCH (heterocedástico condicional autorregresivo generalizado), que permite una estructura de retardo mucho más flexible. La extensión del proceso ARCH al proceso GARCH se parece mucho a la extensión del proceso AR de serie temporal estándar al proceso ARMA general y, como se argumenta a continuación, permite una descripción más parsimoniosa en muchas situaciones (Bollerslev (1986)).
En aplicaciones empíricas del modelo ARCH, a menudo se requiere un rezago relativamente largo en la ecuación de varianza condicional, y para evitar problemas con las estimaciones de los parámetros de varianza negativa, normalmente se impone una estructura de rezago fijo.
En este sentido, parece de interés práctico inmediato ampliar la clase de modelos ARCH para permitir una memoria más larga y una estructura de retardo más flexible.
Sea \(\varepsilon_t\) un proceso estocástico en tiempo discreto con valor real, \(\psi_b\), el conjunto de información (campo sigma) de toda la información a lo largo del tiempo \(t\). El \(GARCH (p, q)\) proceso (heterocedasticidad condicional autorregresiva generalizada) viene dado por
\(r_{t}|r_{t-1} \sim N(0,\sigma^{2}_{t})\)
\(\sigma^{2}_{t}=\alpha_{0} + \sum_{i=1}^{q}\alpha_{i}r^{2}_{t-i}+ \sum_{i=1}^{p}\beta_{i}\sigma^{2}_{t-i}\)
Donde
\(p\geq0\), \(q>0\), \(\alpha_{0}>0\), \(\alpha_{i} \geq 0\) y \(\beta_{i} \geq 0\)
Para \(p = 0\), el proceso se reduce al proceso \(ARCH (q)\), y para \(p = q = 0\) \(\varepsilon_{t}\) es simplemente ruido blanco.
El proceso GARCH (p, q) permite que entren también las varianzas condicionales retrasadas. Esto corresponde a algún tipo de mecanismo de aprendizaje adaptativo.
Como en el análogo \(ARMA\), el proceso GARCH posiblemente podría justificarse mediante un tipo de descomposición de Wald de argumentos como una descripción más parsimoniosa. También se puede aproximar con cualquier grado de precisión mediante un \(ARCH (Q)\) estacionario para un valor suficientemente grande de \(Q\).
El proceso \(GARCH(p,q)\) es estacionario de sentido amplio con \(E(\varepsilon_{t})=0\), \(var(\varepsilon_{t})=\alpha_{0}(1-A(1)-B(1))^{-1}\) y \(cov(\varepsilon_{t},\varepsilon_{s})=0\) para todo \(t \not= s\) si y solo si \(A(1) + B(1) < 1\).
La estimación de máxima verosimilitud condicional de los parámetros del modelo \(GARCH (p, q)\) es similar al caso \(ARCH (p)\).
Para el caso de los retornos podemos escribir la formula de la siguiente manera:
Una vez que se obtienen las estimaciones de los parámetros, el modelo se puede utilizar para obtener pronósticos de la volatilidad un paso adelante, digamos \(\hat{\sigma}^{2}_{t+1}\), dado por
Utilizamos un caso tomado de Kaggle en el cual se quiere estimar los Valores en Riesgo dada la voilatilidad de una serie temporal.
| date | open | high | low | close | volume | Name |
|---|---|---|---|---|---|---|
| 2013-02-08 | 15.07 | 15.12 | 14.63 | 14.75 | 8407500 | AAL |
| 2013-02-11 | 14.89 | 15.01 | 14.26 | 14.46 | 8882000 | AAL |
| 2013-02-12 | 14.45 | 14.51 | 14.10 | 14.27 | 8126000 | AAL |
| 2013-02-13 | 14.30 | 14.94 | 14.25 | 14.66 | 10259500 | AAL |
| 2013-02-14 | 14.94 | 14.96 | 13.16 | 13.99 | 31879900 | AAL |
| 2013-02-15 | 13.93 | 14.61 | 13.93 | 14.50 | 15628000 | AAL |
Este conjunto de datos tiene 619040 filas y 7 columnas
Luego de volver cada columna una accion con su precio de cierre se tienen 1259 filas y 506 correspondientes a las 506 acciones diferentes del conjunto de datos, para este ejemplo, usamos las acciones de Citigroup Inc
vamos a calcular los retorno, siendo \(x_t\) el precio de la acción.
\[r_t=\frac{x_t-x_{t-1}}{x_{t-1}}\]
asumimos entonces el modelo \[r_t=\sigma_t \epsilon_t\] pero la varianza, para esta prueba, la modelamos con la forma de un modelo GARCH(1,1), de modo que \[\sigma_t^2=w+a_1*r_{t-1}^2+\beta_1*\sigma_{t-1}^2\]
Nota: una forma de darse cuenta que necesitamos ajustar un modelo ARCH es ajustar un modelo ARIMA con la metodologia Box-Jenkins y encontrar valores significativos en la ACF y PACF del termino de error.
Realizamos la estimación del modelo GARCH obteniendo la siguiente estimacion
\[\hat\sigma_t^2=0+0.113*t_{t-1}^2+0.810*\sigma_{t-1}^2\] recordemos que tambien se puede escribir \[\sigma^{2}_t=\frac{w}{1-\beta_1}+a_1\sum_{i=1}^\infty\beta_1^{i-1}*r_{t-i}\] de modo que \[\hat\sigma_t^2=0.000091+0.113*(r_{t-1}^2+0.81*r_{t-2}^2+0.65*r_{t-3}^2+...)\]
El valor en riesgo (VaR) es una medida estadística del riesgo a la baja basada en la posición actual. Estima cuánto puede perder un conjunto de inversiones en condiciones normales de mercado en un periodo de tiempo determinado. Una estadística VaR tiene tres componentes: a) periodo de tiempo, b) nivel de confianza, c) cantidad de pérdida (o porcentaje de pérdida). Para un nivel de confianza del 95%, podemos decir que la peor pérdida diaria no superará la estimación del VaR.
\[VaR(a)=\mu+\hat\sigma_{t|t-1}*F^{-1}(a)\]
Bollerslev, Tim. 1986. “Generalized Autoregressive Conditional Heteroskedasticity.” Journal of Econometrics 31 (3): 307–27.
Engle, Robert F. 1982. “Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation.” Econometrica: Journal of the Econometric Society, 987–1007.
Gouriéroux, Christian. 2012. ARCH Models and Financial Applications. Springer Science & Business Media.
Shumway, Robert H, and David S Stoffer. 2017. Time Series Analysis and Its Applications: With R Examples. Vol. 4. Springer.
Weiss, Andrew A. 1984. “ARMA Models with Arch Errors.” Journal of Time Series Analysis 5 (2): 129–43.