Análisis de Volatilidad y Pronóstico del precio de cierre de XLU (The Utilities Select Sector SPDR® Fund)

Una estimación utilizando modelos ARIMA, ARCH Y GARCH

Rodríguez Domínguez Cristopher

2021-01-28

::: {.fullwidth}

Introducción

El ETF de Utilites Select Sector SPDR Fund (XLU) es un ETF que replica el comportamiento de las empresas incluídas en el índice S&P 500. Además dicho ETF incluye empresas de las siguientes industrias: incluye empresas de las siguientes industrias: servicios públicos de electricidad, agua y productores independientes de energía eléctrica renovable y servicios de gas.

En este trabajo, se analizará el comportamiento de dicho ETF y además, se realizará un pronóstico de su comportamiento, el método utilizado será mediante los modelos ARIMA, ARCH Y GARCH, estos permiten un análisis detallado sobre el activo en cuestión.

Como ya se mencionó, este ETF es una réplica del comportamiento de diversas empresas del índice S&P 500, por lo que es importante observar cómo ha sido su comportamiento a lo largo de los años, la muestra utilizada parte del 1 de enero de 2015 hasta el 10 de noviembre del año en curso, por lo que, se tienen datos suficientes para analizar si existe algún tipo de tendencia. Dicho comportamiento se muestra en el gráfico 1.

En dicho gráfico, se puede observar el comportamiento registrado por este ETF en los últimos 5 años, en general, se observa que existe una tendencia alzista a lo largo del periodo seleccionado, sin embargo, han existido diversas bajas en el precio de dicho ETF, por ejemplo, el 14 de noviembre de 2016 se observó un mínimo de 46 dólares al cierre, posteriormente, el precio nuevamente presentó una alza hasta alcanzar un máximo local de 56.87 dólares en el siguiente año, es decir, el 14 de noviembre de 2017, posteriormente se presentó de nueva cuenta una baja en dicho precio, llegando a registrar un nuevo mínimo de 47.56 dólares el 8 de febrero de 2018, a partir de esta fecha, la serie presentaba una tendencia a la alza con algunas bajas y recuperaciones rápidas hasta alcanzar el máximo absoluto de 70.98 USD el 18 de febrero de 2020.

Sin embargo, debido a la contingencia mundial del COVID-19, se presentó una caída abrupta de dicho precio, cayendo hasta los 44.93 dólares el 23 de marzo del año en curso, esta fecha coincide con la fase más fuerte de la pandemia en el continente europeo, habiendo presentado efectos devastadores en el continente asiático de manera previa, sin embargo, a partir de esa fecha se presenta una rápida recuperación de sus precios, que, aunque presentan diversas caídas, mantienen un alza si se generaliza su comportamiento en los últimos meses, por último, el 10 de noviembre del año actual, se ha alcanzado un nuevo máximo de 66.26 USD, también es importante destacar que este crecimiento se ha visto mermado, teniendo una nueva caída.

A countinuación, se presenta una gráfica de los rendimientos del ETF en cuestión.

En este gráfico se puede observar el comportamiento de los rendimientos del ETF XLU, este ETF ha tenido un comportamiento estable en la mayoría del tiempo de muestra, mostrando un claro proceso de regresión a la media y una varianza que no parece ser muy inestable, sin embargo, en el año 2020 es muy claro que existe un gran clúster de volatilidad, este clúster claramente está influenciado por la presencia del COVID-19 en el mundo, en este, podemos observar un rendimiento mínimo de -11% correspondiente al día 16 de Marzo de 2020, mientras que el pico más alto se presenta en día siguiente con un rendimiento del 13%, esto es un claro indicio del impacto que tuvo la emergencia sanitaria en este activo financiero.

Análisis de la serie.

Histogramas.

Antes de iniciar con el análisis de los modelos econométricos que se utilizarán, se observará primero el rendimiento crudo de la variable, para esto utilizaremos los gráficos de histograma del precio del cierre y del rendimiento, buscando que exista una distribución normal en esta variable, para este mismo fin también utilizaremos los gráficos cuantil-cuantil (QQ plots por sus nombres en inglés)

En ambos gráficos, es posible observar el comportamiento en frecuencia de la variable, para el gráfico de niveles, es decir, el histograma del precio de cierre, se observa que no existe ninguna distribución normal, ya que no existe una media concentrada, presentando dos picos de la misma, por otro lado, para el gráfico de rendimientos, se observa que los datos presentan un problema de leptocurosis, es decir, existe una concentración exagerada en la media y se observan problemas de colas extremas, por lo tanto, se puede asumir que ni siquiera los rendimientos de la variable cumplen con el supuesto de normalidad necesario para los modelos ARIMA.

#Gráficos Q-Q (cuantil-cuantil)

Ahora veamos los gráficos QQ.

En estos gráficos, se puede confirmar de forma clara que no existe un comportamiento normal, sin bien la gráfica a niveles muestra que en la media se sigue una distribución muy similar a la media, se tiene que en los puntos extremos esta distribución se pierde completamente, dicho problema es aún más notorio en el QQ plot de los rendimientos, donde se observan problemas serios de colas extremas.

Pruebas de estacionariedad

Ahora procederemos a verificar de forma formal si esta serie tiene un comportamiento estacionario mediante las siguientes pruebas: Dickey-Fuller aumentada, Phillips-Perron y la prueba KPSS.

Los resultados de las pruebas indican lo siguiente: para el caso de la prueba DFA y PP, se obtiene un valor \(p<0.05\) por lo que se rechaza la hipótesis de la presencia de raíces unitarias, sin embargo, es bien sabido que estas pruebas carecen de potencia debido a problemas en las muestras, por lo tanto, es necesario mostrar los resultados más potentes, para esto, se utiliza la prueba KPSS (Kwiatkowski-Phillips-Schmidt-Shin Prueba KPSS) la cual es más potente al analizar la tendencia de dicha serie, esta prueba nos indica un valor \(p=0.01\) por lo que se rechaza la hipótesis nula de la prueba que indica que la serie es estacionaria, con esto, observamos que en efecto, la serie del precio de cierre presenta un comportamiento no estacionario, es decir, no tiene un proceso de reversión a la media y además, tampoco mantiene una varianza constante.

Por otra parte, la serie de rendimientos presenta un comportamiento distinto, en cuanto a las pruebas DFA y PP se vuelve a presentar un valor \(p<0.05\) específicamente, presentaron un valor \(p=0.01\) indicando el rechazo de la hipótesis nula, asimismo, la prueba KPSS arroja un \(p=0.1\) indicando que en efecto, esta serie ya cumple con los criterios de estacionariedad necesarios para la realización del modelo ARIMA.

Funciónes de autocorrelación, autocorrelación parcial y modelo ARIMA.

Ahora se analizarán las funciones de autocorrelación y autocorrelación parcial de la serie, esto se realizará mediante la elaboración del correlograma de la serie. Esto ayuda a detectar problemas de correlación entre los residuos de la serie, a continuación se muestran dichas gráficas.

En este gráfico, se puede observar que existen problemas de autocorrelación en muchos de los residuos, en el caso del componente autorregresivo (AR) se observa que existe correlación hasta el rezago número 33, mientras que en el caso del componente de media móvil, dicha correlación se observa en el rezago número 20.

Los modelos ARIMA (Modelos Autorregresivos Integrados de Media Móvil) tratan de corregir dicho error, por lo que se supone que los problemas de autocorrelación entre los residuos desaparece, para esta investigación, se utilizarán dos modelos ARIMA, uno está dado por la función auto ARIMA y el otro será una propuesta realizada por el investigador. A continuación se muestran los resultados obtenidos por el modelo ARIMA arrojado por la función autoARIMA y por la propuesta realizada por el autor.

ARIMA (4,1,4) ARIMA (1,1,23)
Ljung-Box 0.009827 0.6556
AIC 3664.79 3650.42
Pronóstico 62.65 62.56
Dato Real 62.75 62.75
Diferencial 0.10 0.19

Aquí se puede observar que existe una clara diferencia entre el modelo proporcionado por la función auto ARIMA, el cual fue un ARIMA(4,1,4) y la propuesta realiza, la cual fue un ARIMA(1,1,23), la diferencia principal radica en que el primer modelo presenta un valor P de la prueba de Ljung-Box menor a 0.05, indicando que en efecto, este modelo no tiene el comportamiento de una serie de ruido blanco, mientras que en el caso del modelo ARIMA(1,1,23) se observa que, al ser su valor p mayor a 0.05, se concluye que esta serie sí cumple con el comportamiento de una de ruido blanco.

ARIMA(1,1,23)

A countinuación se presentarán resultados importantes originados del correlograma y la prueba de raíces unitarias (mediante el uso del círuclo unidad)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,1,23)
## Q* = 1.6169, df = 3, p-value = 0.6556
## 
## Model df: 24.   Total lags used: 27

En el, podemos observar que el modelo ARIMA(1,1,23) ya no presenta problemas sobre correlación en los residuos, tal como lo indicó su prueba de Ljung-Box, esto quiere decir que ya presenta un comportamiento de ruido blanco en su parte residual, por el otro lado, se puede observar que estos mismos residuos se ajustan de buena manera a la distribución normal, tal y como lo indican los supuestos del modelo ARIMA.

Por otra parte, en el gráfico del círculo unidad, es fácil apreciar que este modelo no presenta problemas de raíces unitarias invertidas, indicando así que este modelo tiene la estabilidad necesaria.

Pronóstico del modelo ARIMA.

En el siguiente cuadro podemos observar el pronóstico realizado por el modelo ARIMA(4,1,4) proporcionado por la función auto arima de R para el día 19 de enero de 2021 y también se puede apreciar el pronóstico de la propuesta realizada.

ARIMA (4,1,4) ARIMA (1,1,23)
Pronóstico 62.65 62.56
Dato Real 62.75 62.75
Diferencial 0.10 0.19

En este cuadro, es posible apreciar que el modelo ARIMA(4,1,4) tiene un pronóstico más cercano al dato real, sin embargo, este pronóstico no puede ser utilizado debido a que este modelo presenta problemas de correlación en los residuos como se ha mencionado anteriormente.

En cuanto al modelo ARIMA(1,1,23) se puede observar que la diferencia entre el dato pronosticado y el dato real es de solamente 19 centavos, otorgando un pronóstico lo suficientemente certero como para realizar una toma de decisiones adecuada.

Modelos de Volatilidad.

Como se ha mencionado, el modelo ARIMA presenta supuestos muy rígidos, uno de ellos indica que las series deben presentar una varianza constante, sin embargo, es de conocimiento común que los activos financieros no presentan estos comportamientos, ya que están fuertemente influenciados por la volatilidad, es por eso que, en este caso, se utilizarán modelos que tengan en cuenta la presencia de esta volatilidad, nos referimos a los modelos ARCH y GARCH, estos modelos trabajan precisamente con series de tiempo heteroscedásticas, por lo que son modelos ideales para el análisis de activos financieros.

En esta sección se presentará el análisis de los modelos ARCH y GARCH para el ETF XLU, los modelos a utilizar serán los siguientes: ARCH(1), ARCH(2), GARCH(1,1), GARCH(1,2), GARCH(2,1) y GARCH(2,2) y con esto se determinará cuál es el modelo más óptimo.

Antes de comenzar con las estimaciones, se dará una muy breve introducción sobre los modelos ARCH y GARCH.

Modelos ARCH: estos modelos son capaces de trabajar con series heteroscedásticas a través de incorporar una ecuación de la varianza condicionada, en esta ecuación se incorporan los rezagos de los residuos al cuadrado.

Modelos GARCH: En estos modelos también se incorpora la ecuación de la varianza condicional, sin embargo la principal diferencia entre estos modelos y los GARCH, es que en esta ecuación también se incorpora el componente autorregresivo de la propia varianza condicional, es decir, existen rezagos de los residuos al cuadrado y de la varianza condicional.

Ambos modelos están sujetos a una serie de supuestos, los cuales son los siguientes.

1.- No negatividad en la varianza condicional. 2.- Comprobación de efectos ARCH en las series. 3.- La sumatoria de los parámetos no puede ser mayor a 1.

Para verificar que se cumple el segundo supuesto, se procede a realizar la prueba de efectos ARCH (LM Test) donde la hipótesis nula es la no presencia de efectos ARCH, es decir, que los residuos son homoscedásticos

## 
##  ARCH LM-test; Null hypothesis: no ARCH effects
## 
## data:  XLU_R
## Chi-squared = 897.41, df = 12, p-value < 2.2e-16

En esta prueba podemos observar que el resultado de P es \(p<2.2e^{-16}\) por lo que se rechaza la hipótesis nula, indicando la presencia de heteroscedasticidad en la serie de los rendimientos, por lo tanto, es posible proceder con la estimación de los modelos ARCH y GARCH

Modelo omega alpha 1 alpha 2 beta 1 beta 2 AIC BIC
ARCH(1)* - - - -
ARCH(2) 0.000059** 0.229903 0.196984 -6.4631 -6.4547
GARCH(1,1) 0.000003 0.089589 0.881344 -6.5279 -6.5196
GARCH(1,2) 0.000003** 0.099136 0.752633 0.116213** -6.5266 -6.5155
GARCH(2,1) 0.000003** 0.089596 0** 0.881123 -6.5264 -6.5153
GARCH(2,2) 0.000003** 0.09868 0** 0.758943** 0.110409** -6.5256 -6.5118

  • Modelo no Convergente

** Parámetro no significativo

En este cuadro se observa que ocurren demasiados problemas con la mayor parte de los modelos estimados, iniciando con un modelo no convergente correspondiente al ARCH(1), posteriormente se tiene que el valor de omega es un parámetro no significativo para todos los modelos, después se aprecia que los modelos GARCH(1,2), GARCH(2,1) y GARCH(2,2) contienen parámetros no significativos correspondientes tanto a alpha como a beta.

Además, tomando como criterio de decisión los valores del criterio de Akaike y el bayesiano de Schwarz, se define que el modelo óptimo para esta serie es el ARCH(2), este modelo nos indica que los rendimientos el ETF seleccionado se explican en un 41% por su volatilidad, a continuación se mostrarán datos relevantes sobre este modelo.

En este gráfico, se puede observar de color gris la serie original de los rendimientos, mientras que de color azul se puede observar la estimación del modelo ARCH(2), con esto se puede deducir que el modelo capta de forma satisfactoria los clústers de volatilidad presentados por la serie. A continuación se muestran las gráficas simuladas de los rendimientos reales contra los rendimientos estimados por el modelo.

En estos gráficos se aprecia que el modelo ARCH(2) capta de forma satisfactoria el comportamiento de los rendimientos de la serie, sin embargo, también se aprecia que no se capta en el gráfico el clúster de volatilidad, pero eso permite un mejor pronóstico de la serie.

Por último, el modelo ARCH(2) nos indica que el futuro rendimiento de los activos correspondiente al 19 de enero de 2021 será del 1.17%.

Conclusión.

Como conclusión se puede decir que es importante destacar la diferencia presentada en los modelos ARIMA y los modelos ARCH, se observó durante la última sección de este trabajo que los modelos ARCH y GARCH son capaces de absorber de mejor manera el comportamiento real de esta serie, captando especialmente los clústers de volatilidad gracias a que rompen con el supuesto de una varianza constante, sin embargo, se observa que los modelos ARIMA también cumplen un buen papel a la hora de realizar los pronósticos ya que solo presentaron una diferencia menor a los 20 centavos en ambos modelos, lo cuál es suficiente para ayudar a la toma de decisiones. :::