En el presente ejercicio se realiza un análisis del comportamiento del ETF USO en un período de tiempo delimitado entre el 2013/01/01 y el 2021/01/15. Se presenta su información básica, cómo funciona y cómo está administrado, posterior a ello se realiza un análisis tanto de sus precios de cierre como de sus rendimientos enriqueciéndolo con observaciones sobre su tendencia y aquellos clústeres que puedan parecer atípicos. En un segundo apartado, se habla acerca de los modelos ARIMA y se proponen un par de modelos para el pronóstico del precio de cierre del día inmediato del calendario bursátil (19 de enero). Una vez elegido el mejor modelo ARIMA, se presenta información teórica de los modelos ARCH y GARCH, y se realiza el mismo ejercicio de propuesta de modelos para elegir el más adecuado, esto con el fin de pronosticar el rendimiento de la serie del 19 de enero de 2021.
United States Oil Fund
UNITED STATES OIL FUND (USO) es un valor negociado en bolsa cuyas acciones pueden comprarse y venderse en la NYSE Arca. El objetivo de inversión de USO es que los cambios diarios, en términos porcentuales, del valor liquidativo (NAV) de sus acciones reflejen los cambios diarios, en términos porcentuales, del precio al contado del crudo dulce ligero entregado a Cushing, Oklahoma, medido por los cambios diarios en el precio de referencia de los contratos de futuros de petróleo.
Específicamente, USO busca que el cambio porcentual diario promedio en el valor del activo neto de USO, para cualquier período de 30 días de valuación sucesivos, esté dentro de más / menos 10% del cambio porcentual diario promedio en el precio de referencia de los contratos de futuros de petróleo sobre el mismo período [1].
Análisis del comportamiento del precio de cierre del ETF United States Oil Fund en el período enero 2013 y enero 2021
El 2020 es, probablemente, uno de los años con más acontecimientos históricos de carácter catastrófico en la historia moderna y todo a raíz de una pandemia; el ETF USO no quedó exento de estos. El colapso en el mercado del petróleo que derivó, incluso, en contratos de futuros de petróleo a precios negativos orilló a USCF (administradora del fondo) a cambiar las reglas del juego en cuanto al ETF. [2]
Se mencionó que este fondo únicamente compraba futuros en el contrato mensual más cercano, sin embargo con estos fenómenos sin precedentes el fondo comenzó a invertir en cualquier mes disponible debido al super contango. Pero, ¿qué es el contango? El contango es aquella situación en donde los precios de los futuros son mayores al precio del activo subyacente en el mercado de contado[3]; todo esto fue en aras de evitar que aquellos inversores minoristas sufrieran de esas caídas de los precios del crudo.
Sin embargo, esto tal vez no funcionó. Para Abril de 2020, el precio del ETF rozaba los 3 dólares estando a nada de convertirse en un penny stock y esto nos haría pensar “¿por qué entonces no compro un ETF? apuesto que, como todas las demás acciones, ese precio en algún momento subirá” y eso tal vez sucedió, pues muchas personas comenzaron a invertir en este instrumento y el volumen se disparó increíblemente, pero esto no es como se pinta.[4]
Antes de invertir en este ETF debe quedar claro algo: HAY QUE ENTENDER EL MERCADO DE FUTUROS. Comprar petróleo en este término es como comprarlo al próximo mes de entrada, entonces, en ese momento, compraron el barril cuando el precio al contado era realmente negativo.
Todo parecía tener mala pinta pero no terminó ahí, pues, ese volumen disparado, pérdidas sin precedentes e incluso precios ridículos comparados con los históricos obligaron a USCF a tomar una medida desesperada: un split inverso, de nuevo vayamos con la pregunta ¿qué es un split inverso y para qué sirve? Bien, recordando que estaba en aproximadamente 3 dólares cada acción, USCF decidió convertir 8 acciones en una sola no solo para reducir el número de acciones en circulación sino para registrar un precio más alto (por ejemplo, si una acción tiene un precio de 3 dólares y hago un split inverso 8:1 entonces ahora cada acción tendrá un precio de 24 dólares). Esto solo sirve para aumentar el valor nominal pues al final solo es unir esos paquetes de acciones con el fin de no mostrar acciones en precios sumamente bajos, evitando entrar en esos penny stocks. [4]
Para abril, el ETF se había desplomado aproximadamente un 80% en lo que iba de 2020, aun cuando el petróleo crudo había subido un 2,7% a 16,94 dólares por barril.[5]
Hagamos una pausa para revisar el gráfico de rendimientos de este ETF, se muestran clústeres sumamente atípicos entre las fechas de inicio de la pandemia que derivó en problemas en el mercado del petróleo, sin embargo ¿por qué este precio no se vio beneficiado por un gran repunte del petróleo WTI el 23 de abril? La respuesta es tan sencilla como trágica: por lo anteriormente expuesto y también por otra situación -un poco más- compleja. USCF, dentro de sus estrategias por no fallar con sus inversionistas, suspendió la emisión de las cestas de creación (la forma en que un ETF crea acciones para satisfacer la demanda) y solo funcionó como un un fondo mutuo cerrado, es decir, con un número limitado y conocido de acciones.[6] [7]
Dicho lo anterior, parece conveniente presentar un histograma de frecuencia para conocer, entre 2013 y 2021, los datos más frecuentes. Podemos observar que el dato más frecuente es el de los 95 dólares, sin embargo este gráfico nos muestra lo volátil del activo, pues así como ha tenido un valor de 305 dólares, también ha llegado a tener un valor de 15 dólares, algo que, definitivamente no es muy atractivo.
En un proceso similar, pero ahora para analizar los rendimientos del activo, se puede observar un proceso de reversión muy cercano a la media pero no exactamente. Los rendimientos del ETF oscilan entre el 7%, pero hay muchos datos atípicos y sumamente alarmantes, por ejemplo, en algún momento el ETF perdió un 25%. El gráfico presenta muchos “malos días” con pérdidas de más del 10%; eso no es para nada atractivo.
Los gráficos Q-Q (cuantil-cuantil) comparan dos distribuciones de probabilidad mediante el trazado de sus cuantiles uno contra el otro. Un gráfico Q-Q se utiliza para comparar las formas de las distribuciones, proporcionando una vista gráfica de cómo las propiedades, como la ubicación, la escala y la asimetría, son similares o diferentes en las dos distribuciones. [8]
La finalidad de estos gráficos es comparar la distribución teórica (la que suponemos o queremos como se comporte) contra la distribución empírica (la que realmente presenta la variable). [9]
La recta de color azul es la que, teóricamente, representa una distribución normal, por tanto, los puntos deberían estar cerca de esta. No obstante, al menos a niveles no parece estar ni cerca de cumplir con dicha distribución. En tanto a los rendimientos, se puede notar que ya está un poco más cerca de replicar dicho comportamiento, esto puede estar explicado desde la teoría, pues los rendimientos cuentan con la propiedad de media cero, de cualquier modo puede notarse aún ese problema de “colas pesadas”.
Una raíz unitaria (también denominada proceso de raíz unitaria o proceso estacionario de diferencia) es una tendencia estocástica en una serie de tiempo, a veces denominada “caminata aleatoria con deriva”; Si una serie de tiempo tiene una raíz unitaria, muestra un patrón sistemático que es impredecible.
Por ello, se procede a realizar 3 tipos de prueba para conocer si tiene estos problemas. Se realizarán las pruebas Dickey Fuller Aumentada (ADF), Phillips Perron y la prueba Kwiatkowski - Phillips - Schmidt - Shin (KPSS). Antes de los resultados, se presentan las hipótesis de las pruebas:
H0 de Dickey Fuller Aumentada : La serie tiene raíz unitaria
H0 de Phillips Perron : La seria tiene raíz unitaria
H0 de KPSS : La serie es estacionaria
Se busca rechazar la hipótesis nula, recordando la siguiente regla de oro
Si valor p mayor a 0.05 No rechazo (acepto) H0.
Si valor p menor a 0.05 Rechazo H0.
En la tabla 1 se muestran los resultados:
| Phillips - Perron (valor p) | DFA (valor p) | KPSS (valor p) | |
|---|---|---|---|
| A niveles (precio de cierre) | 0.9012 | 0.8255 | 0.01 |
| Primera diferencia (rendimientos) | 0.01 | 0.01 | 0.1 |
Como se observa, la serie a niveles (en sus precios de cierre) presenta problemas de raíz unitaria, al contrario de la serie en sus primeras diferencias (rendimientos) que parece tener solucionados los problemas de estacionariedad. Dicho de otro modo, solo depende del error y del intercepto, pero no de los valores pasados o registrados del precio, por lo tanto, es estacionaria.[9]
Modelos ARIMA
En ese apartado, se realizarán propuestas sobre modelos ARIMA para la serie del ETF USO. Para ello, como primer paso, se mostrará tanto la función de autocorrelación (MA) como la función de autocorrelación parcial (AR). El objetivo de dico gráfico es dotar de información para conocer qué componentes AR y MA se pueden tomar para proponer algún modelo ARIMA.
No obstante, R studio cuenta con una función llamada “auto arima”. La función en R usa una variación del algoritmo de Hyndman-Khandakar (Hyndman & Khandakar, 2008), que combina pruebas de raíz unitaria y minimización del AICc para obtener un modelo ARIMA. [10]
La función muestra que es necesario que la serie sea integrada de orden 1, esto con el fin de tener una serie que sea estacionaria e incluso está en la misma linea de las pruebas de raíces unitarias, que también sugerían la integración de orden 1.
Series: USO
ARIMA(2,1,2)
Coefficients:
ar1 ar2 ma1 ma2
0.1883 0.7624 -0.2099 -0.7084
s.e. 0.2317 0.2281 0.2502 0.2440
sigma^2 estimated as 6.345: log likelihood=-4737.53
AIC=9485.06 AICc=9485.09 BIC=9513.12
El software R arroja un modelo ARIMA (2,1,2), en este proceso faltaría revisar los problemas de autocorrelación a través de la prueba de Ljung Box, esto se verá más adelante. Por ahora, se propone un ARIMA (2,1,26) el cual nace de la observación de la figura 9, se presentan los resultados a continuación:
Call:
arima(x = USO, order = c(2, 1, 26))
Coefficients:
ar1 ar2 ma1 ma2 ma3 ma4 ma5 ma6
0.5407 0.3681 -0.5740 -0.3106 -0.0119 0.0131 -0.0147 0.0439
s.e. 0.4497 0.4241 0.4497 0.4389 0.0408 0.0319 0.0300 0.0296
ma7 ma8 ma9 ma10 ma11 ma12 ma13 ma14
-0.0095 -0.0015 0.0084 -0.0222 -0.0192 -0.0177 0.0136 -0.0086
s.e. 0.0370 0.0307 0.0272 0.0267 0.0291 0.0269 0.0279 0.0282
ma15 ma16 ma17 ma18 ma19 ma20 ma21 ma22
-0.0012 0.0659 -0.0154 -0.0186 -0.0473 0.0626 0.0013 -0.0139
s.e. 0.0279 0.0270 0.0374 0.0314 0.0266 0.0354 0.0442 0.0319
ma23 ma24 ma25 ma26
-0.0108 0.0201 -0.0084 0.0319
s.e. 0.0281 0.0278 0.0312 0.0226
sigma^2 estimated as 6.253: log likelihood = -4724.9, aic = 9507.79
Una vez que se cuenta con ambos modelos, ahora sí podemos hablar acerca de los problemas de autocorrelación, el AIC y también se presentarán los diferenciales entre el dato real y el dato pronosticado, esto con el fin de conocer cuál es el mejor modelo.
| Ljung - Box (valor p) | AIC | Dato real | Dato pronosticado | Diferencial | |
|---|---|---|---|---|---|
| Modelo Autoarima | 0.7412 | 9485.06 | $ 35.75 | $ 36.28 | -$ 0.53 |
| Modelo Propuesto | 0.5941 | 9507.79 | $ 35.75 | $ 36.26 | -$ 0.51 |
Se presentan los resultados de ambos modelos, como se puede observar en la prueba Ljung - Box (con H0 : los residuales del ARIMA no están correlacionados) ambos modelos no rechazan la H0. En cuanto al AIC, la regla práctica de elegir el menor valor, nos dictaría elegir el modelo (2,1,2). Por último, si comparamos los datos pronosticados con el dato real (en este caso el del 19 de enero) podemos notar que hay un menor diferencial con el modelo propuesto, no obstante no parece ser significativo, por lo que se decide tomar al propuesto por la función AUTOARIMA como el mejor modelo.
Ljung-Box test
data: Residuals from ARIMA(2,1,2)
Q* = 3.5205, df = 6, p-value = 0.7412
Model df: 4. Total lags used: 10
Como se observa en el gráfico, este modelo es estable. Entonces, tenemos un modelo estable y sin problemas de autocorrelación, con un diferencial negativo de $.51 dólares. Por lo que podemos concluir que este es un buen modelaje que nos podría pronosticar el futuro comportamiento del ETF USO. El problema con el modelo propuesto (2,1,26) se encuentra en la poca estabilidad que sugiere su gráfico de raíces invertidas, además, al incluir tantos componentes puede ir en contra del principio de la navaja de Ockham. [11]
Modelos de volatilidad
Se pueden desarrollar modelos autorregresivos para datos de series de tiempo univariantes que son estacionarios (AR) o que tienen una tendencia (ARIMA). Todos estos tienen algo en común: no modelan un cambio en la varianza a lo largo del tiempo, pues dentro de sus supuestos básicos se encuentra que la varianza es constante a lo largo del tiempo y que su error se distribuye como una normal a lo largo del tiempo, es decir, homocedásticos. Una serie de tiempo con pequeños cambios en la varianza a veces se puede ajustar usando una transformación de Box-Cox.[12]
Hay algunas series de tiempo en las que la varianza cambia constantemente a lo largo del tiempo. En el contexto de una serie de tiempo en el argot financiero, esto se llamaría volatilidad. Hay algunas series de tiempo donde la varianza aumenta de manera sistemática, a esta propiedad de la serie se llama heterocedasticidad, o en palabras amigables, variaciones desiguales a lo largo la serie.[12]
Si el cambio en la varianza puede correlacionarse con el tiempo, entonces puede modelarse usando un proceso autorregresivo, como ARCH. El método ARCH o Autorregresivo Condicional Heterocedástico proporciona una forma de modelar un cambio en la varianza en una serie de tiempo que depende del tiempo, como una volatilidad creciente o decreciente.[12]
En los modelos ARCH, la autocorrelación en la volatilidad es modelada permitiendo que la varianza condicional del término de error, dependa del valor anterior del error al cuadrado: [13]
\[\sigma_{t}^{2}= \omega + \alpha _1u_{t-1}^{2}\] El modelo anterior supone un ARCH(1) y se puede trasladar a su forma general, en la cual se asume que la varianza del error depende de q rezagos de los errores al cuadrado:
\[\sigma_{t}^{2}= \omega+ \alpha _1u_{t-1}^{2}+\alpha _2u_{t-2}^{2}+...+\alpha _qu_{t-q}^{2}\]
\[\alpha_i \geq 0 \forall i=1,2,...,q\]
Confirmar que hay efectos ARCH en las series: Esto con la prueba ARCH, la cual tiene H_0 : Hay efectos ARCH. Por lo que los q rezagos de los errores al cuadrado son significativos (≠ 0) en la serie, entonces se puede modelar con un modelo de varianza condicional.
La sumatoria de los parámetros no puede ser mayor a 1: si la suma de los valores que reportan los parámetros del modelo es mayor uno, la volatilidad de la serie explota con el tiempo, en otras palabras, el modelo es inestable.
Los modelos Generalizados Autorregresivos Condicionales Heterocedásticos (GARCH) son una extensión del modelo ARCH que incorpora un componente de media móvil junto con el componente autorregresivo. [12] La introducción de un componente de media móvil permite que el modelo modele tanto el cambio condicional en la varianza a lo largo del tiempo, como los cambios en la varianza dependiente del tiempo.[12]
En un modelo GARCH (p,q) la varianza condicional actual se parametriza para depender de q rezagos del error al cuadrado y los p rezagos de la varianza condicional:
\[\sigma_{t}^{2}=\omega+\alpha_{1}u_{t-1}^{2}+\alpha_{2}u_{t-2}^{2}+...+\alpha_{q}u_{t-q}^{2}+\beta_{1}\sigma_{t-1}^{2} +\beta_{2}\sigma_{t-2}^{2}+...+\beta_{p}\sigma_{t-p}^{2}\] De modo que un modelo GARCH permite interpretar [13]:
En este apartado se propondrán algunos modelos tanto ARCH como GARCH para tratar de explicar el comportamiento de la serie de rendimientos del ETF USO que presenta clústeres de volatilidad. En primera instancia, se debe correr la prueba ARCH:
ARCH LM-test; Null hypothesis: no ARCH effects
data: USO_R
Chi-squared = 446.05, df = 12, p-value < 2.2e-16
El valor p nos obliga a rechazar la hipótesis nula que asevera que no hay efectos ARCH en la serie, por lo tanto contamos con evidencia estadística para cumplir con la segunda condición de los modelos ARCH.
A continuación se presentan algunos modelos ARCH y GARCH junto con sus respectivos valores de AKAIKE y BAYES para que, con base en ellos, se elija al mejor modelo de entre los seleccionados.
| MODELO | ω | α1 | α2 | β1 | 2 | AKAIKE | BAYES |
|---|---|---|---|---|---|---|---|
| ARCH(1)* | 0.000298 | 0.457958 | -4.8998 | -4.8942 | |||
| ARCH(2) | 0.000235 | 0.371951 | 0.221233 | -4.939 | -4.9307 | ||
| GARCH(1,1) | 0.000006 | 0.112104 | 0.881893 | -5.0835 | -5.0752 | ||
| GARCH(1,2) | 0.000008 | 0.150323 | 0.370961 | 0.468525 | -5.0838 | -5.0727 | |
| GARCH(2,1) | 0.000006 | 0.111848 | 0.000028 | 0.882116 | -5.0819 | -5.0708 | |
| GARCH(2,2) | 0.00001 | 0.140608 | 0.030763 | 0.21028 | 0.606967 | -5.083 | -5.0692 |
Como se puede observar en el ejercicio previo, tanto el GARCH (1,1) como el GARCH(1,2) parecen ser los mejores modelos, sin embargo se tomará como “el mejor” al primero debido al ya mencionado principio de la navaja de Ockham. El modelo quedaría representado de la siguiente manera:
\[\sigma_{t}^{2}=\omega+\underset{ARCH(1)}{\underbrace{\alpha_{1}u_{t-1}^{2}}} + \underset{GARCH(1)}{\underbrace{\beta_{1}\sigma_{t-1}^{2}}}\] Con los valores obtenidos quedaría:
\[\sigma_{t}^{2}=0.000006+0.11261u_{t-1}^{2}+0.881557\sigma_{t-1}^{2}\]
La volatilidad del ETF USO se explica en un 11.26% por la volatilidad (o rendimientos) de un día anterior y en un 88.15% por la varianza ajustada rezagada un período. Adicionalmente, podemos notar que se cumplen con las características de un modelo bien especificado y estable: los componentes tanto ARCH como GARCH son significativos, son positivos y la suma de ellos es menor a 1.
En la siguiente figura se presenta la varianza condicional del modelo enfrentada con los rendimientos de la serie.
Como se observa en el gráfico, el modelo captura la volatilidad de los rendimientos de manera exitosa, incluso en esos clústeres en el 2020.
*------------------------------------*
* GARCH Model Forecast *
*------------------------------------*
Model: sGARCH
Horizon: 1
Roll Steps: 0
Out of Sample: 0
0-roll forecast [T0=2021-01-14]:
Series Sigma
T+1 0 0.01803
Para el 19 de enero de 2021, con la herramienta ugarchforecast, R arroja que el rendimiento será de un 1.80%.
Conclusiones
Antes de entrar a las conclusiones, con los parámetros de los mejores modelos -GARCH (1,1) Y GARCH(1,2)-, se simulan los rendimientos del ETF USO. En el siguiente gráfico se puede observar como estos procesos si logran caracterizar los rendimientos reales del ETF, es decir, si permiten explicar la volatilidad del activo.
Para las reflexiones finales, me permito referenciar un fragmento de una publicación anterior de mi autoría:
En cuanto a USO es necesario entender que este ETF estuvo a punto de la ruina, cambió su forma de organización con tal de no hacer perder todo a sus inversionistas incluso a tal punto de ir en contra de sus mismos principios. La historia nos demostró que esto no es para inversionistas minoritarios, así que no solo venda sino que no compre. Citando a Warren Pies (estratega de Ned Davis Research) y siendo sumamente claros terminaré esta publicación: “En este entorno, USO es un choque de trenes. Manténgase alejado”[15]
Dicho lo anterior, este ejercicio arroja luz sobre la volatilidad inesperada que sufrió el ETF. Incluso es más alarmante debido a las grandes pérdidas que llegó a sufrir el activo y, con decencia, podemos afirmar que siempre estuvieron provocados por los mismos administradores del fondo, por tanto es mejor no acercarse a un ambiente tan peligroso, financieramente hablando.
Referencias
[1] https://www.uscfinvestments.com/uso
[3]https://blog.bmv.com.mx/tag/mercado-contango/
[7]https://www.rankia.mx/foros/bolsa/temas/2994048-que-fondo-mutuo-cerrado-abierto
[9]https://rpubs.com/Ana_JP/EDZ_ARIMA
[10]https://otexts.com/fpp2/arima-r.html
[11]https://www.elsevier.es/es-revista-offarm-4-articulo-la-navaja-ockam-13089127