En el presente ejercicio se realiza un análisis del comportamiento del ETF USO en un período de tiempo delimitado entre el 2013/01/01 y el 2021/01/15. Se presenta su información básica, cómo funciona y cómo está administrado, posterior a ello se realiza un análisis tanto de sus precios de cierre como de sus rendimientos enriqueciéndolo con observaciones sobre su tendencia y aquellos clústeres que puedan parecer atípicos. En un segundo apartado, se habla acerca de los modelos ARIMA y se proponen un par de modelos para el pronóstico del precio de cierre del día inmediato del calendario bursátil (19 de enero). Una vez elegido el mejor modelo ARIMA, se presenta información teórica de los modelos ARCH y GARCH, y se realiza el mismo ejercicio de propuesta de modelos para elegir el más adecuado, esto con el fin de pronosticar el rendimiento de la serie del 19 de enero de 2021.

United States Oil Fund

UNITED STATES OIL FUND (USO) es un valor negociado en bolsa cuyas acciones pueden comprarse y venderse en la NYSE Arca. El objetivo de inversión de USO es que los cambios diarios, en términos porcentuales, del valor liquidativo (NAV) de sus acciones reflejen los cambios diarios, en términos porcentuales, del precio al contado del crudo dulce ligero entregado a Cushing, Oklahoma, medido por los cambios diarios en el precio de referencia de los contratos de futuros de petróleo.

Específicamente, USO busca que el cambio porcentual diario promedio en el valor del activo neto de USO, para cualquier período de 30 días de valuación sucesivos, esté dentro de más / menos 10% del cambio porcentual diario promedio en el precio de referencia de los contratos de futuros de petróleo sobre el mismo período [1].

Análisis del comportamiento del precio de cierre del ETF United States Oil Fund en el período enero 2013 y enero 2021

El 2020 es, probablemente, uno de los años con más acontecimientos históricos de carácter catastrófico en la historia moderna y todo a raíz de una pandemia; el ETF USO no quedó exento de estos. El colapso en el mercado del petróleo que derivó, incluso, en contratos de futuros de petróleo a precios negativos orilló a USCF (administradora del fondo) a cambiar las reglas del juego en cuanto al ETF. [2]

Se mencionó que este fondo únicamente compraba futuros en el contrato mensual más cercano, sin embargo con estos fenómenos sin precedentes el fondo comenzó a invertir en cualquier mes disponible debido al super contango. Pero, ¿qué es el contango? El contango es aquella situación en donde los precios de los futuros son mayores al precio del activo subyacente en el mercado de contado[3]; todo esto fue en aras de evitar que aquellos inversores minoristas sufrieran de esas caídas de los precios del crudo.

Figura 1 Precio de cierre de United States Oil Fund

Fuente: elaboración propia con datos de Yahoo Finance

Sin embargo, esto tal vez no funcionó. Para Abril de 2020, el precio del ETF rozaba los 3 dólares estando a nada de convertirse en un penny stock y esto nos haría pensar “¿por qué entonces no compro un ETF? apuesto que, como todas las demás acciones, ese precio en algún momento subirá” y eso tal vez sucedió, pues muchas personas comenzaron a invertir en este instrumento y el volumen se disparó increíblemente, pero esto no es como se pinta.[4]

Antes de invertir en este ETF debe quedar claro algo: HAY QUE ENTENDER EL MERCADO DE FUTUROS. Comprar petróleo en este término es como comprarlo al próximo mes de entrada, entonces, en ese momento, compraron el barril cuando el precio al contado era realmente negativo.

Todo parecía tener mala pinta pero no terminó ahí, pues, ese volumen disparado, pérdidas sin precedentes e incluso precios ridículos comparados con los históricos obligaron a USCF a tomar una medida desesperada: un split inverso, de nuevo vayamos con la pregunta ¿qué es un split inverso y para qué sirve? Bien, recordando que estaba en aproximadamente 3 dólares cada acción, USCF decidió convertir 8 acciones en una sola no solo para reducir el número de acciones en circulación sino para registrar un precio más alto (por ejemplo, si una acción tiene un precio de 3 dólares y hago un split inverso 8:1 entonces ahora cada acción tendrá un precio de 24 dólares). Esto solo sirve para aumentar el valor nominal pues al final solo es unir esos paquetes de acciones con el fin de no mostrar acciones en precios sumamente bajos, evitando entrar en esos penny stocks. [4]

Figura 2 Rendimientos de United States Oil Fund

Fuente: elaboración propia

Para abril, el ETF se había desplomado aproximadamente un 80% en lo que iba de 2020, aun cuando el petróleo crudo había subido un 2,7% a 16,94 dólares por barril.[5]

Hagamos una pausa para revisar el gráfico de rendimientos de este ETF, se muestran clústeres sumamente atípicos entre las fechas de inicio de la pandemia que derivó en problemas en el mercado del petróleo, sin embargo ¿por qué este precio no se vio beneficiado por un gran repunte del petróleo WTI el 23 de abril? La respuesta es tan sencilla como trágica: por lo anteriormente expuesto y también por otra situación -un poco más- compleja. USCF, dentro de sus estrategias por no fallar con sus inversionistas, suspendió la emisión de las cestas de creación (la forma en que un ETF crea acciones para satisfacer la demanda) y solo funcionó como un un fondo mutuo cerrado, es decir, con un número limitado y conocido de acciones.[6] [7]

El fondo comenzó a negociar solamente con la oferta y la demanda y no con el petróleo en sí.

Figura 3 Histograma de distribución de precios de cierre de United States Oil Fund

Fuente: elaboración propia

Dicho lo anterior, parece conveniente presentar un histograma de frecuencia para conocer, entre 2013 y 2021, los datos más frecuentes. Podemos observar que el dato más frecuente es el de los 95 dólares, sin embargo este gráfico nos muestra lo volátil del activo, pues así como ha tenido un valor de 305 dólares, también ha llegado a tener un valor de 15 dólares, algo que, definitivamente no es muy atractivo.

Figura 4 Histograma de rendimientos de United States Oil Fund

Fuente: elaboración propia

En un proceso similar, pero ahora para analizar los rendimientos del activo, se puede observar un proceso de reversión muy cercano a la media pero no exactamente. Los rendimientos del ETF oscilan entre el 7%, pero hay muchos datos atípicos y sumamente alarmantes, por ejemplo, en algún momento el ETF perdió un 25%. El gráfico presenta muchos “malos días” con pérdidas de más del 10%; eso no es para nada atractivo.

Los gráficos Q-Q (cuantil-cuantil) comparan dos distribuciones de probabilidad mediante el trazado de sus cuantiles uno contra el otro. Un gráfico Q-Q se utiliza para comparar las formas de las distribuciones, proporcionando una vista gráfica de cómo las propiedades, como la ubicación, la escala y la asimetría, son similares o diferentes en las dos distribuciones. [8]

La finalidad de estos gráficos es comparar la distribución teórica (la que suponemos o queremos como se comporte) contra la distribución empírica (la que realmente presenta la variable). [9]

Figura 5 Gráficos Q-Q a niveles (precio de cierre) y en primera diferencia (rendimientos) de United States Oil Fund

Fuente: elaboración propia

La recta de color azul es la que, teóricamente, representa una distribución normal, por tanto, los puntos deberían estar cerca de esta. No obstante, al menos a niveles no parece estar ni cerca de cumplir con dicha distribución. En tanto a los rendimientos, se puede notar que ya está un poco más cerca de replicar dicho comportamiento, esto puede estar explicado desde la teoría, pues los rendimientos cuentan con la propiedad de media cero, de cualquier modo puede notarse aún ese problema de “colas pesadas”.

Una raíz unitaria (también denominada proceso de raíz unitaria o proceso estacionario de diferencia) es una tendencia estocástica en una serie de tiempo, a veces denominada “caminata aleatoria con deriva”; Si una serie de tiempo tiene una raíz unitaria, muestra un patrón sistemático que es impredecible.

Por ello, se procede a realizar 3 tipos de prueba para conocer si tiene estos problemas. Se realizarán las pruebas Dickey Fuller Aumentada (ADF), Phillips Perron y la prueba Kwiatkowski - Phillips - Schmidt - Shin (KPSS). Antes de los resultados, se presentan las hipótesis de las pruebas:

H₀ de Dickey Fuller Aumentada : La serie tiene raíz unitaria

H₀ de Phillips Perron : La seria tiene raíz unitaria

H₀ de KPSS : La serie es estacionaria

Se busca rechazar la hipótesis nula, recordando la siguiente regla de oro

Si valor p mayor a 0.05 No rechazo (acepto) H₀.

Si valor p menor a 0.05 Rechazo H₀.

En la tabla 1 se muestran los resultados:

Tabla 1 Pruebas de raíz unitaria: ADF, PHILLIPS - PERRON Y KPSS

	Phillips - Perron (valor p)	DFA (valor p)	KPSS (valor p)
A niveles (precio de cierre)	0.9012	0.8255	0.01
Primera diferencia (rendimientos)	0.01	0.01	0.1

Fuente: elaboración propia

Como se observa, la serie a niveles (en sus precios de cierre) presenta problemas de raíz unitaria, al contrario de la serie en sus primeras diferencias (rendimientos) que parece tener solucionados los problemas de estacionariedad. Dicho de otro modo, solo depende del error y del intercepto, pero no de los valores pasados o registrados del precio, por lo tanto, es estacionaria.[9]

Modelos ARIMA

En ese apartado, se realizarán propuestas sobre modelos ARIMA para la serie del ETF USO. Para ello, como primer paso, se mostrará tanto la función de autocorrelación (MA) como la función de autocorrelación parcial (AR). El objetivo de dico gráfico es dotar de información para conocer qué componentes AR y MA se pueden tomar para proponer algún modelo ARIMA.

Figura 6 Función de autocorrelación y autocorrelación parcial

Fuente: elaboración propia

No obstante, R studio cuenta con una función llamada “auto arima”. La función en R usa una variación del algoritmo de Hyndman-Khandakar (Hyndman & Khandakar, 2008), que combina pruebas de raíz unitaria y minimización del AICc para obtener un modelo ARIMA. [10]

La función muestra que es necesario que la serie sea integrada de orden 1, esto con el fin de tener una serie que sea estacionaria e incluso está en la misma linea de las pruebas de raíces unitarias, que también sugerían la integración de orden 1.

Tabla 2 Resultados del modelo de AUTOARIMA

Series: USO 
ARIMA(2,1,2) 

Coefficients:
         ar1     ar2      ma1      ma2
      0.1883  0.7624  -0.2099  -0.7084
s.e.  0.2317  0.2281   0.2502   0.2440

sigma^2 estimated as 6.345:  log likelihood=-4737.53
AIC=9485.06   AICc=9485.09   BIC=9513.12

Fuente: elaboración propia

El software R arroja un modelo ARIMA (2,1,2), en este proceso faltaría revisar los problemas de autocorrelación a través de la prueba de Ljung Box, esto se verá más adelante. Por ahora, se propone un ARIMA (2,1,26) el cual nace de la observación de la figura 9, se presentan los resultados a continuación:

Tabla 3 Resultados del modelo de ARIMA PROPUESTO


Call:
arima(x = USO, order = c(2, 1, 26))

Coefficients:
         ar1     ar2      ma1      ma2      ma3     ma4      ma5     ma6
      0.5407  0.3681  -0.5740  -0.3106  -0.0119  0.0131  -0.0147  0.0439
s.e.  0.4497  0.4241   0.4497   0.4389   0.0408  0.0319   0.0300  0.0296
          ma7      ma8     ma9     ma10     ma11     ma12    ma13     ma14
      -0.0095  -0.0015  0.0084  -0.0222  -0.0192  -0.0177  0.0136  -0.0086
s.e.   0.0370   0.0307  0.0272   0.0267   0.0291   0.0269  0.0279   0.0282
         ma15    ma16     ma17     ma18     ma19    ma20    ma21     ma22
      -0.0012  0.0659  -0.0154  -0.0186  -0.0473  0.0626  0.0013  -0.0139
s.e.   0.0279  0.0270   0.0374   0.0314   0.0266  0.0354  0.0442   0.0319
         ma23    ma24     ma25    ma26
      -0.0108  0.0201  -0.0084  0.0319
s.e.   0.0281  0.0278   0.0312  0.0226

sigma^2 estimated as 6.253:  log likelihood = -4724.9,  aic = 9507.79

Fuente: elaboración propia

Una vez que se cuenta con ambos modelos, ahora sí podemos hablar acerca de los problemas de autocorrelación, el AIC y también se presentarán los diferenciales entre el dato real y el dato pronosticado, esto con el fin de conocer cuál es el mejor modelo.

Tabla 4 Comparación de modelos ARIMA

	Ljung - Box (valor p)	AIC	Dato real	Dato pronosticado	Diferencial
Modelo Autoarima	0.7412	9485.06	$ 35.75	$ 36.28	-$ 0.53
Modelo Propuesto	0.5941	9507.79	$ 35.75	$ 36.26	-$ 0.51

Fuente: elaboración propia

Se presentan los resultados de ambos modelos, como se puede observar en la prueba Ljung - Box (con H₀ : los residuales del ARIMA no están correlacionados) ambos modelos no rechazan la H₀. En cuanto al AIC, la regla práctica de elegir el menor valor, nos dictaría elegir el modelo (2,1,2). Por último, si comparamos los datos pronosticados con el dato real (en este caso el del 19 de enero) podemos notar que hay un menor diferencial con el modelo propuesto, no obstante no parece ser significativo, por lo que se decide tomar al propuesto por la función AUTOARIMA como el mejor modelo.

Figura 7 Residuales del mejor modelo ARIMA


    Ljung-Box test

data:  Residuals from ARIMA(2,1,2)
Q* = 3.5205, df = 6, p-value = 0.7412

Model df: 4.   Total lags used: 10

Fuente: elaboración propia

Una vez elegido el modelo y tener la certeza que no existen problemas de autocorrelación, es momento de revisar si existen problemas de raíces unitarias en el proceso AR y MA. Esto también nos podría sugerir si el modelo es estable.

Figura 8 Pruebas de raíces unitarias del mejor modelo ARIMA

Fuente: elaboración propia

Como se observa en el gráfico, este modelo es estable. Entonces, tenemos un modelo estable y sin problemas de autocorrelación, con un diferencial negativo de $.51 dólares. Por lo que podemos concluir que este es un buen modelaje que nos podría pronosticar el futuro comportamiento del ETF USO. El problema con el modelo propuesto (2,1,26) se encuentra en la poca estabilidad que sugiere su gráfico de raíces invertidas, además, al incluir tantos componentes puede ir en contra del principio de la navaja de Ockham. [11]

Modelos de volatilidad

Se pueden desarrollar modelos autorregresivos para datos de series de tiempo univariantes que son estacionarios (AR) o que tienen una tendencia (ARIMA). Todos estos tienen algo en común: no modelan un cambio en la varianza a lo largo del tiempo, pues dentro de sus supuestos básicos se encuentra que la varianza es constante a lo largo del tiempo y que su error se distribuye como una normal a lo largo del tiempo, es decir, homocedásticos. Una serie de tiempo con pequeños cambios en la varianza a veces se puede ajustar usando una transformación de Box-Cox.[12]

Hay algunas series de tiempo en las que la varianza cambia constantemente a lo largo del tiempo. En el contexto de una serie de tiempo en el argot financiero, esto se llamaría volatilidad. Hay algunas series de tiempo donde la varianza aumenta de manera sistemática, a esta propiedad de la serie se llama heterocedasticidad, o en palabras amigables, variaciones desiguales a lo largo la serie.[12]

Modelos ARCH

Si el cambio en la varianza puede correlacionarse con el tiempo, entonces puede modelarse usando un proceso autorregresivo, como ARCH. El método ARCH o Autorregresivo Condicional Heterocedástico proporciona una forma de modelar un cambio en la varianza en una serie de tiempo que depende del tiempo, como una volatilidad creciente o decreciente.[12]

En los modelos ARCH, la autocorrelación en la volatilidad es modelada permitiendo que la varianza condicional del término de error, dependa del valor anterior del error al cuadrado: [13]

\[\sigma_{t}^{2}= \omega + \alpha _1u_{t-1}^{2}\] El modelo anterior supone un ARCH(1) y se puede trasladar a su forma general, en la cual se asume que la varianza del error depende de q rezagos de los errores al cuadrado:

\[\sigma_{t}^{2}= \omega+ \alpha _1u_{t-1}^{2}+\alpha _2u_{t-2}^{2}+...+\alpha _qu_{t-q}^{2}\]

Condiciones necesarias en un modelo ARCH [13]

No negatividad: El valor de la varianza siempre debe ser estrictamente positivo (esto por ser el cuadrado de los errores). Se debe satisfacer que:

\[\alpha_i \geq 0 \forall i=1,2,...,q\]

Confirmar que hay efectos ARCH en las series: Esto con la prueba ARCH, la cual tiene H_₀ : Hay efectos ARCH. Por lo que los q rezagos de los errores al cuadrado son significativos (≠ 0) en la serie, entonces se puede modelar con un modelo de varianza condicional.
La sumatoria de los parámetros no puede ser mayor a 1: si la suma de los valores que reportan los parámetros del modelo es mayor uno, la volatilidad de la serie explota con el tiempo, en otras palabras, el modelo es inestable.

Modelos GARCH

Los modelos Generalizados Autorregresivos Condicionales Heterocedásticos (GARCH) son una extensión del modelo ARCH que incorpora un componente de media móvil junto con el componente autorregresivo. [12] La introducción de un componente de media móvil permite que el modelo modele tanto el cambio condicional en la varianza a lo largo del tiempo, como los cambios en la varianza dependiente del tiempo.[12]

En un modelo GARCH (p,q) la varianza condicional actual se parametriza para depender de q rezagos del error al cuadrado y los p rezagos de la varianza condicional:

\[\sigma_{t}^{2}=\omega+\alpha_{1}u_{t-1}^{2}+\alpha_{2}u_{t-2}^{2}+...+\alpha_{q}u_{t-q}^{2}+\beta_{1}\sigma_{t-1}^{2} +\beta_{2}\sigma_{t-2}^{2}+...+\beta_{p}\sigma_{t-p}^{2}\] De modo que un modelo GARCH permite interpretar [13]:

La varianza ajustada
ω como una función ponderada de un promedio de largo plazo
la información de la volatilidad previa representada por α
la varianza ajustada del modelo del periodo anterior β

Aplicación de Modelos ARCH y GARCH propuestos

En este apartado se propondrán algunos modelos tanto ARCH como GARCH para tratar de explicar el comportamiento de la serie de rendimientos del ETF USO que presenta clústeres de volatilidad. En primera instancia, se debe correr la prueba ARCH:

Figura 9 Prueba ARCH


    ARCH LM-test; Null hypothesis: no ARCH effects

data:  USO_R
Chi-squared = 446.05, df = 12, p-value < 2.2e-16

Fuente: elaboración propia

El valor p nos obliga a rechazar la hipótesis nula que asevera que no hay efectos ARCH en la serie, por lo tanto contamos con evidencia estadística para cumplir con la segunda condición de los modelos ARCH.

A continuación se presentan algunos modelos ARCH y GARCH junto con sus respectivos valores de AKAIKE y BAYES para que, con base en ellos, se elija al mejor modelo de entre los seleccionados.

Tabla 5 Modelos ARCH y GARCH propuestos

MODELO	ω	α₁	α₂	β₁	₂	AKAIKE	BAYES
ARCH(1)*	0.000298	0.457958				-4.8998	-4.8942
ARCH(2)	0.000235	0.371951	0.221233			-4.939	-4.9307
GARCH(1,1)	0.000006	0.112104		0.881893		-5.0835	-5.0752
GARCH(1,2)	0.000008	0.150323		0.370961	0.468525	-5.0838	-5.0727
GARCH(2,1)	0.000006	0.111848	0.000028	0.882116		-5.0819	-5.0708
GARCH(2,2)	0.00001	0.140608	0.030763	0.21028	0.606967	-5.083	-5.0692

Fuente: elaboración propia

Como se puede observar en el ejercicio previo, tanto el GARCH (1,1) como el GARCH(1,2) parecen ser los mejores modelos, sin embargo se tomará como “el mejor” al primero debido al ya mencionado principio de la navaja de Ockham. El modelo quedaría representado de la siguiente manera:

\[\sigma_{t}^{2}=\omega+\underset{ARCH(1)}{\underbrace{\alpha_{1}u_{t-1}^{2}}} + \underset{GARCH(1)}{\underbrace{\beta_{1}\sigma_{t-1}^{2}}}\] Con los valores obtenidos quedaría:

\[\sigma_{t}^{2}=0.000006+0.11261u_{t-1}^{2}+0.881557\sigma_{t-1}^{2}\]

La volatilidad del ETF USO se explica en un 11.26% por la volatilidad (o rendimientos) de un día anterior y en un 88.15% por la varianza ajustada rezagada un período. Adicionalmente, podemos notar que se cumplen con las características de un modelo bien especificado y estable: los componentes tanto ARCH como GARCH son significativos, son positivos y la suma de ellos es menor a 1.

En la siguiente figura se presenta la varianza condicional del modelo enfrentada con los rendimientos de la serie.

Figura 10 Modelo GARCH (1,1) vs rendimientos

Fuente: elaboración propia

Como se observa en el gráfico, el modelo captura la volatilidad de los rendimientos de manera exitosa, incluso en esos clústeres en el 2020.

Figura 11 Pronóstico de rendimiento para el 19 de enero de 2021


*------------------------------------*
*       GARCH Model Forecast         *
*------------------------------------*
Model: sGARCH
Horizon: 1
Roll Steps: 0
Out of Sample: 0

0-roll forecast [T0=2021-01-14]:
    Series   Sigma
T+1      0 0.01803

Fuente: elaboración propia

Para el 19 de enero de 2021, con la herramienta ugarchforecast, R arroja que el rendimiento será de un 1.80%.

Conclusiones

Antes de entrar a las conclusiones, con los parámetros de los mejores modelos -GARCH (1,1) Y GARCH(1,2)-, se simulan los rendimientos del ETF USO. En el siguiente gráfico se puede observar como estos procesos si logran caracterizar los rendimientos reales del ETF, es decir, si permiten explicar la volatilidad del activo.

Figura 12 Rendimientos reales vs rendimientos simulados

Fuente: elaboración propia

Para las reflexiones finales, me permito referenciar un fragmento de una publicación anterior de mi autoría:

En cuanto a USO es necesario entender que este ETF estuvo a punto de la ruina, cambió su forma de organización con tal de no hacer perder todo a sus inversionistas incluso a tal punto de ir en contra de sus mismos principios. La historia nos demostró que esto no es para inversionistas minoritarios, así que no solo venda sino que no compre. Citando a Warren Pies (estratega de Ned Davis Research) y siendo sumamente claros terminaré esta publicación: “En este entorno, USO es un choque de trenes. Manténgase alejado”[15]

Dicho lo anterior, este ejercicio arroja luz sobre la volatilidad inesperada que sufrió el ETF. Incluso es más alarmante debido a las grandes pérdidas que llegó a sufrir el activo y, con decencia, podemos afirmar que siempre estuvieron provocados por los mismos administradores del fondo, por tanto es mejor no acercarse a un ambiente tan peligroso, financieramente hablando.