LABD

Direxion Daily S&P Biotech Bear 3X acciones

LABD forma para de los instrumentos financieros denominados como Exchange Traded Fund (ETF) que se caracterizan por replicar o hacer un track sobre un activo subyacente (acciones, índices, commodities, divisas, bonos…) o bien, replican un conjunto de activos (similar a un índice).

Los ETFs tienen la facilidad de que cotizan como una acción normal, permitiendo que su compra y venta sea sencilla de llevar a cabo.

LABD refiere a Direxion Daily S&P Biotech Bear 3X acciones y busca resultados de inversión diarios, antes de honorarios y gastos, del 300% del inverso del desempeño diario del S&P Biotechnology Select Industry Index.

LABD en circunstancias normales, invierte en acuerdos de swap, contratos de futuros, posiciones cortas u otros instrumentos financieros que, en combinación, proporcionan una exposición inversa (opuesta) o corta apalancada al índice igual al menos al 80% de los activos netos del fondo (más préstamos para fines de inversión)

El índice está diseñado para medir el rendimiento de la subindustria de la biotecnología en base a los Estándares de Clasificación de la Industria Global (“GICS”) [1].

Comportamiento del precio de LABD

A continuación, se presentan el comportamiento del precio de cierre de LABD a partir del 28 de Mayo del 2015 al 20 de marzo de 2020. LABD presentó su mayor crecimiento a inicios de febrero del 2016, llegando a los $756.2 usd. y a partir de ahí una caída en picada o tendencia a la baja generalizada hasta la actualidad llegando hasta $21.17 usd por ETF.

Figura 1. Precio de Cierre de LABD y S&P500: enero 2015 - marzo 2020

Fuente: elaboración propia con salida de R.

Si se compara este comportamiento con la tendencia registrada por el índice S&P500, que representa las 500 emisoras más representativas que cotizan en Estados Unidos, se puede ver un comportamiento inverso a LABD, lo cual tiene sentido ya que el ETF paga el inverso al rendimiento o desempeño del índice corroborar en la Figura 2.

En lo que refiere a los rendimientos, el S&P500 en promedio osciló entre 5% en tanto que LABD estuvo fluctuando entre 2% debido a que es un instrumento que presenta mayor volatilidad, es decir, presenta más dispersión en sus precios.

A partir de la contingencia sanitaria COVID 19 que se originó en la ciudad de Wuhan, China, el índice Presenta una notable recuperación lo cual es normal ya que las bolsas de valores a nivel mundial se cayeron debido a la caída de los precios del petróleo y la contingencia sanitaria principalmente como también podemos corroborarlo en la Figura 2.

Figura 2. Rendimientos de S&P500 y LABD: enero de 2015 a marzo 2020 Fuente: elaboración propia con salida de R.

Correlación entre LABD y S&P500

La correlación que hay entre los precios de cierre a niveles y entre los rendimientos de LABD y el S&P500, muestra una alta relación inversa cercana al 82.49% y 65.96% respectivamente. Esto tiene bastante sentido ya que la caída del índice S&P500 Biotechnology es el beneficio que obtiene LABD y viceversa.

Tabla 2. Correlación de LABD y S&P500 a niveles

           SP500       LABD
SP500  1.0000000 -0.8249095
LABD  -0.8249095  1.0000000

Fuente: elaboración propia con salida de R.

Tabla 3. Correlación de LABD y S&P500 en rendimientos

           SP500       LABD
SP500  1.0000000 -0.6596588
LABD  -0.6596588  1.0000000

Fuente: elaboración propia con salida de R.

Histogramas y gráficos Q-Q

Los histogramas son gráficos que representan frecuencia de un fenómeno o de una variable mediante una distribución de los datos. En el caso de EDZ y del S&P500, a partir de los intervalos o marcas de clase que se hacen sobre ellos, se puede identificar el número de veces (frecuencia) que los precios caen en dicho intervalo.

En la figura 3 se presentan los histogramas a niveles del S&P500 y del LABD; el eje vertical representan las frecuencias y en el eje horizontal los valores de las variables (puntos base y precios respectivamente).

El histograma del S&P500 a niveles indica que, en el periodo de muestra, el índice tuvo mayor número de repeticiones en los 2080 puntos (34 veces). Sin embargo, la mayor parte de la distribución se centra entre los 2000 y los 2800 puntos. Para el caso de LABD, su mayor número de repeticiones es 185 para el precio de 24usd.

Figura 3. Histogramas a niveles S&P500 y LABD: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

En lo que refiere a los rendimientos, en promedio, los rendimientos presentan un proceso de reversión a la media (0), sin embargo, la distribución de los rendimientos del S&P500 oscila entre 5% y los de LABD en 2%, tal cual como se observó en la figura 2. La figura 4 presenta el histograma de los dos instrumentos que se han estado analizando en rendimientos.

Figura 4. Histogramas en rendimientos S&P500 y LABD: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

Los gráficos Cuantil-Cuantil (también referidos como q-q plots) es la representación gráfica de la distribución de un conjunto de datos a alguna distribución ideal o a priori que se asume como dada. La finalidad de estos gráficos es comparar la distribución teórica (la que suponemos o queremos como se comporte) contra la distribución empírica (la que realmente presenta la variable).

El siguiente gráfico muestra los gráficos Q-Q del S&P y de LABD; los cuantiles teóricos o la distribución contra la que se están comparando los precios es contra una distribución normal; si la distribución empírica fuera así, entonces los puntos de dispersión deberían de distribuirse en torno a la recta.

Lo que se observa es que sí hay una parte de la distribución que se asocia a la línea recta, sin embargo, son más los datos, sobre todo en los extremos o en las colas, donde la distribución se “despega” de la normalidad.

Figura 5. Q-Q plot a niveles S&P500 y LABD: enero de 2015 a marzo 2020 Fuente: elaboración propia con salida de R.

Lo mismo se observa en el caso del gráfico Q-Q de los rendimientos, sin embargo, en este ejemplo, nótese que los datos, al menos en la parte central de la distribución, están más pegados a la recta, esto tiene que ver con la propiedad que cumplen los rendimientos (media cero o constante que es uno de los supuestos que se debe de cumplir para la estacionariedad de las series), sin embargo, ambos instrumentos tuvieron días que presentaron rendimientos que rebasaron su media, provocando mayor dispersión en sus datos.

Con esta representación, no se puede garantizar la normalidad en los datos, y en lo que respecta a los instrumentos financieros, lo más normal es que no sean normales.

Figura 5. Q-Q plot en rendimientos S&P500 y LABD: enero de 2015 a marzo 2020 Fuente: elaboración propia con salida de R.

Estacionariedad y pruebas de raices unitarias

El concepto de estacionariedad es importante para la estimación y para la elaboración de pronósticos, el no garantizar esta condición implicaría que las series, no serían independientes e idénticamente distribuidas, ocasionado problemas de sesgo en las estimaciones, regresiones espurias o el mal cálculo de las bandas de confianza a partir de datos que se encuentran correlacionados.

Las pruebas de raíces unitarias permiten identificar si la serie es estacionaria o no, verificando si la serie tiene alguna estructura de dependencia con los datos anteriores. Al pronosticar series de tiempo, se asumen que estas son aleatorias, por lo tanto:

Ecuación 1

\[E\left ( Y_t \right| \phi_t )=0\]

Donde \(Y_t\) es el valor esperado de la variable condicionado a \(\phi_t\), que refiere a la información pasada o registrada de la misma variable. Si esta variable es aleatoria, entonces su valor esperado es 0. La ecuación 1 también se le conoce como un proceso estocástico y en este caso, los precios se comportan de manera aleatoria, es decir:

Ecuación 2

\[f\left ( Y_t \right| Y_{t-1} )=f ( Y_{t} )\]

Cuando llega nueva información, los precios de las acciones fluctuarán aleatoriamente, al menos así lo dice la teoría.

Adicional al supuesto de la ecuación 1, las condiciones de estacionariedad también implican que las series sean homocedásticas, es decir, que su varianza sea constante. Este supuesto es difícil de cumplir para las series financieras debido a la dispersión o volatilidad que presentan los datos, sin embargo, de este supuesto nos encargaremos después.

Lo primero que se requiere garantizar es que la serie no tenga problemas de raíces unitarias, para que al menos se pueda garantizar el primer supuesto (valor esperado = 0).

Pruebas de raíces unitarias

Las pruebas que se utilzian para detectar raíces unitarias en este análisis son: Dickey Fuller Aumentada (DFA), Phillips Perron y la prueba Kwiatkowski - Phillips - Schmidt - Shin (KPSS). La tabla 4 muestra los resultados de S&P500 y de LABD a niveles y rendimientos.

Tabla 4. Pruebas de raíces unitarias

Variable \(DFA^{a/}\)(Valor p) \(Phillips-Perron^{b/}\)(Valor p) \(KPSS^{c/}\)(Valor p)
S&P500 (a niveles) 0.3986 0.5539 0.01
S&P500 (rendimientos) 0.01 0.01 0.1
LABD (a niveles) 0.2344 0.2025 0.01
LABD (rendimientos) 0.01 0.01 0.1

\(^{a/}H0\): La serie tiene raíz unitaria

\(^{b/}H0\): La serie tiene raíz unitaria

\(^{c/}H0\): La serie es estacionaria

Fuente. Elaboración propia con salida de R.

NUNCA OLVIDAR:

Si valor p mayor a 0.05 No rechazo (acepto) H0.

Si valor p menor a 0.05 Rechazo H0.

¿Por qué la serie en rendimientos no tiene raíz unitaria?

Se debe a lo siguiente:

\[Y_t = \alpha + \beta Y_{t-1} + e_t\]

Suponga \(\beta=1\).

\[Y_t = \alpha + Y_{t-1} + e_t\]

Donde \(Y_t\) depende del valor pasado \(Y_{t-1}\), si esto es cierto, entonces la serie no es aleatoria, hay dependencia con el dato anterior y no podemos cumplir con el primer supuesto (ecuación 1).

A este proceso se le conoce también como: “caminata aleatoria”.

Se aplican primeras diferencias en ambas partes de la ecuación.

\[Y_t - Y_{t-1} = \alpha + \beta Y_{t-1} - Y_{t-1} + e_t\]

\[\Delta Y_t= \alpha + Y_{t-1}(\beta -1) + e_t\]

Recordemos que \(\beta=1\).

\[\Delta Y_t= \alpha + Y_{t-1}(1 -1) + e_t\]

\[\Delta Y_t= \alpha + Y_{t-1}(0) + e_t\] \[\therefore \]

\[ \Delta Y_t= \alpha + e_t\]

La serie, en primeras diferencias, no tiene raíz unitaria, solo depende del error y del intercepto, pero no de los valores pasados o registrados del precio, por lo tanto, es estacionaria.

A este proceso también se le conoce como “ruido blanco”.

Modelos ARIMA (LABD)

Ahora, se va a calcular el primer modelo ARIMA para hacer los pronósticos, utilizando la metodología de Box & Jenkins.

Se obtiene la Función de Autocorrelación (MA) y Función de Autocorrelación parcial (AR). Ambas series requieren ser integrada de orden I, es decir, se les tiene que aplicar una primera diferencia para que al menos puedan ser estacionarias en media. La aplicación de la primera diferencia es congruente con los resultados de las pruebas unitarias, en donde es necesario que las series se transformen en rendimientos.

Figura 6. Componentes de autocorrelación ACF y PACF

Fuente: elaboración propia con salida de R.

Al revisar el correlograma (a pesar de diferenciar una vez la serie), se identifican componentes de autocorrelación tanto en el procero Autorregresivo (PACF) y en el proceso de media móvil (ACF).

El primer ajuste que se hace para el pronóstico de LABD es utilizando la función auto.arima de R, que propone una combinación de ARIMA(0,1,0) para corregir los problemas de autocorrelación.

Tabla 5. Resultados del ARIMA(0,1,0) para LABD

Series: LABD 
ARIMA(0,1,0) 

sigma^2 estimated as 360.5:  log likelihood=-5283.16
AIC=10568.33   AICc=10568.33   BIC=10573.43

Fuente: elaboración propia con salida de R.

Figura 7. Resultados del ARIMA(0,1,0) para LABD


    Ljung-Box test

data:  Residuals from ARIMA(0,1,0)
Q* = 165.28, df = 30, p-value < 2.2e-16

Model df: 0.   Total lags used: 30

Fuente: elaboración propia con salida de R.

El resultado muestra que no se han terminado de corregir los problemas de autocorrelación. Aplicando la prueba de Ljung-Box, donde la H0 es: los datos se distribuyen de forma independiente o dicho de otra forma, los residuales del ARIMA no están correlacionados. Para el ARIMA(0,1,0) la H0 se rechaza. Si bien se puede realizar un pronóstico con estos resultados, se cae el riesgo de obtener resultados sesgados (debido a los problemas de autocorrelación).

A continuación, se muestra la estabilidad del modelo a partir del gráfico de raíces uniarias, tanto en el proceso AR como en el de MA.

Figura 8. Prueba de racíces unitarias ARIMA(0,1,0) - círculo unitario

Fuente: elaboración propia con salida de R.

Si bien el modelo es estable, los problemas de autocorrelación no han sido solventados en su totalidad, por lo que se propone el siguiente modelo.

Propuesta de modelo ARIMA(11,1,28) para LABD

Este modelo mejora significativamente los resultados propuestos por el ARIMA, se corrigen los problemas (en su mayoría) de autocorrelación en los residuales de acuerdo a los resultados de la prueba de Ljung-Box.

Tabla 6. Resultados del ARIMA(11,1,28) para LABD


Call:
arima(x = LABD, order = c(11, 1, 28))

Coefficients:
          ar1      ar2     ar3      ar4      ar5      ar6      ar7     ar8
      -0.0230  -0.0850  0.2502  -0.5643  -0.4169  -0.3624  -0.5458  0.3246
s.e.   0.1091   0.1525  0.1437   0.1288   0.1491   0.0973   0.0597  0.0646
          ar9     ar10     ar11     ma1     ma2      ma3     ma4     ma5
      -0.0964  -0.1681  -0.7302  0.0087  0.1294  -0.2766  0.5451  0.4349
s.e.   0.0899   0.0891   0.0596  0.1095  0.1499   0.1447  0.1340  0.1597
         ma6     ma7      ma8      ma9    ma10    ma11    ma12     ma13
      0.3704  0.6287  -0.3793  -0.0194  0.2147  0.9524  0.0421  -0.2133
s.e.  0.1083  0.0707   0.0790   0.1038  0.1002  0.0731  0.0590   0.0546
         ma14     ma15     ma16    ma17    ma18     ma19     ma20    ma21
      -0.0801  -0.0010  -0.0637  0.1291  0.0648  -0.1197  -0.4183  0.1926
s.e.   0.0636   0.0545   0.0584  0.0620  0.0465   0.0442   0.0484  0.0616
        ma22     ma23     ma24     ma25     ma26     ma27    ma28
      0.1493  -0.0453  -0.0584  -0.0528  -0.0395  -0.1881  0.1177
s.e.  0.0814   0.0586   0.0509   0.0655   0.0555   0.0417  0.0412

sigma^2 estimated as 288.9:  log likelihood = -5158.61,  aic = 10397.22

Fuente: elaboración propia con salida de R.

Figura 9. Resultados del ARIMA(11,1,28) para LABD


    Ljung-Box test

data:  Residuals from ARIMA(11,1,28)
Q* = 8.9788, df = -9, p-value = NA

Model df: 39.   Total lags used: 30

Fuente: elaboración propia con salida de R.

El modelo, a pesar de ser menos parsimonioso, sigue siendo estable, y los residuos se distributyen de una manera normal.

Figura 10. Prueba de racíces unitarias ARIMA(11,1,28) - círculo unitario

Fuente: elaboración propia con salida de R.

A continuación se presentan los pronósticos obtenidos por ambos modelos.

Figura 11. Pronóstico a 20 días de LABD con ARIMA(0,1,0)

Fuente: elaboración propia con salida de R.

Los problemas de una mala especificación o el no corregir los problemas de autocorrelación del modelo, implica que no se obtengan resultados confiables. La propuesta del ARIMA(11,1,28) mejora significativamente su consistencia, pues en este no esta presente la autocorrelación y el valor del criterio de AIC es menor, pero el pronostico empeora de una manera significativa, como se puede observar en la figura 12 y en la tabla de comparación de pronosticos.

Figura 12. Pronóstico a 20 días de LABD con ARIMA(11,1,28)

Fuente: elaboración propia con salida de R.

Los pronósticos para LABD los días 23 y 24 de marzo son:

Fecha Dato real Pronosticado ARIMA (0,1,0) Pronosticado ARIMA (11,1,28)
23-mar-20 21.61 20.36 22.79445
24-mar-20 16.42 20.36 24.90301
Criterio de información AIC 10568.33 10397.22

Finalmente, el Criterio de Información de Akaike muestra un mejor ajuste para el ARIMA(11,1,28).

**Si bien el modelo ARIMA(11,1,28) presenta un mejor ajuste en la autocorrelación y el valor de AIC, podemos observar que empeora la aproximación al precio real inmediato pronosticado (23 de marzo).

Conclusiones

En este trabajo se analizó el comportamiento de LABD, se comparó contra el S&P500 revisando su comportamiento a niveles y en rendimientos. Posteriormente, se hicieron histogramas y gráficos Q-Q que permitieron visualizar la distribución que siguen las series y la mayor parte de la concentración tanto en precios como en rendimientos.

Posteriormente, se realizaron pruebas de raíces unitarias para identificar la estacionariedad de las series en donde los resultados indicaros que las series, para que cumplan con este supuesto (al menos en media o un sentido débil), deben de ser integradas de orden I, es decir, se les tiene que aplicar una primera diferencia.

Consecutivamente, se obtuvieron los correlogramas para identificar los procesos de autocorrelación de las series, en el caso de LABD, se plantearon dos modelos, un ARIMA(0,1,0) propuesto por R y un ARIMA(11,1,28). La primera especificación, a pesar de que era un modelo estable, no corregía en su totalidad los problemas de autocorrelación provocando distorsiones en los pronósticos en tanto que el un ARIMA(0,1,0) muestra mejores resultados, caso contrario del ARIMA (11,1,28) corrige autocorrelación pero empeora los pronósticos.

Si bien esta propuesta mejora la implementada por R, no significa que este sea el mejor modelo o que no se puedan hacer otras especificaciones, pero al menos cumple con los supuestos y permite que tengamos más herramientas para la toma de decisiones.

Finalmente, con base al pronóstico realizado, se sugiere estimar el ARIMA(0,1,0) incorporando siempre la nueva información para ajustar el modelo.

Referencias

[1] Direxion Funds. (2020). Direxion Daily S&P Biotech Bull and Bear 3X acciones. Direxion. Recuperado el 9 de abril de 2020, de https://www.direxion.com/products/daily-sp-biotech-bull-3x-shares

[2] Yahoo Finance. (2020). Direxion Daily S&P Biotech Bear 3X acciones (LABD). Yahoo. Recuperado el 9 de abril del 2020, de https://finance.yahoo.com/quote/LABD?p=LABD