XLE

Energy Select Sector SPDR Fund

XLE forma para de los instrumentos financieros denominados como Exchange Traded Fund (ETF) que se caracterizan por replicar o hacer un track sobre un activo subyacente (acciones, índices, commodities, divisas, bonos…) o bien, replican un conjunto de activos (similar a un índice).

Los ETFs tienen la facilidad de que cotizan como una acción normal, permitiendo que su compra y venta sea sencilla de llevar a cabo.

XLE refiere a Energy Select Sector SPDR Fund es un fondo cotizado en bolsa incorporado en los Estados Unidos. El objetivo de los Fondos es proporcionar resultados de inversión que se correspondan con el desempeño de The Energy Select Sector Index. El índice incluye compañías que desarrollan y producen petróleo crudo y gas natural que proporcionan servicios de perforación y otros servicios relacionados con la energía.

XLE tiene por objeto proveer resultados de inversión que se corresponden con el precio y el rendimiento del sector de Energía del índice S&P 500. El índice incluye las empresas que principalmente desarrollan y producen petróleo crudo y gas natural, realizan perforaciones y otros servicios relacionados con la energía. El Fondo utiliza mecanismos para invertir en una cartera de las acciones que tratan de replicar el índice. El asesor de este fondo de inversión de consejero es SSgA Funds Management, Inc.

Comportamiento del precio de XLE

A continuación, se presentan el comportamiento del precio de cierre de XLE a partir del 1 de enero de 2015 al 30 de marzo de 2020. XLE presentó su mayor crecimiento a finales de abril de 2015, esto está relacionado con los enfrentamientos en Yemen, el petroleo tuvo un rapido y fuerte crecimiento en las dos primeras semanas de abril. La Figura 1 muestra el comportamiento del precio de cierre de XLE.

Figura 1. Precio de Cierre de XLE y S&P500: enero 2015 - marzo 2020

Fuente: elaboración propia con salida de R.

Si se compara este comportamiento con la tendencia registrada por el índice S&P500, que representa las 500 emisoras más representativas que cotizan en Estados Unidos, se puede ver un comportamiento inverso a XLE, esto tiene que ver con la fuerza de arrastre y contagio que tiene el S&P500 sobre los índices de economías emergentes, lo cual se puede corroborar en la Figura 2.

En lo que refiere a los rendimientos, el S&P500 en promedio osciló entre 2% en tanto que EDZ estuvo fluctuando entre 10% debido a que es un instrumento que presenta mayor volatilidad, es decir, presenta más dispersión en sus precios.

Figura 2. Rendimientos de S&P500 y EDZ: enero de 2015 a marzo 2020 Fuente: elaboración propia con salida de R.

Correlación entre XLE y S&P500

La correlación que hay entre los precios de cierre a niveles y entre los rendimientos de EDZ y el S&P500, muestra una alta relación inversa del 26.14 respectivamente. Esto tiene bastante sentido ya que la caída de los índices es el beneficio que obtiene XLE y viceversa.

Tabla 2. Correlación de XLE y S&P500 a niveles

           SP500        XLE
SP500  1.0000000 -0.2614666
XLE   -0.2614666  1.0000000

Fuente: elaboración propia con salida de R.

Tabla 3. Correlación de XLE y S&P500 en rendimientos

          SP500       XLE
SP500 1.0000000 0.7625662
XLE   0.7625662 1.0000000

Fuente: elaboración propia con salida de R.

Histogramas y gráficos Q-Q

Los histogramas son gráficos que representan frecuencia de un fenómeno o de una variable mediante una distribución de los datos. En el caso de XLE y del S&P500, a partir de los intervalos o marcas de clase que se hacen sobre ellos, se puede identificar el número de veces (frecuencia) que los precios caen en dicho intervalo.

En la figura 3 se presentan los histogramas a niveles del S&P500 y del XLE; el eje vertical representan las frecuencias y en el eje horizontal los valores de las variables (puntos base y precios respectivamente).

El histograma del S&P500 a niveles indica que, en el periodo de muestra, el índice tuvo mayor número de repeticiones en los 2100 puntos (48 veces). Sin embargo, la mayor parte de la distribución se centra entre los 2000 y los 3000 puntos. Para el caso de XLE, su mayor número de repeticiones es 115 para el precio de 42usd. Los valores más extremos y con pocas repeticiones se sitúan en más de los 300usd.

Figura 3. Histogramas a niveles S&P500 y EDZ: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

En lo que refiere a los rendimientos, en promedio, los rendimientos presentan un proceso de reversión a la media (0), sin embargo, la distribución de los rendimientos del S&P500 oscila entre 2% y los de en 3%, tal cual como se observó en la figura 2. La figura 4 presenta el histograma de los dos instrumentos que se han estado analizando en rendimientos.

Figura 4. Histogramas en rendimientos S&P500 y XLE: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

Los gráficos Cuantil-Cuantil (también referidos como q-q plots) es la representación gráfica de la distribución de un conjunto de datos a alguna distribución ideal o a priori que se asume como dada. La finalidad de estos gráficos es comparar la distribución teórica (la que suponemos o queremos como se comporte) contra la distribución empírica (la que realmente presenta la variable).

El siguiente gráfico muestra los gráficos Q-Q del S&P y de XLE; los cuantiles teóricos o la distribución contra la que se están comparando los precios es contra una distribución normal; si la distribución empírica fuera así, entonces los puntos de dispersión deberían de distribuirse en torno a la recta.

Lo que se observa es que sí hay una parte de la distribución que se asocia a la línea recta, sin embargo, son más los datos, sobre todo en los extremos o en las colas, donde la distribución se “despega” de la normalidad.

Figura 5. Q-Q plot a niveles S&P500 y XLE: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

Lo mismo se observa en el caso del gráfico Q-Q de los rendimientos, sin embargo, en este ejemplo, nótese que los datos, al menos en la parte central de la distribución, están más pegados a la recta, esto tiene que ver con la propiedad que cumplen los rendimientos (media cero o constante que es uno de los supuestos que se debe de cumplir para la estacionariedad de las series), sin embargo, ambos instrumentos tuvieron días que presentaron rendimientos que rebasaron su media, provocando mayor dispersión en sus datos.

Con esta representación, no se puede garantizar la normalidad en los datos, y en lo que respecta a los instrumentos financieros, lo más normal es que no sean normales.

Figura 5. Q-Q plot en rendimientos S&P500 y XLE: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

Estacionariedad y pruebas de raices unitarias

El concepto de estacionariedad es importante para la estimación y para la elaboración de pronósticos, el no garantizar esta condición implicaría que las series, no serían independientes e idénticamente distribuidas, ocasionado problemas de sesgo en las estimaciones, regresiones espurias o el mal cálculo de las bandas de confianza a partir de datos que se encuentran correlacionados.

Las pruebas de raíces unitarias permiten identificar si la serie es estacionaria o no, verificando si la serie tiene alguna estructura de dependencia con los datos anteriores. Al pronosticar series de tiempo, se asumen que estas son aleatorias, por lo tanto:

Ecuación 1

\[E\left ( Y_t \right| \phi_t )=0\]

Donde \(Y_t\) es el valor esperado de la variable condicionado a \(\phi_t\), que refiere a la información pasada o registrada de la misma variable. Si esta variable es aleatoria, entonces su valor esperado es 0. La ecuación 1 también se le conoce como un proceso estocástico y en este caso, los precios se comportan de manera aleatoria, es decir:

Ecuación 2

\[f\left ( Y_t \right| Y_{t-1} )=f ( Y_{t} )\]

Cuando llega nueva información, los precios de las acciones fluctuarán aleatoriamente, al menos así lo dice la teoría.

Adicional al supuesto de la ecuación 1, las condiciones de estacionariedad también implican que las series sean homocedásticas, es decir, que su varianza sea constante. Este supuesto es difícil de cumplir para las series financieras debido a la dispersión o volatilidad que presentan los datos, sin embargo, de este supuesto nos encargaremos después.

Lo primero que se requiere garantizar es que la serie no tenga problemas de raíces unitarias, para que al menos se pueda garantizar el primer supuesto (valor esperado = 0).

Pruebas de raíces unitarias

Las pruebas que se utilzian para detectar raíces unitarias en este análisis son: Dickey Fuller Aumentada (DFA), Phillips Perron y la prueba Kwiatkowski - Phillips - Schmidt - Shin (KPSS). La tabla 4 muestra los resultados de S&P500 y de XLE a niveles y rendimientos.

Tabla 4. Pruebas de raíces unitarias

Variable	\(DFA^{a/}\)(Valor p)	\(Phillips-Perron^{b/}\)(Valor p)	\(KPSS^{c/}\)(Valor p)
S&P500 (a niveles)	0.4464	0.5515	0.01
S&P500 (rendimientos)	0.01	0.01	0.1
EDZ (a niveles)	0.99	0.01	0.01
EDZ (rendimientos)	0.01	0.03726	0.1

\(^{a/}H0\): La serie tiene raíz unitaria

\(^{b/}H0\): La serie tiene raíz unitaria

\(^{c/}H0\): La serie es estacionaria

Fuente. Elaboración propia con salida de R.

NUNCA OLVIDAR:

Si valor p mayor a 0.05 No rechazo (acepto) H0.

Si valor p menor a 0.05 Rechazo H0.

¿Por qué la serie en rendimientos no tiene raíz unitaria?

Se debe a lo siguiente:

\[Y_t = \alpha + \beta Y_{t-1} + e_t\]

Suponga \(\beta=1\).

\[Y_t = \alpha + Y_{t-1} + e_t\]

Donde \(Y_t\) depende del valor pasado \(Y_{t-1}\), si esto es cierto, entonces la serie no es aleatoria, hay dependencia con el dato anterior y no podemos cumplir con el primer supuesto (ecuación 1).

A este proceso se le conoce también como: “caminata aleatoria”.

Se aplican primeras diferencias en ambas partes de la ecuación.

\[Y_t - Y_{t-1} = \alpha + \beta Y_{t-1} - Y_{t-1} + e_t\]

\[\Delta Y_t= \alpha + Y_{t-1}(\beta -1) + e_t\]

Recordemos que \(\beta=1\).

\[\Delta Y_t= \alpha + Y_{t-1}(1 -1) + e_t\]

\[\Delta Y_t= \alpha + Y_{t-1}(0) + e_t\] \[\therefore \]

\[ \Delta Y_t= \alpha + e_t\]

La serie, en primeras diferencias, no tiene raíz unitaria, solo depende del error y del intercepto, pero no de los valores pasados o registrados del precio, por lo tanto, es estacionaria.

A este proceso también se le conoce como “ruido blanco”.

Modelos ARIMA (XLE)

Ahora, se va a calcular el primer modelo ARIMA para hacer los pronósticos, utilizando la metodología de Box & Jenkins.

Se obtiene la Función de Autocorrelación (MA) y Función de Autocorrelación parcial (AR). Ambas series requieren ser integrada de orden I, es decir, se les tiene que aplicar una primera diferencia para que al menos puedan ser estacionarias en media. La aplicación de la primera diferencia es congruente con los resultados de las pruebas unitarias, en donde es necesario que las series se transformen en rendimientos.

Figura 6. Componentes de autocorrelación ACF y PACF

Fuente: elaboración propia con salida de R.

Al revisar el correlograma (a pesar de diferenciar una vez la serie), se identifican componentes de autocorrelación tanto en el procero Autorregresivo (PACF) y en el proceso de media móvil (ACF).

El primer ajuste que se hace para el pronóstico de EDZ es utilizando la función auto.arima de R, que propone una combinación de ARIMA(2,1,2) para corregir los problemas de autocorrelación.

Tabla 5. Resultados del ARIMA(2,1,2) para XLE

Series: XLE 
ARIMA(2,1,2) with drift 

Coefficients:
         ar1      ar2      ma1     ma2   drift
      0.2653  -0.5665  -0.2619  0.5949  -0.044
s.e.  0.3747      NaN   0.3623     NaN   0.027

sigma^2 estimated as 0.912:  log likelihood=-1797.37
AIC=3606.74   AICc=3606.8   BIC=3637.81

Fuente: elaboración propia con salida de R.

Figura 7. Resultados del ARIMA(2,1,2) para XLE


    Ljung-Box test

data:  Residuals from ARIMA(2,1,2) with drift
Q* = 24.264, df = 25, p-value = 0.5042

Model df: 5.   Total lags used: 30

Fuente: elaboración propia con salida de R.

El resultado muestra que no se han terminado de corregir los problemas de autocorrelación. Aplicando la prueba de Ljung-Box, donde la H0 es: los datos se distribuyen de forma independiente o dicho de otra forma, los residuales del ARIMA no están correlacionados. Para el ARIMA(2,1,2) la H0 se rechaza. Si bien se puede realizar un pronóstico con estos resultados, se cae el riesgo de obtener resultados sesgados (debido a los problemas de autocorrelación).

A continuación, se muestra la estabilidad del modelo a partir del gráfico de raíces uniarias, tanto en el proceso AR como en el de MA.

Figura 8. Prueba de racíces unitarias ARIMA(2,1,2) - círculo unitario

Fuente: elaboración propia con salida de R.

Si bien el modelo es estable, los problemas de autocorrelación no han sido solventados en su totalidad, por lo que se propone el siguiente modelo.

Propuesta de modelo ARIMA(7,1,0) para XLE

Este modelo mejora significativamente los resultados propuestos por el ARIMA, se corrigen los problemas de autocorrelación en los residuales de acuerdo a los resultados de la prueba de Ljung-Box.

Tabla 6. Resultados del ARIMA(7,1,0) para XLE


Call:
arima(x = XLE, order = c(7, 1, 0))

Coefficients:
         ar1     ar2     ar3     ar4      ar5     ar6     ar7
      0.0016  0.0328  0.0077  0.0102  -0.0053  0.0311  0.0728
s.e.  0.0277  0.0279  0.0279  0.0281   0.0282  0.0285  0.0285

sigma^2 estimated as 0.9049:  log likelihood = -1794.72,  aic = 3605.44

Fuente: elaboración propia con salida de R.

Figura 9. Resultados del ARIMA(7,1,0) para XLE


    Ljung-Box test

data:  Residuals from ARIMA(7,1,0)
Q* = 18.437, df = 23, p-value = 0.7334

Model df: 7.   Total lags used: 30

Fuente: elaboración propia con salida de R.

El modelo, nos indica ser estable.

Figura 10. Prueba de racíces unitarias ARIMA(7,1,0) - círculo unitario

Fuente: elaboración propia con salida de R.

Se presentan los pronósticos obtenidos por ambos modelos.

Figura 11. Pronóstico a 20 días de XLE con ARIMA(6,1,1)

Fuente: elaboración propia con salida de R.

Los problemas de una mala especificación o el no corregir los problemas de autocorrelación del modelo, implica que no se obtengan resultados confiables. La propuesta del ARIMA(7,1,0) mejora significativamente el pronóstico.

Figura 12. Pronóstico a 20 días de XLE con ARIMA(7,1,0)

Fuente: elaboración propia con salida de R.

Los pronósticos para EDZ los días 23 y 24 de marzo son:

Fecha	Dato real	Pronosticado ARIMA (6,1,1)	Pronosticado ARIMA (7,1,0)
23-mar-20	NULL	24.98108	25.49077
24-mar-20	664.95	24.99830	25.49101
Criterio de información	AIC	3605.438	3606.738

Finalmente, el Criterio de Información de Akaike muestra un mejor ajuste para el ARIMA(6,1,1).

Si bien el modelo ARIMA(6,1,1) presenta una mejor aproximación al precio real inmediato pronosticado (23 de marzo), la volatilidad del precio de XLE provocó que el 24 de marzo cerrará en los 24.99.

¿Cómo ajustar el pronóstico para instrumentos volátiles? ¿Y el pronóstico del S&P500?

Se presentará en un siguiente trabajo con otro tipo de modelación.

Conclusiones

En este trabajo se analizó el comportamiento de XLE, se comparó contra el S&P500 revisando su comportamiento a niveles y en rendimientos. Posteriormente, se hicieron histogramas y gráficos Q-Q que permitieron visualizar la distribución que siguen las series y la mayor parte de la concentración tanto en precios como en rendimientos.

Posteriormente, se realizaron pruebas de raíces unitarias para identificar la estacionariedad de las series en donde los resultados indicaros que las series, para que cumplan con este supuesto (al menos en media o un sentido débil), deben de ser integradas de orden I, es decir, se les tiene que aplicar una primera diferencia.

Consecutivamente, se obtuvieron los correlogramas para identificar los procesos de autocorrelación de las series, en el caso de XLE, se plantearon dos modelos, un ARIMA(7,1,0) propuesto por R y un ARIMA(6,1,1). La primera especificación, a pesar de que era un modelo estable, no corregía en su totalidad los problemas de autocorrelación provocando distorsiones en los pronósticos en tanto que el un ARIMA(6,1,1) muestra mejores resultados, corrige autocorrelación y mejora los pronósticos.

Si bien esta propuesta mejora la implementada por R, no significa que este sea el mejor modelo o que no se puedan hacer otras especificaciones, pero al menos cumple con los supuestos y permite que tengamos más herramientas para la toma de decisiones.

Finalmente, con base al pronóstico realizado, se sugiere estimar el ARIMA(6,1,1) incorporando siempre la nueva información para ajustar el modelo. Con una perspectiva no tan clara respecto a las economías emergentes, la incertidumbre que se vive en el mercado con la propagación del COVID-19 aunada a las tensiones del sector petrolero, se recomienda una posición de hold o mantener.

Pero, si los estímulos fiscales de Europa, Asia y América Latina no tienen el efecto esperado de alentar a los agentes económicos a través de una inyección de mayor liquidez y la economía china no muestra signos de recuperación a pesar de reducir considerablemente el número de contagio del COVID-19, así como las economías emergentes, entonces se recomienda comprar XLE.

Referencias

[1] ETF.COM (2020). XLEEnergy Select Sector SPDR Fund. Recuperado el 10 de Abril de 2020, de http://www.etf.com/XLE#vestOptions

XLE ARIMA

Tania Buenrostro Trejo

10 de marzo de 2020

XLE

Comportamiento del precio de XLE

Correlación entre XLE y S&P500

Histogramas y gráficos Q-Q

Estacionariedad y pruebas de raices unitarias

Pruebas de raíces unitarias

Modelos ARIMA (XLE)

Propuesta de modelo ARIMA(7,1,0) para XLE

Conclusiones

Referencias