#XLK Technology Select Sector SPDR Fund.

XLK es parte de los instrumentos financieros llamados ETF (Exchange Trade Funds) que son fondos de inversión y cotizan en bolsa al igual que una acción, pueden comprarse y venderse a lo largo de una sesión al precio en el que este a cada momento, a diferencia de otros no tiene que esperar a que el mercado cierre para conocer su valor al que se hace su suscripción-rembolso[1]. En un mismo lote reúne activos como acciones, bonos, índices, commodities y divisas. También nos permite invertir de manera diversificada y con bajo costo[2].

XLK ofrece una exposición bastante amplia al segmento de tecnología de EE. UU. Incluye todos los grandes nombres asociados con la tecnología, pero también algunos que parecen inadaptados, como los procesadores de pagos financieros o las empresas de telecomunicaciones. Evita empresas pequeñas y menos estables lo que da como resultado una menor volatilidad y una inclinación hacia el valor en comparación con nuestro amplio índice de referencia de la industria tecnológica, y puede causar otras diferencias menores de rendimiento. XLK se encuentra entre los fondos más baratos y más grandes de su segmento y, con mucho, el más líquido: los operadores activos no necesitan buscar más. Para muchos inversores, XLK es la opción preferida en el segmento. Tiene una calificación de MSCI ESG Fund de A basada en un puntaje de 6.32 de 10. La calificación de MSCI ESG Fund mide la resistencia de las carteras a los riesgos y oportunidades a largo plazo que surgen de factores ambientales, sociales y de gobernanza[3].

XLK XLK rastrea un índice de acciones tecnológicas del S&P 500.XLK proporciona exposición inversa al índice Technology Select Sector TR (IXTTR).

Comportamiento del precio de XLK

En la siguente grafica se muestra el comportamiento del precio de cierre de XLK a partir del 1 de enero de 2015 al 20 de marzo de 2020. tuvo su mayor crecimiento en febrero del 2020, esto debido al déficit en el comercio exterior que tuvo Estados Unidos en bienes y servicios bajo a 39.900 md. Las compras de los estadounidenses cayeron a 247.500 md, superando el valor que tuvo en octubre del 2017, esto debido a los bienes de capital, como lo son las computadoras, equipos de telecomunicaciones y accesorios de computadoras, suministros y materiales industriales y los bienes de consumo. La Figura 1 muestra el comportamiento del precio de cierre de XLK.

Figura 1. Precio de Cierre de XLK y S&P500: enero 2015 - marzo 2020

Fuente: elaboración propia con salida de R.

Si se compara el comportamiento de tendencia que tuvo el índice S&P500, que se conforma por las 500 emisoras más importantes que cotizan en E.U y el comportamiento de XLK podemos observar que es muy parecido, la única diferencia se encuentra en el mes de enero en donde S&P500 tuvo un mayor crecimiento que XLK. El comportamiento tan similar que tienen se debe a XLK rastrea un índice de acciones tecnológicas del S&P 500.

En cuanto a los rendimientos, el índice XLK y el S&P500 en promedio oscilaron entre 2%. El índice S&P500 tuvo ligeramente mayor volatilidad debido a la dispersión en sus precios.

La caída en los precios de ambos índices se debe a la pandemia del covid-19, también los precios de las inversiones más seguras, como los bonos a largo plazo del Tesoro, cayeron. También es importante mencionar la caída histórica en los precios del petróleo que causa caída en los índices de todo el mundo.

Figura 2. Rendimientos de S&P500 y XLK: enero de 2015 a marzo 2020 Fuente: elaboración propia con salida de R.

Correlación entre XLK y S&P500

La correlación (Relación lineal entre las dos variables) entre los precios de cierre a niveles y entre los rendimientos de XLK y el S&P500, muestra una alta relación positiva del 98.88% y 94.15 % respectivamente.

Tabla 2. Correlación de XLK y S&P500 a niveles

          ^SP500       XLK
^SP500 1.0000000 0.9888809
XLK    0.9888809 1.0000000

Fuente: elaboración propia con salida de R.

Tabla 3. Correlación de XLK y S&P500 en rendimientos

          ^SP500       XLK
^SP500 1.0000000 0.9415991
XLK    0.9415991 1.0000000

Fuente: elaboración propia con salida de R.

Histogramas y gráficos Q-Q

Un histograma nos presenta de manera gráfica estadísticas de diferentes tipos, nos sirve para visualizar más rápido todos datos. En este caso los datos de los índices XLK y del S&P500, donde se puede identificar la frecuencia en la que los precios sufren caídas.

En el grafico 3 se muestran los histogramas a niveles del S&P500 y de XLK; el eje vertical representan las frecuencias y en el eje horizontal los valores de las variables (puntos base y precios respectivamente).

El histograma del S&P500 a niveles indica que, en el periodo de muestra, el índice tuvo mayor número de repeticiones en los 2100 puntos (48 veces). Sin embargo, la mayor parte de la distribución se centra entre los 2000 y los 3000 puntos. Para el caso de XLK, su mayor número de repeticiones es 249 puntos (42 veces). La mayor parte de la distribución se centra entre los 40 a 80 puntos.

Figura 3. Histogramas a niveles S&P500 y EDZ: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

Los rendimientos son un proceso de reversión a la media (0), sin embargo, la distribución de los rendimientos del S&P500 oscila entre -0.10% Y 0.10 y los de XLK en -0.1 Y 0.1 tal cual como se observó en la figura 4.

Figura 4. Histogramas en rendimientos S&P500 y EDZ: enero de 2015 a marzo 2020

Fuente: elaboración propia con salida de R.

Un gráfico Cuantil-Cuantil o q-q plots nos permiten observar que tan cerca está la distribución de un conjunto de datos a alguna distribución ideal ó comparar la distribución de dos conjuntos de datos.

En la siguiente grafica se muestran los gráficos Q-Q del S&P y de XLK; los cuantiles teóricos o la distribución contra la que se están comparando los precios es contra una distribución normal; si la distribución empírica fuera así, entonces los puntos de dispersión deberían de distribuirse en torno a la recta.

Una parte de la distribución que se asocia a la línea recta, pero varios datos datos, principalmente a los extremos de las colas la distribución se “despega” de la normalidad.

Figura 5. Q-Q plot a niveles XLK: enero de 2015 a marzo 2020 Fuente: elaboración propia con salida de R.

En el caso del gráfico Q-Q de los rendimientos, los datos en la parte central de la distribución, están más cerca a la recta, esto se debe a la propiedad que cumplen los rendimientos (media cero o constante que es uno de los supuestos que se debe de cumplir para la estacionariedad de las series), XLK tuvo días que presentaron rendimientos que rebasaron su media, provocando mayor dispersión en sus datos.

Figura 5. Q-Q plot en XLK enero de 2015 a marzo 2020 Fuente: elaboración propia con salida de R.

Estacionariedad y pruebas de raices unitarias

Se dice que una serie temporal es estacionaria cuando su media y su variabilidad son constantes a lo largo del tiempo, esto quiere decir que no está en función de tiempo y no presenta tendencia. Cuando no se garantiza esta condición significa que las series no son independientes e distribuidas idénticamente lo que lleva a problemas de sesgo en las estimaciones, mal cálculo en las bandas de confianza en los datos que se encuentran correlacionados.

Para comprobar si a serie es estacionara se debe verificar si la serie tiene alguna estructura de dependencia con los datos anteriores. Cuando se pronostican series de tiempo, se asumen que estas son aleatorias, por lo tanto:

Ecuación 1

\[E\left ( Y_t \right| \phi_t )=0\]

Donde \(Y_t\) es el valor esperado de la variable condicionado a \(\phi_t\), que refiere a la información pasada de la misma variable. Si la variable es aleatoria, su valor esperado es 0. La ecuación 1 también se le conoce como un proceso estocástico, los precios se comportan de manera aleatoria, es decir:

Ecuación 2

\[f\left ( Y_t \right| Y_{t-1} )=f ( Y_{t} )\]

Cuando llega información nueva la teoria nos dice que los precios de las acciones fluctuarán aleatoriamente.

Las condiciones de estacionariedad indican que la serie sera homocedásticas,esto quiere decir que la varianza es constante . Aunque esto es muy difícil para las series financieras debido a la dispersión o volatilidad de los datos.

Lo importante es garantizar es que la serie no tenga problemas de raíces unitarias, para garantizar que el valor esperado sea igual a 0.

Pruebas de raíces unitarias

Las pruebas que se utilizan para detectar raíces unitarias son: Dickey Fuller Aumentada (DFA),Phillips Perron y la prueba Kwiatkowski - Phillips - Schmidt - Shin (KPSS).

La tabla 4 muestra los resultados de S&P500 y de XLK a niveles y rendimientos.

Tabla 4. Pruebas de raíces unitarias

Variable \(DFA^{a/}\)(Valor p) \(Phillips-Perron^{b/}\)(Valor p) \(KPSS^{c/}\)(Valor p)
S&P500 (a niveles) 0.4464 0.5515 0.01
S&P500 (rendimientos) 0.01 0.01 0.1
XLK (a niveles) 0.6177 0.1191 0.01
XLK (rendimientos) 0.01 0.01 0.1

\(^{a/}H0\): La serie tiene raíz unitaria

\(^{b/}H0\): La serie tiene raíz unitaria

\(^{c/}H0\): La serie es estacionaria

Fuente. Elaboración propia con salida de R.

Si valor p mayor a 0.05 No rechazo (acepto) H0. Al analizar las series en valores probabilisticos no se pueden haceptar al 100%, siempre se tiene un marjen de error

Si valor p menor a 0.05 Rechazo H0.

¿Por qué la serie en rendimientos no tiene raíz unitaria?

Se debe a lo siguiente:

\[Y_t = \alpha + \beta Y_{t-1} + e_t\]

Suponga \(\beta=1\).

\[Y_t = \alpha + Y_{t-1} + e_t\]

Donde \(Y_t\) depende del valor pasado \(Y_{t-1}\), cuando esto se cumple se dice que la serie no es aleatoria y depende del dato anterior hsciendo que ni se cumpla el supuesto de la primera ecuación.

A este proceso se le llama “caminata aleatoria”.

En ambas partes de la ecuación se aplicaran diferencias.

\[Y_t - Y_{t-1} = \alpha + \beta Y_{t-1} - Y_{t-1} + e_t\]

\[\Delta Y_t= \alpha + Y_{t-1}(\beta -1) + e_t\]

Recordemos que \(\beta=1\).

\[\Delta Y_t= \alpha + Y_{t-1}(1 -1) + e_t\]

\[\Delta Y_t= \alpha + Y_{t-1}(0) + e_t\] \[\therefore \]

\[ \Delta Y_t= \alpha + e_t\]

En primeras diferencias la serie no tiene raíz unitaria, depende del error y del intercepto y no valores pasados. Esto significa que es estacionaria.

A dicho proceso se le llama “ruido blanco”.

Modelos ARIMA (XLK)

Utilizando la metodología de Box & Jenkins, se calculara un modelo ARIMA “Autorregresivos Integrados de Medias Móviles”

Este modelo es una metodologia econométrica que se basa en modelos dinámicos que se utiliza en series temporales.Para este modelo es necesario que los datos sean estacionarios.

Se obtiene la Función de Autocorrelación (MA) y Función de Autocorrelación parcial (AR). A las dos series se tiene que aplicar una primera diferencia para que puedan ser estacionarias en media. Es necesario que las series se transformen en rendimientos.

Figura 6. Componentes de autocorrelación ACF y PACF

Fuente: elaboración propia con salida de R. Cuando se reviso el correlograma se identificaron componentes de autocorrelación en el proceso Autorregresivo (PACF) y proceso de media móvil (ACF).

El primer ajuste para el pronóstico de XLK es utilizando la función auto.arima de R, que propone una combinación de ARIMA(1,1,4) para poder corregir los problemas de autocorrelación.

Tabla 5. Resultados del ARIMA(1,1,4) para XLK

Series: XLK 
ARIMA(1,1,4) 

Coefficients:
          ar1     ma1      ma2     ma3      ma4
      -0.7597  0.5224  -0.0973  0.2003  -0.0618
s.e.   0.0456  0.0523   0.0314  0.0303   0.0330

sigma^2 estimated as 0.7637:  log likelihood=-1681.28
AIC=3374.55   AICc=3374.62   BIC=3405.62

Fuente: elaboración propia con salida de R.

Figura 7. Resultados del ARIMA(1,1,4) para EDZ


    Ljung-Box test

data:  Residuals from ARIMA(1,1,4)
Q* = 53.838, df = 25, p-value = 0.0006974

Model df: 5.   Total lags used: 30

Fuente: elaboración propia con salida de R.

El resultado del ARIMA que R propuso con 1 rezago en el componente autorregresivo, un modelo integrado de orden 1 y 4 rezagos en el componente de media móvil. Pero al revisar el correlograma que resulta de esta especificación, se puede ver que todavía tenemos problemas de autocorrelación en el componente de media móvil, lo que quiere decir que este modelo no está completamente corregido.

Cuando revisamos la autocorrelacion en los resuduales realizando la prueba de Ljung-Box donde la H0: Los residuales se distribuyen normalmente (se busca que el valor P>0.05), en nuestro caso el valor es igual 0.0006974 por lo tanto rechazo que los residuales se distribuyan normalmente.

Sus raíces inversas, los cuatro rezagos en que utilice del componente autorregresivo ninguno tiene algún problema de raíz, esto nos garantiza que nuestro modelo será estable en el tiempo

Figura 8. Prueba de racíces unitarias ARIMA(4,1,0) - círculo unitario

Fuente: elaboración propia con salida de R.

Con las pruebas que realizamos anteriormente conseguimos que nuestro modelo sea estable, pero los problemas de autocorrelación no han sido solventados en su totalidad, por lo que se propone el siguiente otro modelo.

Propuesta de modelo ARIMA(10,2,9) para XLK.

El siguiente modelo mejora algunos de los problemas que tenía el auto ARIMA propuesto por R se corrigen los problemas (en su mayoría).

Cuando revisamos el correlograma que resulta de esta especificación, se puede ver que tenemos problemas mínimos de autocorrelación en el componente de media móvil, aunque no está completamente corregido es mejor que el correlograma del auto ARIMA.

Cuando revisamos la autocorrelacion en los residuales realizando la prueba de Ljung-Box donde la H0: Los residuales se distribuyen normalmente (se busca que el valor P>0.05), en nuestro caso el valor es igual 0.0971 por lo tanto acepto que los residuales no se distribuyen normalmente.

Tabla 6. Resultados del ARIMA(10,2,9) para XLK


Call:
arima(x = XLK, order = c(10, 2, 9))

Coefficients:
          ar1     ar2     ar3      ar4      ar5      ar6     ar7     ar8
      -0.1803  0.0322  0.1300  -0.2881  -0.1389  -0.0985  0.4609  0.2896
s.e.   0.1993     NaN  0.0984      NaN   0.1196      NaN  0.0937     NaN
         ar9     ar10      ma1     ma2     ma3     ma4      ma5      ma6
      0.2515  -0.0478  -1.0325  0.0396  0.0041  0.2535  -0.1454  -0.1038
s.e.     NaN      NaN   0.1968     NaN     NaN  0.0909      NaN      NaN
          ma7      ma8     ma9
      -0.2547  -0.2071  0.4463
s.e.      NaN   0.0536     NaN

sigma^2 estimated as 0.7062:  log likelihood = -1637.87,  aic = 3315.74

Fuente: elaboración propia con salida de R.

Figura 9. Resultados del ARIMA(10,2,9) para XLK


    Ljung-Box test

data:  Residuals from ARIMA(10,2,9)
Q* = 17.381, df = 11, p-value = 0.0971

Model df: 19.   Total lags used: 30

Fuente: elaboración propia con salida de R.

En las raíces inversas, los cuatro rezagos en que utilice del componente autorregresivo algunos puntos estan al limite pero no salen de la linea, esto garantizara que nuestro modelo será estable a lo largo del tiempo

Figura 10. Prueba de racíces unitarias ARIMA(10,2,9) - círculo unitario

Fuente: elaboración propia con salida de R.

Se presentan los pronósticos obtenidos por ambos modelos.

Figura 11. Pronóstico a 20 días de XLK con ARIMA(1,1,4)

Fuente: elaboración propia con salida de R.

Cuando se tienen problemas de una mala especificación o el no se corrigen los problemas de autocorrelación del modelo, dara resultado menos confiables. La propuesta del ARIMA(10,2,9) mejora un poco estos problemas.

Figura 12. Pronóstico a 20 días de EDZ con ARIMA(10,2,9)

Fuente: elaboración propia con salida de R.

Los pronósticos para XLK los días 23 y 24 de marzo son:

Fecha Dato real Pronosticado ARIMA (1,1,4) Pronosticado ARIMA (10,2,9)
20-mar-20 71,42 74.17 72.32
23-mar-20 70,40 69.00 70.055
Criterio de información AIC 3374.552 3315.491

El Criterio de Información de Akaike muestra un mejor ajuste para el ARIMA(10,2,29).

En el grafico anterior podemos los datos pronosticados del dia 20 y 23 de marzo y podemos observar que el modelo (10,2,9)** arroja datos mas cercanos a los resultados verdaderos.

El pronóstico del S&P500 Se presentará en un siguiente trabajo con diferente modelación.

Conclusiones

En este trabajo se analizó el comportamiento del índice XLK (Technology Select Sector SPDR Fund y se compara contra el índice S&P500. Se revisó su comportamiento a niveles y rendimientos, se realizaron histogramas y gráficos Q-Q para visualizar más fácilmente la distribución de la serie y la concentración que tienen los precios y rendimientos.

Después, se realizaron pruebas de raíces unitarias para poder identificar la estacionariedad de las series y para que se pueda cumplir este supuesto, deben de ser integradas de orden I aplicando una primera diferencia.

También se obtuvieron los correlogramas para poder identificar los procesos de autocorrelación de las series. Para el caso de XLK se plantearon dos modelos, un ARIMA(1,1,4) que es el que nos propone R y un ARIMA(10,2,9). El primer modelo a pesar de ser un modelo estable, no corregía en su totalidad los problemas de autocorrelación y el modelo ARIMA(10,2,9) mejora este problema. Aunque esta propuesta es mejor que la que nos propone R, podríamos encontrar otro modelo que mejore aún más los resultados, pero al menos este modelo cumple los supuestos.

Con base al pronóstico realizado, se sugiere estimar el ARIMA(10,2,9) incorporando siempre la nueva información para ajustar el modelo. Esto es importante debido a la incertidumbre que se vive en el mercado financiero por la pandemia del COVID-19 y las tensiones del sector petrolero.