Ethereum modelo ARIMA y Volatilidad
Erik Giovanni Cruz Sánchez
27 de enero de 2021
Ethereum es una cadena de bloques (Blockchain) creada en 2015 por Vitalik Buterin. Ethereum es el Blockchain más programable a nivel mundial, ofrece posibilidad de crear diversas aplicaciones como sean posibles, ya sea de finanzas, juegos, redes sociales, trabajo, plataformas, mercados, etc. Hay miles de aplicaciones posibles y todas ellas descentralizadas, esto quiere decir que ninguna entidad o persona las controla. Ethereum cuenta con su propia moneda nativa llamada Ether (ETH).
Ether es una moneda digital y descentralizada. El valor o precio de intercambio lo determina el mercado (Oferta y Demanda). Esta cotiza en el mercado de criptomonedas, junto con otros miles de criptomonedas, Ether es la segunda criptomoneda con mayor capitalización de mercado.
A pesar de que en el mercado de criptomonedas se pueden intercambiar entre ellas, usaremos al dólar como medida de intercambio, con el fin de tener una mayor idea del valor de esta moneda.
Comportamiento de los precios de cierre de Ethereum (ETH) de Agosto 2015 a Enero 2021
Se toma la serie de los precios de cierre de Ethereum (ETH) en su totalidad, desde su incorporacion en el mercado de las criptomonedas, hatsa el dia 15 de enero de 2021. Esto con la finalidad de capturar de mejor manera el comportamiento con la metodologia de BOX-JENKIS.
Figura 1. Precios de cierre Ethereum Ago 2015 - Ene 2021
Fuente: elaboración propia con datos de Yahoo Finance
ETH inicio en año de 2016 con un precio de US$0.95 por moneda, llegando a cotizar hasta los US$20.59 a mediados de ese mismo año, finalizando 2016 cayó a los US$9 aproximadamente. Un Segundo año bastante bueno, ya que termino con un crecimiento del 900% en solo un año.
En 2017 fue el año del BOOM de las criptomonedas, todas crecieron de manera acelerada durante casi todo el año, y aun con mayor intensidad los últimos meses. ETH no fue la excepción, ya que inicio el año con un valor aproximado de US$9, y llegando a la mitad del año ya cotizaba US$400 por moneda, esto significa un crecimiento de un 4,300% en solo seis meses. A pesar de que los mese siguientes fueron de caída, no fue por mucho tiempo para que recuperara y volviera a romper máximos históricos, finalizando el año con un valor de US$750.
Como todo lo que sube tiene que caer, 2018 fue testigo de eso. Todas las criptomonedas cayeron. ETH antes de caer llego a un máximo histórico a los pocos días de haber iniciado el año que fue de US$1400, mismo que no ha llegado a volver a ver, ni siquiera cerca ha estado. A principios de abril se cotizaba a un precio de US$380 por moneda, esto representa una caída aproximando del 73% con respecto a su máximo histórico presentado apenas 3 meses antes. Los siguientes meses tuvo una recuperación llegando a los US$816, sin embargo, a partir de ahí tuvo una tendencia a la baja durante todo el año, finalizando este en US$140, esto representa una caída del 90% con respecto al valor máximo histórico de enero.
La primera mitad del 2019 la monera fue creciente, lento pero seguro, llegando a duplicar su valor para finales de julio, algo bastante decente, pero nada comparado con años anteriores. Lamentablemente eso no duro mucho y para la segunda mitad del año 2019 se volvió a desplomar terminando el año el US$130.
Llegamos al año 2020, donde todo puede pasar, y esto quedo claro con el mercado de las criptomonedas, ya que todas tuvieron un crecimiento considerable, algo que no se veía desde 2017. De manera muy curioso ETH inicia el año con muy buenos datos, pues en enero el precio por moneda estaba en US$130 y para mediados de febrero ya rondaba los US$280. Pero como a casi todos los mercados, la declaración de pandemia, el paro de muchas economías, y la incertidumbre, provoco que cayera en solo cuestión de días a los US$112. A partir de ahí ha llevado una tendencia alcista durante el resto del año, llegando a los US$480 y aun que tuvo una caída después de tocar ese punto, se ha recuperado y continua con la tendencia alcista.
Comportamiento de las tasas de rendimiento de ETH
Figura 2. Tasas de rendimiento de Ethereum Ago 2015 - Ene 2021
Fuente: elaboración propia con datos de Yahoo Finance
Como observamos en la figura 2, las tasas de rendimiento presentan un comportamiento “estable”, ya que los rendimientos estuvieron oscilando en promedio entre 20%, con una clara media 0.
A lo largo de la serie, se pueden observar dos comportamientos distintos, de ago-15 a ene-18 es el primer comportamiento, se observa como la serie presenta una varianza con una mayor fluctuación, que va de -25% hasta 30%, esto se puede asociar a que en los primeros años de ETH ya se estaba popularizando las criptomonedas, esto llevo a que muchos comenzaran a invertir en monedas pequeñas con la esperanza que fuera el próximo bitcoin. De ene-18 a ene-21, se observa un comportamiento más tranquilo, la varianza fluctúa entre -15% y 15, esto se puede asociar a que los inversionistas en criptomonedas eran más cautelosos después de lo ocurrido a finales de 2017, ETH es la segunda criptomoneda con mayor capitalización de mercado, por lo tanto, genera mayor confianza, a parte de que el proyecto que representa, es uno de los más sólidos, incluso (en mi humilde opinión) por encima de bitcoin.
A causa de la pandemia de COVID-19, los rendimientos sufrieron la mayor caída en la historia de ETH, perdiendo el valor de esta hasta un 42% en un día (sin tomar en cuenta el -75% en su primer día), ya ni en 2017 se dieron caídas tan fuertes. En enero de 2021, ETH tuvo uno de los mayores crecimientos porcentuales de su historia, esto debido a la reciente popularización (de nueva cuenta) de las criptomonedas, y en especial por que bitcoin paso la barrera de los US$20,000 incluso llegando a los US$40,000 solo unos días después, esto provoco que monedas como ETH se vieran beneficiadas por el incremento de capital en el mercado de las criptomonedas.
Histograma y Grafico Q-Q de ETH
Con la finalidad de observar y entender de mejor manera el comportamiento de la serie de ETH, tanto a niveles como rendimientos, se elaboraron histogramas, esto nos ayudara a observar la distribución que presenta, así como darnos una idea de los problemas que se nos pueden presentar con dicha serie.
Figura 3. Histograma de niveles y rendimientos de ETH
Fuente: elaboración propia con datos de Yahoo Finance
De acuerdo con la figura 3, en el histograma que representa el nivel de precios de cierre de ETH, observamos como a hay una gran acumulación de valores cerca de 0, esto es debido a que durante los primeros años de ETH su valor oscilaba en ese rango de precios. Aun así, la distribución tiene problemas de cola pesada, no presenta una distribución normal y tiene bastantes valores atípicos.
Por parte del histograma de rendimientos, aunque se asemeje a una distribución normal, no encontramos un problema de leptocurtosis, una muy alta concentración de valores en la media, aparte de esto, también observamos problemas de colas pesadas originados por valores atípicos en las colas.
Para observar que tanto las distribuciones empíricas se asemejan a la distribución teórica, que en este caso es la distribución normal, se formara un gráfico Q-Q.
Figura 4. Gráficos Q-Q de niveles y rendimientos de ETH
Fuente: elaboración propia con datos de Yahoo Finance
Como se observa en la figura 4, el QQ-Plot de los niveles de precios de cierre de ETH, y como lo observamos en la parte del histograma, este prácticamente no presenta una distribución normal, son muy pocos los valores donde cruza con la recta de la distribución normal, incluso observamos como cerca del cero, se desvía muy precipitadamente, esto es debido a que la concentración de los valores esta muy cercana a cero lo cual provoca una media cercana a cero, y por ende, una distribución normal implicaría tener valores negativos. Incluso se asemeja más a una Chi-cuadrada.
En cuanto a los rendimientos, estos si presentan una mayor semejanza a la distribución normal, sin embargo, en las colas en donde este se desborda llegando a valores muy lejanos de la distribución normal. Aun así, tenemos que tomar en cuenta que estos valores son en condiciones muy específicas, por ejemplo, los dos valores mas alejados por la parte inferior, uno es después e su primer día en el mercado de las criptomonedas (el-75%) y el segundo (-42%) es a causa de la pandemia.
Pruebas de raíces unitarias
Tabla 1. Prueba de raíces unitarias a niveles y rendimientos
| Variable | DFA (Valor p) | Phillips−Perron (Valor p) | KPSS (Valor p) |
|---|---|---|---|
| ETH (a niveles) | 0.9535 | 0.9452 | 0.01 |
| ETH (rendimientos) | 0.01 | 0.01 | 0.08682 |
Fuente: elaboración propia
Para ETH (a niveles):
DFA: Con un valor de p igual a 0.9535, no se rechaza que la serie a niveles tenga raíces unitarias.
PP: Con un valor p de 0.9452, no se rechaza que la serie a niveles tenga raíces unitarias.
KPSS: Con un valor p de 0.01, se rechaza que la serie a niveles sea estacionaria.
Para ETH (rendimientos):
DFA: Con un valor p de 0.01, se rechaza que la serie de rendimientos tenga raíz unitaria.
PP: Con un valor p de 0.01, se rechaza que la seria de rendimientos tenga raíz unitaria.
KPSS: Con un valor p de 0.08682, no se rechaza que la serie de rendimientos sea estacionaria.
Modelo ARIMA
Desarrollaremos un modelo ARIMA con la metodología Box y Jenkins, en primera instancia usaremos la función de auto.arima, esta función de R nos dirá que modelo es el más apropiado. Posteriormente, propondremos un modelo cuya meta es ser mejor que el dado por R. Finalmente los compararemos y elegiremos uno de acuerdo con el criterio de información de akaike y la prueba de Ljung-Box. También compararemos los pronósticos dados por dichos modelos y el dato real.
El orden de integración va a ser 1, esto de acuerdo con lo observado en las pruebas anteriores, de esta manera nos aseguramos de que la serie presenta estacionariedad, media 0 y no tiene problemas de raíces unitarias.
Figura 5. Componentes de autocorrelación ACF y PACF
Fuente: elaboración propia con datos de Yahoo Finance
De acuerdo con el correlograma de la figura 5, las funciones de autocorrelación (MA) y de autocorrelación parcial (PAC), se pueden identificar componentes de autocorrelación tanto para el proceso autorregresivo como para el proceso de media móvil.
Utilizando la función de R (auto.arima), propone un modelo ARIMA (0,1,1), para corregir los problemas de autocorrelación.
Series: ETH
ARIMA(0,1,1)
Coefficients:
ma1
0.0856
s.e. 0.0227
sigma^2 estimated as 420: log likelihood=-8824.36
AIC=17652.72 AICc=17652.73 BIC=17663.91
Nuestra propuesta de modelo es un ARIMA (25,1,0), esto con base en lo observado en la figura 5, y después de mucha prueba y error.
Call:
arima(x = ETH, order = c(25, 1, 0))
Coefficients:
ar1 ar2 ar3 ar4 ar5 ar6 ar7 ar8 ar9
0.0701 0.0072 0.0395 -0.0579 0.0221 0.1343 0.0162 -0.0808 -0.0697
s.e. 0.0224 0.0225 0.0226 0.0226 0.0231 0.0230 0.0230 0.0230 0.0231
ar10 ar11 ar12 ar13 ar14 ar15 ar16 ar17 ar18
0.0041 0.0851 -0.0777 -0.0479 -0.0225 0.1011 0.0065 0.0567 0.0199
s.e. 0.0233 0.0233 0.0234 0.0239 0.0239 0.0238 0.0239 0.0238 0.0238
ar19 ar20 ar21 ar22 ar23 ar24 ar25
0.1529 0.0669 -0.0302 -0.0121 -0.0626 -0.0422 0.1092
s.e. 0.0238 0.0239 0.0239 0.0239 0.0239 0.0240 0.0240
sigma^2 estimated as 380.4: log likelihood = -8727.19, aic = 17506.37
Tabla 2. comparación entre el modelo de R y el nuestro
| Modelo ARIMA | Ljung-Box | AIC | Dato real | Dato pronosticado | Diferencia |
|---|---|---|---|---|---|
| ARIMA (0,1,1) | 1.341e-07 | 17652.72 | 1171.83 | 1167.258 | -4.57 |
| ARIMA (25,0,0) | 0.05728 | 17506.37 | 1171.83 | 1172.098 | 0.27 |
Fuente: elaboración propia
De acuerdo con los datos obtenidos, el modelo propuesto por R no presenta residuales con distribución normal, en cambio nuestro modelo si presenta residuales con distribución normal, en cuanto al AIC, nuestro resultado es más favorable ya que es menor y por ende, explica de mejor manera la serie, y por último, en dato pronosticado de nuestro modelo presenta un error de apenas US$0.27 mientras que el modelo propuesto por R, tiene un error en su predicción de US$4.57.
Esto quiere decir que nuestro modelo explica y pronostica de mejor manera que el de R.
Figura 6.Residuos del modelo ARIMA(25,1,0)
Ljung-Box test
data: Residuals from ARIMA(25,1,0)
Q* = 7.5108, df = 3, p-value = 0.05728
Model df: 25. Total lags used: 28
Fuente: elaboración propia con con salidad de R
Figura 7. Prueba de racíces unitarias ARIMA(25,1,0) - círculo unitario
Fuente: elaboración propia con con salidad de R
Figura 8. Pronostico del modelo ARIMA(25,1,0) con sus limites
Fuente: elaboración propia con con salidad de R
Conclusión de los modelos ARIMA:
El mercado de las criptomonedas está dominado por el análisis técnico, lo que hace que un modelo ARIMA sea muy útil en este tipo de mercados, ya que el propio análisis técnico se fija bastante en la historia de la serie con los techos, pisos, y demás, por lo tanto, ARIMA modela muy bien este tipo de comportamiento. Es cierto que el modelo propuesto y elegido es muy poco parsimonioso, pero explica de gran manera el comportamiento de la serie. A parte de que al ser una criptonomeda, estas tienen una increíble volatilidad, así que se necesitan modelos igual de locos para poder explicarlas.
Modelos de volatilidad
Usaremos los modelos de volatilidad ARCH y GARCH, para encontrar un modelo para los rendimientos de la serie de ETH, estos modelos serán explicados de acuerdo con la volatilidad, o sea la varianza, para lo cual necesitamos que esta no sea homocedástica, totalmente contrario a los modelos ARIMA, de esta manera las fluctuaciones fuertes en los rendimientos son algo que vamos a ver como bueno.
Procederemos en hacer la prueba ARCH, para verificar que la serie no tiene un comportamiento homocedástico.
ARCH LM-test; Null hypothesis: no ARCH effects
data: ETH_R
Chi-squared = 161.29, df = 12, p-value < 2.2e-16
Rechazo que ETH sea homocedstico, lo cual indica que no tiene una varianza constante.
Tabla 3. Comparación entre modelos de volatilidad
| MODELO | omega | alfa1 | alfa2 | beta1 | beta2 | AKAIKE | BAYES |
|---|---|---|---|---|---|---|---|
| ARCH(1) | 0.002803 | 0.346901 | -2.7179 | -2.7123 | |||
| ARCH(2) | 0.002315 | 0.242718 | 0.196765 | -2.7796 | -2.7712 | ||
| GARCH(1,1) | 0.00031 | 0.18426 | 0.74171 | -2.8878 | -2.8794 | ||
| GARCH(1,2)* | 0.00028 | 0.179122 | 0.696195 | 0.060676 | -2.8567 | -2.8455 | |
| GARCH(2,1) | 0.000351 | 0.153859 | 0.050759 | 0.713822 | -2.8825 | -2.8712 | |
| GARCH(2,2) | 0.000414 | 0.175406 | 0.077021 | 0.423901 | 0.228577 | -2.8829 | -2.8688 |
Fuente: elaboración propia
_*Modelo con coeficientes no significantes._
De acuerdo con los criterios de informacion de AKAIKE y BAYES, el mejor modelo de volatilidad es GARCH(1,1)
Modelo GARCH(1,1):
Coeficientes: El rendimiento del ETH se explica en un 18.43% por la volatilidad de hace un día y en un 74.17% por la varianza ajustada del componente ARCH de hace un día.
Características: Si cumple con coeficiente positivos, la suma es menor a uno y todos son significativos.
Tabla 4. Comparación entre el pronostico y dato real del 16 de enero de 2021
| MODELO | Pronostico | Dato real | Diferencia |
|---|---|---|---|
| GARCH(1,1) | 0.06931 | 0.0526 | 0.01671 |
Fuente: elaboración propia
Conclusión de los modelos de volatilidad:
Me parece bastante interesante esta “nueva” forma de modelar las series, creo que elegiría el modelo de GARCH sobre el de ARIMA, ya que en series tan volátiles como las criptomonedas deberían de ofrecer un mayor poder de predicción, o por lo menos teóricamente.
Referencias
[1] https://ethereum.org/es/what-is-ethereum/
[2] https://www.criptonoticias.com/criptopedia/que-es-ethereum-eth/