Las Variables que veremos a continuación se basan en criptomonedas, como bien sabemos existe una gran variedad de criptomonedas en el mercado. En este analisis vamos a estudiar tres (3) criptomonedas las cuales me llaman la atencion, las cuales son las siguientes:
Ethereum(ETH) (Desde Nov 2017 - Hasta Mar 2022)
Carnado(ADA) (Desde Nov 2017 - Hasta Mar 2022)
Polkadot(DOT) (Desde Ago 2020 - Hasta Ene 2022)
Ethereum (2015) es una plataforma de codigo abierto, que funciona para efectuar contratos inteligentes. La confiabilidad de esta cripto es que tiene un alto grado de descentralización a diferencia de otras, el precio historico de la misma llegó a ser bastante atractiva para los inversionistas.
Cardano (2015) es una cadena de bloques de codigo abierto, la cual sirve para ejecutar contratos inteligentes y asi crear su propia moneda digital, esta fue fundada por unos de los cofundadores de Ethereum. El precio de ella siempre ha sido “estable” donde no ha tenido un precio de cierre mayor a 3 USD
Polkadot (2020) trata diversas “blockchains” especilizadas que se conectan a la cadena de relevo de Polkadot la cual constituyen el aspecto “multicadena”. la cual es bastante curiosa porque puede repartir la informacion y distribuirla en redes diferentes que intervienen.
La data suministrada fue obtenida por [yahoofinance.com] de forma diaria para las tres (3) criptomonedas que se veran en estudio
Para el uso de los modelos estadisticos, estos deben cumplir una serie de supuestos para emplear de buena manera el modelo, y así, tener una mejor predicion basado en el mejor ajuste del modelo. En las series de tiempo Estacionarias sucede lo mismo, se deben cumplir ciertos supuestos para la utilización del modelo ARMA, estos supuestos son:
Identificación: Se determinan los ordenes de (p) y (q) del modelo ARMA
Estimación: Se selecciona un método de estimación del ARMA (p,q) la cual nos permite conococer los parámetros phi , theta y su respectiva varianza
Diagnóstico: Se verifica la normalidad, autocorrelacion y homocedasticidad de los residuos
Pronóstico: Se emplea la función de pronóstico del ARMA para proyectar la serie
El siguiente cuadro muestra un breve resumen de los datos donde trabajaremos con los precios del cierre del dia, a continuacion se presentan los cuadros:
| date | open | high | low | close | volume | adjusted | |
|---|---|---|---|---|---|---|---|
| 1 | 2017-11-09 | 308.64 | 329.45 | 307.06 | 320.88 | 893249984 | 320.88 |
| 2 | 2017-11-10 | 320.67 | 324.72 | 294.54 | 299.25 | 885985984 | 299.25 |
| 3 | 2017-11-11 | 298.59 | 319.45 | 298.19 | 314.68 | 842300992 | 314.68 |
| 4 | 2017-11-12 | 314.69 | 319.15 | 298.51 | 307.91 | 1613479936 | 307.91 |
| … | NA | … | … | … | … | … | … |
| 1624 | 2022-04-20 | 3103.94 | 3157.89 | 3045.29 | 3077.75 | 15547362265 | 3077.75 |
| 1625 | 2022-04-21 | 3077.83 | 3173.45 | 2962.41 | 2987.48 | 20783591093 | 2987.48 |
| 1626 | 2022-04-22 | 2986.94 | 3024.85 | 2942.36 | 2964.84 | 16782795477 | 2964.84 |
| 1627 | 2022-04-23 | 2964.8 | 2975.32 | 2926.74 | 2938.11 | 9116955609 | 2938.11 |
| date | open | high | low | close | volume | adjusted | |
|---|---|---|---|---|---|---|---|
| 1 | 2017-11-09 | 0.03 | 0.04 | 0.03 | 0.03 | 18716200 | 0.03 |
| 2 | 2017-11-10 | 0.03 | 0.03 | 0.03 | 0.03 | 6766780 | 0.03 |
| 3 | 2017-11-11 | 0.03 | 0.03 | 0.03 | 0.03 | 5532220 | 0.03 |
| 4 | 2017-11-12 | 0.03 | 0.03 | 0.02 | 0.02 | 7280250 | 0.02 |
| … | NA | … | … | … | … | … | … |
| 1624 | 2022-04-20 | 0.95 | 0.97 | 0.93 | 0.94 | 828312845 | 0.94 |
| 1625 | 2022-04-21 | 0.94 | 0.97 | 0.9 | 0.91 | 871111347 | 0.91 |
| 1626 | 2022-04-22 | 0.91 | 0.92 | 0.89 | 0.91 | 725788912 | 0.91 |
| 1627 | 2022-04-23 | 0.91 | 0.91 | 0.88 | 0.89 | 447997661 | 0.89 |
| date | open | high | low | close | volume | adjusted | |
|---|---|---|---|---|---|---|---|
| 1 | 2020-08-20 | 2.79 | 3.08 | 2.69 | 2.9 | 48819867 | 2.9 |
| 2 | 2020-08-21 | 2.9 | 3.09 | 2.73 | 2.88 | 49313137 | 2.88 |
| 3 | 2020-08-22 | 2.88 | 4.51 | 2.82 | 4.48 | 485801096 | 4.48 |
| 4 | 2020-08-23 | 4.49 | 4.49 | 3.72 | 3.97 | 320749483 | 3.97 |
| … | NA | … | … | … | … | … | … |
| 609 | 2022-04-20 | 18.9 | 19.49 | 18.57 | 19.09 | 830807797 | 19.09 |
| 610 | 2022-04-21 | 19.09 | 19.63 | 18.14 | 18.19 | 772305840 | 18.19 |
| 611 | 2022-04-22 | 18.19 | 18.52 | 18.12 | 18.3 | 629068408 | 18.3 |
| 612 | 2022-04-23 | 18.3 | 19.23 | 18.04 | 18.73 | 625753368 | 18.73 |
A continuacion, graficamos los históricos de las series
Podemos observar que la serie del ETH en el 2018 comenzó con un precio de cierre en el mercado hasta de 1000 usd, sin embargo, los años 2019, 2020 y 2021 no fueron tan amigables con esta criptomoneda.
Desde el 2018 hasta finales del 2020 el volumen de transacción fue mucho menor que para el año 2021 y parte del 2022, por lo cual, puedo sospechar que son variables que tienen cierta relacion (tienen una correlación del 55%). Podemos notar que el covid 2019 no fue una variable que impacte a la serie, como pudo haber afectado otros mercados financieros
Se puede notar que la serie del ADA es muy similar a la serie del ETH, teniendo un inicio en el año 2018 de mas de 1 USD, el cual fue disminuyendo manteniendo un valor casi constante desde el 2019 hasta finales del 2021 donde su variabilidad no fue tan pronunciada. Sin embargo, a partir del 2021 el precio del cierre de esta criptomoneda comenzó a llegar a precios historicos a lo largo de su trayectoria, en consecuencia, pudo haber sucedido gracias a la “nueva” realidad post COVID-19, donde muchas personas apostaron a invertir en un mercado donde posiblemente tengan mayor rentabilidad (teniendo en cuenta que muchas personas estuvieron desempleadas por cortes de nómina)
La serie de Polkadot (DOT) es bastante distinta a las anteriores, primero porque no cuento con mucho pasado y no se puede apreciar el comportamiento de los años antes y después de la pandemia ya que fue lanzada recientemente.
Sin embargo, podemos notar que en el primer trimestre del 2021 y 2022 tuvieron un comportamiento bastante similar, ¿Podemos esperar un comportamiento decreciente en el el segundo trimestre del año 2022?
Para simplificar el análisis, por los momentos, revisaremos las
series de forma mensual
Efectivamente las series tienen menor ruido en el grafico por la reducción de la periodicidad.
ETH
El gráfico anterior referente al Ethereum preseta 3 graficos, el histórico del precio de cierre, la función de autocorrelación y la funcion de autocorrelación parcial.
Vemos que la funcion de autocorrelación simple va descendiendo poco a poco hasta llegar a 0, además, la función de autocorrelación parcial presenta un rezago significativo. por lo tanto, se espera que se ajuste a un modelo AR(1), sin embargo, vamos a probar dos modelos para comparar con este que ya seleccionamos por el correlograma y elegir el mejor modelo que se ajuste.
ADA
El gráfico anterior referente al Cardano presenta 3 gráficos, el histórico del precio de cierre, la función de autocorrelación y la función de autocorrelación parcial.
Vemos que la función de autocorrelación simple, al igual que la serie de ETH va descendiendo poco a poco hasta llegar a 0, como también, la función de autocorrelación parcial presenta un regazo significativo, sin embargo, presenta varios regazos que tocan aproximadamente la linea azul que representa la banda de confianza que la serie temporal presente autocorrelacion en el periodo indicado, por lo tanto, además de probar el modelo AR(1) que es el que se puede concluir mediante el correlograma, vamos a probar dos modelos ARMA(1,1) y ARMA(1,2) para verificar si en realidad es el mejor modelo que se ajusta a la serie y el que menor error tiene
DOT
El gráfico anterior referente al Polkadot presenta 3 graficos donde se ve reflejado el historico del precio de cierre, la función de autocorrelación y la función de autocorrelación parcial.
Con dicha gráfica podemos concluir que a diferencia de ETH y DOT la función de autocorrelación simple o acf no va descendiendo poco a poco sino a partir de la segunda barra ya esta dentro de la línea, conjuntamente, la función de autocorrelación parcialo pacf tiene un rezago significativo lo que puede trascender que debería utilizarse el modelo ARMA(1,1) por el correlograma, sin embargo, para mejor capacidad de análisis vamos a estimar dos modelos conjuntamente a este para observar cual tiene menor error.
Preparamos los datos para ajustar el modelo ARMA, separando la data por la de entrenamiento y la de prueba para posteriormente estimar
EHT
## # A tibble: 3 × 5
## .model MAPE RMSE MAE MPE
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 ar1 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 0)) 108. 0.280 0.233 101.
## 2 arma11 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 1)) 170. 0.311 0.268 70.1
## 3 arma12 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 2)) 177. 0.275 0.238 15.3
El modelo que minimiza aproximadamente todos los errores es el modelo AR(1) en comparación con los otros dos, por lo tanto, será el modelo que tomaré para el estudio posterior con la serie de ETH
ADA
## # A tibble: 3 × 5
## .model MAPE RMSE MAE MPE
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 ar1 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 0)) 105. 0.385 0.291 105.
## 2 arma11 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 1)) 118. 0.425 0.318 118.
## 3 arma12 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 2)) 120. 0.424 0.319 120.
El mejor modelo en cuestión es el modelo AR(1), ya que, en comparación a los otros modelos es quien minimiza los errores en estudio. El modelo AR(1) será el que escogeré para los estudios posteriores
DOT
## # A tibble: 3 × 5
## .model MAPE RMSE MAE MPE
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 ar1 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 0)) 263. 0.359 0.309 257.
## 2 arma11 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 1)) 269. 0.370 0.313 264.
## 3 arma12 <- ARIMA(formula = r_close ~ 1 + pdq(1, 0, 2)) 442. 0.583 0.528 388.
Al igual que las series de ETH y ADA el modelo que minimiza mejor los errores es el modelo AR(1) y será el que se utilizará para los estudios posteriores
En las siguientes graficas veremos el comportamiento de los residuos, asi mismo, los test serán llevados a cabo con los residuos del modelo fijandonos en la autocorrelación en los residuos del modelo y la normalidad que deben cumplir los mismos
Se debe considerar que:
La prueba de autocorrelación sera el de Box-L-Jung, donde la hipótesis nula será rechazada siempre y cuando p-value < 0.05. Es importante que un modelo estacionario cumpla estas condiciones para tener un buen pronóstico, en caso contrario el pronóstico será explicado por otro modelo donde se le haga un mejor tratamiento a la varianza y un mejor ajuste a los parametros de la serie
La prueba de normalidad sera la de Jarque Bera que al contrario de la prueba de autocorrelacion, ésta será rechazada siempre y cuando p-value <= 0.05. Es importante que un modelo estacionario cumpla con este supuesto, sin embargo, lo común en las series financieras es que no necesariamente con la prueba de Jarque Bera los residuos se distribuyen normal, lo ende, se debe emplear otro tipo de aproximaciones
ETH
No presenta autocorrelación en los residuos y los residuos no se distribuyen normalmente.
ADA
No presenta autocorrelación en los residuos, y los mismos pueden distribuirse normal, esto se verá en la prueba de Jarque Bera
DOT
Los residuos presentan una autocorrelación y la forma en su grafica puede asemejarse a una normal
Realizamos la prueba de Box-L-Jung (Prueba de Autocorrelación en los residuos)
ETH
## lb_stat lb_pvalue
## 4.4540690 0.9737815
Como p-value > 0.05 no existen elementos suficientes para rechazar la hipotesis nula, donde concluimos que los residuos no estan autocorrelacionados.
ADA
## lb_stat lb_pvalue
## 6.3452713 0.8976868
Como p-value > 0.05, no existen elementos suficientes para rechazar la hipotesis nula, donde concluimos que los residuos no estan autocorrelacionados.
DOT
## lb_stat lb_pvalue
## 15.2918567 0.2258624
Como p-value > 0.05, no existen elementos suficientes para rechazar la hipotesis nula, donde concluimos que los residuos no estan autocorrelacionados.
Realizamos la prueba de Jarque Bera (Prueba de Normalidad en los residuos)
ETH
##
## Jarque Bera Test
##
## data: .
## X-squared = 0.57253, df = 2, p-value = 0.7511
no se puede rechazar la hipotesis nula ya que el p-value es mayor que 5%,los residuos no se distribuyen normalmente
ADA
##
## Jarque Bera Test
##
## data: .
## X-squared = 45.181, df = 2, p-value = 1.545e-10
Existen elementos suficientes para rechazar la hipotesis nula, los residuos se distribuyen de manera normal
DOT
##
## Jarque Bera Test
##
## data: .
## X-squared = 1.4626, df = 2, p-value = 0.4813
No existen elementos suficientes para rechazar la hipotesis nula por el p-value