SERIES DE TIEMPO
Daniel Fernando Buitron - 1925967
Julian Bedoya
Jaramillo - 1926444
Leony Ordoñez Martinez - 1925713
En el actual trabajo se presenta un análisis de la tasa de interés de España. Esta tasa fue tomada a partir del 2009 hasta el presente. Con ello, se pretende crear un modelo mediante el método ARIMA, el cual permitirá predecir el comportamiento de la tasa dentro de los próximos 5 meses. Se emplea el lenguaje de programación R para crear diversos modelos que, después de un análisis, se compararán y se tomará el mejor. El contexto del país, los modelos obtenidos y la decisión final se desagregan en el desarrollo del documento.
España es un país ubicado en la península ibérica, en el suroeste de Europa. La historia económica de España se remonta a la cultura de los metales, que comenzó alrededor del año 2000 a.C. Alrededor del año 1840, España empezó a experimentar la industrialización, después de haber logrado la reforma de las instituciones y la legislación. Para este proceso fue clave la apertura hacia el exterior, de donde se obtuvo tecnología, capitales y todo aquello que la economía española no podía proporcionar. Durante la colonización española, España aplicó en América una política económica mercantilista, que consideraba que la riqueza de las naciones dependía de las cantidades de oro y plata que poseyeran. A pesar de que la sociedad estaba estratificada étnicamente, los blancos españoles nacidos en la colonia eran vistos como ciudadanos de segunda frente a los españoles nacidos en Europa.
Este país se unió a la Unión Europea (UE) el 1 de enero de 1986, junto con Portugal. Desde entonces, España ha sido un miembro activo de la UE y ha participado en la construcción del proyecto europeo. A su vez, ha contribuido al desarrollo de las relaciones exteriores, especialmente en lo referente a la política orientada hacia América Latina. Además, es miembro de la zona del euro desde el 1 de enero de 1999, lo que implica la eliminación de su propia moneda y la adopción del euro como moneda oficial.
El Banco Central Europeo (BCE) es el encargado de gestionar la política monetaria en la zona del euro, con el objetivo principal de mantener la estabilidad de precios. Para ello, el BCE utiliza una serie de instrumentos de política monetaria, dentro de los cuales, se destaca el tipo de interés oficial. Cada seis semanas, el BCE adopta decisiones de política monetaria que determinan cómo actuar para mantener la inflación en el 2%. Además, el BCE también realiza operaciones de mercado abierto para fijar los tipos de interés oficiales.
En España, el Banco de España es el encargado de aplicar las políticas monetarias del BCE en el país. Estas dos entidades trabajan juntas para influir en el coste y la disponibilidad del dinero en la economía.
Ahora bien, el horizonte temporal que se eligió se basó en la crisis del euro, también conocida como la crisis de la zona euro, que fue un período de incertidumbre económica en la zona euro que comenzó en 2009 y se prolongó hasta 2016. La crisis se desencadenó por los altos niveles de deuda pública, especialmente en los países de Portugal, Irlanda, Italia, Grecia y España. La crisis de la deuda soberana se extendió a otros países de la zona euro, lo que provocó una pérdida de confianza en las economías europeas y en las empresas.
Para hacer frente a la crisis, los líderes europeos acordaron un rescate y aplicaron medidas de austeridad para ayudar a los países a salir de la deuda. Esto implicó un aumento en las tasas de interés para bajar el consumo, logrando a su vez estabilizar la acelerada inflación que sufría el antíguo continente.
En esta práctica se busca crear un(os) modelos de predicción de la tasa de interés de España (UE), a través del método ARIMA. Para ello, se usará el lenguaje de programación R, en el entorno de desarrollo integrado, R estudio.
Series De Tiempo
Las series de tiempo son una secuencia de observaciones recopiladas en intervalos de tiempo regulares. Siendo así que, las series de tiempo se utilizan para analizar la tendencia de los datos a lo largo del tiempo y predecir valores futuros basándose en los datos históricos.
Además, es importante mencionar algunos parámetros que se pueden observar dentro de una serie de tiempo:
El análisis de series de tiempo es una herramienta poderosa en campos como la economía, las finanzas, la meteorología y la ciencia de datos en general, ya que permite entender mejor los datos y tomar decisiones informadas basadas en los patrones observados.
ARIMA
Los modelos ARIMA, que significa Modelo Autoregresivo Integrado de Media Móvil, son una clase de modelos utilizados en el análisis de series de tiempo para entender los datos o predecir futuros puntos en la serie.
El modelo ARIMA se compone de tres partes:
AR (Autoregresivo): Utiliza la dependencia entre una observación y un número de observaciones anteriores.
I (Integrado): Utiliza la diferenciación de las observaciones (restar una observación de la observación en el paso de tiempo anterior) para hacer la serie de tiempo estacionaria.
MA (Media Móvil): Utiliza la dependencia entre una observación y un error residual de una media móvil aplicada a observaciones anteriores.
Cada una de estas tres partes se representa con un parámetro en el modelo ARIMA(p, d, q):
Los modelos ARIMA son útiles cuando los datos muestran evidencia de no estacionariedad, donde las estadísticas resumidas como la media y la varianza cambian con el tiempo.
– tidyverse: Esta biblioteca fue utilizada para la manipulación, visualización y análisis de datos. Facilitó la preparación y exploración de los datos, asegurando que estuvieran en un formato adecuado para el análisis y la construcción de los modelos.
– readr: Se recurrió a esta biblioteca para importar datos de archivos de información csv a R. Esto permitió incorporar los datos relevantes para el estudio que fueron obtenidos de data.oecd.org.
– fpp2: Usada para analizar la naturaleza de la serie y crear pronósticos.
– tseries: Proporciona herramientas estadística para evaluar las series de tiempo, por ejemplo, para realizar pruebas sobre el estado de Estacionariedad de la serie.
– psych: Una librería usada para el análisis estadístico; estadísticas descriptivas correlaciones, análisis de fiabilidad, entre otros.
– MLmetrics: Proporciona la prueba MAPE para evaluar el error de cada modelo.
Después de optener la base dde datos, se seleccionan las columnas correspondientes a TIME y Value. Con lo cual, posteriormente de crea la serie de tiempo usando la función ts(), donde se tiene un horizonte temporal desde enero de 2009 hasta julio de 2023. El gráfico 1 muestra el autoplot() de la serie de tiempo:
Gráfico 1 - Tasa De Interés - España
Ahora, se dividió la serie en dos ventanas: primero, una ventada de entrenamiento comprendida entre enero de 2009 y febrero de 2023; la segunda, comprendida entre marzo de 2023 y julio de 2003, fue de utilidad para comparar los datos pronósticados (por ARIMA) con los valores reales.
Posteriormente, con la ventana de tiempo se hizo las pruebas de estacionariedad. En donde, después de dos diferenciaciones de la serie de tiempo se logró obtener una serie estacionaria, equivalente a un ruído blanco (p = 0, q = 0).
Gráfico 2 - Prueba De Estacionariedad 1
##
## Augmented Dickey-Fuller Test
##
## data: ventana
## Dickey-Fuller = -0.6665, Lag order = 5, p-value = 0.9717
## alternative hypothesis: stationary
##
## Box-Ljung test
##
## data: ventana
## X-squared = 784.01, df = 10, p-value < 2.2e-16
El valor p = 97% Dickey-Fuller implica la aceptación de H0, por lo tanto, la serie no es estacionaria. El valor p < 5% en el Box-Ljung test implica el rechazo de H0, por lo tanto, los datos son no independientes.
Gráfico 3 - Serie Diferenciada
Gráfico 4 - Prueba De Estacionariedad 2
##
## Augmented Dickey-Fuller Test
##
## data: diff1
## Dickey-Fuller = -3.0303, Lag order = 5, p-value = 0.1462
## alternative hypothesis: stationary
##
## Box-Ljung test
##
## data: diff1
## X-squared = 298.66, df = 10, p-value < 2.2e-16
El valor p = 14% en el Dickey-Fuller implica la aceptación de H0, por lo tanto, la serie no es estacionaria. El valor p < 5% en el Box-Ljung test implica el rechazo de H0, por lo tanto, los datos son no independientes.
Gráfico 5 - Serie Segunda Diferenciada
Gráfico 6 - Prueba De Estacionariedad 2
##
## Augmented Dickey-Fuller Test
##
## data: diff2
## Dickey-Fuller = -5.9268, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary
##
## Box-Ljung test
##
## data: diff2
## X-squared = 9.7886, df = 10, p-value = 0.4592
El valor p = 1% en el Dickey-Fuller implica el rechazo de H0, por lo tanto, la serie es estacionaria. El valor p > 5% en el Box-Ljung test implica la aceptación de H0, por lo tanto, los datos son independientes.
Los valores de p y q se obtienen al observar las gráficas del ACF y del PACF. Para ello, se logró determinar que las series diferenciadas oscilaban dentro del ACF y del PACF. Por ende, al observar a la serie diferenciada dos veces, no se hallan rezagos que sobresalgan del intérvalo de confianza.
Además, la prueba de Dickey-Fuller ayuda a determinar la estacionariedad de una serie: si el valor p es menor al 5%, se rechaza H0 y se acepta H1, donde la hipótesis alternativa nos indica que la serie es estacionaria.
Por su parte, el Test Ljung box es un tipo de prueba estadística que verifica si un grupo de autocorrelaciones de una serie de tiempo son diferentes de cero. Aquí, H0 indica la independencia de los datos, mientras que, H1 indica que los datos no son independientes.
La diferenciación de la serie hasta obtener una serie estacionara ayuda a determindar el valor de “D” que debe usarse para la elaboración del modelo ARIMA.
Además, con la función auto.arima() se logra obtener un modelo adicional que se puede comparar con los demás, y así determinar el mejor de ellos.
Auto ARIMA
Cuadro 1 - AUTOARIMA
## Series: Serie2
## ARIMA(0,2,1)(2,0,1)[12]
##
## Coefficients:
## ma1 sar1 sar2 sma1
## -0.1374 -0.7992 -0.1010 0.8166
## s.e. 0.0807 0.3650 0.1208 0.3645
##
## sigma^2 = 0.003276: log likelihood = 250.78
## AIC=-491.55 AICc=-491.2 BIC=-475.79
Como se puede observar, el auto.ARIMA sugiere un modelo ARIMA (0,2,1)(2,0,1)[12] con un AIC = -491.55. Este tipo de modelo es más complejo que el tipo de modelo que se trabajará aquí. No obstante, este modelo servirá para hacer una comparación con los modelos que se plantearán. Estos modelos serán una combinación de P y Q tomando valores de 0 y 1, manteniendo constante el D en 2. Esto para lograr tener una mayor cantidad de modelos para comparar. Observe el cuadro 2 con esta información.
Cuadro 2 - Modelos ARIMA
| # | P | D | Q | AIC |
|---|---|---|---|---|
| 1 | 0 | 2 | 0 | -494.38 |
| 2 | 1 | 2 | 0 | -495.48 |
| 3 | 0 | 2 | 1 | -495.37 |
| 4 | 1 | 2 | 1 | -493.30 |
Una vez obtenidos los modelos, se realiza una comparación de diferentes pruebas que ayudarán a determinar cuál es el modelo más apto para pronósticar la tasa de interés en España. La ventana 2 de la separación de la serie temporal será útil para realizar este apartado, dado que con ella se comparará el pronóstico de cada modelo. Esta evaluación conlleva los siguientes parámetros:
Estas pruebas podrá observarlas en el apartado de Resultados.
Una vez realizada la evaluación, podrá determinarse cúal es el mejor modelo para ser usado.
A continuación se presenta una serie de datos estadísticos que buscan describir el comportamiento de una serie relacionada con la tasa de interés.
Este análisis tendrá en cuenta medidas de tendencia central, considerando horizontes de tiempo que contienen sucesos de interes; Inicio de la crisis del Euro, La crisis del Euro, Tiempo luego de la crisis, Pandemia y post pandemia. El análisis se hará tambien teniendo en cuenta el Gráfico 1, que representa la serie.
Cuadro 3 - Estadística Descriptiva, 2009
| # | Promedio | Desviación estandar | Mediana | Min | Max | Rango |
|---|---|---|---|---|---|---|
| TI | 0.52 | 0.61 | 0.29 | -0.32 | 2.46 | 2.77 |
Gráfico 7 - Inicio de la crisis del Euro
Como podemos ver, para el primer año de la crisis, se presenta un comportamiento de caída, pasando de un 2.46 a un interés negativo de -0.32 en este periodo de tiempo. De igual manera los datos se concentran en el rango de 0 a 1.5, con pocos datos mayores a ellos.
Cuadro 4 - Estadística Descriptiva, 2009 - 2016
| # | Promedio | Desviación estandar | Mediana | Min | Max | Rango |
|---|---|---|---|---|---|---|
| TI | 1.23 | 0.56 | 1.1 | 0.71 | 2.46 | 1.74 |
Gráfico 8 - Crisis del Euro
Ya durante la crisis que comprende de 2009 a 2016, se mantiene un comportamiento de decrecimiento, con un dato atípico para 2010, cercano a 2.5. Pero la tendencia general, es de decrimiento. Concentrandose la tasa de interés, entre 1 y 0.
Cuadro 5 - Estadística Descriptiva, 2017 - 2019
| # | Promedio | Desviación estandar | Mediana | Min | Max | Rango |
|---|---|---|---|---|---|---|
| TI | -0.34 | 0.03 | -0.33 | -0.42 | -0,31 | 0.11 |
Gráfico 9 - Post-Crisis del Euro
En el periodo luego de la crisis, se mantiene el comportamiento de decrecimiento, con valores atípicos negativos cercanos a cero. De igual manera, los datos se concentraron cerca a cero, pero siendo estos, valores positivos, con una leve variación general, pues su rango fue bajo, 0.11, el menor observado en este análisis.
Cuadro 6 - Estadística Descriptiva, 2020 - 2021
| # | Promedio | Desviación estandar | Mediana | Min | Max | Rango |
|---|---|---|---|---|---|---|
| TI | -0.5 | 0.09 | -0.54 | 0.58 | -0.25 | 0.33 |
Gráfico 10 - Pandemia del Covid-19
Luego de la crisis, el mundo paso por otra, la cual afecto la tasa de interes en todo el mundo, para España, siguio con un comportamiento decreciente, con un leve pico de crecimiento cercano a -0.25.
Cuadro 7 - Estadística Descriptiva, 2022 - 7/2023
| # | Promedio | Desviación estandar | Mediana | Min | Max | Rango |
|---|---|---|---|---|---|---|
| TI | 1.35 | 1.59 | 1.43 | -0.56 | 3.67 | 4.23 |
Gráfico 11 - Post-Pandemia del Covid-19
Por último, para la post pandemia, se presentó un crecimiento exponencial, esto representado por su gran variación entre el mínimo y el máximo, con un rango de 4.23.
Gráfico 12
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,2,1)(2,0,1)[12]
## Q* = 18.813, df = 20, p-value = 0.534
##
## Model df: 4. Total lags used: 24
Al gráfico ACF de los residuales muestra que ningún rezago sale del intérvalo de confianza, indicando que los residuales se comportan como ruido , o sea, cumplen con la independencia Además, el valor p > 5% sugiere este mismo comportamiento. También, se puede observar que el gráfico de los residuales sugiere comportamiento normal.
Gráfico 13
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,2,0)
## Q* = 23.663, df = 24, p-value = 0.481
##
## Model df: 0. Total lags used: 24
Al gráfico ACF de los residuales muestra que ningún rezago sale del intérvalo de confianza, indicando que los residuales se comportan como ruido , o sea, cumplen con la independencia Además, el valor p > 5% sugiere este mismo comportamiento. También, se puede observar que el gráfico de los residuales sugiere comportamiento normal.
Gráfico 14
##
## Ljung-Box test
##
## data: Residuals from ARIMA(1,2,0)
## Q* = 20.119, df = 23, p-value = 0.6347
##
## Model df: 1. Total lags used: 24
Al gráfico ACF de los residuales muestra que ningún rezago sale del intérvalo de confianza, indicando que los residuales se comportan como ruido , o sea, cumplen con la independencia Además, el valor p > 5% sugiere este mismo comportamiento. También, se puede observar que el gráfico de los residuales sugiere comportamiento normal.
Gráfico 15
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,2,1)
## Q* = 19.863, df = 23, p-value = 0.6502
##
## Model df: 1. Total lags used: 24
Al gráfico ACF de los residuales muestra que ningún rezago sale del intérvalo de confianza, indicando que los residuales se comportan como ruido , o sea, cumplen con la independencia Además, el valor p > 5% sugiere este mismo comportamiento. También, se puede observar que el gráfico de los residuales sugiere comportamiento normal.
Gráfico 16
##
## Ljung-Box test
##
## data: Residuals from ARIMA(1,2,1)
## Q* = 19.158, df = 22, p-value = 0.6355
##
## Model df: 2. Total lags used: 24
Al gráfico ACF de los residuales muestra que ningún rezago sale del intérvalo de confianza, indicando que los residuales se comportan como ruido , o sea, cumplen con la independencia Además, el valor p > 5% sugiere este mismo comportamiento. También, se puede observar que el gráfico de los residuales sugiere comportamiento normal.
Una vez obtenidos los modelos y considerar que son actos para realizar pronósticos, se procede a recopilar los 5 pronósticos realizados por cada modelo y se hace la comparación con los valores reales de la serie temporal. El cuadro 8 muestra cada uno de los pronósticos de los modelos y el valor real a constratar:
Cuatro 8 - Pronósticos
## PronoA Prono1 Prono2 Prono3 Prono4 Real
## Aug 3.820806 3.8077 3.812345 3.812960 3.815237 2.9106
## Sep 3.971450 3.9436 3.952249 3.954121 3.960700 3.1670
## Oct 4.120974 4.0795 4.092241 4.095281 4.106707 3.3664
## Nov 4.274107 4.2154 4.232220 4.236441 4.252862 3.5359
## Dec 4.422232 4.3513 4.372202 4.377602 4.399055 3.6718
Como se logra observar, los modelos tienden a sobrevalorar el valor que tendrá la tasa de interés. Esto es coherente debido a que la serie de tiempo muestra un comportamiento abrutamente creciente en los últimos periodos de tiempo, por lo que cualquier modelo ARIMA seguirá esta tendencia.
Una vez obtenidos los pronósticos, se puede realizar el cálculo del error absoluto porcentual de cada modelo respecto a los valores reales de la tasa de interés. El cuadro 9 resume los MAPE obtendios para cada modelo:
Cuatro 9 - MAPE
| Modelo | MAPE |
|---|---|
| Auto | 24.08% |
| 1 | 22.85% |
| 2 | 23.22% |
| 3 | 23.30% |
| 4 | 23.64% |
Observando los datos, se evidencia que el modelo 1 realiza un pronóstico con el menor error absoluto porcentual (22.85%).
Al terminar con la evaluación de los modelos se llega a las siguientes conclusiones: