Pasos para el proceso de manejo de datos: 1. Descargar librerias: quantmod, tseries, forecast. 2. Extraemos los datos de la base de datos de FRED por medio de la función “getSymbols”.Se extrae el par MXN/USD (“DEXMXUS”). 3.Se elige la frecuencia en la que se van a analizar los datos, con la función “to.monthly” recopliamos los datos de manera mensual. 4.Graficamos los datos extraidos.

#La libreria quantmod (Quantitative Financial Modelling Framework) se utiliza para poder llamar la función getSymbols y .xts
library(quantmod)
#La libreria tseries (Time Series Analysis and Computational Finance) se utiliza para el análisis de Series de Tiempo
library(tseries)
#La libreria forecast (Forecasting Functions for Time Series and Linear Models) se utiliza para analizar y visualizar series del tiempo univariadas. 
library(forecast)
# Se utiliza para poder usar la función auto.arima() la cual nos ayudará a generar un modelo arima.
library(lmtest)

#Usamos la función "getSymbols" la cual nos ayudará a extraer los valores del par USD/MXN de la base de datos FRED.

getSymbols(Symbols="DEXMXUS", src="FRED")
[1] "DEXMXUS"
#Indicamos la fecha de incio para tomar los datos de la base de datos
DEXMXUS = DEXMXUS["1994-01-01/"]

Aquí se pueden visualizar el valor del par USD/MXN por meses desde enero del 1994 hasta mayo 2022.

#Dado que la base de datos con la que estamos trabajando tiene una periodicidad diaria es necesario convertirla a mensual con la función "to.monthly()"
mrate.xts = to.monthly(DEXMXUS)
Warning in to.period(x, "months", indexAt = indexAt, name = name, ...) :
  missing values removed from data
plot(mrate.xts)

#Una vez teniendo los valores mensuales tomamos el precio de cierre con la función Cl.
mrate = Cl(mrate.xts)

# Transformamos el DataFrame a un objeto TimeSeries con frecuencia mensual. La función de ts() se usa para crear objetos de SeriesdeTiempo. Se le indica el incio y el final con una frecuencia mensual
mrate<-ts(coredata(mrate),start=c(1994,1), end=c(2022,5),frequency=12) 

Ahora procedemos a visualizar los datos, es recomendable graficar el logaritmo de la variable del tipo de cambio para poder ver si la serie temporal es estacionaria o no. Y en caso de no serlo, comenzaremos a transformar la variable del tipo de cambio para que sea una variable estacionaria.

#Calculamos el logaritmo de la variable mrate y después la graficamos con respecto al tiempo
lnmrate<- log(mrate)
plot(lnmrate)

Como podemos observar la serie no es estacionaria debido a que la media cambia con el tiempo. Para poder transformar los datos a estacionarios primero calcularemos la diferencia estacional del logaritmo de la serie de tiempo.

Esta diferencia es el variación anual de mes en mes que existe entre una estación (año) y otra. En nuestro caso, al ser mensual existen 12 periodos por estación, por lo que la diferencia estacionaria de Y por periodo t será: Y(t)-Y(t-12).

#Sacamos la diferencia del logaritmo de nuestra variable mrate con la función "diff()"
dif_log = diff(lnmrate,lag=12)

#Practicamente lo que estamos calculando es la diferencia que existe entre el log de la variable del tipo de cambio (mrate) y el log de la misma variable pero de hace 12 meses, es por esto que es anual. Podemos calcular esto mismo de la siguiente manera:dif_log= lnmrate-lag(lnmrate,12)
plot(dif_log)

Como podemos observar los datos visualmente se ven estacionarios, pero para corroborar que en efecto los datos sean estacionarios vamos a realizar el test de Dicky-Fuller.

El Dicky-Fuller test nos ayudará a determinar si hay o no presencia de tendencia en una autoregresión.

La hipotesis nula establece la presencia de tendencia entre las observaciones (no estacionaria) y la alternativa establece que no hay presencia de tendencia (estacionaria).

Si como resultado del test obtenemos que la variable es estacionaria entonces D = 1 y d = 0.

#Augmented Dickey Fuller Test (ADF Test)
adf.test(dif_log,k=1)
Warning in adf.test(dif_log, k = 1) :
  p-value smaller than printed p-value

    Augmented Dickey-Fuller Test

data:  dif_log
Dickey-Fuller = -4.6301, Lag order = 1, p-value = 0.01
alternative hypothesis: stationary

Como podemos observar el p valor del test es de 0.01 al 95% de confianza por lo que rechazamos la hipotesis nula, concluyendo así que la diferencia estacional del logaritmo es estacionaria.

Una vez teniendo los datos con los que vamos a trabajar de manera estacionaria y sabiendo que D=1 y d=0, hace falta definir los valores p, q, P, Q. Utilizando la variable estacionaria procederemos a realizar las gráficas de autocorrelación ACF (autocorrelación) y PACF (autocorrelación parcial) para identificar los parámetros p, q, P, Q, dependiendo del comportamiento de estas.

Los 2 patrones más comunes que podemos encontrar en las gráficas son los siguientes:

-Firma AR: cuando la magnitud de las autocorrelaciones del ACF van decayendo de manera progresiva y son positivas, mientras que las autocorrelaciones del PACF con positivas pero disminuyen rápidamente después del lag 1,2 o 3. Si esto se cumple entonces p=número de lags positivos significativos y q= 0

-Firma MA: cuando hay una autocorrelación negativa y significativa en el mismo número de lag para ambas gráficas. Si esto se cumple q= al número del lag negativo más significativo.

Procederemos a gráficarlas en los siguientes correlogramas:

#La función acf2() la extraemos de la biblioteca astsa
library(astsa)
#Intoducimos la variable "dif_log" la cual tiene asignados los valores logarítmicos de la variación del tipo de cambio e indicamos un máximo de 24 lags
acf2(dif_log,max.lag = 24)
     [,1]  [,2]  [,3]  [,4] [,5]  [,6]  [,7]  [,8]  [,9] [,10] [,11] [,12]
ACF  0.92  0.83  0.73  0.64 0.57  0.50  0.43  0.36  0.28  0.19  0.10  0.02
PACF 0.92 -0.09 -0.07 -0.03 0.06 -0.05 -0.04 -0.04 -0.13 -0.08 -0.14  0.10
     [,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23]
ACF   0.02  0.01  0.02  0.02  0.01  0.00 -0.02 -0.03 -0.04 -0.05 -0.04
PACF  0.32 -0.06  0.05 -0.06  0.02 -0.09 -0.01 -0.04 -0.04 -0.05 -0.02
     [,24]
ACF  -0.04
PACF  0.07

Para poder interpretar estas gráficas es importante entender lo que esta ocurriendo. Primero que nada,como se mencionó anteriormente tenemos dos gráficas:

En ambas gráficas, el eje de las x tenemos los lag (periodo), mientras que en el eje ‘y’ tenemos el nivel de autocorrelación. Además, las líneas negras verticales representan el nivel de autocorrelación existente entre el valor actual de Y(t) y sus porpios lags (Yt-1, Yt-2,…) y las líneas horizontales azules delimitan el intervalo del 95% de confianza para las autocorrelaciones.

Una vez sabiendo esto podemos observar de manera sencilla cuales son los lags de la variable que tienen una autocorrelación significante. Si la línea vertical sobresale de las líneas punteadas entonces podemos concluir que la autocorrelación de la variable Y(t), con su correspondiente lag Yt-1 es estadisticamente diferente a cero.

Analizando los valores obtenidos en el ACF podemos ver que LAG 1 (Yt-1) esta significativamente autocorrelacionada de manera positiva con el valor actual de la variable (Yt), ya que su valor es mayor a cero (0.92). Esto significa que el valor de Y en cualquier punto del tiempo tiene una autocorrelación promedio de 0.92 con respecto a su propio valor en t-1.

Por el otro lado, en la gráfica PACF lo que podemos concluir es que el lag 1 está autocorrelacionado con el valor actual después de considerar el efecto de los valores intermedios, o en otra palabras, la variación del tipo de cambio del mes actual parece estar positivamente correlacionado con su propio valor del siguiente mes.

Finalmente analizando los patrones,la magnitud de las autocorrelaciones del ACF van decayendo de manera progresiva y son positivas, mientras que las autocorrelaciones del PACF disminuyen rápidamente después del lag 1. Indicandonos que estamos frente a un patrón tipo AR, por lo cual podemos decir que p=1 y q=0.

Ahora solo hace falta comprobar si existe una autocorrelación significativa entre los rezagos estacionales de ACF y PACF para poder encontrar los valores de P y Q. Al estar manejando datos mensuales, deberemos hacer una autocorrelación significativa en el lag 12.

Debido a que no tenemos autocorrelación significativa entonces P=0 y Q=0.


model2 <- Arima(mrate, 
                lambda = 0, # Aplicamos el logaritmo natural a la variable
                order = c(1,0,0), #p=1; d=0; q=0
                seasonal = list(order=c(0,1,0),period=12), #P=0,D=1,Q=0
                include.constant = TRUE,
                ) 
coeftest(model2)

z test of coefficients:

       Estimate Std. Error z value Pr(>|z|)    
ar1   0.9577562  0.0183124 52.3011   <2e-16 ***
drift 0.0078381  0.0051803  1.5131   0.1303    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Para una buena interpretación de los resultados de la modelación de la variación anual del tipo de cambio tenemos que:

El coeficiente del término AR (1) es 0.9577562 y es significativamente positivo. Esto significa que:El porcentaje del crecimiento anual del tipo de cambio tiene una relación significativa y porsitiva respecto a su propio crecimeinto anual del mes anterior.

Una vez corrido el arima, es importante verificar si los errores o los residuales son una serie estacionaria. De ser así esto significa que tenemos todos los términos permiten la explicación de la serie.

errors <- model2$residuals
acf2(errors,max.lag = 24)
     [,1]  [,2] [,3]  [,4]  [,5]  [,6]  [,7] [,8]  [,9] [,10] [,11] [,12]
ACF  0.07 -0.01 0.02 -0.15 -0.01  0.00 -0.04 0.10 -0.03  0.06 -0.06 -0.42
PACF 0.07 -0.02 0.02 -0.15  0.02 -0.01 -0.04 0.09 -0.05  0.08 -0.09 -0.39
     [,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23]
ACF  -0.02 -0.07  0.04  0.04  0.06  0.00  0.02 -0.04 -0.02 -0.04  0.05
PACF  0.03 -0.08  0.07 -0.10  0.10 -0.06  0.01 -0.01 -0.05  0.03 -0.01
     [,24]
ACF   0.01
PACF -0.16

Como podemos ver, los errores presenta una serie estacionaria, pero hay una autocorrelación negativa y significativa en el lag 12. En este caso es relevante por lo que de acuerdo con los patrones previamente mencionados si el lag es negativo y significante y aparece en ambas gráficas, no se sigue una firma AR() sino que se incluye una MA() Q=1 debido a que es la correlación existente entre lag 12 y los datos son mensuales.

Por lo que haremos el modelo de nuevo ahora con los nuevos valores:

model3 <- Arima(mrate, order = c(1,0,0),#p=1; d=0; q=0
    seasonal = list(order=c(0,1,1),period=12), #P=0,D=1,Q=1
    include.constant = TRUE,
    lambda = 0)
coeftest(model3)

z test of coefficients:

        Estimate Std. Error  z value  Pr(>|z|)    
ar1    0.9941204  0.0076181 130.4938 < 2.2e-16 ***
sma1  -0.9381461  0.0649265 -14.4493 < 2.2e-16 ***
drift  0.0054506  0.0020961   2.6004  0.009312 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

El coeficiente del término AR (1) es 0.9941204 y es significativamente positivo. Esto significa que:El porcentaje del crecimiento anual del tipo de cambio tiene una relación significativa y porsitiva respecto a su propio crecimeinto anual del mes anterior.

El coeficiente del término AR (1) estacional es -0,9381461 y es significativamente negativo, lo que significa que el porcentaje de crecimiento anual del tipo de cambio esta relacionado negativamente y significativamente con su propio crecimiento anual de hace 12 meses. En otras palabras, si el cambio creció hace 12 meses es probable que este baje.

Una vez más corroboraremos si los errores/residuales para ver si estos siguen una serie estacionaria.

errors <- model3$residuals
acf2(errors,max.lag = 24)
     [,1] [,2] [,3]  [,4] [,5]  [,6]  [,7]  [,8] [,9] [,10] [,11] [,12]
ACF  0.08 0.01 0.02 -0.15 0.00 -0.04 -0.03 -0.01 0.00  0.08  0.00  0.13
PACF 0.08 0.00 0.02 -0.16 0.02 -0.04 -0.02 -0.04 0.01  0.07 -0.02  0.13
     [,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23]
ACF   0.00 -0.10  0.05 -0.06  0.03 -0.05  0.00 -0.06 -0.01  0.05  0.04
PACF -0.03 -0.08  0.05 -0.03  0.04 -0.08  0.04 -0.09  0.03  0.01  0.06
     [,24]
ACF   0.11
PACF  0.08

Nuestro modelo se ajusta bien debido a que hay Ruido Blanco, p-value es mayor a 0.05.

Box.test(residuals(model3),type="Ljung-Box")

    Box-Ljung test

data:  residuals(model3)
X-squared = 2.3074, df = 1, p-value = 0.1288

Como podemos ver, ahora si se muestra una serie estacionaria por lo que procederemos a hacer la predicción de los valores.

Haremos un pronóstico para el tipo de cambio de los siguientes 18 meses usando nuestro modelo calibrado.

#Se utiliza la función forecast para predecir los valores futuros de los siguientes 18 meses
mrate_forecast <- forecast(model3, h=18)
autoplot(mrate_forecast)

Como podemos ver, en el gráfico se arroja el pronóstico para el tipo de cambio en color violeta. El error del pronóstico es alto ya que con un intervalo de confianza del 95% oscilan los valores entre 17-27 MXN.

Finalmente, calculemos los valores para los siguientes 18 meses de manera puntual, siendo estos el promedio de cada mes.

tail(mrate_forecast$mean,18)
          Jan      Feb      Mar      Apr      May      Jun      Jul
2022                                              19.72655 19.55919
2023 20.83118 20.93177 20.90727 20.86060 21.04845 21.09801 20.91879
          Aug      Sep      Oct      Nov      Dec
2022 19.91763 20.13384 20.31126 20.48773 20.72025
2023 21.30193 21.53293 21.72245 21.91096         

Referencias: https://www.machinelearningplus.com/time-series/arima-model-time-series-forecasting-python/ https://rpubs.com/cdorante/fz2020_w3 https://rpubs.com/Stefan240sx/e1fe2 https://rpubs.com/Rafael_Romo/779985 https://www.estadistica.net/ECONOMETRIA/SERIES-TEMPORALES/modelo-arima.pdf https://www.researchgate.net/publication/328633706_Forecasting_of_demand_using_ARIMA_model https://www.sciencedirect.com/science/article/abs/pii/S0360835298000667

