Pasos para el proceso de manejo de datos: 1. Descargar librerias:
quantmod, tseries, forecast. 2. Extraemos los datos de la base de datos
de FRED por medio de la función “getSymbols”.Se extrae el par MXN/USD
(“DEXMXUS”). 3.Se elige la frecuencia en la que se van a analizar los
datos, con la función “to.monthly” recopliamos los datos de manera
mensual. 4.Graficamos los datos extraidos.
#La libreria quantmod (Quantitative Financial Modelling Framework) se utiliza para poder llamar la función getSymbols y .xts
library(quantmod)
#La libreria tseries (Time Series Analysis and Computational Finance) se utiliza para el análisis de Series de Tiempo
library(tseries)
#La libreria forecast (Forecasting Functions for Time Series and Linear Models) se utiliza para analizar y visualizar series del tiempo univariadas.
library(forecast)
# Se utiliza para poder usar la función auto.arima() la cual nos ayudará a generar un modelo arima.
library(lmtest)
#Usamos la función "getSymbols" la cual nos ayudará a extraer los valores del par USD/MXN de la base de datos FRED.
getSymbols(Symbols="DEXMXUS", src="FRED")
[1] "DEXMXUS"
#Indicamos la fecha de incio para tomar los datos de la base de datos
DEXMXUS = DEXMXUS["1994-01-01/"]
Aquí se pueden visualizar el valor del par USD/MXN por meses desde
enero del 1994 hasta mayo 2022.
#Dado que la base de datos con la que estamos trabajando tiene una periodicidad diaria es necesario convertirla a mensual con la función "to.monthly()"
mrate.xts = to.monthly(DEXMXUS)
Warning in to.period(x, "months", indexAt = indexAt, name = name, ...) :
missing values removed from data
plot(mrate.xts)

#Una vez teniendo los valores mensuales tomamos el precio de cierre con la función Cl.
mrate = Cl(mrate.xts)
# Transformamos el DataFrame a un objeto TimeSeries con frecuencia mensual. La función de ts() se usa para crear objetos de SeriesdeTiempo. Se le indica el incio y el final con una frecuencia mensual
mrate<-ts(coredata(mrate),start=c(1994,1), end=c(2022,5),frequency=12)
Ahora procedemos a visualizar los datos, es recomendable graficar el
logaritmo de la variable del tipo de cambio para poder ver si la serie
temporal es estacionaria o no. Y en caso de no serlo, comenzaremos a
transformar la variable del tipo de cambio para que sea una variable
estacionaria.
#Calculamos el logaritmo de la variable mrate y después la graficamos con respecto al tiempo
lnmrate<- log(mrate)
plot(lnmrate)

Como podemos observar la serie no es estacionaria debido a que la
media cambia con el tiempo. Para poder transformar los datos a
estacionarios primero calcularemos la diferencia estacional del
logaritmo de la serie de tiempo.
Esta diferencia es el variación anual de mes en mes que existe entre
una estación (año) y otra. En nuestro caso, al ser mensual existen 12
periodos por estación, por lo que la diferencia estacionaria de Y por
periodo t será: Y(t)-Y(t-12).
#Sacamos la diferencia del logaritmo de nuestra variable mrate con la función "diff()"
dif_log = diff(lnmrate,lag=12)
#Practicamente lo que estamos calculando es la diferencia que existe entre el log de la variable del tipo de cambio (mrate) y el log de la misma variable pero de hace 12 meses, es por esto que es anual. Podemos calcular esto mismo de la siguiente manera:dif_log= lnmrate-lag(lnmrate,12)
plot(dif_log)

Como podemos observar los datos visualmente se ven estacionarios,
pero para corroborar que en efecto los datos sean estacionarios vamos a
realizar el test de Dicky-Fuller.
El Dicky-Fuller test nos ayudará a determinar si hay o no presencia
de tendencia en una autoregresión.
La hipotesis nula establece la presencia de tendencia entre las
observaciones (no estacionaria) y la alternativa establece que no hay
presencia de tendencia (estacionaria).
Si como resultado del test obtenemos que la variable es estacionaria
entonces D = 1 y d = 0.
#Augmented Dickey Fuller Test (ADF Test)
adf.test(dif_log,k=1)
Warning in adf.test(dif_log, k = 1) :
p-value smaller than printed p-value
Augmented Dickey-Fuller Test
data: dif_log
Dickey-Fuller = -4.6301, Lag order = 1, p-value = 0.01
alternative hypothesis: stationary
Como podemos observar el p valor del test es de 0.01 al 95% de
confianza por lo que rechazamos la hipotesis nula, concluyendo así que
la diferencia estacional del logaritmo es estacionaria.
Una vez teniendo los datos con los que vamos a trabajar de manera
estacionaria y sabiendo que D=1 y d=0, hace falta definir los valores p,
q, P, Q. Utilizando la variable estacionaria procederemos a realizar las
gráficas de autocorrelación ACF (autocorrelación) y PACF
(autocorrelación parcial) para identificar los parámetros p, q, P, Q,
dependiendo del comportamiento de estas.
Los 2 patrones más comunes que podemos encontrar en las gráficas son
los siguientes:
-Firma AR: cuando la magnitud de las autocorrelaciones del ACF van
decayendo de manera progresiva y son positivas, mientras que las
autocorrelaciones del PACF con positivas pero disminuyen rápidamente
después del lag 1,2 o 3. Si esto se cumple entonces p=número de lags
positivos significativos y q= 0
-Firma MA: cuando hay una autocorrelación negativa y significativa en
el mismo número de lag para ambas gráficas. Si esto se cumple q= al
número del lag negativo más significativo.
Procederemos a gráficarlas en los siguientes correlogramas:
#La función acf2() la extraemos de la biblioteca astsa
library(astsa)
#Intoducimos la variable "dif_log" la cual tiene asignados los valores logarítmicos de la variación del tipo de cambio e indicamos un máximo de 24 lags
acf2(dif_log,max.lag = 24)
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12]
ACF 0.92 0.83 0.73 0.64 0.57 0.50 0.43 0.36 0.28 0.19 0.10 0.02
PACF 0.92 -0.09 -0.07 -0.03 0.06 -0.05 -0.04 -0.04 -0.13 -0.08 -0.14 0.10
[,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23]
ACF 0.02 0.01 0.02 0.02 0.01 0.00 -0.02 -0.03 -0.04 -0.05 -0.04
PACF 0.32 -0.06 0.05 -0.06 0.02 -0.09 -0.01 -0.04 -0.04 -0.05 -0.02
[,24]
ACF -0.04
PACF 0.07

Para poder interpretar estas gráficas es importante entender lo que
esta ocurriendo. Primero que nada,como se mencionó anteriormente tenemos
dos gráficas:
- ACF nos indica la autocorrelación entre los valores de las series
que se encuentran a k intervalos de distancia.
- PACF nos indica las autocorrelación entre los valores de las series
que se encuentran a k intervalos de distancia, teniendo en cuenta los
valores de los intervalos intermedios.
En ambas gráficas, el eje de las x tenemos los lag (periodo),
mientras que en el eje ‘y’ tenemos el nivel de autocorrelación. Además,
las líneas negras verticales representan el nivel de autocorrelación
existente entre el valor actual de Y(t) y sus porpios lags (Yt-1,
Yt-2,…) y las líneas horizontales azules delimitan el intervalo del 95%
de confianza para las autocorrelaciones.
Una vez sabiendo esto podemos observar de manera sencilla cuales son
los lags de la variable que tienen una autocorrelación significante. Si
la línea vertical sobresale de las líneas punteadas entonces podemos
concluir que la autocorrelación de la variable Y(t), con su
correspondiente lag Yt-1 es estadisticamente diferente a cero.
Analizando los valores obtenidos en el ACF podemos ver que LAG 1
(Yt-1) esta significativamente autocorrelacionada de manera positiva con
el valor actual de la variable (Yt), ya que su valor es mayor a cero
(0.92). Esto significa que el valor de Y en cualquier punto del tiempo
tiene una autocorrelación promedio de 0.92 con respecto a su propio
valor en t-1.
Por el otro lado, en la gráfica PACF lo que podemos concluir es que
el lag 1 está autocorrelacionado con el valor actual después de
considerar el efecto de los valores intermedios, o en otra palabras, la
variación del tipo de cambio del mes actual parece estar positivamente
correlacionado con su propio valor del siguiente mes.
Finalmente analizando los patrones,la magnitud de las
autocorrelaciones del ACF van decayendo de manera progresiva y son
positivas, mientras que las autocorrelaciones del PACF disminuyen
rápidamente después del lag 1. Indicandonos que estamos frente a un
patrón tipo AR, por lo cual podemos decir que p=1 y q=0.
Ahora solo hace falta comprobar si existe una autocorrelación
significativa entre los rezagos estacionales de ACF y PACF para poder
encontrar los valores de P y Q. Al estar manejando datos mensuales,
deberemos hacer una autocorrelación significativa en el lag 12.
- Si es significativa y positiva entonces P = 1 y Q = 0.
- Si es significativa y negativa, definimos P = 0 y Q = 1.
- Si no hay una autocorrelación significativa, entonces P = 0 y Q =
0.
Debido a que no tenemos autocorrelación significativa entonces P=0 y
Q=0.
model2 <- Arima(mrate,
lambda = 0, # Aplicamos el logaritmo natural a la variable
order = c(1,0,0), #p=1; d=0; q=0
seasonal = list(order=c(0,1,0),period=12), #P=0,D=1,Q=0
include.constant = TRUE,
)
coeftest(model2)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.9577562 0.0183124 52.3011 <2e-16 ***
drift 0.0078381 0.0051803 1.5131 0.1303
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Para una buena interpretación de los resultados de la modelación de
la variación anual del tipo de cambio tenemos que:
El coeficiente del término AR (1) es 0.9577562 y es
significativamente positivo. Esto significa que:El porcentaje del
crecimiento anual del tipo de cambio tiene una relación significativa y
porsitiva respecto a su propio crecimeinto anual del mes anterior.
Una vez corrido el arima, es importante verificar si los errores o
los residuales son una serie estacionaria. De ser así esto significa que
tenemos todos los términos permiten la explicación de la serie.
errors <- model2$residuals
acf2(errors,max.lag = 24)
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12]
ACF 0.07 -0.01 0.02 -0.15 -0.01 0.00 -0.04 0.10 -0.03 0.06 -0.06 -0.42
PACF 0.07 -0.02 0.02 -0.15 0.02 -0.01 -0.04 0.09 -0.05 0.08 -0.09 -0.39
[,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23]
ACF -0.02 -0.07 0.04 0.04 0.06 0.00 0.02 -0.04 -0.02 -0.04 0.05
PACF 0.03 -0.08 0.07 -0.10 0.10 -0.06 0.01 -0.01 -0.05 0.03 -0.01
[,24]
ACF 0.01
PACF -0.16

Como podemos ver, los errores presenta una serie estacionaria, pero
hay una autocorrelación negativa y significativa en el lag 12. En este
caso es relevante por lo que de acuerdo con los patrones previamente
mencionados si el lag es negativo y significante y aparece en ambas
gráficas, no se sigue una firma AR() sino que se incluye una MA() Q=1
debido a que es la correlación existente entre lag 12 y los datos son
mensuales.
Por lo que haremos el modelo de nuevo ahora con los nuevos
valores:
model3 <- Arima(mrate, order = c(1,0,0),#p=1; d=0; q=0
seasonal = list(order=c(0,1,1),period=12), #P=0,D=1,Q=1
include.constant = TRUE,
lambda = 0)
coeftest(model3)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.9941204 0.0076181 130.4938 < 2.2e-16 ***
sma1 -0.9381461 0.0649265 -14.4493 < 2.2e-16 ***
drift 0.0054506 0.0020961 2.6004 0.009312 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
El coeficiente del término AR (1) es 0.9941204 y es
significativamente positivo. Esto significa que:El porcentaje del
crecimiento anual del tipo de cambio tiene una relación significativa y
porsitiva respecto a su propio crecimeinto anual del mes anterior.
El coeficiente del término AR (1) estacional es -0,9381461 y es
significativamente negativo, lo que significa que el porcentaje de
crecimiento anual del tipo de cambio esta relacionado negativamente y
significativamente con su propio crecimiento anual de hace 12 meses. En
otras palabras, si el cambio creció hace 12 meses es probable que este
baje.
Una vez más corroboraremos si los errores/residuales para ver si
estos siguen una serie estacionaria.
errors <- model3$residuals
acf2(errors,max.lag = 24)
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12]
ACF 0.08 0.01 0.02 -0.15 0.00 -0.04 -0.03 -0.01 0.00 0.08 0.00 0.13
PACF 0.08 0.00 0.02 -0.16 0.02 -0.04 -0.02 -0.04 0.01 0.07 -0.02 0.13
[,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23]
ACF 0.00 -0.10 0.05 -0.06 0.03 -0.05 0.00 -0.06 -0.01 0.05 0.04
PACF -0.03 -0.08 0.05 -0.03 0.04 -0.08 0.04 -0.09 0.03 0.01 0.06
[,24]
ACF 0.11
PACF 0.08

Nuestro modelo se ajusta bien debido a que hay Ruido Blanco, p-value
es mayor a 0.05.
Box.test(residuals(model3),type="Ljung-Box")
Box-Ljung test
data: residuals(model3)
X-squared = 2.3074, df = 1, p-value = 0.1288
Como podemos ver, ahora si se muestra una serie estacionaria por lo
que procederemos a hacer la predicción de los valores.
Haremos un pronóstico para el tipo de cambio de los siguientes 18
meses usando nuestro modelo calibrado.
#Se utiliza la función forecast para predecir los valores futuros de los siguientes 18 meses
mrate_forecast <- forecast(model3, h=18)
autoplot(mrate_forecast)

Como podemos ver, en el gráfico se arroja el pronóstico para el tipo
de cambio en color violeta. El error del pronóstico es alto ya que con
un intervalo de confianza del 95% oscilan los valores entre 17-27
MXN.
Finalmente, calculemos los valores para los siguientes 18 meses de
manera puntual, siendo estos el promedio de cada mes.
tail(mrate_forecast$mean,18)
Jan Feb Mar Apr May Jun Jul
2022 19.72655 19.55919
2023 20.83118 20.93177 20.90727 20.86060 21.04845 21.09801 20.91879
Aug Sep Oct Nov Dec
2022 19.91763 20.13384 20.31126 20.48773 20.72025
2023 21.30193 21.53293 21.72245 21.91096
Referencias: https://www.machinelearningplus.com/time-series/arima-model-time-series-forecasting-python/
https://rpubs.com/cdorante/fz2020_w3 https://rpubs.com/Stefan240sx/e1fe2 https://rpubs.com/Rafael_Romo/779985 https://www.estadistica.net/ECONOMETRIA/SERIES-TEMPORALES/modelo-arima.pdf
https://www.researchgate.net/publication/328633706_Forecasting_of_demand_using_ARIMA_model
https://www.sciencedirect.com/science/article/abs/pii/S0360835298000667
