MODELO MA

Juan Arteaga, Carolina Hoyos e Isabella Lacharme

CONTENIDO

  1. Introducción a las series de tiempo.

  2. Definición y conceptos básicos.

  3. Aplicaciones del modelo MA.

  4. Condiciones de uso y ajustes.

  5. Implementación del modelo en lenguaje R.

  6. Ejemplo del modelo.

  7. Conclusiones y referencias.

SERIES DE TIEMPO

  • Conjunto de datos que representan observaciones realizadas en diferentes momentos a lo largo del tiempo en una variable de interés.

  • Los datos no son independientes, tienen un significado su secuencia y orden temporal.

  • Su objetivo principal es poder predecir valores futuros utilizando valores previos.

SERIES DE TIEMPO

  • Un propósito es estudiar la influencia entre variables que forman series de tiempo.
  • Rara vez se puede asumir que la secuencia de tiempo de los patrones causales coincide con los periodos de tiempo de las series.
  • Tiene mucha importancia en diferentes campos porque permite comprender como cambian los datos a lo largo del tiempo.

MODELO MA

  • Consiste en predecir valores futuros, pronósticos basándose en promedios ponderados de errores pasados de los datos históricos para modelar el valor actual de la serie.

  • El modelo asume que la serie de tiempo es de tipo estacionario, es decir, que sus datos estadísticos como la media no cambian en el tiempo.

  • Se tiene que el valor actual de la serie de tiempo que se está analizando es dependiente de un error actual y de q términos de errores pasados, representando las desviaciones entre los valores observados y los que se predijeron en periodos pasados.

FORMULACIÓN

\[ x_t = \mu + a_{t} + \theta_1\ a_{t-1} +\\\theta_2\ a_{t-2} + \cdots + \theta_q\ a_{t-q} \]

\[ a_t = \epsilon_t \times \sigma \]

\[ \epsilon_t \sim \text{i.i.d } \sim N(0, 1) \]

  • xt : Es el valor de la serie en el tiempo t.
  • μ: Es la media de la serie.
  • ϵ: Es el término de error en el tiempo t.
  • 01, 02…, 0q son los coeficientes del modelo que determinan el peso de los errores pasados.
  • q: es el orden del modelo MA, es decir, el número de términos de error pasados incluidos.

Tipos de Modelo

Aplicaciones

Ofrece un amplio portafolio de aplicaciones en diversas áreas gracias a su capacidad para usar los errores pasados en las predicciones que lo hace especialmente útil en situaciones donde es fundamental captar y corregir patrones de errores en los datos históricos para obtener de manera oportuna y eficiente predicciones.

Campos de aplicación

  • Predicción Financiera: para predecir precios de acciones, análisis económico por medio de indicadores económicos y modelos macroeconómicos.
  • Control de Calidad: En procesos industriales para monitorear y controlar la calidad de producción. También en la optimización de procesos al prever desviaciones y fallos que se puedan. presentar.
  • Clima: predice el comportamiento del clima, analizando los patrones climáticos de periodos anteriores, analizando series temporales de los datos meteorológicos.
  • Marketing: se usa para la proyección de demanda, predecir ventas futuras y de productos que se analicen y junto a esto las tendencias para ajustar estrategias futuras.

Criterios para el uso del modelo MA

.

Criterios

Para hacer uso en predicción de series de tiempo el modelo de medias móviles (MA) se deben cumplir los siguientes criterios:

  • Errores pasados: Se deben utilizar los errores de predicción de períodos anteriores para modelar el valor actual de la serie.
  • Estacionariedad:Se asume que la serie de tiempo es estacionaria, lo que significa que sus propiedades estadísticas, como la media y la varianza no cambian con el tiempo.
  • Independencia de los errores: Los errores deben ser independientes e idénticamente distribuidos (i.i.d.). No deben estar correlacionados entre sí y deben seguir una distribución con media cero y varianza constante. Esto implica que los errores son ruido blanco.
  • Estabilidad del modelo: Los coeficientes del modelo (los θ) deben ser tales que la serie resultante no diverge. En términos prácticos, esto se refiere a la condición de invertibilidad del modelo.

Caso aplicado de modelo MA

#install.packages("quantmod")
#install.packages("forecast")
library(quantmod)
library(forecast)
library (tseries)

# Obtener datos de la tasa de desempleo de EE.UU. desde FRED: 
#FRED = FEDERAL RESERVE ECONOMIC DATA
getSymbols("UNRATE", src = "FRED")
[1] "UNRATE"
plot(UNRATE, main = "Tasa de Desempleo en EE.UU.", ylab = "Tasa de Desempleo en %", xlab = "Año")

# Convertir datos a serie de tiempo:
unrate.ts <- ts(UNRATE, frequency = 12,start = c(1948, 1))

#Descomposición de los datos: 
unrate.ts_dec<- decompose(unrate.ts)

#Gráficas de las caracterisiticas de los datos: 
plot(unrate.ts_dec$trend, main = "Tendencia", col = "purple", ylab = "Valores")

plot(unrate.ts_dec$seasonal, main = "Estacionalidad", col = "red", ylab = "Valores")

plot(unrate.ts_dec$random, main = "Irregularidad", col = "blue", ylab = "Valores")

#Verificar criterios del modelo con prueba Dickey Fulle: 
adf.test(unrate.ts) #Augmented Dickey Fuller

    Augmented Dickey-Fuller Test

data:  unrate.ts
Dickey-Fuller = -3.9374, Lag order = 9, p-value = 0.01213
alternative hypothesis: stationary
# H0: Serie No estacionaria & H1: Serie Estacionaria
# Si el p-valor > 0.05, no se encuentra  suficiente
#evidencia estadistica para rechazar la H0.

#Resultado: Se encuentra suficiente evidencia estadistica
#para rechazar H0, es decir, la serie temporal es estacionaria 

#Determinación del q:
Acf(unrate.ts, main='Función de autocorrelación (ACF)') #Función de autocorrelación simple 

# Ajuste del modelo MA(1):
modelo <- Arima(unrate.ts, order = c(0, 0, 1))

# Resumen del modelo ajustado: 
summary(modelo)
Series: unrate.ts 
ARIMA(0,0,1) with non-zero mean 

Coefficients:
         ma1    mean
      0.8758  5.6943
s.e.  0.0116  0.0610

sigma^2 = 0.9707:  log likelihood = -1285.87
AIC=2577.74   AICc=2577.77   BIC=2592.2

Training set error measures:
                       ME      RMSE       MAE       MPE     MAPE      MASE
Training set 0.0009672543 0.9841818 0.7430083 -4.797901 14.06699 0.7820229
                  ACF1
Training set 0.7134294
#Validación del modelo con prueba de Ljung-Box: 
# La prueba de Ljung-Box, evalúa si hay o no autocorrelación en los residuos.
# H0: No hay autocorrelación de los residuos & H1: Existe autocorrelación de los residuos. 
# P-value > a 0.05,  no se rechaza H0. 
Box.test(modelo$residuals, lag = 1, type = c("Box-Pierce", "Ljung-Box"), fitdf = 0)

    Box-Pierce test

data:  modelo$residuals
X-squared = 466.23, df = 1, p-value < 2.2e-16
#Resultado: 2.2e−16 < 0.05, se dice que hay suficiente evidencia para rechazar la H0,
#es decir, existe autocorrelación de los residuos. 

#Prueba de Shapiro-Wilk que muestra la distibucción normal de los
#residuos en el modelo:
# H0: Los residuos siguen una distribución normal.
#& H1: Los residuos NO siguen una distribución normal.
# P-value < 0.05, se puede rechazar la H0, diciendo que
#no sigue una distribución normal.
shapiro.test(modelo$residuals)

    Shapiro-Wilk normality test

data:  modelo$residuals
W = 0.91533, p-value < 2.2e-16
#Resultado: Se rechaza la H0. los residuos no siguen una distribucción normal.

# Diagnóstico del modelo
checkresiduals(modelo)


    Ljung-Box test

data:  Residuals from ARIMA(0,0,1) with non-zero mean
Q* = 7179.9, df = 23, p-value < 2.2e-16

Model df: 1.   Total lags used: 24
# Predicción a futuro para 24 meses
forecast_values <- forecast(modelo, h = 24)
print(forecast_values)
         Point Forecast    Lo 80    Hi 80    Lo 95    Hi 95
May 2024       5.070022 3.807363 6.332681 3.138952 7.001092
Jun 2024       5.694306 4.015827 7.372785 3.127295 8.261317
Jul 2024       5.694306 4.015827 7.372785 3.127295 8.261317
Aug 2024       5.694306 4.015827 7.372785 3.127295 8.261317
Sep 2024       5.694306 4.015827 7.372785 3.127295 8.261317
Oct 2024       5.694306 4.015827 7.372785 3.127295 8.261317
Nov 2024       5.694306 4.015827 7.372785 3.127295 8.261317
Dec 2024       5.694306 4.015827 7.372785 3.127295 8.261317
Jan 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Feb 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Mar 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Apr 2025       5.694306 4.015827 7.372785 3.127295 8.261317
May 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Jun 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Jul 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Aug 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Sep 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Oct 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Nov 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Dec 2025       5.694306 4.015827 7.372785 3.127295 8.261317
Jan 2026       5.694306 4.015827 7.372785 3.127295 8.261317
Feb 2026       5.694306 4.015827 7.372785 3.127295 8.261317
Mar 2026       5.694306 4.015827 7.372785 3.127295 8.261317
Apr 2026       5.694306 4.015827 7.372785 3.127295 8.261317
# Graficar las predicciones
plot(forecast_values, main = "Predicción de la Tasa de Desempleo en EE.UU." , ylab = "Pronostico de Desempleo en %", xlab = "Año")

Conclusiones

  • Las pruebas para confirmar que el modelo si es aplicable a la serie temporal de la tasa de desempleo son indispensables para cumplir con los criterios para el uso del modelo MA.

  • Se grafican los datos para analizar patrones y observaciones atípicas, teniendo unas mejores características de la tasa de desempleo en EE.UU.

  • La tasa de desempleo en EE.UU se ve una clara irregularidad en el año 2020 por el suceso mundial de la pandemia del virus “COVID-19”.

  • En la grafica se observa el pronóstico 24 meses hacia adelante, midiendo mejor la tendencia de los datos a un incremento de 5% a 7% .

  • La función arima es una opción para elegir el mejor modelo matemático que mejor predice el pronóstico de la tasa de desempleo, con esto los encargados podrán analizar y tomar medidas al respecto en el país de EE.UU.

REFERENCIAS BIBLIOGRÁFICAS

  • 3 Modelización de series univariantes: (S)ARIMA | Series de tiempo. (s. f.). https://bookdown.org/victor_morales/SeriesdeTiempo/modelizaci%C3%B3n-de-series-univariantes-sarima.html#ruido-blanco

  • Econometría. (2020, 17 junio). El modelo de medias móviles (MA) [Vídeo]. YouTube. https://www.youtube.com/watch?v=fMBeeGFjhOk

  • Modelo de promedio móvil (MA o MM). (s. f.). Numxl. https://support.numxl.com/hc/es/articles/207842983-Modelo-de-promedio-m%C3%B3vil-MA-o-MM

  • Modelos predictivos y programación lineal: Ejercicios resueltos con Excel 2013/2010/2007. (2015). María Pérez Marqués.

  • Rodó, P. (2022, 24 noviembre). Modelo ARMA. Economipedia. https://economipedia.com/definiciones/modelo-arma.html

  • RPubs - Aplicación modelo ARIMA. (s. f.). https://rpubs.com/stefens07/Arima

  • RPUbs - Modelos ARIMA. (s. f.). https://www.rpubs.com/valeamasso/386527

  • RPubs - Pronóstico de ventas con la función auto.arima de RStudio. (s. f.). https://rpubs.com/sergioarellano1985/pronosticodeventasconlafuncionautoarimatrabajofinaldelamater iametodoscuantitativos2020_1#:~:text=La%20funci%C3%B3n%20forecast%20te%20permite,proyecciones%20fuera%20de%20la%20muestra

  • Técnicas analíticas y aprendizaje estadístico en un enfoque práctico: CIencia de datos (1.a ed.). (s. f.). Jesús García, José M. molina, Antonio Berlanga, Miguel A. Patricio, Álvaro L. Bustamante, Washington R. Padilla.