Licença
This work is licensed under the Creative Commons
Attribution-ShareAlike 4.0 International License. To view a copy of this
license, visit http://creativecommons.org/licenses/by-sa/4.0/ or send a
letter to Creative Commons, PO Box 1866, Mountain View, CA 94042,
USA.
Citação
Sugestão de citação: FIGUEIREDO, Adriano Marcos Rodrigues. Exemplo
Séries Temporais: modeltime - IPCA Var. Mensal. Campo Grande-MS, Brasil:
RStudio/Rpubs, 2023. Disponível em https://rpubs.com/amrofi/modeltime_ipca.
Introdução
Os dados vem do pacote sidrar, seguindo o exemplo da Análise Macro
(2022), atualizados para a consulta eletrônica em 06/04/2023.
Carregar pacotes
# # https://analisemacro.com.br/data-science/modelagem-e-previsao-com-o-modeltime/
library(sidrar)
library(magrittr)
library(dplyr)
library(lubridate)
library(timetk)
library(rsample)
library(modeltime)
library(parsnip)
library(generics)
library(yardstick)
library(ggplot2)
Passo 1: dados
# IPCA (% a.m.): coleta de dados online do SIDRA/IBGE
# Brasil, variação mensal - dez 1979 a fev 2023
raw_ipca <- sidrar::get_sidra(api = "/t/1737/n1/all/v/63/p/all/d/v63%202")
## Tratamento de dados ----
# recortou após jan 1999
# mudou nome da coluna Valor para ipca
# mudou de data.frame para tibble
# mudou coluna Mês (Código) para data YYYY-MM-DD
# posicionou no dia 01 de cada mês
dados <- raw_ipca %>%
dplyr::mutate(
date = lubridate::ym(`Mês (Código)`),
ipca = `Valor`,
.keep = "none"
) %>%
dplyr::filter(date >= lubridate::ymd("1999-01-01")) %>%
dplyr::as_tibble()
dados
# # A tibble: 282 × 2
# date ipca
# <date> <dbl>
# 1 1999-01-01 0.7
# 2 1999-02-01 1.05
# 3 1999-03-01 1.1
# 4 1999-04-01 0.56
# 5 1999-05-01 0.3
# 6 1999-06-01 0.19
# 7 1999-07-01 1.09
# 8 1999-08-01 0.56
# 9 1999-09-01 0.31
# 10 1999-10-01 1.19
# # … with 272 more rows
#
Visualização de
dados
# usou timetk para plotar
timetk::plot_time_series(
.data = dados,
.date_var = date,
.value = ipca,
.title = "IPCA (% a.m.) - Brasil - Variação mensal",
.x_lab = "Ano",
.y_lab = "(% a.m. - Variação mensal)",
.interactive = TRUE
)
Passo 2: separar
amostras treino x teste
# Separar amostra de "treino" e de "teste" (i.e. pseudo fora da amostra)
amostras <- rsample::initial_time_split(data = dados, prop = 0.95)
amostras
## <Training/Testing/Total>
## <275/15/290>
rsample::training(amostras) # treino
rsample::testing(amostras) # teste
#
Passo 3: modelagem
## Modelo 1: auto ARIMA ----
fit_auto_arima <- modeltime::arima_reg() %>%
parsnip::set_engine(engine = "auto_arima") %>% # usa forecast::auto.arima
generics::fit(
ipca ~ date, # interface de fórmula do modeltime (date não é um regressor)
data = rsample::training(amostras) # amostra de treino
)
fit_auto_arima
## parsnip model object
##
## Series: outcome
## ARIMA(1,0,0)(2,0,1)[12] with non-zero mean
##
## Coefficients:
## ar1 sar1 sar2 sma1 mean
## 0.6281 0.8541 -0.0054 -0.6918 0.5400
## s.e. 0.0470 0.1768 0.0900 0.1684 0.0866
##
## sigma^2 = 0.09064: log likelihood = -58.75
## AIC=129.5 AICc=129.81 BIC=151.2
## Modelo 2: passeio aleatório (random walk) ----
fit_rw <- modeltime::naive_reg(seasonal_period = 12) %>% # sazonalidade
parsnip::set_engine(engine = "naive") %>%
generics::fit(
ipca ~ date,
data = rsample::training(amostras)
)
fit_rw
## parsnip model object
##
## NAIVE
## --------
## Model:
## # A tibble: 1 × 2
## date value
## <date> <dbl>
## 1 2021-11-01 0.95
Passo 4: avaliar
modelos
# Diagnóstico de resíduos (normalidade e autocorrelação)
fit_auto_arima %>%
modeltime::modeltime_table() %>% # adicionar modelos para uma "tabela de modelos"
modeltime::modeltime_calibrate( # cálculo de resíduos dos modelos
new_data = rsample::training(amostras)
) %>%
modeltime::modeltime_residuals() %>% # extrai resíduos
modeltime::modeltime_residuals_test() # aplica testes de normalidade e autocorrelação
#
Passo 5: previsão
modelos %>% # Reestima modelos e gera 12 pontos de previsão fora da amostra
modeltime::modeltime_calibrate(new_data = rsample::testing(amostras)) %>%
modeltime::modeltime_refit(data = dados) %>% # reestima modelos com amostra completa
modeltime::modeltime_forecast(h = 12, actual_data = dados) %>%
modeltime::plot_modeltime_forecast()
