1. Introdução
Neste roteiro prático, vamos aplicar os conceitos fundamentais da
econometria de séries temporais para analisar uma proxy mensal do
Produto Interno Bruto (PIB) do Brasil, o Indicador de Atividade
Econômica da FGV (IAE-FGV). Sendo um dado de alta frequência, esta série
exibe características temporais complexas (tendência, sazonalidade
mensal) que a tornam um excelente objeto de estudo. Nosso objetivo é
diagnosticar essas características, entender por que elas são um
“problema” para a modelagem tradicional, e aprender como tratá-las
adequadamente.
2. Preparação do Ambiente
Carregamos os pacotes que nos darão as ferramentas para baixar,
manipular, visualizar e testar os dados.
# Pacote para acessar dados do Banco Central do Brasil
library(rbcb)
# Coleção de pacotes para manipulação e visualização de dados
library(tidyverse)
# Pacote específico para testes de raiz unitária
library(tseries)
3. Aquisição e Análise Inicial dos Dados
Utilizaremos o pacote rbcb para importar a série do PIB
mensal (código 4380 no SGS-BCB) a partir de 1996. Para estabilizar a
variância da série e para que as diferenças possam ser interpretadas
como taxas de crescimento, trabalharemos com o logaritmo natural
da série.
# Código da série PIB mensal (proxy) no SGS-BCB
codigo_pib_mensal <- 4380
# Obter a série histórica a partir de 1996
pib_mensal_df <- rbcb::get_series(c(PIB_Mensal = codigo_pib_mensal), start_date = "1996-01-01")
# Calcular o logaritmo natural
pib_mensal_df <- pib_mensal_df %>%
mutate(log_PIB_Mensal = log(PIB_Mensal))
# Plotar a série do log(PIB_Mensal)
ggplot(pib_mensal_df, aes(x = date, y = log_PIB_Mensal)) +
geom_line(color = "darkblue", size = 1) +
labs(
title = "Logaritmo do PIB Mensal do Brasil (Proxy IAE-FGV)",
subtitle = "Série observada a valores correntes",
x = "Ano",
y = "Log(PIB Mensal)"
) +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

O gráfico revela uma clara tendência de crescimento
ao longo do tempo. A série definitivamente não flutua em torno de uma
média constante, o que é um forte indício visual de
não-estacionariedade.
4. Decomposição da Série Temporal
Para entender melhor a estrutura dos dados, vamos decompor a série em
seus componentes. Uma série temporal \(Y_t\) pode ser vista como a soma de uma
tendência (\(T_t\)), um componente
sazonal (\(S_t\)), e um componente
irregular (\(e_t\)).
\(Y_t = T_t + S_t + e_t\)
- Tendência: O movimento de longo prazo da
série.
- Sazonalidade: Flutuações periódicas que ocorrem
dentro de um ano. Com dados mensais, esperamos um padrão que se repete a
cada 12 meses (ex: Dezembro é tipicamente um mês de alta
atividade).
- Irregular (Ruído): Choques não previsíveis.
Para isso, convertemos nossos dados para um objeto ts,
informando ao R que se trata de uma série mensal
(frequency = 12).
# Converter a série para o formato ts, especificando a frequência MENSAL = 12
log_pib_mensal_ts <- ts(pib_mensal_df$log_PIB_Mensal, start = c(1996, 1), frequency = 12)
# Decompor a série
decomposicao <- decompose(log_pib_mensal_ts)
# Plotar a decomposição
plot(decomposicao)

A análise do gráfico de decomposição agora mostra um rico componente
sazonal, com picos e vales que se repetem anualmente,
refletindo o ciclo de atividade econômica ao longo do ano. A
tendência de longo prazo continua evidente.
5. Estacionariedade e o Teste de Raiz Unitária
5.1. A Importância Crucial da Estacionariedade
(Esta explicação teórica se mantém perfeitamente válida) Uma série é
estacionária se suas propriedades estatísticas não
mudam ao longo do tempo. Regredir uma série não-estacionária contra
outra pode levar a uma regressão espúria: encontrar
correlações fortes que são meramente coincidentes, frutos de tendências
independentes. Para evitar conclusões falsas, precisamos trabalhar com
séries estacionárias. O “problema” que impede isso é a chamada
raiz unitária.
5.2. O Teste de Dickey-Fuller Aumentado (ADF)
(Esta explicação teórica se mantém perfeitamente válida) O teste ADF
é nossa ferramenta formal para detectar a raiz unitária. As hipóteses
são:
- \(H_0\) (Hipótese
Nula): A série possui uma raiz unitária (é
não-estacionária).
- \(H_1\) (Hipótese
Alternativa): A série é estacionária.
Aplicamos o teste à nossa série log_pib_mensal_ts.
# Aplicar o teste ADF simplificado à série em nível
teste_adf_nivel <- tseries::adf.test(log_pib_mensal_ts)
# Exibir o resultado do teste
print(teste_adf_nivel)
##
## Augmented Dickey-Fuller Test
##
## data: log_pib_mensal_ts
## Dickey-Fuller = -1.3535, Lag order = 7, p-value = 0.8496
## alternative hypothesis: stationary
Interpretando o Resultado do Teste ADF
O p-value é alto (muito maior que 0.05). Com um p-valor
tão elevado, nós não temos evidências para rejeitar a hipótese
nula. Nossa conclusão, portanto, é a mesma de antes: a série do
log(PIB Mensal) é não-estacionária.
7. Funções de Autocorrelação (ACF e PACF)
Com a série estacionária em mãos, investigamos sua estrutura
de memória ou dependência temporal. Quão forte é a relação
entre o crescimento do PIB hoje e o crescimento em meses passados? Para
isso, usamos os correlogramas da FAC e FACP.
7.1. Função de Autocorrelação (FAC ou ACF)
A ACF mede a correlação “total” (direta e indireta) entre a série e
suas defasagens. Formalmente, a autocorrelação \(\rho_k\) para uma defasagem (lag) \(k\) é a razão entre a autocovariância no
lag \(k\) (\(\gamma_k\)) e a variância da série (\(\gamma_0\)).
\[ \rho_k = \frac{\text{Cov}(Y_t,
Y_{t-k})}{\text{Var}(Y_t)} = \frac{\gamma_k}{\gamma_0} \]
O valor de \(\rho_k\) varia entre -1
e 1. Ele nos diz o quão forte é a associação linear entre uma observação
e outra ocorrida \(k\) períodos no
passado, considerando todos os canais (inclusive o efeito através das
observações intermediárias).
7.2. Função de Autocorrelação Parcial (FACP ou PACF)
A PACF mede a correlação “direta” entre a série e uma defasagem, após
remover (“parcializar”) o efeito das defasagens intermediárias.
A forma mais intuitiva de entender a PACF é através de modelos
autorregressivos. O valor da PACF no lag \(k\), denotado por \(\phi_{kk}\), é o coeficiente estimado para
a \(k\)-ésima defasagem em uma
regressão da série contra suas \(k\)
defasagens:
\[ Y_t = c + \phi_{k1}Y_{t-1} +
\phi_{k2}Y_{t-2} + \dots + \mathbf{\phi_{kk}}Y_{t-k} + \epsilon_t
\]
Assim, \(\phi_{11}\) é simplesmente
a correlação entre \(Y_t\) e \(Y_{t-1}\). Já \(\phi_{22}\) é o coeficiente de \(Y_{t-2}\) em uma regressão de \(Y_t\) contra \(Y_{t-1}\) e \(Y_{t-2}\), capturando a correlação direta
entre \(Y_t\) e \(Y_{t-2}\) que não passa através de \(Y_{t-1}\).
7.3. Análise Gráfica dos Correlogramas
Estas ferramentas são essenciais para identificar a estrutura de
modelos da classe ARIMA, que veremos futuramente. Vamos agora gerar os
gráficos.
# Plotar os correlogramas da série estacionária
par(mfrow = c(1, 2))
acf(log_pib_mensal_diff, main = "ACF do Crescimento do PIB", na.action = na.omit, lag.max = 36)
pacf(log_pib_mensal_diff, main = "PACF do Crescimento do PIB", na.action = na.omit, lag.max = 36)

Interpretando os Correlogramas
As linhas azuis pontilhadas são os limites de significância
estatística.
- Autocorrelação Sazonal: No gráfico ACF, observe se
há picos significantes em lags que são múltiplos de 12 (12, 24, 36).
Isso indica a presença de um padrão sazonal remanescente na série, mesmo
após a diferenciação.
- Padrões de Curto Prazo: Analisamos os lags iniciais
para identificar a estrutura de dependência de curto prazo. Um corte
abrupto no PACF após o lag \(p\) sugere
um componente Autoregressivo de ordem \(p\), AR(\(p\)). Um corte abrupto no ACF após o lag
\(q\) sugere um componente de Média
Móvel de ordem \(q\), MA(\(q\)). Essa análise visual será o ponto de
partida da nossa próxima aula de modelagem.
---
title: "Aula 4: Fundamentos de Séries Temporais"
subtitle: "Análise da Dinâmica do PIB Mensal Brasileiro (Proxy IAE-FGV)"
author: "Bruno Melo de Oliveira Santos"
date: "02/10/2025"
output:
  html_document:
    toc: true
    toc_float: true
    theme: cerulean
    highlight: tango
    code_folding: show
    code_download: true  
---

# 1. Introdução

Neste roteiro prático, vamos aplicar os conceitos fundamentais da econometria de séries temporais para analisar uma proxy mensal do Produto Interno Bruto (PIB) do Brasil, o Indicador de Atividade Econômica da FGV (IAE-FGV). Sendo um dado de alta frequência, esta série exibe características temporais complexas (tendência, sazonalidade mensal) que a tornam um excelente objeto de estudo. Nosso objetivo é diagnosticar essas características, entender por que elas são um "problema" para a modelagem tradicional, e aprender como tratá-las adequadamente.

# 2. Preparação do Ambiente

Carregamos os pacotes que nos darão as ferramentas para baixar, manipular, visualizar e testar os dados.

```{r setup, message=FALSE, warning=FALSE}
# Pacote para acessar dados do Banco Central do Brasil
library(rbcb)

# Coleção de pacotes para manipulação e visualização de dados
library(tidyverse)

# Pacote específico para testes de raiz unitária
library(tseries)
```

# 3. Aquisição e Análise Inicial dos Dados

Utilizaremos o pacote `rbcb` para importar a série do PIB mensal (código 4380 no SGS-BCB) a partir de 1996. Para estabilizar a variância da série e para que as diferenças possam ser interpretadas como taxas de crescimento, trabalharemos com o **logaritmo natural da série**.

```{r}
# Código da série PIB mensal (proxy) no SGS-BCB
codigo_pib_mensal <- 4380

# Obter a série histórica a partir de 1996
pib_mensal_df <- rbcb::get_series(c(PIB_Mensal = codigo_pib_mensal), start_date = "1996-01-01")

# Calcular o logaritmo natural
pib_mensal_df <- pib_mensal_df %>%
  mutate(log_PIB_Mensal = log(PIB_Mensal))

# Plotar a série do log(PIB_Mensal)
ggplot(pib_mensal_df, aes(x = date, y = log_PIB_Mensal)) +
  geom_line(color = "darkblue", size = 1) +
  labs(
    title = "Logaritmo do PIB Mensal do Brasil (Proxy IAE-FGV)",
    subtitle = "Série observada a valores correntes",
    x = "Ano",
    y = "Log(PIB Mensal)"
  ) +
  theme_minimal()
```

O gráfico revela uma clara **tendência de crescimento** ao longo do tempo. A série definitivamente não flutua em torno de uma média constante, o que é um forte indício visual de não-estacionariedade.

# 4. Decomposição da Série Temporal

Para entender melhor a estrutura dos dados, vamos decompor a série em seus componentes. Uma série temporal $Y_t$ pode ser vista como a soma de uma tendência ($T_t$), um componente sazonal ($S_t$), e um componente irregular ($e_t$).

$Y_t = T_t + S_t + e_t$

-   **Tendência:** O movimento de longo prazo da série.
-   **Sazonalidade:** Flutuações periódicas que ocorrem dentro de um ano. Com dados mensais, esperamos um padrão que se repete a cada 12 meses (ex: Dezembro é tipicamente um mês de alta atividade).
-   **Irregular (Ruído):** Choques não previsíveis.

Para isso, convertemos nossos dados para um objeto `ts`, informando ao R que se trata de uma série **mensal** (`frequency = 12`).

```{r}
# Converter a série para o formato ts, especificando a frequência MENSAL = 12
log_pib_mensal_ts <- ts(pib_mensal_df$log_PIB_Mensal, start = c(1996, 1), frequency = 12)

# Decompor a série
decomposicao <- decompose(log_pib_mensal_ts)

# Plotar a decomposição
plot(decomposicao)
```

A análise do gráfico de decomposição agora mostra um rico componente **sazonal**, com picos e vales que se repetem anualmente, refletindo o ciclo de atividade econômica ao longo do ano. A **tendência** de longo prazo continua evidente.

# 5. Estacionariedade e o Teste de Raiz Unitária

## 5.1. A Importância Crucial da Estacionariedade

(Esta explicação teórica se mantém perfeitamente válida) Uma série é **estacionária** se suas propriedades estatísticas não mudam ao longo do tempo. Regredir uma série não-estacionária contra outra pode levar a uma **regressão espúria**: encontrar correlações fortes que são meramente coincidentes, frutos de tendências independentes. Para evitar conclusões falsas, precisamos trabalhar com séries estacionárias. O "problema" que impede isso é a chamada **raiz unitária**.

## 5.2. O Teste de Dickey-Fuller Aumentado (ADF)

(Esta explicação teórica se mantém perfeitamente válida) O teste ADF é nossa ferramenta formal para detectar a raiz unitária. As hipóteses são:

-   $H_0$ **(Hipótese Nula):** A série possui uma raiz unitária (é **não-estacionária**).
-   $H_1$ **(Hipótese Alternativa):** A série é **estacionária**.

Aplicamos o teste à nossa série `log_pib_mensal_ts`.

```{r}
# Aplicar o teste ADF simplificado à série em nível
teste_adf_nivel <- tseries::adf.test(log_pib_mensal_ts)

# Exibir o resultado do teste
print(teste_adf_nivel)
```

### **Interpretando o Resultado do Teste ADF**

O `p-value` é alto (muito maior que 0.05). Com um p-valor tão elevado, nós **não temos evidências para rejeitar a hipótese nula**. Nossa conclusão, portanto, é a mesma de antes: a série do log(PIB Mensal) é **não-estacionária**.

# 6. Transformando a Série com Diferenciação

A solução é a **diferenciação**. A primeira diferença do logaritmo da série $\Delta \ln(Y_t) = \ln(Y_t) - \ln(Y_{t-1})$, representa a **taxa de crescimento mensal** da atividade econômica.

```{r}
# Calcular a primeira diferença da série de log(PIB Mensal)
log_pib_mensal_diff <- diff(log_pib_mensal_ts)

# Plotar a série diferenciada
plot(
  log_pib_mensal_diff,
  main = "Taxa de Crescimento Mensal do PIB (Proxy)",
  ylab = "Variação do Log(PIB Mensal)",
  col = "darkblue"
)
abline(h = 0, col = "red", lty = 2)
```

A série agora parece flutuar em torno de uma média constante. Vamos aplicar o teste ADF novamente para confirmar.

```{r}
# Aplicar o teste ADF simplificado à série diferenciada
teste_adf_diff <- tseries::adf.test(log_pib_mensal_diff)

# Exibir o resultado
print(teste_adf_diff)
```

O resultado agora é drasticamente diferente. O `p-value` é extremamente baixo (reportado como 0.01 na saída, mas na verdade é menor, o que significa p < 0.01). Como este p-valor é muito inferior a 0.05, nós **rejeitamos a hipótese nula** com forte convicção. Concluímos que a série da taxa de crescimento é **estacionária**.

# 7\. Funções de Autocorrelação (ACF e PACF)

Com a série estacionária em mãos, investigamos sua **estrutura de memória** ou dependência temporal. Quão forte é a relação entre o crescimento do PIB hoje e o crescimento em meses passados? Para isso, usamos os correlogramas da FAC e FACP.

### 7.1. Função de Autocorrelação (FAC ou ACF)

A ACF mede a correlação "total" (direta e indireta) entre a série e suas defasagens. Formalmente, a autocorrelação $\rho_k$ para uma defasagem (lag) $k$ é a razão entre a autocovariância no lag $k$ ($\gamma_k$) e a variância da série ($\gamma_0$).

$$ \rho_k = \frac{\text{Cov}(Y_t, Y_{t-k})}{\text{Var}(Y_t)} = \frac{\gamma_k}{\gamma_0} $$
  
  O valor de $\rho_k$ varia entre -1 e 1. Ele nos diz o quão forte é a associação linear entre uma observação e outra ocorrida $k$ períodos no passado, considerando todos os canais (inclusive o efeito através das observações intermediárias).

### 7.2. Função de Autocorrelação Parcial (FACP ou PACF)

A PACF mede a correlação "direta" entre a série e uma defasagem, após remover ("parcializar") o efeito das defasagens intermediárias.

A forma mais intuitiva de entender a PACF é através de modelos autorregressivos. O valor da PACF no lag $k$, denotado por $\phi_{kk}$, é o coeficiente estimado para a $k$-ésima defasagem em uma regressão da série contra suas $k$ defasagens:
  
  $$ Y_t = c + \phi_{k1}Y_{t-1} + \phi_{k2}Y_{t-2} + \dots + \mathbf{\phi_{kk}}Y_{t-k} + \epsilon_t $$
  
  Assim, $\phi_{11}$ é simplesmente a correlação entre $Y_t$ e $Y_{t-1}$. Já $\phi_{22}$ é o coeficiente de $Y_{t-2}$ em uma regressão de $Y_t$ contra $Y_{t-1}$ e $Y_{t-2}$, capturando a correlação direta entre $Y_t$ e $Y_{t-2}$ que não passa através de $Y_{t-1}$.

### 7.3. Análise Gráfica dos Correlogramas

Estas ferramentas são essenciais para identificar a estrutura de modelos da classe ARIMA, que veremos futuramente. Vamos agora gerar os gráficos.

```{r}
# Plotar os correlogramas da série estacionária
par(mfrow = c(1, 2))
acf(log_pib_mensal_diff, main = "ACF do Crescimento do PIB", na.action = na.omit, lag.max = 36)
pacf(log_pib_mensal_diff, main = "PACF do Crescimento do PIB", na.action = na.omit, lag.max = 36)
par(mfrow = c(1, 1))
```

### **Interpretando os Correlogramas**

As linhas azuis pontilhadas são os limites de significância estatística.

* **Autocorrelação Sazonal:** No gráfico ACF, observe se há picos significantes em lags que são múltiplos de 12 (12, 24, 36). Isso indica a presença de um padrão sazonal remanescente na série, mesmo após a diferenciação.
* **Padrões de Curto Prazo:** Analisamos os lags iniciais para identificar a estrutura de dependência de curto prazo. Um corte abrupto no PACF após o lag $p$ sugere um componente Autoregressivo de ordem $p$, AR($p$). Um corte abrupto no ACF após o lag $q$ sugere um componente de Média Móvel de ordem $q$, MA($q$). Essa análise visual será o ponto de partida da nossa próxima aula de modelagem.