Este material tem como objetivo introduzir os conceitos sobre efeito causal dinâmico em uma série temporal multivariada. Vamos entender como podemos usar os modelos de regressão com defasagens distribuídas (distributed lag regression model) e autorregressivo com defasagens distribuídas (autoregressive distributed lag regression model) para estimar tal efeito.
INTRODUÇÃO
Em alguns trabalhos empíricos o objetivo é saber como uma série temporal muda em função de outra(s) série(s) temporal(is). Porém, quase sempre temos o interesse de conhecer o impacto presente e futuro. Ou seja, como a oscilação em uma série temporal impacta outra série temporal hoje e nos próximos períodos (dias, semanas, meses, trimestres, …).
Isto é conhecido como o efeito causal dinâmico sobre uma série temporal dado uma mudança na(s) outra(s) série(s). A alternativa econométrica que provavelmente seria a primeira opção é a regressão linear múltipla estimada pelo método dos mínimos quadrados ordinários (MQO). Neste caso, chamamos de distributed lag regression em função de adicionar defasagens da(s) variável(is) explicativa(s) como regressores.
Exemplo:
Assuma que temos uma série temporal multivariada com dois componentes (\(y\) e \(x\)) e que queremos estimar como \(x\) impacta \(y\) linearmente hoje e no futuro (\(r\) períodos à frente). No contexto do distributed lag regression model (DLM) poderíamos fazer:
\[
y_t = \beta_0 + \beta_1x_t + \beta_2x_{t-1} + \beta_3x_{t-2} + ... + \beta_{r+1}x_{t-r}+ u_t
\]
onde \(u_t\) é um termo de erro e o modelo relaciona \(x_t\) e \(r\) de suas defasagens a \(y_t\). Com relação aos parâmetos temos:
- \(\beta_{1}\): efeito imediato ou contemporâneo de uma mudança em uma unidade em \(x_t\) sobre \(y_t\)
- \(\beta_{2}\): efeito sobre \(y_t\) de uma mudança em uma unidade em \(x_{t-1}\) ou, equivalentemente, o efeito sobre \(y_{t+1}\) de uma mudança em uma unidade em \(x_{t}\). Ou seja, \(\beta_{2}\) é o efeito de uma mudança em uma unidade em \(x\) sobre \(y\) um período depois.
- em geral, o coeficiente \(x_{t-h}\) é o efeito de uma mudança em uma unidade em \(x\) sobre \(y\) depois de \(h\) períodos.
Porém, os estimadores obtidos por MQO para tal regressão linear múltipla (ou distributed lag regression model) não são viesados, mas são inconsistentes. Isso acontece em função de estarmos trabalhando com séries temporais e não dados cross-section. Provavelmente, os determinates de \(y_t\) omitidos são correlacionados ao longo do tempo e o termo de erro \(u_t\) pode ser serialmente correlacionado.
Neste cenário, não podemos assumir a hipótese de exogenidade (\(x_t\), …, \(x_{t-r}\) não são relacionados com \(u_t\), ou seja, \(E\left[u_t|x_t,x_{t-1},...x_{t-r}\right]=0\)). Como sabemos, apesar de não implicar em viés, a violação desta hipótese torna a inferência estatística não confiável, pois produz erros padrões incorretos. Assim, precisamos tratar a matriz de variâncias e covariâncias de forma que o problema de não exogeneidade seja contornado (por exemplo, usar estimativas para a matriz de variâncias e covariâncias proposto por Newey and West (1987))
Outra alternativa para obter o efeito causal dinâmico é modelar a correlação serial no termo de erro como um modelo autorregressivo e então usá-lo para derivar um modelo de regressão autorregressivo com defasagens distribuídas (autoregressive distributed lag regression model). Contudo, é requerido exogeneidade estrita sobre a qual os erros tem média condicional igual a zero dado os valores passados, presentes e futuros de \(x\).
Exemplo:
Suponha que até duas defasagens de \(x_t\) impactam \(y_t\) e que o termo de erro se comporta como um AR(1). Assim, teríamos as seguintes equações:
\[
\begin{aligned}
y_t &= \beta_0 + \beta_1x_t + \beta_2x_{t-1} + u_t \\
\\
u_t &= \phi_1u_{t-1}+a_t
\end{aligned}
\] onde \(\phi_1\) é o parâmetro autorregressivo e \(a_t\) é um termo de erro não autocorrelacionado. Perceba que não é necessário intercepto, pois assumimos que \(E[u_t]=0\). Posteriormente, mostraremos por meio de derivações que tal modelo pode ser reescrito como:
\[
y_t = \alpha_0 + \phi_1y_{t-1}+\delta_0x_t + \delta_1x_{t-1}+\delta_2x_{t-2}+a_t
\]
que é conhecido como autoregressive distributed lag regression model (ADL). Aqui, um \(ADL(1,2)\) onde temos \(1\) defasagem de \(y_t\) e \(2\) defasagens de \(x_t\) como variáveis explicativas.
No decorrer deste documento, apresentaremos as hipóteses de exogeneidade e exegeneidade forte e como elas estão ligadas aos modelos \(DLM\) e \(ADL\). Além disso, definiremos o efeito causal dinâmico e o processo que deve ser usado para escolher qual dos dois modelos usar na prática.
EFEITO CAUSAL DINÂMICO
Um efeito causal é resultado de um experimento aleatório controlado. Por exemplo, um horticultor aplica fertilizantes aleatoriamente em alguns pés de tomate, mas em outros não e então mede a produção. A diferença esperada entre a produção com e sem fertilizante é o efeito causal de usar fertilizantes na produção de tomates.
Este conceito de um experimento pode ser pensado em dados cross-section (aqui, pés de tomate) ou em dados em painel (por exemplo, renda individual antes e após um programa de treinamento em formato experimental). Por ter múltiplos sujeitos é possível ter grupos tanto de tratamento quanto de controle e assim, estimar o efeito causal do tratamento.
Na análise de séries temporais, esta definição de efeito causal em termos da ideia de um experimento aleatório controlado precisa ser modificada. Considere um problema de macroeconomia de estimar o efeito de uma mudança não antecipada na taxa de juros de curto prazo sobre a atividade econômica atual e futura de um dado país, medida pelo PIB.
Tomado literalmente, o experimento aleatório controlado em cross-section e dados em painel, implicaria em fazer um experimento aleatório em diversos países e ter o grupo de controle e o grupo de tratamento. Os bancos centrais no grupo de tratamento aplicariam o tratamento de uma mudança aleatória na taxa de juros enquanto o grupo de controle não aplicaria qualquer mudança. Para ambos os grupos, a atividade econômica deveria ser medida ao longo dos próximos anos. Porém, e se estamos interessados em aplicar este efeito para um país específico? Então, este experimento teria diferentes “clones” deste país como sujeito, que seriam divididos entre os grupos de tratamento e controle. Obviamente, este universo paralelo é inviável.
Ao invés disso, em dados de séries temporais é útil pensar em um experimento aleatório controlado consistindo do mesmo sujeito (por exemplo, a economia dos EUA) sendo dado diferentes tratamentos (mudanças aleatorias na taxa de juros) em diferentes pontos do tempo (1970, 1980 e assim em diante). Nesta abordagem, o único sujeito em período de tempo diferente desempenha tanto o papel de controle quanto o de tratamento (às vezes o FED muda a taxa de juros e às vezes não). Em função dos dados serem coletados ao longo do tempo, é possível estimar o efeito causal dinâmico, ou seja, o caminho temporal do efeito sobre a taxa de juros originado em função do tratamento.
Esta formulação do efeito causal dinâmico em dados de séries temporais como o resultado esperado de um experimento no qual diferentes níveis de tratamentos são repetidamente aplicados ao mesmo sujeito tem duas implicações para tentativa empíricas de medi-lo em séries temporais:
- O efeito não deveria mudar para a amostra de dados que temos
- \(x\) deve ser não correlacionado com o termo de erro (exogeneidade)
Exemplo:
Suponha que nos EUA existe um mercado de compra e venda de grandes quantidades de suco de laranja concentrado em um preço específico para uma data futura. A fonte de quase todo o concentrado deste suco é a Flórida. Além disso, de tempos em tempos ondas de frio na Flórida matam as laranjas de tal forma que a oferta desta fruta cai drasticamente fazendo com que o preço do suco de laranja concentrado aumente.
Em função deste problema, seria importante para a gestão saber:
- Qual é a alteração nos preços quando há ondas de frio na Flórida?
- Por quanto tempo a mudança climática influencia nos preços (hoje e futuramente)?
Assumindo que realprice é a variável que representa o preço real do suco de laranja concentrado e que fdd é o número de dias em que a temperatura (em graus Fahrenheit) cai abaixo de zero em um determinado mês, teríamos:
\[
realprice_t = \beta_0 + \beta_1fdd_t + \beta_2fdd_{t-1} + \beta_3fdd_{t-2} + ... + \beta_{r+1}fdd_{t-r}+ u_t
\] como o modelo DLM com \(r\) defasagens de \(fdd\) impactando o preço real, sendo:
- \(\beta_1\) é o efeito contemporâneo que mostra o aumento percentual nos preços ao longo do mês no qual ocorre um dia adicional de temperatura abaixo de zero.
- \(\beta_2\) até \(\beta_{r+1}\) representam o quanto um dia adicional de temperatura abaixo de zero impactaria nos preços ao longo dos próximos \(r\) meses.
Por outro lado,
\[
\begin{aligned}
realprice_t = \alpha_0 + \phi_1realprice_{t-1}+\delta_0fdd_t + \delta_1fdd_{t-1}+\delta_2fdd_{t-2}+a_t
\end{aligned}
\] seria um modelo ADL(1,2) onde \(1\) defasagem do próprio preço real e \(2\) defasagens de \(fdd\) impactam o preço real corrente.
Em ambos os casos os parâmetros estimados para \(fdd_t\) e suas defasagens serão os responsáveis por nos fornecer o efeito causal dinâmico (valor corrente e futuro) em realprice à medida que ocorre o aumento em uma unidade (um dia) em \(fdd_t\) ou suas defasagens.
DOIS TIPOS DE EXOGENEIDADE
Como sabemos, uma variável é definida como exógena se ela não está correlacionada com o termo de erro enquanto uma variável é considerada endógena se ela está correlacionada com o termo de erro.
Por exemplo, se vamos estimar o efeito causal dinâmico usando o modelo DLM,
\[
y_t = \beta_0 + \beta_1x_t + \beta_2x_{t-1} + \beta_3x_{t-2} + ... + \beta_{r+1}x_{t-r}+ u_t
\]
os regressores (os \(x`s\)) devem ser não correlacionados com o termo de erro. Assim, \(x\) será exógeno. Em função de estarmos trabalhando com séries temporais, é preciso refinar a definição de exogeneidade. Existem dois diferentes conceitos de exogeneidade que usaremos:
O termo de erro tem média condicional igual a \(0\) dado os valores correntes e passados de \(x\). Ou seja, \(E\left[u_t|x_t,x_{t-1},x_{t-2},...\right]=0\). Isto modifica a hipótese padrão de média condicional para regressão linear múltipla com dados cross-section que requer apenas que \(u_t\) tenha uma média condicional igual a \(0\) dado os regressores incluídos (\(E\left[u_t|x_t,x_{t-1},...,x_{t-r}\right]=0\)). Adicionar todas as defasagens de \(x\) na esperança condicional implica que todos os efeitos mais distantes (efeito causal além de \(r\)) são nulos. Assim, sob esta hipótese, todos as \(r\) defasagens são diferentes de zero e podemos chamar esta hipótese de exogeneidade.
O termo de erro tem média zero, dado todos os valores passados, presentes e futuros de \(x_t\). Ou seja, \(E\left(u_t|...,x_{t+1},x_t,x_{t-1},x_{t-2},...\right) = 0\). Isso é chamado de exogeneidade estrita. A razão para introduzir o conceito de exogeneidade estrita é que, quando \(x\) é estritamente exógeno, existe estimadores mais eficientes do efeito causal dinâmico do que os estimadores obtidos por OLS (aqui, DLM).
A diferença entre exogeneidade (passado e presente) e exogeneidade estrita (passado, presente, e futuro) é que a exogeneidade estrita inclui valores futuros de \(x\) na esperança. Assim, exogeneidade estrita implica exogeneidade, mas não o reverso.
Exemplo:
Considere o exemplo do preço do concentrado do suco de laranja, em que \(realprice_t\) é a mudança percentual no preço real do suco de laranja no mês e \(fdd_t\) é o número de dias com temperatura abaixo de zero neste mês. A partir da perspectiva do mercado de suco de laranja, podemos pensar no clima como se ele fosse aleatoriamente definido, no sentido de que o clima está fora do controle humano. Se o efeito de \(fdd\) é linear e se ele não tem efeito sobre os preços depois de \(r\) meses, então segue-se que o clima é exógeno. Mas o clima é estritamente exógeno? Se a média condicional de \(u_t\) dado valores futuros de \(fdd\) é diferente de zero, então \(fdd\) não é estritamente exógeno. Responder esta questão requer pensar cuidadosamente sobre o que precisamente está contido em \(u_t\).
Em particular, se os participantes do mercado de suco de laranja usam previsões do \(fdd\) quando eles decidem quanto eles comprarão ou venderão a um dado preço, então os preços de suco de laranja e, consequentemente, o termo de erro \(u_t\) incorporarão informações sobre o futuro de \(fdd\) que tornaria \(u_t\) um útil preditor de \(fdd\). Isto significa que \(u_t\) será correlacionado com valores futuros de \(fdd\) e em função disso não é estritamente exógeno.
REFERÊNCIAS
Newey, Whitney K, and Kenneth D West. 1987. “A Simple, Positive Semi-Definite, Heteroskedasticity and Autocorrelationconsistent Covariance Matrix” 55. Econometrica: 703–8.
Stock, James H, and Mark W Watson. 2019. Introduction to Econometrics. Pearson.
