Fonte: GUJARATI, D. N.; PORTER, D. C. Econometria Básica, 5. ed. Bookman: Porto Alegre, 2011.

1. O que é “autocorrelação”?

A autocorrelação é a correlação encontrada quando os termos de erro são correlacionados. Pode ocorrer entre integrantes de séries de observações ordenadas no tempo (quando é o caso de séries temporais) ou no espaço (em corte transversal).

A autocorrelação espacial ocorre quando o termo de erro de uma unidade é correlacionado ao termo de erro de outra unidade. Exemplo: o termo de erro pertencente a um domicílio é correlacionado ao termo de erro de outro domicílio em uma dada análise de função de consumo.

Em séries temporais, ocorre quando observações sucessivas apresentam intercorrelações. Exemplo: índices de preços subindo por dias sucessivos na bolsa de valores.

Também pode ser chamada de correlação serial. Porém alguns autores defendem que o nome autocorrelação deve ser usado quando a a correlação for defasada em relação a ela mesma (defasagem de algumas unidades de tempo). Por outro lado, quando for defasada entre duas séries diferentes, deverá ser chamada de correlação serial.

2. O que a presença de autocorrelação causa na regressão?

A correlação faz com que o erro presente em uma observação influencie demais observações. Exemplo: o efeito de uma greve em um trimestre afetar o resultado do trimestre seguinte; o aumento na renda de uma família e o efeito em seus gastos afetar os gastos de outra família.

Em resumo, quando a autocorrelação ocorre: \(E \left ( u_i, u_j \right ) \ne 0\), sendo \(i \ne 0\)

3. Quais são os testes de detecção de autocorrelação?

Os testes de detecção de autocorrelação podem ser resumidos através do gráfico a seguir:

O capítulo 12 de Gujarati apresenta a seguinte tabela:

Em seguida, graficamente, é possível perceber a relação positiva entre a remuneração real por hora e a produção por hora:

Aqui se encontra a regressão linear:

## 
## Call:
## lm(formula = dados[, 2] ~ dados[, 3])
## 
## Coefficients:
## (Intercept)   dados[, 3]  
##     29.5193       0.7137

Dessa vez, a plotagem dos resíduos:

Aplica-se agora o teste das carreiras:

##  [1] "-" "-" "-" "-" "-" "-" "-" "-" "-" "+" "+" "+" "+" "+" "+" "+" "+" "+" "+"
## [20] "+" "+" "+" "+" "+" "+" "+" "+" "+" "+" "+" "-" "-" "-" "-" "-" "-" "-" "-"
## [39] "-" "-"

E tendo \(N\) como o número de observações, \(N_1\) o número de observações positivas, \(N_2\) o número de observações negativas e \(R\) o número de carreiras:

\[ N = N_1 +N_2 = 40\\ N_1 = 21\\ N_2 = 19\\ R = 3 \] O valor da média e da variação são respectivamente:

## [1] 20.95
## [1] 2452.322

Para esses valores, a 95% de confiança, o intervalo está entre os dois valores abaixo:

## [1] 22.91
## [1] 18.99

O \(R\), número de carreiras, é menor que o intervalo de confiança.

Conclusão:

Dessa forma, é rejeitada a hipótese nula de aleatoriedade. Os resíduos apresentam autocorrelação.

Teste d de Durbin-Watson

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Carregando pacotes exigidos: zoo
## Warning: package 'zoo' was built under R version 4.2.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(mod1)
## 
##  Durbin-Watson test
## 
## data:  mod1
## DW = 0.1229, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0

Teste de Breusch-Godfrey (BG)

bgtest(mod1, order = 1, type = c("Chisq","F"))
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  mod1
## LM test = 32.205, df = 1, p-value = 1.388e-08

4. Quais são as possíveis correções?

A autocorrelação pode ser solucionada com o uso de Mínimos Quadrados Generalizados (MQG) ou com o método de Newey-West.

library(sandwich)
## Warning: package 'sandwich' was built under R version 4.2.3
NeweyWest(mod1)
##             (Intercept)  dados[, 3]
## (Intercept)   791.78904 -11.5830251
## dados[, 3]    -11.58303   0.1695712