Variância Constante: o erro é uma variável aleatória com variância constante e igual, isto é, \(E(\varepsilon _i^2)=\sigma ^2\) Significa que a variância do erro é a mesma em todas as observações. Mais especificamente, significa que as distribuições dos erros (\(\varepsilon _i\)), definidas aos níveis de \(X_i\), apresentam a mesma variância. Ou seja, por definição, \(V(\varepsilon _i)=E[\varepsilon _i-E(\varepsilon _i)]^2\) dado que \(E(\varepsilon _i)=0\) a \(V(\varepsilon _i)=E(\varepsilon _i^2)=\sigma ^2\) para todo \(i\).
Esta variância é, em geral, desconhecida e constitui, também um parâmetro do modelo a ser estimado com os dados da amostra. Tecnicamente, esta pressuposição é denominada de “homoscedasticidade” que significa variação ou variabilidade igual. O caso de variância não constante é denominada de “heteroscedasticidade”. Dada a relação entre Y e o erro, pode-se mostrar que a variância de Y será igual à variância de e. Desta forma, esta pressuposição implica que a dispersão dos valores populacionais de Y é a mesma independentemente do nível de X.
1.1. A Natureza da Heteroscedasticidade
Modelos de aprendizagem do erro (a medida que o tempo passa o erro é menor);
Renda discricionária (a variância aumenta com o aumento da renda);
Técnica de coleta de dados;
Presença de “outliers” (observações aberrantes);
Modelo com erro de especificação.
Obs: o problema de heteroscedasticidade é mais comum em dados de corte do que em séries temporais (vide tabela 11.1 pg 359 do Gujarati, 2000).
1.2. Conseqüências sobre as propriedades dos estimadores de MQO
Admita as seguintes propriedades, dadas as hipóteses do MRLC:
Linearidade e não-viés \(\therefore E(\widehat{\beta })=\beta\)
Eficiência \(Min\) \(Var(\widehat{\beta })<Var(\widetilde{\beta })\)
Consistência \(\therefore \lim_{n\rightarrow \infty }E(\widehat{\beta })=\beta\)
Como o estimador de \(\sigma ^2\) é \(\widehat{\sigma }^2=\frac{\widehat{\varepsilon' }\widehat{\varepsilon }}{n-k}\) a soma do quadrado dos resíduos tende a ser alta e torna o estimador \(\widehat{\sigma }^2\) viesado e, portanto, o estimador \(Var(\widehat{\beta })\) é inapropriado. Os testes t-student e F-snedecor também serão enganosos por que a soma dos quadrados dos resíduos não pondera a heterocedasticidade e \(\widehat{\sigma }^2\) é tendencioso.
CONCLUSÃO: não levar em consideração a informação acerca da heterocedasticidade torna o estimador não eficiente.
Assim, apesar da estimação dos parâmetros continuarem não tendenciosos, não é eficiente; isto é, não será estimações de variâncias mínimas se apresentar heteroscedasticidade conduzindo a testes estatísticos incorretos. A violação do pressuposto de que a distribuição tem variância constante ao longo das observações se dá o nome de heteroscedasticidade, que é mais comum em dados de seção cruzada, prejudicando a eficiência dos parâmetros estimados.
Dessa forma, a conseqüência do uso do MQO na presença de heteroscedasticidade é de que os intervalos de confianças e os testes de hipóteses com as estatísticas “t” e “F” geralmente não garantem variâncias mínimas para os parâmetros estimados. Neste caso, os intervalos de confiança são maiores tendo como conseqüência a imprecisão dos testes.
O Objetivo da avaliação econométrica em relação à heteroscedasticidade é:
Como identificar a heteroscedasticidade?
Quais suas conseqüências?
Como corrigir o problema?
Não existe uma regra firme e segura para detectar a presença de heteroscedasticidade, somente algumas regras gerais e básicas. Em alguns casos, pode ser uma questão de intuição, conjectura, experiência empírica anterior ou pura especulação (Gujarati, 2000).
A pergunta que se faz é: admitindo que o parâmetro estimado \(\beta _i\) ainda seja linear e não-viesado, continua sendo eficiente? (ou de variância mínima?).