Lista 3 de Econometria I - Regressão Linear Múltipla
Exercícios Teóricos
Questão 1 (3.3 Wooldridge)
O modelo a seguir é uma versão simplificada do modelo de regressão múltipla usado por Biddle e Hamermesh (1990) para estudar a compensação entre o tempo gasto dormindo e trabalhando e observar outros fatores que afetam o sono:
\[\operatorname{sleep} =\beta_0 + \beta_1 \operatorname{totwrk} + \beta_2 \operatorname{educ} + \beta_3 \operatorname{age} + u\]
onde o \(\operatorname{sleep}\) e o \(\operatorname{totwrk}\) (trabalho total) são medidos em minutos por semana e a \(\operatorname{educ}\) e \(\operatorname{age}\) é medida em anos.
Se os adultos trocam o sono pelo trabalho, qual é o sinal de \(\beta_1\)?
Que sinais você acha que \(\beta_2\) e \(\beta_3\) terão?
Usando os dados em
SLEEP75, a equação estimada é
\[\widehat{\operatorname{sleep}} = 3638.25 - 0.148 \operatorname{totwrk} - 11.13 \operatorname{educ} + 2.20 \operatorname{age} \\ n = 706, R^2=0,113\]
Se alguém trabalha mais cinco horas por semana, quantos minutos é sono previsto para cair? Esta é uma grande troca?
Discuta o sinal e a magnitude do coeficiente estimado na \(\operatorname{educ}\).
Você diria que \(\operatorname{totwrk}\), \(\operatorname{educ}\) e \(\operatorname{age}\) explicam grande parte da variação em \(\operatorname{sleep}\)? Que outros fatores podem afetar o tempo gasto dormindo? São estes provavelmente estão correlacionados com \(\operatorname{totwrk}\)?
Questão 2 (3.7 Wooldridge)
Qual das alternativas a seguir pode fazer com que os estimadores OLS sejam viesados?
Heterocedasticidade.
Omissão de uma variável importante.
Um coeficiente de correlação amostral de 0,95 entre duas variáveis independentes incluídas no modelo.
Exercícios Práticos
A base de dados PNAD2023 em .RDS contém os dados da PNAD
Contínua do 1º Trimestre de 2023 e será utilizada nos exercícios 3, 4 e
5.
A base possui 194887 observações com as seguintes variáveis:
- educ: Anos de Estudo,
- rend: Rendimento no último mês em R$
- idade: Idade em anos
Questão 3
Na lista 1 estimamos a Regressão Simples
\[ \operatorname{rend} = \beta_0 + \beta_1
\operatorname{educ} + u\] Agora, através do comando
lm(), estime a seguinte Regressão múltipla.
\[ \operatorname{rend} = \alpha + \beta_{1}(\operatorname{educ}) + \beta_{2}(\operatorname{idade}) + \epsilon \]
Obs.: lembre-se de definir um diretório de trabalho pelo
comando setwd() e importe a base de dados através
do readRDS()
Interprete os coeficientes do modelo estimado
Utilize o comando
summary()para recuperar as estatísticas do modeloCompare os resultados estimados ao modelo de Regressão Simples. Qual sua interpretação sobre o \(R^2\)
Questão 4
Repita a questão 3, mas estimando o modelo Log-Nível. Isto é, estime o modelo.
\[ \operatorname{log(rend)} = \alpha + \beta_{1}(\operatorname{educ}) + \beta_{2}(\operatorname{idade}) + \epsilon \] Como você interepreta os coeficientes?
Questão 5
Os estimadores \(\beta\) em notação matricial são dados por
\[\beta=(X'X)^{-1}X'y\]
E os estimadores da variância de beta são dados por
\[\text{Var} (\hat{\beta}) = \sigma^2 (X'X)^{-1} \]
- Estime manualmente no R:
Lembre-se dos seguintes comandos de operação matricial:
- %*%: múltiplicação matricial (não confundir com o operador *)
- t(): transposição
- solve(): inversa
O modelo de Regressão Múltipla
As seguintes estatísticas
\(R^2\)
\(R^2\) ajustado (\(\bar{R}^2\))
Erro padrão dos resíduos (\(SER\))
A matriz de variância e covariância de \(\hat{\beta}\)
- Os valores são os mesmos encontrados através da função
summary()na Questão 3?