Lista 3 de Econometria I - Regressão Linear Múltipla

Exercícios Teóricos

Questão 1 (3.3 Wooldridge)

O modelo a seguir é uma versão simplificada do modelo de regressão múltipla usado por Biddle e Hamermesh (1990) para estudar a compensação entre o tempo gasto dormindo e trabalhando e observar outros fatores que afetam o sono:

\[\operatorname{sleep} =\beta_0 + \beta_1 \operatorname{totwrk} + \beta_2 \operatorname{educ} + \beta_3 \operatorname{age} + u\]

onde o \(\operatorname{sleep}\) e o \(\operatorname{totwrk}\) (trabalho total) são medidos em minutos por semana e a \(\operatorname{educ}\) e \(\operatorname{age}\) é medida em anos.

  1. Se os adultos trocam o sono pelo trabalho, qual é o sinal de \(\beta_1\)?

  2. Que sinais você acha que \(\beta_2\) e \(\beta_3\) terão?

  3. Usando os dados em SLEEP75, a equação estimada é

\[\widehat{\operatorname{sleep}} = 3638.25 - 0.148 \operatorname{totwrk} - 11.13 \operatorname{educ} + 2.20 \operatorname{age} \\ n = 706, R^2=0,113\]

Se alguém trabalha mais cinco horas por semana, quantos minutos é sono previsto para cair? Esta é uma grande troca?

  1. Discuta o sinal e a magnitude do coeficiente estimado na \(\operatorname{educ}\).

  2. Você diria que \(\operatorname{totwrk}\), \(\operatorname{educ}\) e \(\operatorname{age}\) explicam grande parte da variação em \(\operatorname{sleep}\)? Que outros fatores podem afetar o tempo gasto dormindo? São estes provavelmente estão correlacionados com \(\operatorname{totwrk}\)?

Questão 2 (3.7 Wooldridge)

Qual das alternativas a seguir pode fazer com que os estimadores OLS sejam viesados?

  1. Heterocedasticidade.

  2. Omissão de uma variável importante.

  3. Um coeficiente de correlação amostral de 0,95 entre duas variáveis independentes incluídas no modelo.

Exercícios Práticos

A base de dados PNAD2023 em .RDS contém os dados da PNAD Contínua do 1º Trimestre de 2023 e será utilizada nos exercícios 3, 4 e 5.

A base possui 194887 observações com as seguintes variáveis:

  • educ: Anos de Estudo,
  • rend: Rendimento no último mês em R$
  • idade: Idade em anos

Questão 3

Na lista 1 estimamos a Regressão Simples

\[ \operatorname{rend} = \beta_0 + \beta_1 \operatorname{educ} + u\] Agora, através do comando lm(), estime a seguinte Regressão múltipla.

\[ \operatorname{rend} = \alpha + \beta_{1}(\operatorname{educ}) + \beta_{2}(\operatorname{idade}) + \epsilon \]

Obs.: lembre-se de definir um diretório de trabalho pelo comando setwd() e importe a base de dados através do readRDS()

  1. Interprete os coeficientes do modelo estimado

  2. Utilize o comando summary() para recuperar as estatísticas do modelo

  3. Compare os resultados estimados ao modelo de Regressão Simples. Qual sua interpretação sobre o \(R^2\)

Questão 4

Repita a questão 3, mas estimando o modelo Log-Nível. Isto é, estime o modelo.

\[ \operatorname{log(rend)} = \alpha + \beta_{1}(\operatorname{educ}) + \beta_{2}(\operatorname{idade}) + \epsilon \] Como você interepreta os coeficientes?

Questão 5

Os estimadores \(\beta\) em notação matricial são dados por

\[\beta=(X'X)^{-1}X'y\]

E os estimadores da variância de beta são dados por

\[\text{Var} (\hat{\beta}) = \sigma^2 (X'X)^{-1} \]

  1. Estime manualmente no R:

Lembre-se dos seguintes comandos de operação matricial:

- %*%: múltiplicação matricial (não confundir com o operador *)
- t(): transposição
- solve(): inversa
  1. O modelo de Regressão Múltipla

  2. As seguintes estatísticas

    • \(R^2\)

    • \(R^2\) ajustado (\(\bar{R}^2\))

    • Erro padrão dos resíduos (\(SER\))

  3. A matriz de variância e covariância de \(\hat{\beta}\)

  1. Os valores são os mesmos encontrados através da função summary() na Questão 3?