Lista 4 de Econometria I - Inferência Estatística

Observações:

As respostas estarão em verde. Não consegui entender o motivo, mas nas questões 1 e 2/I o comando não funcionou como esperado, deixando as resposta em uma caixa.

Exercícios Teóricos

1 (4.1 Wooldridge)

Qual das alternativas a seguir pode fazer com que as estatísticas usuais de MQO t sejam inválidas (isto é, não ter distribuições t sob H0)?

  1. Heterocedasticidade.

  2. Um coeficiente de correlação amostral de 0,95 entre duas variáveis independentes que estão no modelo.

  3. Omissão de uma variável explicativa importante.

Resposta:

  [As alternativas I, II, e III estão corretas, pois heterocedascidade ocorrerá quando a variância do erro não for constante em relação aos valores das variáveis independentes; a multicolinearidade ocorrerá quando há variáveis correlacionadas; a omissão de variáveis explicativas pode levar à estimativas enviesadas.]{style="color: green;"}

Questão 2 (4.3 Wooldridge)

A variável rdintens são gastos com pesquisa e desenvolvimento (P&D) como porcentagem das vendas. As vendas são medidas em milhões de dólares. A variável profmarg é lucros como porcentagem das vendas. Usando os dados do RDCHEM para 32 empresas da indústria química, a seguinte equação é estimada:

rdintensˆ =1.369(0.472)−0.216(0.321)×log(sales)+0.50×profmarg n=32 , R2=0.099

  1. Interprete o coeficiente no log(sales). Em particular, se as vendas aumentarem em 10%, qual é a variação estimada em pontos percentuais em rdintens? Isto é um efeito economicamente grande?

     [A intensidade de P&D diminuirá relativamente ao aumento das vendas. Dessa forma, um aumento das vendas em 10%, a intensidade de P&D tenderá a diminuir em  0,22 (apoximado) pontos percentuais.]{style="color: green;"}
  2. Testar a hipótese de que a intensidade de P&D não muda com as vendas, contra a alternativa de que aumenta com as vendas. Faça o teste nos níveis de 5% e 10%.

    Podemos afirmar que, coeficiente log(sales) é estatisticamente significativo no nível 5%. Dessa forma, significa que a intensidade de P&D aumenta com vendas.

  3. O profmarg tem um efeito estatisticamente significativo nos rdintens?

    Sim, pois o coeficiente do profmarg é estatisticamente significativo no nível 5%, e significa que os lucros têm um efeito positivo na intensidade P&D.

Exercícios Práticos

A base de dados PNAD2023 em .RDS contém os dados da PNAD Contínua do 1º Trimestre de 2023 e será utilizada nos exercícios 3, 4 e 5. Não estava disponível os exercícios 4 e 5

A base possui 194887 observações com as seguintes variáveis:

educ: Anos de Estudo

rend: Rendimento no último mês em R$

idade: Idade em anos

Questão 3

Na 2 estimamos a seguinte Regressão múltipla.

rend=β0+β1(educ)+β2(idade)+ϵ Estime novamente o modelo e faça o que se pede.

Obs.: lembre-se de definir um diretório de trabalho pelo comando setwd() e importe a base de dados através do readRDS().

# Definindo o diretório de trabalho
setwd("C:/Users/WTINFO PC/Downloads")

# Importando a base de dados
dados <- readRDS("PNAD2023 (1).RDS")

# Estimando o modelo de regressão múltipla
modelo <- lm(rend ~ educ + idade, data = dados)

summary(modelo)
## 
## Call:
## lm(formula = rend ~ educ + idade, data = dados)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -7200  -1729   -713    531 297989 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -3550.8003    47.6036  -74.59   <2e-16 ***
## educ          356.4904     2.4609  144.86   <2e-16 ***
## idade          64.5915     0.7798   82.83   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4396 on 188797 degrees of freedom
## Multiple R-squared:  0.1091, Adjusted R-squared:  0.1091 
## F-statistic: 1.156e+04 on 2 and 188797 DF,  p-value: < 2.2e-16
  1. Interprete os coeficientes dos modelos estimados

O coeficiente educ é 356,49, o que significa que cada ano adicional de escolaridade é estimado aumentar a renda em R$356,49. O coediciente idade tem um valor de 64,59, o que significa que cada ano adicional de idade é estimado aumentar a renda em R$64,59. Esse é um número positivo, o que significa que a renda está positivamente relacionada à idade.

  1. Utilize o comando summary() para recuperar as estatísticas do modelo. Interprete a significância estatística dos estimadores.

Os resíduos representam a diferença entre o aluguel observado e o aluguel previsto para cada indivíduo. Variando de -7200 a 297989, entretanto, a maioria dos resíduos está em de $ 713 do aluguel previsto. Isso significa que o modelo tem capaciedade de prever o aluguelrazoávelmente.

  1. Qual a estatística F dos dois modelos? O que ela nos diz?

O valor da estatística F de 1,156e+04 com um valor-p de < 2,2e-16 indica que o modelo é estatisticamente significativo, o que significa que a relação entre renda, escolaridade e idade é estatisticamente significativa.

  1. Calcule o intervalo de confiança ao nível de 99% para os coeficientes. Realize o teste de hipóteses com H0:β2=65.
# Definindo o diretório de trabalho
setwd("C:/Users/WTINFO PC/Downloads")

# Importando a base de dados
dados <- readRDS("PNAD2023 (1).RDS")

# Estimando o modelo de regressão múltipla
modelo <- lm(rend ~ educ + idade, data = dados)

summary(modelo)
## 
## Call:
## lm(formula = rend ~ educ + idade, data = dados)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -7200  -1729   -713    531 297989 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -3550.8003    47.6036  -74.59   <2e-16 ***
## educ          356.4904     2.4609  144.86   <2e-16 ***
## idade          64.5915     0.7798   82.83   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4396 on 188797 degrees of freedom
## Multiple R-squared:  0.1091, Adjusted R-squared:  0.1091 
## F-statistic: 1.156e+04 on 2 and 188797 DF,  p-value: < 2.2e-16
# Calculando com base na questão
confint(modelo, level = 0.99)
##                   0.5 %     99.5 %
## (Intercept) -3673.42021 -3428.1803
## educ          350.15158   362.8293
## idade          62.58279    66.6003