As respostas estarão em verde. Não consegui entender o motivo, mas nas questões 1 e 2/I o comando não funcionou como esperado, deixando as resposta em uma caixa.
Qual das alternativas a seguir pode fazer com que as estatísticas usuais de MQO t sejam inválidas (isto é, não ter distribuições t sob H0)?
Heterocedasticidade.
Um coeficiente de correlação amostral de 0,95 entre duas variáveis independentes que estão no modelo.
Omissão de uma variável explicativa importante.
[As alternativas I, II, e III estão corretas, pois heterocedascidade ocorrerá quando a variância do erro não for constante em relação aos valores das variáveis independentes; a multicolinearidade ocorrerá quando há variáveis correlacionadas; a omissão de variáveis explicativas pode levar à estimativas enviesadas.]{style="color: green;"}
A variável rdintens são gastos com pesquisa e desenvolvimento (P&D) como porcentagem das vendas. As vendas são medidas em milhões de dólares. A variável profmarg é lucros como porcentagem das vendas. Usando os dados do RDCHEM para 32 empresas da indústria química, a seguinte equação é estimada:
rdintensˆ =1.369(0.472)−0.216(0.321)×log(sales)+0.50×profmarg n=32 , R2=0.099
Interprete o coeficiente no log(sales). Em particular, se as vendas aumentarem em 10%, qual é a variação estimada em pontos percentuais em rdintens? Isto é um efeito economicamente grande?
[A intensidade de P&D diminuirá relativamente ao aumento das vendas. Dessa forma, um aumento das vendas em 10%, a intensidade de P&D tenderá a diminuir em 0,22 (apoximado) pontos percentuais.]{style="color: green;"}Testar a hipótese de que a intensidade de P&D não muda com as vendas, contra a alternativa de que aumenta com as vendas. Faça o teste nos níveis de 5% e 10%.
Podemos afirmar que, coeficiente log(sales) é estatisticamente significativo no nível 5%. Dessa forma, significa que a intensidade de P&D aumenta com vendas.
O profmarg tem um efeito estatisticamente significativo nos rdintens?
Sim, pois o coeficiente do profmarg é estatisticamente significativo no nível 5%, e significa que os lucros têm um efeito positivo na intensidade P&D.
A base de dados PNAD2023 em .RDS contém os dados da PNAD Contínua do 1º Trimestre de 2023 e será utilizada nos exercícios 3, 4 e 5. Não estava disponível os exercícios 4 e 5
A base possui 194887 observações com as seguintes variáveis:
educ: Anos de Estudo
rend: Rendimento no último mês em R$
idade: Idade em anos
Na 2 estimamos a seguinte Regressão múltipla.
rend=β0+β1(educ)+β2(idade)+ϵ Estime novamente o modelo e faça o que se pede.
Obs.: lembre-se de definir um diretório de trabalho pelo comando setwd() e importe a base de dados através do readRDS().
# Definindo o diretório de trabalho
setwd("C:/Users/WTINFO PC/Downloads")
# Importando a base de dados
dados <- readRDS("PNAD2023 (1).RDS")
# Estimando o modelo de regressão múltipla
modelo <- lm(rend ~ educ + idade, data = dados)
summary(modelo)
##
## Call:
## lm(formula = rend ~ educ + idade, data = dados)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7200 -1729 -713 531 297989
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3550.8003 47.6036 -74.59 <2e-16 ***
## educ 356.4904 2.4609 144.86 <2e-16 ***
## idade 64.5915 0.7798 82.83 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4396 on 188797 degrees of freedom
## Multiple R-squared: 0.1091, Adjusted R-squared: 0.1091
## F-statistic: 1.156e+04 on 2 and 188797 DF, p-value: < 2.2e-16
O coeficiente educ é 356,49, o que significa que cada ano adicional de escolaridade é estimado aumentar a renda em R$356,49. O coediciente idade tem um valor de 64,59, o que significa que cada ano adicional de idade é estimado aumentar a renda em R$64,59. Esse é um número positivo, o que significa que a renda está positivamente relacionada à idade.
Os resíduos representam a diferença entre o aluguel observado e o aluguel previsto para cada indivíduo. Variando de -7200 a 297989, entretanto, a maioria dos resíduos está em de $ 713 do aluguel previsto. Isso significa que o modelo tem capaciedade de prever o aluguelrazoávelmente.
O valor da estatística F de 1,156e+04 com um valor-p de < 2,2e-16 indica que o modelo é estatisticamente significativo, o que significa que a relação entre renda, escolaridade e idade é estatisticamente significativa.
# Definindo o diretório de trabalho
setwd("C:/Users/WTINFO PC/Downloads")
# Importando a base de dados
dados <- readRDS("PNAD2023 (1).RDS")
# Estimando o modelo de regressão múltipla
modelo <- lm(rend ~ educ + idade, data = dados)
summary(modelo)
##
## Call:
## lm(formula = rend ~ educ + idade, data = dados)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7200 -1729 -713 531 297989
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3550.8003 47.6036 -74.59 <2e-16 ***
## educ 356.4904 2.4609 144.86 <2e-16 ***
## idade 64.5915 0.7798 82.83 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4396 on 188797 degrees of freedom
## Multiple R-squared: 0.1091, Adjusted R-squared: 0.1091
## F-statistic: 1.156e+04 on 2 and 188797 DF, p-value: < 2.2e-16
# Calculando com base na questão
confint(modelo, level = 0.99)
## 0.5 % 99.5 %
## (Intercept) -3673.42021 -3428.1803
## educ 350.15158 362.8293
## idade 62.58279 66.6003