Aula 1 - Introdução à Inferência

Pressupostos para Inferência Clássica

Erro Padrão da Estimativa \(\hat{\beta}_j\)

\[ \text{Var}(\hat{\beta}_j) = \sigma^2 (X'X)^{-1}_{jj} \]

\[ \hat{\sigma}^2 = \frac{1}{n - k} \sum_{i=1}^n \hat{u}_i^2 \]

\[ se(\hat{\beta}_j) = \sqrt{\hat{\sigma}^2 (X'X)^{-1}_{jj}} \]

Teste t – Estrutura Formal

Interpretação Intuitiva do Teste t

Relação com Valor-p

Significância Estatística vs. Prática

Exemplo Intuitivo com Simulação

\[ \hat{\beta}_1 = 2.5, \quad se(\hat{\beta}_1) = 0.5 \] \[ t = \frac{2.5}{0.5} = 5 \] - Valor crítico para \(t_{0.05, 28} \approx 2.048\) → Rejeitamos \(H_0\) - Conclusão: \(X_1\) afeta significativamente \(Y\).

Exercício Resolvido (Gujarati, Exemplo 8.2)

Exercício Computacional em R

#install.packages("wooldridge")
library(wooldridge)

modelo <- lm(wage ~ educ + exper + female, data = wage1)
#Verificar coeficientes, erros padrão, t e p-valores

Resultado:

summary(modelo)
## 
## Call:
## lm(formula = wage ~ educ + exper + female, data = wage1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.3856 -1.9652 -0.4931  1.1199 14.8217 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.73448    0.75362  -2.302   0.0218 *  
## educ         0.60258    0.05112  11.788  < 2e-16 ***
## exper        0.06424    0.01040   6.177 1.32e-09 ***
## female      -2.15552    0.27031  -7.974 9.74e-15 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.078 on 522 degrees of freedom
## Multiple R-squared:  0.3093, Adjusted R-squared:  0.3053 
## F-statistic: 77.92 on 3 and 522 DF,  p-value: < 2.2e-16

Resumo e Conclusões

Aula 2 – Teste F e Testes de Hipóteses Conjuntas

Limitações do Teste t:

Estrutura do Teste F Geral

\[ H_0: \beta_1 = \beta_2 = \dots = \beta_{k-1} = 0 \] \[ H_1: \text{Ao menos um } \beta_j \ne 0 \]

Interpretação do Teste F

Relação entre R² e o Teste F

\[ F = \frac{R^2 / (k - 1)}{(1 - R^2) / (n - k)} \] - Alternativa ao uso de SQE e SQR. - Prático: softwares de regressão sempre retornam \(R^2\). - Ajuda a avaliar se o modelo “explica algo”.

Teste F para Conjuntos de Coeficientes

\[ H_0: \beta_2 = \beta_3 = 0 \]

Estatística F:

\[ F = \frac{(SSR_r - SSR_{ur}) / q}{SSR_{ur} / (n - k)} \] Onde \(q\) é o número de restrições.

Comparação com o Teste t

Exemplo numérico de Teste F

\[ F = \frac{0.60 / 2}{(1 - 0.60) / (30 - 3)} = \frac{0.30}{0.0148} \approx 20.27 \] - Valor crítico de \(F_{(2,27)} \approx 3.35\) → Rejeita-se \(H_0\)

Exercício com Resolução (Wooldridge)

\[ F = \frac{(0.25 - 0.18)/1}{(1 - 0.25)/97} = \frac{0.07}{0.00773} \approx 9.06 \] - \(F_{1,97}^{5\%} \approx 3.94 \ \rightarrow \ \) Rejeitamos \(H_0:\) \(X_2\) é relevante

Exercício Computacional em R

# Carregar pacote e dados
library(wooldridge)
data(wage1)

# Modelo completo com educ + exper
modelo_completo <- lm(wage ~ educ + exper, data = wage1)

# Modelo restrito com apenas educ
modelo_restrito <- lm(wage ~ educ, data = wage1)

Interpretação do teste

Se o valor-p for pequeno (\(p < 0.05\)), rejeitamos \(H_0\). Isso significa que exper é estatisticamente relevante.

Resultado

# Teste F: comparação dos modelos
anova(modelo_restrito, modelo_completo)
## Analysis of Variance Table
## 
## Model 1: wage ~ educ
## Model 2: wage ~ educ + exper
##   Res.Df    RSS Df Sum of Sq      F   Pr(>F)    
## 1    524 5980.7                                 
## 2    523 5548.2  1    432.52 40.772 3.78e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Agora um teste conjunto

Testar se duas variáveis juntas são significativas para explicar o salário (wage): \[ H_0 : \beta_{exper} = \beta_{tenure} = 0 \] Ou seja: verificar se podemos excluir ambas as variáveis do modelo ao mesmo tempo.

Resultado:

## Analysis of Variance Table
## 
## Model 1: wage ~ educ
## Model 2: wage ~ educ + exper + tenure
##   Res.Df    RSS Df Sum of Sq     F    Pr(>F)    
## 1    524 5980.7                                 
## 2    522 4966.3  2    1014.4 53.31 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Teste de Chow – Estabilidade dos Coeficientes

Teste de Chow – Estabilidade dos Coeficientes

\[ H_0 = \lambda_1 = \gamma_1 \ \text{e } \ \lambda_2 = \gamma_2 \]

Teste de Chow – Estabilidade dos Coeficientes

Teste de Chow – Estabilidade dos Coeficientes

\[ F = \frac{(SQR_c - (SQR_1 + SQR_2)) / k}{(SQR_1 + SQR_2) / (n_1 + n_2 - 2k)} \] Onde:

Exercício com Resolução (Gujarati - Cap. 8, seção 8.7, Tabela 8.9)

# Instalar o devtools
install.packages('devtools')
# Instalar o pacote com os dados do Gujarati
devtools::install_github("brunoruas2/gujarati")
library(gujarati)
# Visualizar os datasets disponíveis
data(package = "gujarati")

Exercício com Resolução (Gujarati - Cap. 8, seção 8.7, Tabela 8.9)

dados <- gujarati::Table8_9
class(dados$YEAR)
## [1] "factor"
class(dados$SAVINGS)
## [1] "factor"
class(dados$INCOME)
## [1] "factor"
# Corrigindo as variáveis de factor para numérico:
dados$YEAR    <- as.numeric(as.character(dados$YEAR))
dados$SAVINGS <- as.numeric(as.character(dados$SAVINGS))
dados$INCOME  <- as.numeric(as.character(dados$INCOME))

Exercício com Resolução (Gujarati - Cap. 8, seção 8.7, Tabela 8.9): Modelos estimados

Exercício com Resolução (Gujarati - Cap. 8, seção 8.7, Tabela 8.9): Gráficos Comparativos do exemplo

Exercício com Resolução (Gujarati - Cap. 8, seção 8.7, Tabela 8.9): Teste de Chow

# Soma dos quadrados dos resíduos
SSR_total <- sum(residuals(modelo_total)^2)
SSR_antes <- sum(residuals(modelo_antes)^2)
SSR_depois <- sum(residuals(modelo_depois)^2)

# Tamanhos da amostra e número de parâmetros para graus de liberdade:
n1 <- sum(dados$YEAR < 1982)
n2 <- sum(dados$YEAR >= 1982)
k <- length(coef(modelo_total))

Exercício com Resolução (Gujarati - Cap. 8, seção 8.7, Tabela 8.9): Teste de Chow

# Estatística F do teste de Chow
F_chow <- ((SSR_total - (SSR_antes + SSR_depois)) / k) /
          ((SSR_antes + SSR_depois) / (n1 + n2 - 2 * k))

# Estatística de teste:
F_chow 
## [1] 10.69006
# P-Value:
df(F_chow,2*k, n1+ n2 -2*k)
## [1] 3.743812e-05

Resumo

Aula 3 – Intervalos de Confiança e Hipóteses sobre Combinações Lineares

Relembrando a Distribuição t

Intervalo de Confiança para \(\beta_j\)

Intervalo para Previsão Média

\[ \hat{y}_0 \pm t_{\alpha/2, n-k} \cdot se(\hat{y}_0) \]

Hipóteses sobre Combinações Lineares

\[ H_0: a_1\beta_1 + a_2\beta_2 = c \] - Exemplo: \(H_0: \beta_1 = \beta_2\)

\[ t = \frac{a_1 \hat{\beta}_1 + a_2 \hat{\beta}_2 - c}{\sqrt{\text{Var}(a_1 \hat{\beta}_1 + a_2 \hat{\beta}_2)}} \] - Onde:

\[ \text{Var}(a_1 \hat{\beta}_1 + a_2 \hat{\beta}_2) = a_1^2 \text{Var}(\hat{\beta}_1) + a_2^2 \text{Var}(\hat{\beta}_2) + 2a_1a_2 \text{Cov}(\hat{\beta}_1, \hat{\beta}_2) \]

Exemplo Prático – Igualdade de Coeficientes

\[ t = \frac{\hat{\beta}_1 - \hat{\beta}_2}{\sqrt{se(\hat{\beta}_1)^2 + se(\hat{\beta}_2)^2 - 2 \cdot \text{Cov}(\hat{\beta}_1, \hat{\beta}_2)}} \]

Importância do Valor-p

Intervalo de Confiança vs. Teste de Hipóteses

Resumo

Exercício Resolvido (Gujarati – Exemplo 8.3)

Regressão: \(\hat{y} = 3.5 + 2.1 x_1 + 1.4 x_2\)

Conclusão: efeitos similares (estatisticamente)

Teste F para Combinações Lineares de Parâmetros

Formulação Matricial e Estatística do Teste F

Exemplo de teste F usando matrizes

Teste F: Igualdade entre Coeficientes (educ = exper)

Construção da matriz \(R\):

Exercício Computacional em R

suppressPackageStartupMessages(library(car))

# Modelo com três variáveis explicativas
modelo <- lm(wage ~ educ + exper + tenure, data = wage1)

# Restrição: beta_educ - beta_exper = 0
R <- matrix(c(0, 1, -1, 0), nrow = 1)

# Vamos ver a matriz:
print(R)
##      [,1] [,2] [,3] [,4]
## [1,]    0    1   -1    0

Exercício Computacional em R

# Teste F da hipótese linear
car::linearHypothesis(modelo, R)
## 
## Linear hypothesis test:
## educ - exper = 0
## 
## Model 1: restricted model
## Model 2: wage ~ educ + exper + tenure
## 
##   Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
## 1    523 6291.4                                  
## 2    522 4966.3  1    1325.1 139.28 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Teste F com Duas Restrições Lineares

Exercício computacional em R: exemplo com duas restrições lineares sobre os coeficientes do modelo

# Estimando o modelo completo
modelo <- lm(wage ~ educ + exper + tenure, data = wage1)

# Definindo a matriz de restrições R
R <- matrix(c(
  0, 1, -1, 0,   # beta_educ - beta_exper = 0
  0, 0,  0, 1    # beta_tenure = 0
), nrow = 2, byrow = TRUE)

# Vetor r (valores do lado direito das restrições): [0, 0]
r <- c(0, 0)

R; r
##      [,1] [,2] [,3] [,4]
## [1,]    0    1   -1    0
## [2,]    0    0    0    1
## [1] 0 0

Exercício computacional em R: exemplo com duas restrições lineares sobre os coeficientes do modelo

# Aplicando o teste F para as duas restrições
linearHypothesis(modelo, R, r)
## 
## Linear hypothesis test:
## educ - exper = 0
## tenure = 0
## 
## Model 1: restricted model
## Model 2: wage ~ educ + exper + tenure
## 
##   Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
## 1    524 6862.1                                  
## 2    522 4966.3  2    1895.8 99.632 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1