Exercícios

  1. Estimativa RE dos efeitos dos subsídios para qualificação profissional;

  2. Estimativa FE dos efeitos dos subsídios para qualificação profissional;

  3. Teste F para comparação do RE e FE;

  4. Estimação com erros-padrão robustos para a equação log (scrap);

  5. Estimativas FD dos efeitos dos subsídios de formação profissional;e

  6. Teste de Hausman.

O conjunto de dados JTRAIN é derivado do estudo de H. Holzer, R. Block, M. Cheatham, e J. Knott (1993), “Are Training Subsidies Effective? The Michigan Experience,” publicado na Industrial and Labor Relations Review 46, 625-636. A base de dados pode ser acessada pelo pacote do Wooldridge no software R.

1.0 Contextualização do conjunto de dados “JTRAIN” e descrição das variáveis

O conjunto de dados JTRAIN contém 471 observações em 30 variáveis. Abaixo estão as variáveis-chave para a análise, baseadas no Apêndice do Wooldridge:

  • year: Ano da observação (1987, 1988 ou 1989);
  • fcode: Código numérico da empresa (Identificador de painel \(i\));
  • employ: Número de empregados na fábrica;
  • sales: Vendas anuais (em dólares);
  • avgsal: Salário médio dos empregados;
  • scrap: Taxa de refugo (por 100 itens);
  • rework: Taxa de retrabalho (por 100 itens);
  • tothrs: Total de horas de treinamento;
  • union: Variável Dummy: 1 se a fábrica for sindicalizada;
  • grant: Variável Dummy: 1 se a fábrica recebeu o subsídio de treinamento (Variável de Interesse \(\text{grant}_{it}\));
  • d89: Variável Dummy: 1 se o ano for 1989;
  • d88: Variável Dummy: 1 se o ano for 1988;
  • totrain: Total de empregados treinados;
  • hrsemp: \(\text{tothrs}/\text{totrain}\) (Horas de treinamento por empregado treinado);
  • lscrap: \(\log(\text{scrap})\) (Variável Dependente \(\log(\text{scrap}_{it})\));
  • lemploy: \(\log(\text{employ})\);
  • lsales: \(\log(\text{sales})\);
  • lrework: \(\log(\text{rework})\);
  • lhrsemp: \(\log(1 + \text{hrsemp})\);
  • lscrap_1: \(\text{lscrap}\) defasado (período \(t-1\));
  • grant_1: \(\text{grant}\) defasado (assumido 0 em 1987);
  • clscrap: \(\text{lscrap} - \text{lscrap}_{t-1}\) (Primeiras Diferenças para \(\text{lscrap}\));
  • cgrant: \(\text{grant} - \text{grant}_{t-1}\) (Primeiras Diferenças para \(\text{grant}\));
  • clemploy: \(\text{lemploy} - \text{lemploy}_{t-1}\);
  • clsales: \(\text{lsales} - \text{lsales}_{t-1}\);
  • lavgsal: \(\log(\text{avgsal})\);
  • clavgsal: \(\text{lavgsal} - \text{lavgsal}_{t-1}\);
  • cgrant_1: \(\text{cgrant}\) defasado;
  • chrsemp: \(\text{hrsemp} - \text{hrsemp}_{t-1}\);
  • clhrsemp: \(\text{lhrsemp} - \text{lhrsemp}_{t-1}\).

2.0 Segue a sequência das operações realizadas

2.1 Instalar e carregar pacotes necessários para a análise econométrica

library(wooldridge)
library(plm)
library(lmtest) 
library(stargazer)

2.2 Carregamento e definição da estrutura de dados em painel

data("jtrain")
jtrain_p <- pdata.frame(jtrain, index = c("fcode", "year"))

2.3 Definição da fórmula do modelo

formula_model <- lscrap ~ d88 + d89 + union + grant

O modelo estima o impacto do subsídio de qualificação (\(\text{grant}\)) na taxa de refugo \(\log(\text{scrap})\), replicando o Exemplo 10.5. Segundo o texto fornecido, há 54 firmas que relataram taxas de refugo para cada um dos anos de 1987, 1988 e 1989. Os subsídios não foram concedidos em 1987.

Além disso, algumas firmas receberam subsídios em 1988, outras receberam subsídios em 1989, e uma firma não pôde receber subsídio duas vezes. Dessa forma, existem firmas em 1989 que receberam um subsídio somente em 1988, sendo relevante permitir que o efeito de subsídio persista por um período.

2.4 Estimação de todos os modelos necessários para as questões

reg.ols <- (plm(formula_model, data=jtrain_p, model="pooling"))
reg.re <- (plm(formula_model, data=jtrain_p, model="random"))
reg.fe <- (plm(formula_model, data=jtrain_p, model="within"))
reg.fd <- (plm(formula_model, data=jtrain_p, model="fd"))

2.5 Tabela de comparação das estimativas

stargazer(
  reg.ols, reg.re, reg.fe, reg.fd,
  type = "latex",
  header = FALSE,
  float = FALSE,
  column.labels = c(
    "OLS (Pooling)",
    "Efeitos Aleatórios (RE)",
    "Efeitos Fixos (FE)",
    "First Difference (FD)"
  ),
  title = "Tabela de Regressão: Comparação dos Estimadores de Painel",
  dep.var.labels = "log(scrap)",
  keep = c("d88", "d89", "union", "grant"),
  keep.stat = c("n", "rsq"),
  covariate.labels = c(
    "Ano 1988 (d88)",
    "Ano 1989 (d89)",
    "Sindicalizada (union)",
    "Subsídio (grant)"
  )
)

Para a estimação OLS, se uma empresa recebe o subsídio (\(\text{grant}=1\)), sua taxa de refugo (\(\text{scrap}\)) é esperada para pouco mais de 20% menor pois \(100 \cdot (-0.209) = -20,9\%\), ceteris paribus.Já se a empresa for sindicalizada (\(\text{union}=1\)), sua taxa de refugo (\(\text{scrap}\)) é esperada para ser cerca de 53% maior do que uma empresa não sindicalizada, ceteris paribus. Nota-se que para as estimações, o \(R^2\) é baixo, o que é considerado normal, quando trata-se de Dados em Painel. Por sugestão do livro base, não estimou-se a equação com (\(\text{grant}_1\)).

Para FE, receber o subsídio de treinamento causa uma redução na taxa de refugo (\(\text{scrap}\)) de aproximadamente 8% (\(100 \times -0.08\)), após controlar por todas as características não observadas e invariantes no tempo de cada empresa (\(a_i\)). É importante destacar que, variável (\(\text{union}\)) não aparece no modelo FE e FD porque não varia no tempo. Já a variável (\(\text{d89}\)) não aparece na estimativa de First Difference, porque dummies de tempo na FD não são identificadas como regressoras tradicionais, pois entram apenas como efeitos globais, e não como variáveis explicativas individuais.

2.6 Teste para verificar se os efeitos fixos são estatisticamente significativos

Foi aplicado o teste F para comparação do RE, FE e OLS (como sugerido pelo livro), segue:

pFtest(reg.fe, reg.re, reg.ols)
## 
##  F test for individual effects
## 
## data:  formula_model
## F = 1.0059, df1 = 52, df2 = 105, p-value = 0.4794
## alternative hypothesis: significant effects

\(H_0\): Os efeitos individuais fixos são nulos (\(\mathbf{a_i = 0}\) para todas as empresas). É comum decidir em rejeitar \(H_0\), quando p-valor é muito pequeno, geralmente \(p < 0.05\). De modo geral, existe uma diferença estatisticamente significante entre as empresas que é constante ao longo do tempo. Como o p-value é 0.4794, muito alto ao nível usual de 5%, então não rejeitamos \(H_0\). Isto é, não há evidências estatísticas de que existam efeitos fixos individuais significativos. Assim, de acordo com a estimação, as variações entre empresas não são estatisticamente relevantes para explicar a taxa de scrap. Para validação, faz-se para o Teste de Hausman.

2.7 Teste de Hausman

Para comparar a consistência dos estimadores. Sendo, \(H_0\): O estimador RE é consistente e eficiente.

Caso o p-valor for baixo (geralmente \(< 0.05\)), rejeitamos \(H_0\) e escolhemos o FE.

phtest(reg.fe, reg.re)
## 
##  Hausman Test
## 
## data:  formula_model
## chisq = 1.5705, df = 3, p-value = 0.6661
## alternative hypothesis: one model is inconsistent

Conforme os resultados, como o p-value = 0.6661, muito acima de 0.05, então o modelo de efeitos aleatórios é consistente. Logo, o modelo RE é preferível ao FE, pois é mais eficiente (menor variância) e utiliza mais variabilidade dos dados.

2.8 Coeficientes do modelo FE com Erros-Padrão Robustos (HC1)

O modelo de Efeitos Fixos foi reestimado usando erros-padrão robustos (HC1), para validar a inferência, que corrigem para heterocedasticidade e autocorrelação (Cluster-Robust Standard Errors). O que não altera os coeficientes estimados, mas ajusta os desvios-padrão, t-estatísticas e p-valores.

fe_robust <- coeftest(reg.fe, vcov = vcovHC(reg.fe, type = "HC1"))
print(fe_robust)
## 
## t test of coefficients:
## 
##        Estimate Std. Error t value Pr(>|t|)   
## d88   -0.140066   0.086031 -1.6281 0.106505   
## d89   -0.427040   0.130230 -3.2791 0.001413 **
## grant -0.082214   0.065805 -1.2494 0.214310   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Assim, para (\(\text{d88}\)), o coeficiente é negativo, sugerindo que, em 1988, o log(scrap) foi cerca de 14% menor, em média, em relação ao ano base (1987).Contudo, o p-valor é maior que 0.10, logo, não há evidência estatística de que o ano de 1988 tenha afetado de forma significativa a taxa de scrap.

Para (\(\text{d89}\)), o coeficiente negativo indica que, em 1989, o log(scrap) foi cerca de 42,7% menor em relação ao ano base. E o efeito é estatisticamente significativo ao nível de 1%, mesmo com erros robustos.

Já o sinal negativo em (\(\text{grant}\)), sugere que empresas que receberam subsídio tiveram uma taxa de scrap cerca de 8% menor, em média. No entanto, o p-valor é acima que 0.20, indicando que o efeito não é estatisticamente significante. Ou seja, não se pode afirmar que o subsídio teve qualquer impacto mensurável no scrap.

2.9 Estimativas Fisrt Difference (FD)

Para painéis de dois períodos, o estimador de Primeiras Diferenças (FD) de forma algébrica é idêntico ao FE, no entanto, é incluído por ser um método de estimação diferente.

summary(reg.fd)
## Oneway (individual) effect First-Difference Model
## 
## Call:
## plm(formula = formula_model, data = jtrain_p, model = "fd")
## 
## Balanced Panel: n = 54, T = 3, N = 162
## Observations used in estimation: 108
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -3.02706 -0.17968  0.09035  0.27947  2.53765 
## 
## Coefficients: (1 dropped because of singularities)
##              Estimate Std. Error t-value  Pr(>|t|)    
## (Intercept) -0.213438   0.056465 -3.7800 0.0002607 ***
## d88          0.073684   0.060695  1.2140 0.2274713    
## grant       -0.083100   0.091933 -0.9039 0.3681121    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    35.902
## Residual Sum of Squares: 35.333
## R-Squared:      0.015836
## Adj. R-Squared: -0.0029099
## F-statistic: 0.844774 on 2 and 105 DF, p-value: 0.43255

O intercepto indica que a variação média do log(scrap) entre os anos é negativa (ou seja, redução), mesmo sem considerar dummies e subsídios. Já em relação a (\(\text{d88}\)), a diferença entre 1988 e o ano anterior não é estatisticamente significante. Isto é, não há evidência de que a taxa de scrap tenha variado de maneira sistemática - 1988 em relação a 1987. Quanto à variável (\(\text{grant}\)), o resultado sugere uma leve redução, de aproximadamente 8% na variação do scrap entre anos para empresas que receberam subsídio. Todavia, o efeito não é estatisticamente significativo. Portanto, não há evidência de impacto causal do subsídio na variação da taxa de scrap (efeito dos subsídios de formação profissional) no período analisado.