Estimativa RE dos efeitos dos subsídios para qualificação profissional;
Estimativa FE dos efeitos dos subsídios para qualificação profissional;
Teste F para comparação do RE e FE;
Estimação com erros-padrão robustos para a equação log (scrap);
Estimativas FD dos efeitos dos subsídios de formação profissional;e
Teste de Hausman.
O conjunto de dados JTRAIN é derivado do estudo de H.
Holzer, R. Block, M. Cheatham, e J. Knott (1993), “Are Training
Subsidies Effective? The Michigan Experience,” publicado na
Industrial and Labor Relations Review 46, 625-636. A base de
dados pode ser acessada pelo pacote do Wooldridge no software
R.
O conjunto de dados JTRAIN contém 471 observações em 30
variáveis. Abaixo estão as variáveis-chave para a análise, baseadas no
Apêndice do Wooldridge:
library(wooldridge)
library(plm)
library(lmtest)
library(stargazer)
data("jtrain")
jtrain_p <- pdata.frame(jtrain, index = c("fcode", "year"))
formula_model <- lscrap ~ d88 + d89 + union + grant
O modelo estima o impacto do subsídio de qualificação (\(\text{grant}\)) na taxa de refugo \(\log(\text{scrap})\), replicando o Exemplo 10.5. Segundo o texto fornecido, há 54 firmas que relataram taxas de refugo para cada um dos anos de 1987, 1988 e 1989. Os subsídios não foram concedidos em 1987.
Além disso, algumas firmas receberam subsídios em 1988, outras receberam subsídios em 1989, e uma firma não pôde receber subsídio duas vezes. Dessa forma, existem firmas em 1989 que receberam um subsídio somente em 1988, sendo relevante permitir que o efeito de subsídio persista por um período.
reg.ols <- (plm(formula_model, data=jtrain_p, model="pooling"))
reg.re <- (plm(formula_model, data=jtrain_p, model="random"))
reg.fe <- (plm(formula_model, data=jtrain_p, model="within"))
reg.fd <- (plm(formula_model, data=jtrain_p, model="fd"))
stargazer(
reg.ols, reg.re, reg.fe, reg.fd,
type = "latex",
header = FALSE,
float = FALSE,
column.labels = c(
"OLS (Pooling)",
"Efeitos Aleatórios (RE)",
"Efeitos Fixos (FE)",
"First Difference (FD)"
),
title = "Tabela de Regressão: Comparação dos Estimadores de Painel",
dep.var.labels = "log(scrap)",
keep = c("d88", "d89", "union", "grant"),
keep.stat = c("n", "rsq"),
covariate.labels = c(
"Ano 1988 (d88)",
"Ano 1989 (d89)",
"Sindicalizada (union)",
"Subsídio (grant)"
)
)
Para a estimação OLS, se uma empresa recebe o subsídio (\(\text{grant}=1\)), sua taxa de refugo (\(\text{scrap}\)) é esperada para pouco mais de 20% menor pois \(100 \cdot (-0.209) = -20,9\%\), ceteris paribus.Já se a empresa for sindicalizada (\(\text{union}=1\)), sua taxa de refugo (\(\text{scrap}\)) é esperada para ser cerca de 53% maior do que uma empresa não sindicalizada, ceteris paribus. Nota-se que para as estimações, o \(R^2\) é baixo, o que é considerado normal, quando trata-se de Dados em Painel. Por sugestão do livro base, não estimou-se a equação com (\(\text{grant}_1\)).
Para FE, receber o subsídio de treinamento causa uma redução na taxa de refugo (\(\text{scrap}\)) de aproximadamente 8% (\(100 \times -0.08\)), após controlar por todas as características não observadas e invariantes no tempo de cada empresa (\(a_i\)). É importante destacar que, variável (\(\text{union}\)) não aparece no modelo FE e FD porque não varia no tempo. Já a variável (\(\text{d89}\)) não aparece na estimativa de First Difference, porque dummies de tempo na FD não são identificadas como regressoras tradicionais, pois entram apenas como efeitos globais, e não como variáveis explicativas individuais.
Foi aplicado o teste F para comparação do RE, FE e OLS (como sugerido pelo livro), segue:
pFtest(reg.fe, reg.re, reg.ols)
##
## F test for individual effects
##
## data: formula_model
## F = 1.0059, df1 = 52, df2 = 105, p-value = 0.4794
## alternative hypothesis: significant effects
\(H_0\): Os efeitos individuais fixos são nulos (\(\mathbf{a_i = 0}\) para todas as empresas). É comum decidir em rejeitar \(H_0\), quando p-valor é muito pequeno, geralmente \(p < 0.05\). De modo geral, existe uma diferença estatisticamente significante entre as empresas que é constante ao longo do tempo. Como o p-value é 0.4794, muito alto ao nível usual de 5%, então não rejeitamos \(H_0\). Isto é, não há evidências estatísticas de que existam efeitos fixos individuais significativos. Assim, de acordo com a estimação, as variações entre empresas não são estatisticamente relevantes para explicar a taxa de scrap. Para validação, faz-se para o Teste de Hausman.
Para comparar a consistência dos estimadores. Sendo, \(H_0\): O estimador RE é consistente e eficiente.
Caso o p-valor for baixo (geralmente \(< 0.05\)), rejeitamos \(H_0\) e escolhemos o FE.
phtest(reg.fe, reg.re)
##
## Hausman Test
##
## data: formula_model
## chisq = 1.5705, df = 3, p-value = 0.6661
## alternative hypothesis: one model is inconsistent
Conforme os resultados, como o p-value = 0.6661, muito acima de 0.05, então o modelo de efeitos aleatórios é consistente. Logo, o modelo RE é preferível ao FE, pois é mais eficiente (menor variância) e utiliza mais variabilidade dos dados.
O modelo de Efeitos Fixos foi reestimado usando erros-padrão robustos (HC1), para validar a inferência, que corrigem para heterocedasticidade e autocorrelação (Cluster-Robust Standard Errors). O que não altera os coeficientes estimados, mas ajusta os desvios-padrão, t-estatísticas e p-valores.
fe_robust <- coeftest(reg.fe, vcov = vcovHC(reg.fe, type = "HC1"))
print(fe_robust)
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## d88 -0.140066 0.086031 -1.6281 0.106505
## d89 -0.427040 0.130230 -3.2791 0.001413 **
## grant -0.082214 0.065805 -1.2494 0.214310
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Assim, para (\(\text{d88}\)), o coeficiente é negativo, sugerindo que, em 1988, o log(scrap) foi cerca de 14% menor, em média, em relação ao ano base (1987).Contudo, o p-valor é maior que 0.10, logo, não há evidência estatística de que o ano de 1988 tenha afetado de forma significativa a taxa de scrap.
Para (\(\text{d89}\)), o coeficiente negativo indica que, em 1989, o log(scrap) foi cerca de 42,7% menor em relação ao ano base. E o efeito é estatisticamente significativo ao nível de 1%, mesmo com erros robustos.
Já o sinal negativo em (\(\text{grant}\)), sugere que empresas que receberam subsídio tiveram uma taxa de scrap cerca de 8% menor, em média. No entanto, o p-valor é acima que 0.20, indicando que o efeito não é estatisticamente significante. Ou seja, não se pode afirmar que o subsídio teve qualquer impacto mensurável no scrap.
Para painéis de dois períodos, o estimador de Primeiras Diferenças (FD) de forma algébrica é idêntico ao FE, no entanto, é incluído por ser um método de estimação diferente.
summary(reg.fd)
## Oneway (individual) effect First-Difference Model
##
## Call:
## plm(formula = formula_model, data = jtrain_p, model = "fd")
##
## Balanced Panel: n = 54, T = 3, N = 162
## Observations used in estimation: 108
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -3.02706 -0.17968 0.09035 0.27947 2.53765
##
## Coefficients: (1 dropped because of singularities)
## Estimate Std. Error t-value Pr(>|t|)
## (Intercept) -0.213438 0.056465 -3.7800 0.0002607 ***
## d88 0.073684 0.060695 1.2140 0.2274713
## grant -0.083100 0.091933 -0.9039 0.3681121
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 35.902
## Residual Sum of Squares: 35.333
## R-Squared: 0.015836
## Adj. R-Squared: -0.0029099
## F-statistic: 0.844774 on 2 and 105 DF, p-value: 0.43255
O intercepto indica que a variação média do log(scrap) entre os anos é negativa (ou seja, redução), mesmo sem considerar dummies e subsídios. Já em relação a (\(\text{d88}\)), a diferença entre 1988 e o ano anterior não é estatisticamente significante. Isto é, não há evidência de que a taxa de scrap tenha variado de maneira sistemática - 1988 em relação a 1987. Quanto à variável (\(\text{grant}\)), o resultado sugere uma leve redução, de aproximadamente 8% na variação do scrap entre anos para empresas que receberam subsídio. Todavia, o efeito não é estatisticamente significativo. Portanto, não há evidência de impacto causal do subsídio na variação da taxa de scrap (efeito dos subsídios de formação profissional) no período analisado.