Na estrutura de dados em painel espacial, a heterogeneidade individual não observável é tratada de diferentes formas, a depender das propriedades estatísticas dos efeitos individuais. Se forem invariantes no tempo, é comum recorrer a especificação com efeitos fixos, eliminando a correlação com os regressores através do procedimento time-demeaned (Elhorst, 2003). Essa estratégia, no entanto, tem sido alvo de crítica em razão de alterações potenciais na distribuição conjunta dos erros (Anselin, et al., 2008). Para contornar isso, em determinados casos talvez seja mais interessante assumir que a heterogeneidade individual é tempo-variante, então os efeitos individuais podem ser tratados como um componente de erro.
Neste exercício, estamos interessados na segunda hipótese. A ideia é demonstrar como a heterogeneidade individual pode estar associada aos efeitos autorregressivos espaciais presentes na estrutura de um modelo de dados em painel com efeitos aleatórios. Para tanto, comparamos a estrutura de variância-covariância proposta por Kapoor, Kelejian and Prucha (2007), com o modelo com efeitos aleatórios independentes proposto por Baltagi, Song and Koh (2003b). Tais matrizes são estimados a partir dos resíduos do modelo de consumo de seguros não-vida regional desenvolvido por Millo e Carmeci (2011). Em linhas gerais, com base em uma amostra de dados em painel, que permite observar 103 províncias italianas ao longo de 1998 a 2002, os autores investigaram os determinantes regionais da demanda por seguro não-vida na Itália, usando modelos com efeitos aleatórios.
Ambas estruturas são avaliadas por meio do estimado de máxima verossimilhança. Testes LM desenvolvidos por Baltagi, Song and Koh (2003b) para modelos com efeitos aleatórios são inferidos com o objetivo de testar as hipóteses conjuntas e condicionais de que a autocorrelação espacial reforça a heterogeneidade individual não-observável. Em razão do critério de momentos generalizados (GM) proposto por Kapoor, Kelejian and Prucha (2007), oferecemos uma análise eficiência comparativa do estimador G2SLS com LM.
Especificando um modelo espacial sem considerar os efeitos autorregressivos da variável dependente, Baltagi, Song and Koh (2003b) assumem que os efeitos individuais não-observáveis são não correlacionados com os regressores do modelo. Formalmente, a especificação de BSK pode ser representada por: \[\begin{eqnarray} \tag{1} y & = & Z \gamma + u \\ \tag{2} u & = & (\iota_T \otimes I_N) \mu + \epsilon \\ \tag{3} \epsilon & = & \lambda (I_T \otimes W_N)\epsilon + \nu. \end{eqnarray}\]
A variável endógena \(y\) em (1) é um vetor empilhado \((NT \times 1)\), \(Z\) é uma matriz \((NT \times K)\) de variáveis explicativas exógenas com um vetor unitário na primeira coluna e \(\gamma\) é um vetor \((K \times 1)\) de coeficientes associado, \(W_N\) é uma matriz \((N \times N)\) de pesos espaciais, \(I_T\) é uma matriz identidade \((T \times T)\) e \(\iota_T\) é um vetor unitário. Em (2), \(\mu \sim \mbox{IID} (0,\sigma_{\mu}^2)\) é um vetor \((N \times 1)\) com coeficientes individuais, \(\epsilon\) é um vetor de erros idiossincráticos autocorrelacionados espacialmente e \(\lambda\) é o coeficiente autorregressivo erro espacial. Por fim, em (3), \(\nu \sim \mbox{IID} (0,\sigma_{\nu}^2)\) é um ruído aleatório com média zero e variância homocedástica.
Note no erro composto (2), que os efeitos individuais são independente dos erros espaciais autocorrelacionados (3).
Defindo \(B_N=(I_N - \lambda W_N)\) como uma matriz não-singular, o erro composto pode ser reescrito como: \[\begin{equation} \tag{4} u = (\iota_T \otimes I_N)\mu + (I_T \otimes B_N^{-1}) \nu. \end{equation}\] com matriz de variância-covariância dada por \[\begin{equation} \tag{5} \Omega_u = \sigma_{\mu}^2(\iota_T \otimes I_N) + \sigma_{\nu}^2 [I_T \otimes (B_N^\top B_N)^{-1}] \end{equation}\] em que, \(\sigma_{\mu}^2\) e \(\sigma_{\nu}^2\) são as variâncias dos efeitos individuais e do ruído aleatório, respectivamente.
Kapoor, Kelejian and Prucha (2007) apresentam uma especificação diferente para o erro composto. Eles assumem que a correlação espacial se aplica tanto para os efeitos individuais quanto para o ruído aleatório. Embora os dois processos geradores de dados pareçam semelhantes, a interação implica em diferentes formas de spillovers espaciais que pode ser controladas pela matriz de variância-covariância.
Para demonstra a interação com efeitos aleatórios, KKP consideram que o termo de erro composto é influenciado pela autocorrelação espacial \[\begin{equation} \tag{6} u = \lambda (I_T \otimes W_N)u + \epsilon \end{equation}\] e os efeitos aleatórios são especificados da seguinte forma \[\begin{equation} \tag{7} \epsilon = (\iota_T \otimes I_N)\mu + \nu. \end{equation}\] Considerando que \(B_N=(I_N - \lambda W_N)\) é não-singular, a interação com os efeitos aleatórios pode ser representada por \[\begin{equation} \tag{8} u = [I_T \otimes B_N^{-1}][(\iota_T \otimes I_N)\mu + \nu] \end{equation}\] e a matriz de variância-covariância por \[\begin{equation} \tag{9} \Omega_u = [I_T \otimes B_N^{-1}]\Omega_\epsilon[I_T \otimes (B_N^\top)^{-1}] \end{equation}\] em que \[\begin{equation} \tag{10} \Omega_\epsilon=\sigma_\nu^2 Q_0 + (\sigma_\nu^2 + T \sigma_\mu^2)Q_1 \end{equation}\] com, \(Q_0=(I_T - J_T/T) \otimes I_N\), \(Q_1=J_T/T \otimes I_N\), com \(J_T=\iota_T \iota_T^\top\), tal que, \(Q_1\) e \(Q_2\) são matrizes tamanho \(NT \times NT\) de coeficientes constantes.
Note que (9) é a típica matriz de variância-covariância de um modelo de componente de erro unidirecional adaptado à diferente ordenação dos dados (Croissant and Millo, 2019).
A demonstração esclarece que a diferença entre o modelo de BSK e KKP está na estrutura da variância-covariância (VC). Devido ao cálculo da matriz inverva, Croissant and Millo (2019) argumentam que (5) é mais complexa do que (9). No presente exercício, estimamos ambos modelos. Primeiramente, recorremos ao estimador de máxima verossimilhança com efeitos aleatórios. Posteriormente, aplicamos o método GM de forma semelhante a Kapoor, Kelejian and Prucha (2007). O estimador GM pode ser aplicado de forma restrita, usando apenas três condições iniciais; o estimador irrestrito emprega seis condições de momentos.
Baltagi, Song and Koh (2003b) desenvolveram testes multiplicador de Lagrange (LM) para verificar se a heterogeneidade e dependência espacial configuram um problema de especificação em modelos erro espacial com efeitos aleatórios (SEMRE). Com base em resíduos extraídos do modelo pooled, as estatísticas de testes são comparadas com cinco hipóteses, especificadas na forma conjunta, marginal e condicional.
Mais detalhes sobre os testes multiplicador de Lagrange (LM), consulte Baltagi, Song and Koh (2003b).
O estimador de máxima verossimilhança para efeitos aleatórios é
obtido pela função spml do pacote splm. Nesta
função, o argumento model = "random" permite identificar os
efeitos aleatórios, ao passo que spatial.error permite
identificar três tipos de estruturas para a matriz de
variância-covariância. A opção b faz referência a estrutura
(5) de Baltagi, Song and Koh (2003b). A opção kkp faz
referência a estrutura (9) proposta por Kapoor, Kelejian and Prucha
(2007). A opção none, por sua vez, indica ausência de
autocorrelação erro espacial.
Antes da análise econométrica, cabe proceder testes LM de
especificação visando verificar se a autocorrelação espacial reforça a
heterogeneidade individual. Por meio da da função bsktest,
começamos avaliando a hipótese conjunta. Se a hipótese nula for
rejeitada, seguimos para a hipótese condicional.
Carregando os pacotes e a base de dados
library('splm')
library('spdep')
Lendo a base de dados e a matriz de pesos espaciais
data("Insurance", package = "splm")
data("itaww") # matriz de pesos espaciais
wq <- mat2listw(as(itaww, "CsparseMatrix"), style="W", zero.policy=TRUE) # converte W à dimensão do painel
Usando a função mat2listw do pacote spdep,
a matriz de pesos espaciais foi transformada no objeto wq
classe "listw". Essa transformação é necessária no emprego
da função spml.
Teste LM da hipótese conjunta: \(H_0^a: \lambda=\sigma_\mu^2=0\).
fm <- log(ppcd)~log(rgdp)+log(bank)+log(den)+rirs+log(agen)+school+vaagr+log(fam)+log(inef)+log(trust)+d99+d00+d01+d02+NorthWest+NorthEast+South+Islands
bsktest(fm, data = Insurance, listw = wq, test = "LMH")
##
## Baltagi, Song and Koh LM-H one-sided joint test
##
## data: log(ppcd) ~ log(rgdp) + log(bank) + log(den) + rirs + log(agen) + school + vaagr + log(fam) + log(inef) + log(trust) + d99 + d00 + d01 + d02 + NorthWest + NorthEast + South + Islands
## LM-H = 709.04, p-value < 2.2e-16
## alternative hypothesis: Random Regional Effects and Spatial autocorrelation
Considerando um nível de significância de 5%, a estatística de teste é grande o suficiente para rejeitar a hipótese conjunta de ausência de efeitos aleatórios e dependência espacial. Com este resultado, seguimos para a hipótese condicional.
Teste LM da hipótese condicional: \(H_0^d: \lambda=0 | \sigma_\mu^2 \geq 0\).
bsktest(fm, data = Insurance, listw = wq, test = "CLMlambda")
##
## Baltagi, Song and Koh LM*-lambda conditional LM test (assuming
## sigma^2_mu >= 0)
##
## data: log(ppcd) ~ log(rgdp) + log(bank) + log(den) + rirs + log(agen) + school + vaagr + log(fam) + log(inef) + log(trust) + d99 + d00 + d01 + d02 + NorthWest + NorthEast + South + Islands
## LM*-lambda = 1.3993, p-value = 0.1617
## alternative hypothesis: Spatial autocorrelation
Considerando um nível de significância de 5%, a estatística
LM*lambda não é grande o suficiente para rejeitar a
hipótese condicional de ausência de autocorrelação erro espacial.
Baseados em Baltagi, Song, Jung and Koh (2007), Millo and Carmeci (2011)
realizaram um teste uniderecional condicional, em que os efeitos
aleatórios são influenciados pela autocorrelação espacial e serial –
Hipótese C.1, BSJK (2007, p.9). De forma semelhante, os autores
constataram que a autocorrelação espacial não é relevante para a
especificação com os determinantes da demanda por seguro não-vida entre
regiões da Itália.
semre1 <- spml(formula=fm, data = Insurance, listw = wq, model = "random", lag = FALSE, spatial.error = "b")
semre2 <- spml(formula=fm, data = Insurance, listw = wq, model = "random", lag = FALSE, spatial.error = "kkp")
Modelo espacial com efeitos aleatórios independentes
summary(semre1)
## ML panel with , random effects, spatial error correlation
##
## Call:
## spreml(formula = formula, data = data, index = index, w = listw2mat(listw),
## w2 = listw2mat(listw2), lag = lag, errors = errors, cl = cl)
##
## Residuals:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -0.43292 -0.10367 0.00703 -0.00001 0.10989 0.48270
##
## Error variance parameters:
## Estimate Std. Error t-value Pr(>|t|)
## phi 13.685990 2.711511 5.0474 4.479e-07 ***
## rho -0.104385 0.071143 -1.4673 0.1423
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## (Intercept) -0.1517236 1.0196327 -0.1488 0.8817097
## log(rgdp) 0.2790452 0.0832357 3.3525 0.0008009 ***
## log(bank) 0.1142807 0.0364522 3.1351 0.0017181 **
## log(den) 0.0751925 0.0227295 3.3081 0.0009392 ***
## rirs -0.0177573 0.0065971 -2.6917 0.0071096 **
## log(agen) 0.1578928 0.0479744 3.2912 0.0009977 ***
## school -0.0012598 0.0030144 -0.4179 0.6759970
## vaagr -0.0068994 0.0036135 -1.9093 0.0562209 .
## log(fam) -0.1932574 0.1500017 -1.2884 0.1976178
## log(inef) -0.1900403 0.0644891 -2.9469 0.0032102 **
## log(trust) 1.6495523 0.5182568 3.1829 0.0014581 **
## d99 0.0027450 0.0126573 0.2169 0.8283108
## d00 0.0352710 0.0167022 2.1118 0.0347071 *
## d01 0.0686416 0.0203097 3.3798 0.0007255 ***
## d02 0.0868636 0.0262848 3.3047 0.0009508 ***
## NorthWest 0.2043182 0.0548282 3.7265 0.0001941 ***
## NorthEast 0.1250250 0.0552638 2.2623 0.0236771 *
## South -0.4879256 0.0679888 -7.1766 7.149e-13 ***
## Islands -0.5409337 0.0755615 -7.1588 8.136e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Modelo espacial com efeitos aleatórios correlacionados
summary(semre2)
## ML panel with , spatial RE (KKP), spatial error correlation
##
## Call:
## spreml(formula = formula, data = data, index = index, w = listw2mat(listw),
## w2 = listw2mat(listw2), lag = lag, errors = errors, cl = cl)
##
## Residuals:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -0.43084 -0.10310 0.00775 -0.00024 0.11085 0.48205
##
## Error variance parameters:
## Estimate Std. Error t-value Pr(>|t|)
## phi 13.590961 2.711547 5.0123 5.38e-07 ***
## rho -0.042155 0.065039 -0.6481 0.5169
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## (Intercept) -0.1488063 1.0178827 -0.1462 0.8837698
## log(rgdp) 0.2784647 0.0837843 3.3236 0.0008887 ***
## log(bank) 0.1162740 0.0368844 3.1524 0.0016194 **
## log(den) 0.0719310 0.0225744 3.1864 0.0014406 **
## rirs -0.0184010 0.0067421 -2.7293 0.0063477 **
## log(agen) 0.1623105 0.0483896 3.3542 0.0007958 ***
## school -0.0013504 0.0030863 -0.4376 0.6617074
## vaagr -0.0074022 0.0036398 -2.0337 0.0419864 *
## log(fam) -0.2021412 0.1500548 -1.3471 0.1779431
## log(inef) -0.1867253 0.0643693 -2.9008 0.0037216 **
## log(trust) 1.6655809 0.5106523 3.2617 0.0011076 **
## d99 0.0023146 0.0130133 0.1779 0.8588268
## d00 0.0355726 0.0170710 2.0838 0.0371775 *
## d01 0.0687094 0.0207170 3.3166 0.0009113 ***
## d02 0.0862939 0.0267574 3.2251 0.0012595 **
## NorthWest 0.2048687 0.0532655 3.8462 0.0001200 ***
## NorthEast 0.1231220 0.0539045 2.2841 0.0223671 *
## South -0.4859694 0.0670389 -7.2491 4.197e-13 ***
## Islands -0.5389686 0.0742242 -7.2614 3.832e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
No modelo semre1 com a estrutura de BSK a variância dos
efeitos aleatórios é \(\sigma_\mu^2=0.0274\); enquanto no modelo
semre2 com a estrutura de KKP é \(\sigma_\mu^2=0.0273\). A variância do ruído
aleatório idiossincrático em ambos os casos é \(\sigma_\nu^2=0.002\); o coeficiente \(\phi=\sigma_\mu^2/\sigma_\nu^2\) é uma
proporção de variância. Esse resultado é um indicativo de que não há
diferença sistemática entre a estrutura da matriz de VC proposta por
KKP, em relação a BKS.
Ademais, a ausência de significância estatística do coeficiente autorregressivo espacial em ambos os modelos indica que a dependência erro espacial não reforça sistematicamente a heterogeneidade individual entre os determinantes da demanda por seguro não-vida na Itália.
Comparar diretamente os resultados acima com os estimados por Millo
and Carmeci (2011), não seria factível em razão das diferentes
estruturas de VC. O modelo RE-AR(1) da Tabela 7, por exemplo, assume que
apenas a autocorrelação serial influencia os efeitos aleatórios e isso
altera a estrutura (5) ou (9). Os modelos semre1 e
semre2 são estáticos, portanto, não incorporam efeitos da
dinâmica temporal.
Estimador GM para modelo espacial com efeitos aleatórios
semregm1 <- spgm(formula=fm, data = Insurance, listw = wq, model = "random", lag = FALSE, spatial.error = TRUE, moments = "fullweights", method = "g2sls")
summary(semregm1)
## Spatial random effects error model (GM estimation)
##
## Call:
## spgm(formula = fm, data = Insurance, listw = wq, model = "random",
## lag = FALSE, spatial.error = TRUE, moments = "fullweights",
## method = "g2sls")
##
## Residuals:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -0.38146 -0.08770 0.00594 0.00032 0.08648 0.46167
##
## Estimated spatial coefficient, variance components and theta:
## Estimate
## rho 0.0717548
## sigma^2_v 0.0030992
## sigma^2_1 0.0770156
## theta 0.7993976
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## (Intercept) -1.8330208 1.0120124 -1.8113 0.0701001 .
## log(rgdp) 0.4428613 0.0925115 4.7871 1.692e-06 ***
## log(bank) 0.2081537 0.0420956 4.9448 7.623e-07 ***
## log(den) 0.0711896 0.0181709 3.9178 8.937e-05 ***
## rirs -0.0240047 0.0084677 -2.8349 0.0045845 **
## log(agen) 0.2248552 0.0525706 4.2772 1.893e-05 ***
## school -0.0027465 0.0034082 -0.8058 0.4203320
## vaagr -0.0089325 0.0039770 -2.2460 0.0247012 *
## log(fam) -0.1999215 0.1623383 -1.2315 0.2181315
## log(inef) -0.1744114 0.0486221 -3.5871 0.0003344 ***
## log(trust) 1.1176045 0.4097268 2.7277 0.0063781 **
## d99 0.0035021 0.0160196 0.2186 0.8269517
## d00 0.0486558 0.0197701 2.4611 0.0138521 *
## d01 0.0802971 0.0236988 3.3882 0.0007034 ***
## d02 0.0940705 0.0305002 3.0843 0.0020406 **
## NorthWest 0.1780132 0.0442861 4.0196 5.829e-05 ***
## NorthEast 0.0913453 0.0441080 2.0709 0.0383640 *
## South -0.3539438 0.0577941 -6.1242 9.113e-10 ***
## Islands -0.4097352 0.0654758 -6.2578 3.904e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Quando se tem modelo = "random",
spatial.error = TRUE e lag = FALSE, a função
spgm estima o modelo espacial GM com efeitos aleatórios de
KKP. Quando o argumento moments = "fullweights" é chamado,
seis condições de momentos são usadas com cômputo da matriz de VC. A
opção method = "g2sls" indica que o modelo GLS é estimado
pelo estimador de momentos generalizado de dois estágios.
Os coeficientes estimados \(\rho=0.0717\), \(\sigma^2_{\nu}=0.003\), \(\sigma^2_{1}=0.077\), \(\theta=1 - \sigma_{\nu}/\sigma_{1}=0.779\), como resultado, \(\sigma^2_{\mu}=0.0739\). Estas coeficientes correspondem aos parâmetros da matriz de VC das equações (9)-(10), estimados por G2SLS.
Esse resumo estatístico permite comparar a eficiência do estimador de
máxima verossimilhança com o método de momentos. Como resultado, a
variância do estimador semre2 é ligeiramente inferior a
semregm1. Portanto, neste exercício, o estimador G2SLS se
mostra menos eficiente.
Este exercício demonstrou como a heterogeneidade individual pode estar associada aos efeitos autorregressivos espaciais de modelos de dados em painel com efeitos aleatórios. Por meio da base de dados de Millo e Carmeci (2011), com os determinantes dos seguros não-vida consumidos entre regiões da Itália, a estrutura de variância-covariância proposta por Kapoor, Kelejian and Prucha (2007) foi confrontada com o modelo com efeitos aleatórios independentes proposto por Baltagi, Song and Koh (2003b). Assim como em Millo e Carmeci (2011), não encontramos evidências estatísticas acerca do controle dos efeitos autorregressivos erro espacial, de sorte que a diferença entre a matriz de VC proposta por KKP, em relação a BKS, não é relevante. Comparamos também a eficiência do estimador G2SLS com o de máxima verossimilhança proposto por BKS. A análise de variância mostrou que o G2SLS é menos eficiente. Este resultado sugere que o estimador de máxima verossimilhança exerce melhor controle sobre os efeitos da heterogeneidade individual.
Anselin, L. Le Gallo, J. and Jayet, H. (2008). Spatial Panel Econometrics. In The Econometrics of Panel Data, Fundamentals and Recent Developments in Theory and Practice, 3rd ed.; Matyas, L., Sevestre, P., Eds.; Springer: Berlin/Heidelberg, Germany, pp. 624–660.
Baltagi BH, Song SH Jung BC and Koh W (2003b). Testing panel data regression models with spatial error correlation. J. Econom. 2003, 117, 123–150.
Baltagi BH, Song SH, Jung BC and Koh W (2007). Testing for serial correlation, spatial autocorrelation and random effects using panel data. J Econom 140(1):5-51.
Elhorst, JP (2003). Specification and estimation of spatial panel data models. International Regional Science Review, 26 (3):244–268, 2003.
Kapoor, M. Kelejian, HH. and Prucha, IR (2007). Panel data models with spatially correlated error components. Journal of Econometrics 140 (2007) 97–130.
Millo, Giovanni and Carmeci, Gaetano (2011). Non-life insurance consumption in italy: a sub-regional panel data analysis. Journal of Geographical Systems, 13(3):273-298, 07 2010.