Introdução

Na estrutura de dados em painel espacial, a heterogeneidade individual não observável é tratada de diferentes formas, a depender das propriedades estatísticas dos efeitos individuais. Se forem invariantes no tempo, é comum recorrer a especificação com efeitos fixos, eliminando a correlação com os regressores através do procedimento time-demeaned (Elhorst, 2003). Essa estratégia, no entanto, tem sido alvo de crítica em razão de alterações potenciais na distribuição conjunta dos erros (Anselin, et al., 2008). Para contornar isso, em determinados casos talvez seja mais interessante assumir que a heterogeneidade individual é tempo-variante, então os efeitos individuais podem ser tratados como um componente de erro.

Neste exercício, estamos interessados na segunda hipótese. A ideia é demonstrar como a heterogeneidade individual pode estar associada aos efeitos autorregressivos espaciais presentes na estrutura de um modelo de dados em painel com efeitos aleatórios. Para tanto, comparamos a estrutura de variância-covariância proposta por Kapoor, Kelejian and Prucha (2007), com o modelo com efeitos aleatórios independentes proposto por Baltagi, Song and Koh (2003b). Tais matrizes são estimados a partir dos resíduos do modelo de consumo de seguros não-vida regional desenvolvido por Millo e Carmeci (2011). Em linhas gerais, com base em uma amostra de dados em painel, que permite observar 103 províncias italianas ao longo de 1998 a 2002, os autores investigaram os determinantes regionais da demanda por seguro não-vida na Itália, usando modelos com efeitos aleatórios.

Ambas estruturas são avaliadas por meio do estimado de máxima verossimilhança. Testes LM desenvolvidos por Baltagi, Song and Koh (2003b) para modelos com efeitos aleatórios são inferidos com o objetivo de testar as hipóteses conjuntas e condicionais de que a autocorrelação espacial reforça a heterogeneidade individual não-observável. Em razão do critério de momentos generalizados (GM) proposto por Kapoor, Kelejian and Prucha (2007), oferecemos uma análise eficiência comparativa do estimador G2SLS com LM.

Modelo de dados em painel com efeitos aleatórios

Modelo com efeitos aleatórios independentes

Especificando um modelo espacial sem considerar os efeitos autorregressivos da variável dependente, Baltagi, Song and Koh (2003b) assumem que os efeitos individuais não-observáveis são não correlacionados com os regressores do modelo. Formalmente, a especificação de BSK pode ser representada por: \[\begin{eqnarray} \tag{1} y & = & Z \gamma + u \\ \tag{2} u & = & (\iota_T \otimes I_N) \mu + \epsilon \\ \tag{3} \epsilon & = & \lambda (I_T \otimes W_N)\epsilon + \nu. \end{eqnarray}\]

A variável endógena \(y\) em (1) é um vetor empilhado \((NT \times 1)\), \(Z\) é uma matriz \((NT \times K)\) de variáveis explicativas exógenas com um vetor unitário na primeira coluna e \(\gamma\) é um vetor \((K \times 1)\) de coeficientes associado, \(W_N\) é uma matriz \((N \times N)\) de pesos espaciais, \(I_T\) é uma matriz identidade \((T \times T)\) e \(\iota_T\) é um vetor unitário. Em (2), \(\mu \sim \mbox{IID} (0,\sigma_{\mu}^2)\) é um vetor \((N \times 1)\) com coeficientes individuais, \(\epsilon\) é um vetor de erros idiossincráticos autocorrelacionados espacialmente e \(\lambda\) é o coeficiente autorregressivo erro espacial. Por fim, em (3), \(\nu \sim \mbox{IID} (0,\sigma_{\nu}^2)\) é um ruído aleatório com média zero e variância homocedástica.

Note no erro composto (2), que os efeitos individuais são independente dos erros espaciais autocorrelacionados (3).

Defindo \(B_N=(I_N - \lambda W_N)\) como uma matriz não-singular, o erro composto pode ser reescrito como: \[\begin{equation} \tag{4} u = (\iota_T \otimes I_N)\mu + (I_T \otimes B_N^{-1}) \nu. \end{equation}\] com matriz de variância-covariância dada por \[\begin{equation} \tag{5} \Omega_u = \sigma_{\mu}^2(\iota_T \otimes I_N) + \sigma_{\nu}^2 [I_T \otimes (B_N^\top B_N)^{-1}] \end{equation}\] em que, \(\sigma_{\mu}^2\) e \(\sigma_{\nu}^2\) são as variâncias dos efeitos individuais e do ruído aleatório, respectivamente.

Modelo com efeitos aleatórios correlacionados

Kapoor, Kelejian and Prucha (2007) apresentam uma especificação diferente para o erro composto. Eles assumem que a correlação espacial se aplica tanto para os efeitos individuais quanto para o ruído aleatório. Embora os dois processos geradores de dados pareçam semelhantes, a interação implica em diferentes formas de spillovers espaciais que pode ser controladas pela matriz de variância-covariância.

Para demonstra a interação com efeitos aleatórios, KKP consideram que o termo de erro composto é influenciado pela autocorrelação espacial \[\begin{equation} \tag{6} u = \lambda (I_T \otimes W_N)u + \epsilon \end{equation}\] e os efeitos aleatórios são especificados da seguinte forma \[\begin{equation} \tag{7} \epsilon = (\iota_T \otimes I_N)\mu + \nu. \end{equation}\] Considerando que \(B_N=(I_N - \lambda W_N)\) é não-singular, a interação com os efeitos aleatórios pode ser representada por \[\begin{equation} \tag{8} u = [I_T \otimes B_N^{-1}][(\iota_T \otimes I_N)\mu + \nu] \end{equation}\] e a matriz de variância-covariância por \[\begin{equation} \tag{9} \Omega_u = [I_T \otimes B_N^{-1}]\Omega_\epsilon[I_T \otimes (B_N^\top)^{-1}] \end{equation}\] em que \[\begin{equation} \tag{10} \Omega_\epsilon=\sigma_\nu^2 Q_0 + (\sigma_\nu^2 + T \sigma_\mu^2)Q_1 \end{equation}\] com, \(Q_0=(I_T - J_T/T) \otimes I_N\), \(Q_1=J_T/T \otimes I_N\), com \(J_T=\iota_T \iota_T^\top\), tal que, \(Q_1\) e \(Q_2\) são matrizes tamanho \(NT \times NT\) de coeficientes constantes.

Note que (9) é a típica matriz de variância-covariância de um modelo de componente de erro unidirecional adaptado à diferente ordenação dos dados (Croissant and Millo, 2019).

A demonstração esclarece que a diferença entre o modelo de BSK e KKP está na estrutura da variância-covariância (VC). Devido ao cálculo da matriz inverva, Croissant and Millo (2019) argumentam que (5) é mais complexa do que (9). No presente exercício, estimamos ambos modelos. Primeiramente, recorremos ao estimador de máxima verossimilhança com efeitos aleatórios. Posteriormente, aplicamos o método GM de forma semelhante a Kapoor, Kelejian and Prucha (2007). O estimador GM pode ser aplicado de forma restrita, usando apenas três condições iniciais; o estimador irrestrito emprega seis condições de momentos.

Teste LM para modelos com efeitos aleatórios e erro espacial

Baltagi, Song and Koh (2003b) desenvolveram testes multiplicador de Lagrange (LM) para verificar se a heterogeneidade e dependência espacial configuram um problema de especificação em modelos erro espacial com efeitos aleatórios (SEMRE). Com base em resíduos extraídos do modelo pooled, as estatísticas de testes são comparadas com cinco hipóteses, especificadas na forma conjunta, marginal e condicional.

  1. \(H_0^a: \lambda=\sigma_\mu^2=0\), sob hipótese alternativa de que pelo menos um desses parâmetros é diferentes de zero.
  2. Assumindo ausência de correlação espacial \((\lambda=0)\), testa-se \(H_0^b: \sigma_\mu^2=0\), contra a hipótese alternativa de efeitos aleatórios.
  3. Assumindo ausência de efeitos aleatórios \((\sigma_\mu^2=0)\), testa-se \(H_0^c: \lambda=0\), contra a hipótese alternativa de autocorrelação espacial.
  4. Assumindo a possibilidade de existência de efeitos aleatórios \((\sigma_\mu^2 \geq 0)\), testa-se \(H_0^d: \lambda=0\), contra a hipótese alternativa de autocorrelação espacial.
  5. Assumindo a possibilidade de existência de autocorrelação espacial \((\lambda \neq 0)\), testa-se \(H_0^e: \sigma_\mu^2=0\), contra a hipótese alternativa de efeitos aleatórios.

Mais detalhes sobre os testes multiplicador de Lagrange (LM), consulte Baltagi, Song and Koh (2003b).

Estimação

O estimador de máxima verossimilhança para efeitos aleatórios é obtido pela função spml do pacote splm. Nesta função, o argumento model = "random" permite identificar os efeitos aleatórios, ao passo que spatial.error permite identificar três tipos de estruturas para a matriz de variância-covariância. A opção b faz referência a estrutura (5) de Baltagi, Song and Koh (2003b). A opção kkp faz referência a estrutura (9) proposta por Kapoor, Kelejian and Prucha (2007). A opção none, por sua vez, indica ausência de autocorrelação erro espacial.

Antes da análise econométrica, cabe proceder testes LM de especificação visando verificar se a autocorrelação espacial reforça a heterogeneidade individual. Por meio da da função bsktest, começamos avaliando a hipótese conjunta. Se a hipótese nula for rejeitada, seguimos para a hipótese condicional.

Carregando os pacotes e a base de dados

library('splm')
library('spdep')

Lendo a base de dados e a matriz de pesos espaciais

data("Insurance", package = "splm")
data("itaww") # matriz de pesos espaciais
wq <- mat2listw(as(itaww, "CsparseMatrix"), style="W", zero.policy=TRUE) # converte W à dimensão do painel

Usando a função mat2listw do pacote spdep, a matriz de pesos espaciais foi transformada no objeto wq classe "listw". Essa transformação é necessária no emprego da função spml.

Teste LM da hipótese conjunta: \(H_0^a: \lambda=\sigma_\mu^2=0\).

fm <- log(ppcd)~log(rgdp)+log(bank)+log(den)+rirs+log(agen)+school+vaagr+log(fam)+log(inef)+log(trust)+d99+d00+d01+d02+NorthWest+NorthEast+South+Islands
bsktest(fm, data = Insurance, listw = wq, test = "LMH")
## 
##  Baltagi, Song and Koh LM-H one-sided joint test
## 
## data:  log(ppcd) ~ log(rgdp) + log(bank) + log(den) + rirs + log(agen) +     school + vaagr + log(fam) + log(inef) + log(trust) + d99 +     d00 + d01 + d02 + NorthWest + NorthEast + South + Islands
## LM-H = 709.04, p-value < 2.2e-16
## alternative hypothesis: Random Regional Effects and Spatial autocorrelation

Considerando um nível de significância de 5%, a estatística de teste é grande o suficiente para rejeitar a hipótese conjunta de ausência de efeitos aleatórios e dependência espacial. Com este resultado, seguimos para a hipótese condicional.

Teste LM da hipótese condicional: \(H_0^d: \lambda=0 | \sigma_\mu^2 \geq 0\).

bsktest(fm, data = Insurance, listw = wq, test = "CLMlambda")
## 
##  Baltagi, Song and Koh LM*-lambda conditional LM test (assuming
##  sigma^2_mu >= 0)
## 
## data:  log(ppcd) ~ log(rgdp) + log(bank) + log(den) + rirs + log(agen) +     school + vaagr + log(fam) + log(inef) + log(trust) + d99 +     d00 + d01 + d02 + NorthWest + NorthEast + South + Islands
## LM*-lambda = 1.3993, p-value = 0.1617
## alternative hypothesis: Spatial autocorrelation

Considerando um nível de significância de 5%, a estatística LM*lambda não é grande o suficiente para rejeitar a hipótese condicional de ausência de autocorrelação erro espacial. Baseados em Baltagi, Song, Jung and Koh (2007), Millo and Carmeci (2011) realizaram um teste uniderecional condicional, em que os efeitos aleatórios são influenciados pela autocorrelação espacial e serial – Hipótese C.1, BSJK (2007, p.9). De forma semelhante, os autores constataram que a autocorrelação espacial não é relevante para a especificação com os determinantes da demanda por seguro não-vida entre regiões da Itália.

semre1 <- spml(formula=fm, data = Insurance, listw = wq, model = "random", lag = FALSE, spatial.error = "b")
semre2 <- spml(formula=fm, data = Insurance, listw = wq, model = "random", lag = FALSE, spatial.error = "kkp")

Modelo espacial com efeitos aleatórios independentes

summary(semre1)
## ML panel with , random effects, spatial error correlation 
## 
## Call:
## spreml(formula = formula, data = data, index = index, w = listw2mat(listw), 
##     w2 = listw2mat(listw2), lag = lag, errors = errors, cl = cl)
## 
## Residuals:
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.43292 -0.10367  0.00703 -0.00001  0.10989  0.48270 
## 
## Error variance parameters:
##      Estimate Std. Error t-value  Pr(>|t|)    
## phi 13.685990   2.711511  5.0474 4.479e-07 ***
## rho -0.104385   0.071143 -1.4673    0.1423    
## 
## Coefficients:
##               Estimate Std. Error t-value  Pr(>|t|)    
## (Intercept) -0.1517236  1.0196327 -0.1488 0.8817097    
## log(rgdp)    0.2790452  0.0832357  3.3525 0.0008009 ***
## log(bank)    0.1142807  0.0364522  3.1351 0.0017181 ** 
## log(den)     0.0751925  0.0227295  3.3081 0.0009392 ***
## rirs        -0.0177573  0.0065971 -2.6917 0.0071096 ** 
## log(agen)    0.1578928  0.0479744  3.2912 0.0009977 ***
## school      -0.0012598  0.0030144 -0.4179 0.6759970    
## vaagr       -0.0068994  0.0036135 -1.9093 0.0562209 .  
## log(fam)    -0.1932574  0.1500017 -1.2884 0.1976178    
## log(inef)   -0.1900403  0.0644891 -2.9469 0.0032102 ** 
## log(trust)   1.6495523  0.5182568  3.1829 0.0014581 ** 
## d99          0.0027450  0.0126573  0.2169 0.8283108    
## d00          0.0352710  0.0167022  2.1118 0.0347071 *  
## d01          0.0686416  0.0203097  3.3798 0.0007255 ***
## d02          0.0868636  0.0262848  3.3047 0.0009508 ***
## NorthWest    0.2043182  0.0548282  3.7265 0.0001941 ***
## NorthEast    0.1250250  0.0552638  2.2623 0.0236771 *  
## South       -0.4879256  0.0679888 -7.1766 7.149e-13 ***
## Islands     -0.5409337  0.0755615 -7.1588 8.136e-13 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Modelo espacial com efeitos aleatórios correlacionados

summary(semre2)
## ML panel with , spatial RE (KKP), spatial error correlation 
## 
## Call:
## spreml(formula = formula, data = data, index = index, w = listw2mat(listw), 
##     w2 = listw2mat(listw2), lag = lag, errors = errors, cl = cl)
## 
## Residuals:
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.43084 -0.10310  0.00775 -0.00024  0.11085  0.48205 
## 
## Error variance parameters:
##      Estimate Std. Error t-value Pr(>|t|)    
## phi 13.590961   2.711547  5.0123 5.38e-07 ***
## rho -0.042155   0.065039 -0.6481   0.5169    
## 
## Coefficients:
##               Estimate Std. Error t-value  Pr(>|t|)    
## (Intercept) -0.1488063  1.0178827 -0.1462 0.8837698    
## log(rgdp)    0.2784647  0.0837843  3.3236 0.0008887 ***
## log(bank)    0.1162740  0.0368844  3.1524 0.0016194 ** 
## log(den)     0.0719310  0.0225744  3.1864 0.0014406 ** 
## rirs        -0.0184010  0.0067421 -2.7293 0.0063477 ** 
## log(agen)    0.1623105  0.0483896  3.3542 0.0007958 ***
## school      -0.0013504  0.0030863 -0.4376 0.6617074    
## vaagr       -0.0074022  0.0036398 -2.0337 0.0419864 *  
## log(fam)    -0.2021412  0.1500548 -1.3471 0.1779431    
## log(inef)   -0.1867253  0.0643693 -2.9008 0.0037216 ** 
## log(trust)   1.6655809  0.5106523  3.2617 0.0011076 ** 
## d99          0.0023146  0.0130133  0.1779 0.8588268    
## d00          0.0355726  0.0170710  2.0838 0.0371775 *  
## d01          0.0687094  0.0207170  3.3166 0.0009113 ***
## d02          0.0862939  0.0267574  3.2251 0.0012595 ** 
## NorthWest    0.2048687  0.0532655  3.8462 0.0001200 ***
## NorthEast    0.1231220  0.0539045  2.2841 0.0223671 *  
## South       -0.4859694  0.0670389 -7.2491 4.197e-13 ***
## Islands     -0.5389686  0.0742242 -7.2614 3.832e-13 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

No modelo semre1 com a estrutura de BSK a variância dos efeitos aleatórios é \(\sigma_\mu^2=0.0274\); enquanto no modelo semre2 com a estrutura de KKP é \(\sigma_\mu^2=0.0273\). A variância do ruído aleatório idiossincrático em ambos os casos é \(\sigma_\nu^2=0.002\); o coeficiente \(\phi=\sigma_\mu^2/\sigma_\nu^2\) é uma proporção de variância. Esse resultado é um indicativo de que não há diferença sistemática entre a estrutura da matriz de VC proposta por KKP, em relação a BKS.

Ademais, a ausência de significância estatística do coeficiente autorregressivo espacial em ambos os modelos indica que a dependência erro espacial não reforça sistematicamente a heterogeneidade individual entre os determinantes da demanda por seguro não-vida na Itália.

Comparar diretamente os resultados acima com os estimados por Millo and Carmeci (2011), não seria factível em razão das diferentes estruturas de VC. O modelo RE-AR(1) da Tabela 7, por exemplo, assume que apenas a autocorrelação serial influencia os efeitos aleatórios e isso altera a estrutura (5) ou (9). Os modelos semre1 e semre2 são estáticos, portanto, não incorporam efeitos da dinâmica temporal.

Estimador GM para modelo espacial com efeitos aleatórios

semregm1 <- spgm(formula=fm, data = Insurance, listw = wq, model = "random", lag = FALSE, spatial.error = TRUE, moments = "fullweights", method = "g2sls")
summary(semregm1)
## Spatial random effects error model (GM estimation) 
## 
## Call:
## spgm(formula = fm, data = Insurance, listw = wq, model = "random", 
##     lag = FALSE, spatial.error = TRUE, moments = "fullweights", 
##     method = "g2sls")
## 
## Residuals:
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.38146 -0.08770  0.00594  0.00032  0.08648  0.46167 
## 
## Estimated spatial coefficient, variance components and theta:
##            Estimate
## rho       0.0717548
## sigma^2_v 0.0030992
## sigma^2_1 0.0770156
## theta     0.7993976
## 
## Coefficients:
##               Estimate Std. Error t-value  Pr(>|t|)    
## (Intercept) -1.8330208  1.0120124 -1.8113 0.0701001 .  
## log(rgdp)    0.4428613  0.0925115  4.7871 1.692e-06 ***
## log(bank)    0.2081537  0.0420956  4.9448 7.623e-07 ***
## log(den)     0.0711896  0.0181709  3.9178 8.937e-05 ***
## rirs        -0.0240047  0.0084677 -2.8349 0.0045845 ** 
## log(agen)    0.2248552  0.0525706  4.2772 1.893e-05 ***
## school      -0.0027465  0.0034082 -0.8058 0.4203320    
## vaagr       -0.0089325  0.0039770 -2.2460 0.0247012 *  
## log(fam)    -0.1999215  0.1623383 -1.2315 0.2181315    
## log(inef)   -0.1744114  0.0486221 -3.5871 0.0003344 ***
## log(trust)   1.1176045  0.4097268  2.7277 0.0063781 ** 
## d99          0.0035021  0.0160196  0.2186 0.8269517    
## d00          0.0486558  0.0197701  2.4611 0.0138521 *  
## d01          0.0802971  0.0236988  3.3882 0.0007034 ***
## d02          0.0940705  0.0305002  3.0843 0.0020406 ** 
## NorthWest    0.1780132  0.0442861  4.0196 5.829e-05 ***
## NorthEast    0.0913453  0.0441080  2.0709 0.0383640 *  
## South       -0.3539438  0.0577941 -6.1242 9.113e-10 ***
## Islands     -0.4097352  0.0654758 -6.2578 3.904e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Quando se tem modelo = "random", spatial.error = TRUE e lag = FALSE, a função spgm estima o modelo espacial GM com efeitos aleatórios de KKP. Quando o argumento moments = "fullweights" é chamado, seis condições de momentos são usadas com cômputo da matriz de VC. A opção method = "g2sls" indica que o modelo GLS é estimado pelo estimador de momentos generalizado de dois estágios.

Os coeficientes estimados \(\rho=0.0717\), \(\sigma^2_{\nu}=0.003\), \(\sigma^2_{1}=0.077\), \(\theta=1 - \sigma_{\nu}/\sigma_{1}=0.779\), como resultado, \(\sigma^2_{\mu}=0.0739\). Estas coeficientes correspondem aos parâmetros da matriz de VC das equações (9)-(10), estimados por G2SLS.

Esse resumo estatístico permite comparar a eficiência do estimador de máxima verossimilhança com o método de momentos. Como resultado, a variância do estimador semre2 é ligeiramente inferior a semregm1. Portanto, neste exercício, o estimador G2SLS se mostra menos eficiente.

Comentários finais

Este exercício demonstrou como a heterogeneidade individual pode estar associada aos efeitos autorregressivos espaciais de modelos de dados em painel com efeitos aleatórios. Por meio da base de dados de Millo e Carmeci (2011), com os determinantes dos seguros não-vida consumidos entre regiões da Itália, a estrutura de variância-covariância proposta por Kapoor, Kelejian and Prucha (2007) foi confrontada com o modelo com efeitos aleatórios independentes proposto por Baltagi, Song and Koh (2003b). Assim como em Millo e Carmeci (2011), não encontramos evidências estatísticas acerca do controle dos efeitos autorregressivos erro espacial, de sorte que a diferença entre a matriz de VC proposta por KKP, em relação a BKS, não é relevante. Comparamos também a eficiência do estimador G2SLS com o de máxima verossimilhança proposto por BKS. A análise de variância mostrou que o G2SLS é menos eficiente. Este resultado sugere que o estimador de máxima verossimilhança exerce melhor controle sobre os efeitos da heterogeneidade individual.

Referências

Anselin, L. Le Gallo, J. and Jayet, H. (2008). Spatial Panel Econometrics. In The Econometrics of Panel Data, Fundamentals and Recent Developments in Theory and Practice, 3rd ed.; Matyas, L., Sevestre, P., Eds.; Springer: Berlin/Heidelberg, Germany, pp. 624–660.

Baltagi BH, Song SH Jung BC and Koh W (2003b). Testing panel data regression models with spatial error correlation. J. Econom. 2003, 117, 123–150.

Baltagi BH, Song SH, Jung BC and Koh W (2007). Testing for serial correlation, spatial autocorrelation and random effects using panel data. J Econom 140(1):5-51.

Elhorst, JP (2003). Specification and estimation of spatial panel data models. International Regional Science Review, 26 (3):244–268, 2003.

Kapoor, M. Kelejian, HH. and Prucha, IR (2007). Panel data models with spatially correlated error components. Journal of Econometrics 140 (2007) 97–130.

Millo, Giovanni and Carmeci, Gaetano (2011). Non-life insurance consumption in italy: a sub-regional panel data analysis. Journal of Geographical Systems, 13(3):273-298, 07 2010.