Introdução

O presente exercício tem como objetivo estimar a grandeza dos spillovers espaciais formados pela política de gastos governamentais delineada entre municípios do estado de São Paulo em 2015. Para tanto, um modelo econométrico espacial é especificado considerando que o dispêndio público municipal com Habitação e Urbanismo está condicionado aos aspectos das demanda local, à capacidade de financiamento dos dispêndios e à política fiscal implementada nas vizinhanças.

Estudos empíricos têm explorado essa questão considerando que tal decisão não deve levar em conta unicamente aspectos sociais, demográficos e econômicos subjacentes à economia local. Evidências mostram que, se os agentes (usuários do serviço público) enfretam baixo custo de mobilidade entre municípios, podendo decidir livremente onde realizar suas preferências, então a política fiscal local está sujeita a um comportamento estatrégico interativo (Ferraresi, Migali e Rizzo, 2018; Langer, 2019). No Brasil, em particular, a proximidade geográfica entre municípios condiciona não só a política gastos públicos locais, mas interfere também a taxação dos impostos locais e as transferências intergovernamentais.

Em ambiente federativo, o comportamento estatrégico espacial da política fiscal tem sido estuado sob duas abordagens distintas, porém complementares. A primeira (yardstick competition model) mostra que a taxação dos impostos locais é refletida na probabilidade de reeleição de agentes públicos locais. O trabalho seminal de Besley e Case (1995), aplicado aos Estados Unidos, mostra que eleitores sem informação completa, comparam a política de gastos e taxação em sua jurisdição com as juridições vizinhas; como consequência, punem as decisões de gastos que não estiverem em conformidade com uma média esperada entre seus vizinhos.

A segunda fonte de interdependência espacial surge com os modelos de competição fiscal (tax competition models). O comportamento estatrégico na taxação dos impostos locais dá origem à chamada competição fiscal, com efeitos progressivos sobre os gastos. O efeito interação implica que, os gastos públicos realizados em dado município, podem impactar positiva ou negativamente o bem-estar daqueles que residem nas vizinhanças (Revelli, 2003; Baicker, 2005; Werck, Heyndels e Geys, 2008; Costa, Veiga e Portela, 2015; Ferraresi, Migali e Rizzo, 2018; Langer, 2019).

Como demonstrado a seguir, o efeito líquido da política fiscal local é filtrado de um modelo espacial especificado sob a forma SDM (Spatial Durbin model). Desde o estudo de LeSage e Pace (2009), essa estrutura tem sido bastante empregada por combinar o efeito autorregressivo na variável dependente com os spillovers formados nas variáveis exógenas defasadas no espaço (Elhrost, 2010). Recentemente, a popularidade do SDM levou ao aperfeiçoamento do teste de especificação LM (Koley e Bera, 2024).

Estratégia empírica

Modelos econométricos espaciais

A econometria espacial oferece um amplo conjunto de modelos preditivos que podem ser empregados na análise de fenômenos influenciados pelo espaço. Uma questão relevante relacionada à especificação, diz respeito à natureza dos efeitos espaciais. A literatura recomenda que, quando tais efeitos engedram a heterogeneidade espacial, especificar um modelo SEM (spatial error model), pode ser um solução aceitável. No entanto, quando se manifestam pela interdependência entre regiões vizinhas, especificar um modelo SAR (spatial autoregressive model) talvez seja a melhor alternativa (Anselin 1988; LeSage e Pace, 2009).

Também é possível que os efeitos autorregressivos sejam simultâneos. Neste caso, é interessante examinar o problema sob ótica do SAC (spatial autoregressive complete) de LeSage e Pace (2009), denominado SARAR na descrição de Kelejian e Prucha (1998). \[\begin{eqnarray} \tag{1} y & = & \rho W_1 y + \alpha \iota_n + X \beta + u \\ \tag{2} u &=& \lambda W_2 u + \epsilon, \\ \tag{3} \epsilon & \sim & i.i.d. N(0,\sigma^2_{\epsilon} I_n). \end{eqnarray}\]

Em que, \(y\) é um vetor \((N \times 1)\) da variável dependente, \(X\) é uma matriz \((N \times K)\) de variáveis explicativas exógenas, \(W_1\) e \(W_2\) são duas matrizes \((N \times N)\) construídas com diferentes métricas de ponderação espacial. Entre os coeficientes, \(\alpha \iota_n\) é uma constante, \(\beta\) é um vetor \((K \times 1)\) de coeficientes angulares a ser estimado, \(\rho\) é o coeficiente autorregressivo espacial lag espacial e \(\lambda\) é o coeficiente autorregressivo erro espacial. Além disso, \(u\) é um vetor \((N \times 1)\) de distúrbios autocorrelacionados, ao passo que \(\epsilon\) são erros aleatórios indiferentes e identicamente distribuídos a partir de uma variância \(\sigma^2_{\epsilon}\) finita e homogênea no espaço.

Impondo a seguinte restrição, \(\rho=0\), o SAC é reduzido ao modelo SEM. Analogamente, restringindo \(\lambda=0\), então o modelo SAC é reduzido ao modelo SAR.

Dado que \(| \lambda | < 1\) e \(W_2\) é normalizada na linha, a forma reduzida do modelo SEM é \[\begin{equation} \tag{4} y = \alpha \iota_n + X \beta + (I_n - \lambda W_2)^{-1} \epsilon. \end{equation}\]

Com matriz de variância-covariância: \(\Omega^{SEM} = \sigma^2_{\epsilon} (I_n - \lambda W_2)^{-1} (I_n - \lambda W_2')^{-1}\).

Analogamente, dado que \(| \rho | < 1\) e \(W_1\) é normalizada na linha, a forma reduzida do modelo SAR é \[\begin{equation} \tag{5} y = (I_n - \rho W_1)^{-1} [\alpha \iota_n + X \beta] + (I_n - \rho W_1)^{-1} \epsilon. \end{equation}\]

Com matriz de variância-covariância: \(\Omega^{SAR} = \sigma^2_{\epsilon} (I_n - \rho W_1)^{-1} (I_n - \rho W_1')^{-1}\).

A forma reduzida (4) e (5) mostra que os modelos SEM e SAR não são diretamente comparáveis. Se a heterogeneidade do SEM puder ser controlado pela estrutura \(\Omega^{SEM}\), então os coeficientes \(\beta\) lineares são eficientes e podem ser interpretados na forma convencional do modelo clássico (LeSage e Pace, 2009; Elhorst, 2010). Tal interpretação, entretanto, não se aplica ao SAR, notadamente não linear nos parâmentros. A ausência de linearidade decorre da natureza endógena do processo autorregressivo espacial. No caso específico, a endogeneidade pode resultar do comportamento estratégico e interativo característico da política fiscal local.

Os modelos SAR e SEM estão no centro do problema de especificação. Mas com o avanço da econometria espacial, outras variações tornaram-se relevante, uma delas é o SDM (spatial Durbin model), especificado a seguir: \[\begin{eqnarray} \tag{6} y & = & \rho W_1 y + \alpha \iota_n + X \beta + W_1 X \delta + \epsilon \\ \tag{7} \epsilon & \sim & i.i.d. N(0,\sigma^2_{\epsilon} I_n). \end{eqnarray}\]

Segundo Elhorst (2010), a estrutura tem a vantagem de combinar o efeito autorregressivo na variável dependente com os spillovers formados nas variáveis exógenas defasadas no espaço. Segundo o autor, uma pequena mudança na variável exógena \(X_k\), provoca dois efeitos, decompostos da seguinte forma: \[\begin{equation} \tag{8} \frac{\partial E(y)}{\partial X_{k,1}},...,\frac{\partial E(y)}{\partial X_{k,n}} = (I_n - \rho W_1)^{-1} [I_n \beta_k + W_1 \theta_k]. \end{equation}\]

Trata-se de um efeito global, em que a diagonal principal da matriz (8) expressa o impacto direto, ao passo que os elementos fora da diagonal principal são os impactos indiretos.

Esta especificação ganhou notoriedade com a abordagem Bayesiana apresentada em LeSage e Pace (2009). Por algum tempo, a não linearidade paramétrica da estrutura SDM foi considerada uma forte restrição para o desenvolvimento e implentação de testes robustos tipo LM (Anselin, et. al., 1996). Como explorado adiante, essa barreira foi quebrada com o desenvolvimento de novos testes – Rao’s score test – que passaram a revelar a superioridade do SDM em relação ao SAR (Koley e Bera, 2024).

Matriz de pesos espaciais e testes de especificação

No escopo da econometria espacial, a construção da matriz de ponderação espacial W é sempre uma etapa delicada. Quando o pesquisador não dispõe de argumentos teóricos suficientes para identificar a natureza da relação de vizinhança, a solução imediata é definir W como uma matriz exógena, onde os pesos \(w_{ij}\) são determinados segundo algum critério de distância geográfica.

Neste exercício, dado que a relação de vizinhança não é em princípio evidente, a análise empírica se baseia em duas matrizes usualmente empregadas na literatura, quais sejam: (1) uma matriz de contiguidade de primeira ordem; (2) e uma matriz inverso da distância Euclidiana.

A primeira, adota o seguinte critério de ponderação: \(w_{ij}=1\), se o município \(j\) é contíguo a \(i\); ou \(w_{ij}=0\), caso contrário. Como resultado, a matriz \(W_1\) é binária, com diagonal principal composta por zeros.

Os pesos da segunda matriz \(W_2\) são definidos pelo seguinte critério: se \(d_{ij} < D_c\), então \(w_{ij}=1/d_{ij}^\alpha\); caso contrário, \(w_{ij}=0\). Nesta abordagem, \(d_{ij}\) é a distância geográfica entre os municípios \(i\) e \(j\), \(\alpha=2\) é um parâmetro da função e \(D_c\) é uma distância de corte.

A aplicação dessas matrizes é coerente com as características geográficas do arranjo espacial em questão, formado por 465 municípios cujas áreas são relativamente simétricas e proporcionais.

Além da estatística I de Moran, essas matrizes são empregadas na inferência dos testes de especificação tipo máxima verossimilhança. Nesse sentido, Anselin, et. al. (1996) desenvolveram testes LM (Lagrange multiplier) focados no diagnóstico de dependência espacial em modelos de regressão. A ideia inicial era diferenciar um processo autorregressivo erro espacial do lag espacial.

Mesmo sendo popular entre estudos empíricos, Elhorst (2010) argumenta que os testes LM podem não ser muito úteis quando a dependência espacial é causada por interações entre variáveis exógenas. O autor adverte ainda que a realização de testes ignorando os spillovers espaciais nas variáveis exógenas, pode levar a falha de interpretação como consequência de erros no diagnóstico de dependência espacial. Nessa direção, envolvendo modelos nested SAR e SDM, Koley e Bera (2024) desenvolveram testes para dependência espacial sob hipótese de regressores endógenos. Para corrigir a não linearidade, introduzem um sistema de ponderação baseado em Rao’s scores para adequar a estrutura SDM. Os testes comparam a contribuição marginal de um coeficiente autorregressivo, bem como oferecem uma estatística conjunta para análise combinada dos efeitos espaciais.

Dados e variáveis

Baseado no estudo de Ferraresi, Migali e Rizzo (2018), o modelo proposto busca verificar a existência de spillovers sobre dispêndio público municipal sob a hipótese de que os agentes econômicos de uma jurisdição podem se beneficiar dos dispêndios das jurisdições vizinhas em função de suas capacidades de locomoção. Mais especificamente, testa-se a hipótese de que o dispêndio público com Habitação e Urbanismo nos municípios paulistas possuem algum comportamento estratégico com relação vizinhança. \[\begin{eqnarray} \tag{9} log\left( \frac{Habitacao\_Urbanismo}{Populacao}\right) &=& log(Populacao) + Prop\_Menos15anos + Prop\_Mais65anos + Ocupacao\_pc \\ \nonumber & & + log\left( \frac{Massa\_salarial}{Populacao}\right) + log\left( \frac{Arrecadacao\_propria}{Populacao}\right) + log\left( \frac{Transf\_Corrente}{Populacao}\right). \end{eqnarray}\]

Em que: \(Habitacao\_Urbanismo/Populacao\) é o montante de dispêndio per capita com Habitação e Urbanismo; \(Populacao\) é o número estimado de habitantes no município a 1º de junho; \(Prop\_Menos15anos\) é a proporção de habitantes com menos de 15 anos; \(Prop\_Mais65anos\) a proporção de habitantes com mais de 65 anos; \(Ocupacao\_pc\) é a proporção do número de vínculos ativos a 31/12 frente à população total, é uma proxy para a taxa de ocupação municipal; \(Arrecadacao\_propria/Populacao\) é o montante arrecadado per capita pelo esforço próprio do município; \(Transf\_Corrente/Populacao\) é o montante recebido de transferências dos entes superiores (União e Estado).

Os dados para realização deste exercício foram coletados em diferentes fonte. A estimativa da população residente foi fornecida pelo IBGE. A proporção do número de habitantes com menos de 15 anos e proporção do número de habitantes com mais de 65 anos foram fornecidas pelo Datasus. Ocupações e massa salarial foram fornecidas pela RAIS. E os dados sobre receita e gastos públicos foram fornecidos pela Finbra.

Resultados e discussões

Análise Exploratória de Dados Espaciais (AEDE).

Iniciamos a AEDE examinando a distribuição dos dispêndios públicos municipais com Habitação e Urbanismo no estado de São Paulo. Para tanto, a base com os determinantes dos dispêndios públicos é integrada a um arquivo shapefile com a malha municipal do estado de São Paulo fornecida pelo IBGE.

Carregando os pacotes

library(ggplot2)
library(dplyr)
library(sf)
library(sfdep)
library(spdep)
library(spatialreg)
library(ggspatial)

Integrando a base de dados

# Lendo arquivo shapefile e database
munsp <- st_read(dsn="SP_Municipios_2022.shp", stringsAsFactors=FALSE) 
b0 <- read.delim(file = "Database.csv", sep = ";", header = T)
# Converte o shapefile em um arquivo de coordenadas
proj_munsp <- st_transform(munsp, crs = 26917) 
# Juntando as bases
b0$CD_MUN <- as.factor(b0$municipio.id)
proj_munsp <- left_join(proj_munsp,b0,by=c("CD_MUN"))

Agora, o objeto proj_munsp georeferenciado contendo os determinantes dos dispêndios públicos municipais, pode ser examinado com mais detalhes.

glimpse(proj_munsp)

## Rows: 645
## Columns: 24
## $ CD_MUN                  <chr> "3500105", "3500204", "3500303", "3500402", "3…
## $ NM_MUN                  <chr> "Adamantina", "Adolfo", "Aguaí", "Águas da Pra…
## $ SIGLA_UF                <chr> "SP", "SP", "SP", "SP", "SP", "SP", "SP", "SP"…
## $ AREA_KM2                <dbl> 411.987, 211.055, 474.554, 142.673, 60.126, 40…
## $ municipio.id            <int> 3500105, 3500204, 3500303, 3500402, 3500501, 3…
## $ municipio.nome          <chr> "Adamantina", "Adolfo", "Aguaí", "Águas da Pra…
## $ UF.id                   <int> 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35…
## $ UF.sigla                <chr> "SP", "SP", "SP", "SP", "SP", "SP", "SP", "SP"…
## $ UF.nome                 <chr> "São Paulo", "São Paulo", "São Paulo", "São Pa…
## $ regiao.id               <int> 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3…
## $ regiao.sigla            <chr> "SE", "SE", "SE", "SE", "SE", "SE", "SE", "SE"…
## $ regiao.nome             <chr> "Sudeste", "Sudeste", "Sudeste", "Sudeste", "S…
## $ Ano                     <int> 2015, 2015, 2015, 2015, 2015, 2015, 2015, 2015…
## $ Populacao               <int> 35048, 3623, 34863, 8025, 18313, 5944, 3139, 3…
## $ Prop_Menos15anos        <dbl> 16.40607, 17.69252, 22.23561, 17.08411, 18.320…
## $ Prop_Mais65anos         <dbl> 14.211938, 12.751863, 8.774345, 14.903427, 12.…
## $ Prop_Menos15_Mais65anos <dbl> 30.61801, 30.44438, 31.00995, 31.98754, 30.497…
## $ Massa_salarial          <dbl> 328378546, 29555634, 277439544, 33693725, 1656…
## $ Ocupacao_pc             <dbl> 31.60523, 28.20867, 27.23231, 14.75389, 33.058…
## $ Habitacao_Urbanismo     <dbl> 21057680, 12716879, 9196194, 4449552, 10582085…
## $ Receitas_Correntes      <dbl> 181700269, 31297585, 113898386, 33763052, 1041…
## $ Transf_Corrente         <dbl> 104053254, 28390404, 91456623, 23079061, 59205…
## $ Arrecadacao_propria     <dbl> 77647014.4, 2907181.4, 22441763.1, 10683991.1,…
## $ geometry                <MULTIPOLYGON [m]> MULTIPOLYGON (((3702335 -27..., M…

Como a base contém 24 colunas, a função glimpse oferece uma visualização interessante e mais compacta para a apresentação das variáveis. Observe que todas as variáveis explicativas são numéricas, assim como a variável dependente definida como a quantia per capita dos dispêndios anuais com Habitação e Urbanismo. De acordo com o gráfico a seguir, não há sinais de forte heterogeneidade afetando a distribuição espacial da variável de interesse do modelo.

ggplot() +
  geom_sf(data = proj_munsp, aes(fill=Habitacao_Urbanismo/Populacao), size =.3, color = "black") +
  scale_fill_distiller(palette = "OrRd", direction = 1) +
  annotation_scale(location = "bl", width_hint = 0.5) +
  annotation_north_arrow(location = "bl", which_north = "true", 
                         pad_x = unit(.5, "in"), pad_y = unit(0.2, "in"), 
                         style=north_arrow_fancy_orienteering)

A primeira matriz a ser construída é a de contiguidade de primeira ordem. Com base no polígono proj_munsp, a função poly2nb do pacote spdep, retorna uma lista de vizinhança tipo queen. O resumo estatístico mostra que, do arranjo composto por 465 municípios, menos de 1% das ligações possíveis tem peso 1. Um grande grupo composto por 393 municípios estabelece de 4 a 6 ligações, intervalo que delimita a média estimada em 5.68. Há um município com 0 ligação (Ilhabela); Água de São Pedro e Itirapuã têm apenas 1 ligação cada; e São Paulo tem o número máximo (23) de ligações.

# Cria uma matriz de vizinhança na forma de lista
wqnb <- poly2nb(pl=proj_munsp, queen = TRUE)
summary(wqnb)

## Neighbour list object:
## Number of regions: 645 
## Number of nonzero links: 3664 
## Percentage nonzero weights: 0.8807163 
## Average number of links: 5.68062 
## 1 region with no links:
## 233
## 2 disjoint connected subgraphs
## Link number distribution:
## 
##   0   1   2   3   4   5   6   7   8   9  10  11  12  14  23 
##   1   2  19  53 116 143 119  89  43  28  19   8   2   2   1 
## 2 least connected regions:
## 7 271 with 1 link
## 1 most connected region:
## 563 with 23 links

O primeiro passo executado na construção da matriz inverso da distância Euclidiana consiste em determinar os centróides de cada município. Essas informações são usadas no passo seguinte, para o qual uma distância máxima de corte foi definida em 100km. Como mostra o resumo abaixo, esse critério reduz o número de ligações entre municípios de borda (caso de Rosana, com apenas 3 ligações), mas aumenta consideralvelmente o número de ligações naqueles centralizados e cercados por municípios pequenos (Jundiaí tem o número máximo de ligações, 101).

# Cria uma matriz de vizinhança baseada no inverso da distância
centroids <- st_centroid(proj_munsp$geometry)
wdnb <- dnearneigh(centroids, 0, 100000, row.names = proj_munsp$CD_MUN) # dmax = 100Km
summary(wdnb)

## Neighbour list object:
## Number of regions: 645 
## Number of nonzero links: 35848 
## Percentage nonzero weights: 8.61679 
## Average number of links: 55.57829 
## Link number distribution:
## 
##   3   6  10  11  12  13  14  16  17  18  19  20  21  22  23  24  25  26  27  28 
##   1   1   1   1   2   2   1   2   3   4   4   3   3   3   6   5   2   9   3   7 
##  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48 
##  14  10   3   9   6  10   4   5   7   1   5   5   9   6   6   7  10  12  10   9 
##  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68 
##  11   7  11  13  12  12  12  11  17   8  17  26  18  10  20  12  16  13  16  15 
##  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  86  87  88  89 
##  14   9   6   7  10  10  13  10   9  10   7   4   4   2   4   3   5   1   3   1 
##  90  91  92  93  94  95  96  97  98 100 101 
##   2   5   3   2   3   3   1   3   1   1   1 
## 1 least connected region:
## 3544251 with 3 links
## 1 most connected region:
## 3525904 with 101 links

Estatística I de Moran global

Com base nos arranjos examinados acima e no vetor com os dispêndios per capita com Habitação e Urbanismo, estima-se agora o coeficiente I de Moran global.

Coeficiente I de Moran com \(W_1\)

wq <- nb2listw(neighbours = wqnb, glist = NULL, style = "W", zero.policy = TRUE)
moran.test(log(b0$Habitacao_Urbanismo/b0$Populacao), wq, zero.policy = TRUE, na.action = na.pass)

## 
##  Moran I test under randomisation
## 
## data:  log(b0$Habitacao_Urbanismo/b0$Populacao)  
## weights: wq  
## n reduced by no-neighbour observations  
## 
## Moran I statistic standard deviate = 3.7334, p-value = 9.447e-05
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##       0.082164899      -0.001555210       0.000502871

Coeficiente I de Moran com \(W_2\)

wd <- nb2listwdist(wdnb, proj_munsp, type = "idw", style = "W", alpha = 2, dmax = 100000, zero.policy = TRUE)
moran.test(log(b0$Habitacao_Urbanismo/b0$Populacao), wd, zero.policy = TRUE, na.action = na.pass)

## 
##  Moran I test under randomisation
## 
## data:  log(b0$Habitacao_Urbanismo/b0$Populacao)  
## weights: wd    
## 
## Moran I statistic standard deviate = 3.935, p-value = 4.16e-05
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##      0.0865730024     -0.0015527950      0.0005015575

Os resultados mostram que, ambas estatísticas são significantes a menos de 5% de probabilidade de erro, e não há diferença sistemática entre coeficientes estimados. A ligeira superioridade do I de Moran estimado com \(W_2\), evidencia que a autocorrelação positiva afetou a distribuição espacial dos dispêndios com Habitação e Urbanismo realizados paulistas em 2015.

Testes de especificação

Para que os resíduos sejam usados nos testes RS (Rao’s score test) de dependência espacial, estima-se o modelo OLS linear.

fm <- log(Habitacao_Urbanismo/Populacao) ~ log(Populacao) + Prop_Menos15anos + Prop_Mais65anos + Ocupacao_pc +
  log(Massa_salarial/Populacao) + log(Arrecadacao_propria/Populacao) + log(Transf_Corrente/Populacao)
resols <- lm(formula = fm, data = proj_munsp)

Assim como antes, o diagnóstico é inferido sob duas estruturas.

LM teste com \(W_1\)

lm.RStests(model = resols, listw = wq, test = "all")

## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wq
## 
## RSerr = 2.5134, df = 1, p-value = 0.1129
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wq
## 
## RSlag = 3.5399, df = 1, p-value = 0.05991
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wq
## 
## adjRSerr = 0.040089, df = 1, p-value = 0.8413
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wq
## 
## adjRSlag = 1.0666, df = 1, p-value = 0.3017
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wq
## 
## SARMA = 3.58, df = 2, p-value = 0.167

LM teste com \(W_2\)

lm.RStests(model = resols, listw = wd, test = "all")

## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wd
## 
## RSerr = 2.5189, df = 1, p-value = 0.1125
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wd
## 
## RSlag = 5.6126, df = 1, p-value = 0.01783
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wd
## 
## adjRSerr = 5.1513, df = 1, p-value = 0.02323
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wd
## 
## adjRSlag = 8.245, df = 1, p-value = 0.004086
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## test weights: wd
## 
## SARMA = 10.764, df = 2, p-value = 0.004599

A função lm.RStests reporta cinco estatísticas de teste. Focando nos resultados robustos da matriz \(W_2\), a estatística RSerr não é significante a 5% de probabilidade de erro. Assim, a hipótese de um processo autorregressivo erro espacial pode ser descartada. A significância da estatística RSlag indica que o vetor lag espacial é um elemento importante na especificação do modelo. A versão robusta adjRSlag corrobora esse resultado e alerta para a necessidade de correção da missing lagged dependent variable. A significância da estatística SARMA sugere que especificar um modelo SAR com médias móveis pode ser uma alternativa.

Note que os RS testes convencionais não consideram explicitamente os spillovers espaciais nas variáveis exógenas. Por isso, recorre-se às versões robutas que comparam a adequação do SDM com uma estrutura linear.

SD.RStests(model = resols, listw = wd, zero.policy=TRUE, test = "SDM")

## 
##  Rao's score test spatial Durbin diagnostics
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## weights: wd
## 
## SDM_RSlag = 5.6126, df = 1, p-value = 0.01783
## 
## 
##  Rao's score test spatial Durbin diagnostics
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## weights: wd
## 
## SDM_adjRSlag = 2.5189, df = 1, p-value = 0.1125
## 
## 
##  Rao's score test spatial Durbin diagnostics
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## weights: wd
## 
## SDM_RSWX = 16.909, df = 7, p-value = 0.018
## 
## 
##  Rao's score test spatial Durbin diagnostics
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## weights: wd
## 
## SDM_adjRSWX = 13.815, df = 7, p-value = 0.05457
## 
## 
##  Rao's score test spatial Durbin diagnostics
## 
## data:  
## model: lm(formula = fm, data = proj_munsp)
## weights: wd
## 
## SDM_Joint = 19.427, df = 8, p-value = 0.01273

A estatística SDM_RSlag = 5.6126 é significante a 5% probabilidade de erro. No entanto, a versão ajustada pelos scores (SDM_adjRSlag) não corrobora com a adequação do SDM. Considerando \(H_0: \rho=0, \gamma \neq 0\) em (6)-(7), a estatística SDM_RSWX = 16.909 é significante a 5%. No entanto, mantendo o rigor, esse resultado não é corroborado pela estatística ajustada SDM_adjRSWX. Finalmente, sob hipótese \(H_0: \rho=0, \gamma=0\), a significância da estatística SDM_Joint sugere que SDM pode oferecer um bom ajuste para predizer a distribuição espacial dos dispêndios com Habitação e Urbanismo dos municípios paulistas em 2015.

Estimando o modelo SDM

Com base na estatística SDM_Joint, estimam-se os parâmetros SDM.

resSDM <- lagsarlm(formula = fm, data = b0, listw = wd, Durbin = TRUE)
summary(resSDM)

## 
## Call:lagsarlm(formula = fm, data = b0, listw = wd, Durbin = TRUE)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -13.09562  -0.21306   0.10051   0.36450   1.48876 
## 
## Type: mixed 
## Coefficients: (asymptotic standard errors) 
##                                          Estimate Std. Error z value  Pr(>|z|)
## (Intercept)                            -6.8981251  4.1961193 -1.6439   0.10019
## log(Populacao)                         -0.0155031  0.0618555 -0.2506   0.80210
## Prop_Menos15anos                       -0.0023225  0.0219074 -0.1060   0.91557
## Prop_Mais65anos                         0.0098003  0.0235995  0.4153   0.67794
## Ocupacao_pc                            -0.0045793  0.0050753 -0.9023   0.36691
## log(Massa_salarial/Populacao)           0.1960465  0.1547897  1.2665   0.20532
## log(Arrecadacao_propria/Populacao)      0.1747845  0.0846826  2.0640   0.03902
## log(Transf_Corrente/Populacao)          0.7302769  0.1649657  4.4268 9.562e-06
## lag.log(Populacao)                      0.0261235  0.1111396  0.2351   0.81417
## lag.Prop_Menos15anos                   -0.0238576  0.0402552 -0.5927   0.55341
## lag.Prop_Mais65anos                    -0.0597243  0.0506907 -1.1782   0.23871
## lag.Ocupacao_pc                        -0.0087111  0.0126581 -0.6882   0.49134
## lag.log(Massa_salarial/Populacao)      -0.1429642  0.3393744 -0.4213   0.67357
## lag.log(Arrecadacao_propria/Populacao)  0.4052516  0.1640108  2.4709   0.01348
## lag.log(Transf_Corrente/Populacao)      0.3807152  0.3399981  1.1198   0.26282
## 
## Rho: 0.11973, LR test value: 3.0482, p-value: 0.080828
## Asymptotic standard error: 0.060989
##     z-value: 1.9632, p-value: 0.049623
## Wald statistic: 3.8542, p-value: 0.049623
## 
## Log likelihood: -878.3334 for mixed model
## ML residual variance (sigma squared): 0.88965, (sigma: 0.94321)
## Number of observations: 645 
## Number of parameters estimated: 17 
## AIC: 1790.7, (AIC for lm: 1791.7)
## LM test for residual autocorrelation
## test value: 4.5517, p-value: 0.032886

Entre as variáveis explicativas especificadas na regressão (8), apenas os coeficientes associados à \(Arrecadacao\_propria/Populacao\) e \(Transf\_Corrente/Populacao\) foram estimados significantes a 5% de probabilidade de erro. Esse resulta é interessante porque corrobora com a hipótese de comportamento estatrégico interativo da política fiscal local. A análise parcial do coeficiente autorregressivo \(\rho\) indica que o mesmo não é significante a 5%. No entanto, se análise for dirigida pela estatística Wald, então é possível considerar que todos os parâmetros estimados são diferentes de zero.

Assim sendo, a análise econômica dos resultados é dirigida pelos impactos direto e indireto do modelo SDM.

impacts(resSDM, listw=wd)

## Impact measures (mixed, exact):
##                                          Direct    Indirect       Total
## log(Populacao)                     -0.014974581  0.02703954  0.01206496
## Prop_Menos15anos                   -0.002848163 -0.02689291 -0.02974108
## Prop_Mais65anos                     0.008524979 -0.06523969 -0.05671471
## Ocupacao_pc                        -0.004781005 -0.01031719 -0.01509819
## log(Massa_salarial/Populacao)       0.193443889 -0.13314138  0.06030251
## log(Arrecadacao_propria/Populacao)  0.184067017  0.47486537  0.65893239
## log(Transf_Corrente/Populacao)      0.740473712  0.52163532  1.26210903

As elasticidades acima expressa os impactos direto e indireto especificados em (8). Para facilitar o entendimento, suponha que \(i\) seja um município com um padrão moderado de dispêndio com Habitação e Urbanismo, ao passo que \(j\) são seus vizinhos. Então, uma pequena variação na arrecadação própria de \(i\), gera dois efeitos sobre o dispêndio. O primeiro é um efeito interno, estimado em 0,184; e o segundo são spillovers espaciais que agem sobre o dispêndio médio de \(j\), estimado em 0,475. Como resultado da soma dos dois efeitos, é possível afirmar que um aumento de 1% na arrecadação própria de todos os municípios paulista, gera um impacto de 0,66% no dispêndio com Habitação e Urbanismo.

Dado que existem outras fontes de arrecadação fiscal, é importante considerar os impactos das transferências intergovernamentais. Seguindo o método de análise, se o município \(i\) foi penalizado com uma pequena redução (digamos de 1%) nas transferências intergovernamentais, o dispêndio com Habitação e Urbanismo deveria reduzir em um montante equivalente a 0,74% para manter o equilíbrio fiscal local. Em termos globais, o esforço de ajuste fiscal seria ainda mais significativo, na ordem de 1,26%.

Por fim, é possível concluir que o dispêndio com Habitação e Urbanismo é mais sensível às transferências intergovernamentais do que a arrecadação própria dos municípios paulista.

Referências

Anselin, L. (1988). Spatial Economdrics: Methods and Models. Dordrecht: Kluwer Academic.

Besley, T., & Case, A. (1995). Does electoral accountability affect economic policy choices? Evidence from gubernatorial term limits. Quarterly Journal of Economics, 110, 769–798.

Baicker, K. (2005). The spillover effects of state spending. Journal of Public Economics, 89(2), 529–544.

Costa, H., Veiga, G., & Portela, M. (2015). Interactions in local governments’ spending decisions: Evidence from Portugal. Regional Studies, 49(9), 1441–1456.

Elhorst, J. P. (2010). `Applied Spatial Econometrics: Raising the Bar’. Spatial Economic Analysis, 5(1), 9–28.

Ferraresi, M. Migali, G. and Rizzo, L. (2018). Spillover effects in local public spending. Regional Studies, 52(11): 1570–1584.

Langer, S. (2019). Expenditure interactions between municipalities and the role of agglomeration forces: a spatial analysis for north rhine-westphalia. The Annals of Regional Science, 62(3): 497–527.

LeSage, J. P. and R. K. Pace, (2009). Introduction to Spatial Econometrics, CRC Press, Taylor & Francis Group,: Boca Raton, FL.

Koley, M. and Bera, A. K. (2023) Testing for spatial dependence in a spatial autoregressive (SAR) model in the presence of endogenous regressors. Journal of Spatial Econometrics, (3) 11, 2–46.

Revelli, F. (2005). On spatial public finance empirics. International Tax and Public Finance, 12, 475–492.

Werck, K., Heyndels, B., & Geys, B. (2008). The impact of ‘central places’ on spatial spending patterns: Evidence from Flemish local government cultural expenditures. Journal of Cultural Economics, 32(1), 35–58.

Spillovers espaciais da política fiscal local

André Luiz Ferreira e Silva

2024-05-26