Este relatório apresenta a análise espacial dos dados de
escolarização e do IDEB - (anos iniciais em
escolas públicas) no estado da Bahia, utilizando as bibliotecas
tmap para a criação de mapas e spdep para
análises espaciais.
O objetivo dessa análise é explorar a distribuição espacial desse indicadores nos municípios baianos e verificar a autocorrelação espacial entre os municípios.
A Bahia é o maior estado da região Nordeste do Brasil, com 417 municípios e uma grande diversidade geográfica, econômica e social. O estado possui áreas metropolitanas desenvolvidas, como Salvador e Feira de Santana, mas também apresenta extensas regiões rurais e semiáridas, onde o acesso à educação e à infraestrutura é um desafio significativo. Essa heterogeneidade faz com que a taxa de escolarização e o IDEB - nos anos iniciais em escolas públicas variem consideravelmente entre os municípios.
O estudo da relação entre a taxa de escolarização e o IDEB é fundamental para compreender como as condições regionais influenciam a qualidade e o acesso à educação, além de identificar padrões espaciais que revelem desigualdades educacionais. Municípios com melhores indicadores socioeconômicos tendem a apresentar maior taxa de escolarização e melhores resultados no IDEB, enquanto áreas com menores recursos podem enfrentar desafios na oferta de ensino de qualidade.
library(sf)
library(spdep)
library(tmap)
library(ggplot2)
library(RColorBrewer)
library(dplyr)
library(readxl)
library(ggspatial)
library(sp)
library(classInt)
library(mapview)
library(spData)
ShapeBA <- st_read("C:/Users/helde/Downloads/BA_Municipios_2023/BA_Municipios_2023.shp")
## Reading layer `BA_Municipios_2023' from data source
## `C:\Users\helde\Downloads\BA_Municipios_2023\BA_Municipios_2023.shp'
## using driver `ESRI Shapefile'
## Simple feature collection with 417 features and 3 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -46.57728 ymin: -18.34856 xmax: -37.34115 ymax: -8.532821
## Geodetic CRS: SIRGAS 2000
plot(ShapeBA)
Carregando e Mesclando a Base de
Dados
dados <- read_excel("C:/Users/helde/Downloads/BA_Municipios_2023/dados_bahia.xls")
dados <- as.data.frame(dados)
Shapedados <- merge(ShapeBA, dados, by.x = "NM_MUN", by.y = "Município", all.x = TRUE)
Os dados utilizados foram disponibilizados pelo IBGE. E pelo QEDU e possuem as seguintes variáveis:
IDEB - Anos iniciais em escolas públicas Índice de Desenvolvimento da Educação Básica que mede a qualidade do ensino no Brasil
Escolarização de Crianças de 6 a 14 anos (%): Representa o nível de escolaridade média na faixa etária.
Nesta etapa iremos realizar uma análise descritiva dos indicadores para vizualizarmos melhor as váriaveis em estudo
summary(Shapedados$`IDEB`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.300 4.500 4.800 4.932 5.300 7.800
summary(Shapedados$`Escolarização 6 á 14 anos`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 89.90 96.50 97.40 97.15 98.10 99.70
Mapa do IDEB
O mapa mostra a distribuição do IDEB, destacando diferenças regionais. Podemos Observar Municipios com alto indíce de desnevolvimento (Tons cinza escuro) e Municípios com baixos indíces de desenvolvimento (Tons mais claros)
| Municípios | IDEB |
|---|---|
| APORÁ | 3.3 |
| ARATACA | 3.3 |
| ITAPEBI | 3.3 |
| ESPLANADA | 3.5 |
| ITABELA | 3.5 |
| Municípios | IDEB |
|---|---|
| LICÍNIO DE ALMEIDA | 7.8 |
| ITATIM | 7.7 |
| JACARACI | 7.3 |
| NOVO HORIZONTE | 7.1 |
| MORTUGABA | 7.0 |
Histograma do IDEB - anos iniciais em escolas públicas na bahia
O mapa mostra a distribuição da taxa de escolarização de crianças de 6 a 14 anos na Bahia, destacando diferenças regionais. Municípios litorâneos e próximos a centros urbanos apresentam taxas mais altas (tons mais escuros), indicando melhor infraestrutura educacional e acesso à escola. Já regiões mais afastadas e no interior têm taxas mais baixas (tons claros), sugerindo desafios estruturais e socioeconômicos.
| Municípios | (%) |
|---|---|
| Caatiba | 89.9 |
| Teolândia | 90.5 |
| Olindina | 91.4 |
| Buerarema | 91.5 |
| Jucuruçu | 91.5 |
| Municípios | (%) |
|---|---|
| Mortugaba | 99.7 |
| Santana | 99.7 |
| São Felipe | 99.7 |
| Elisio Medrado | 99.6 |
| Dom Macedo Costa | 99.3 |
Histograma para Taxa de Escolarização de crianças de 6 a 14 anos
— O histograma apresenta uma distribuição assimétrica à
esquerda, indicando que a maioria dos municípios possui taxas de
escolarização elevadas.
Nesta etapa vamos investigar se as variaveis Escolarização de Crianças de 6 á 14 anos e IDEB - anos iniciais em escolas públicas no município da Bahia apresenta algum padrão espacial, ou seja se os municípios com taxas semelhantes de escolariação e do IDEB estão próximos uns aos outros. Sendo assim utilizaremos alguns métodos de analise espaçial. E realizar também uma análise entre os dois indicaodres para verificar se há correlação entre eles.
Primeiro criamos uma estrutura de vizinhaça espacial, onde cada município é considerado vizinho se compartilha uma fronteira com outro. Utilizaremos o critério de vizinhaça de queen (ou método da rainha), que considera os municípios adjacentes.
rn_municipios.nb <- poly2nb(Shapedados, queen=TRUE)
Diagrama de Dispersão de Moran (Moran Scatterplot) Para Escolarização
O gráfico de dispersão (Moran Scatterplot) apresenta a relação entre a taxa de escolarização de cada município baiano e a taxa média de escolarização considerando seus municípios vizinhos.
A análise do Moran Scatterplot mostra a seguinte distribuição dos municípios:
A presença de 161 municípios no quadrante (++) e 111 no quadrante (–) indica que há uma forte tendência de dependência espacial positiva, ou seja, municípios tendem a compartilhar padrões semelhantes com seus vizinhos.
Já os 79 municípios no quadrante (+-) e 76 no (-+) sugerem a existência de áreas de contraste, onde a escolarização de um município não segue a tendência de seus vizinhos, possivelmente devido a diferenças estruturais, políticas públicas locais ou condições socioeconômicas específicas.
Os resultados sugerem que há um padrão regional na escolarização dos municípios baianos, com alguns municípios destoando significativamente. Essas diferenças podem estar relacionadas a investimentos educacionais locais, condições socioeconômicas ou fatores geográficos.
Diagrama de dispersão de Moran Para IDEB - anos iniciais em
escolas públicas
O gráfico de dispersão (Moran Scatterplot) apresenta a relação
entre a taxa do IDEB de cada município baiano e a
taxa média do IDEB considerando seus municípios
vizinhos.
A presença de uma tendência positiva (linha preta inclinada para cima) sugere que há um certo efeito espacial positivo. Ou seja, municípios com IDEB alto tendem a estar próximos de outros municípios com IDEB alto, e municípios com IDEB baixo tendem a estar próximos de outros com IDEB baixo.
Isso indica que a qualidade da educação (medida pelo IDEB) não é distribuída de forma completamente aleatória no estado, mas sim que existem clusters regionais de municípios com desempenhos educacionais similares.
A análise do Moran Scatterplot mostra a seguinte distribuição dos municípios:
Este gráfico sugere que há uma dependência espacial no IDEB dos anos iniciais na Bahia em escolas públicas. Isso significa que a qualidade da educação em um município pode estar influenciada pela qualidade educacional de seus municípios vizinhos. A identificação desses padrões pode ajudar na formulação de políticas públicas educacionais focadas em regiões que apresentam desempenho abaixo da média.
Correlação entre o IDEB e a taxa de escolarização na Bahia
— O gráfico de dispersão apresenta a relação entre o
IDEB (eixo X) e a Taxa de Escolarização
(%) (eixo Y). A linha vermelha representa a tendência da
correlação entre essas duas variáveis.
1.Tendência Positiva:
A inclinação positiva da linha vermelha indica que há uma correlação positiva entre o IDEB e a Taxa de Escolarização. Ou seja, municípios com um IDEB mais alto tendem a apresentar uma taxa de escolarização maior. No entanto, essa correlação não parece ser muito forte, já que a dispersão dos pontos em torno da linha de tendência é grande.
2.Distribuição dos Dados:
A maioria dos municípios apresenta uma taxa de escolarização acima de 95%, o que sugere que o acesso à escola já é elevado na maior parte dos municípios analisados. Há alguns pontos abaixo dos 95%, indicando municípios com menor taxa de escolarização, mas eles são minoria.
3.Correlação Fraca a Moderada:
Apesar da tendência positiva, os pontos estão bastante dispersos ao redor da linha de tendência, o que sugere que o IDEB e a Taxa de Escolarização não estão fortemente correlacionados. Isso indica que, embora a escolarização seja um fator importante, outros elementos (como qualidade do ensino, infraestrutura escolar, investimento público, formação de professores, entre outros) também influenciam diretamente o IDEB.
Existe uma correlação positiva entre a taxa de escolarização e o IDEB, ou seja, municípios com maior escolarização tendem a ter melhores notas no IDEB.
No entanto, essa correlação não é muito forte, o que sugere que a qualidade da educação não depende apenas da escolarização, mas também de outros fatores estruturais e pedagógicos.
Para entender melhor essa relação, seria interessante calcular o coeficiente de correlação de Pearson e realizar análises complementares, como mapas espaciais ou regressões para verificar a influência de outras variáveis.
O Índice Global de Moran é uma medida que quantifica o nível de autocorrelação espacial em todo o conjunto de dados. Esse índice varia entre -1 e 1, onde valores positivos indicam agrupamento espacial (ou seja, municípios com taxas de escolarização semelhantes estão próximos uns dos outros), valores negativos sugerem um padrão de dispersão (municípios com taxas diferentes estão próximos), e valores próximos de zero indicam ausência de padrão espacial.
Ao calcular esse índice para a escolarização de crianças de 6 a 14 anos na Bahia e para o IDEB - anos iniciais em escolas públicas verificamos se há um padrão de agrupamento significativo, o que pode indicar desigualdades educacionais regionais. Um Moran Global positivo e significativo sugere que municípios com altas taxas de IDEB e escolarização tendem a estar próximos de outros com altas taxas, assim como os com baixas taxas tendem a estar próximos de outros com baixas taxas. Esse resultado pode refletir fatores socioeconômicos, acesso à infraestrutura educacional e políticas públicas locais
vizinhança <- nb2listw(rn_municipios.nb, style = "W", zero.policy = TRUE)
BAlobal <- moran.test(Shapedados$`Escolarização 6 á 14 anos`, listw = vizinhança)
print(BAlobal)
##
## Moran I test under randomisation
##
## data: Shapedados$`Escolarização 6 á 14 anos`
## weights: vizinhança
##
## Moran I statistic standard deviate = 6.521, p-value = 3.491e-11
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.191002275 -0.002403846 0.000879642
BAlobal_IDEB <- moran.test(Shapedados$`IDEB`, listw = vizinhança)
print(BAlobal_IDEB)
##
## Moran I test under randomisation
##
## data: Shapedados$IDEB
## weights: vizinhança
##
## Moran I statistic standard deviate = 11.219, p-value < 2.2e-16
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.3313983198 -0.0024038462 0.0008853164
O Índice Local de Moran (LISA) expande o conceito do Índice Global de Moran, permitindo identificar clusters espaciais específicos dentro do conjunto de dados. Enquanto o Moran Global avalia o padrão espacial como um todo, o Moran Local permite analisar a distribuição espacial de cada município individualmente, indicando se há agrupamentos significativos de altas ou baixas taxas de escolarização.
LISA Escolarização
## [1] 417 5
## Ii E.Ii Var.Ii Z.Ii Pr(z != E(Ii))
## 1 0.02229868 -2.890612e-06 0.0001984765 1.5830003 0.1134214
## 2 0.04827898 -5.013660e-04 0.1042306454 0.1510940 0.8799016
## 3 0.03113931 -8.545794e-04 0.0883703001 0.1076252 0.9142930
## 4 -0.16401423 -1.067644e-03 0.0880891036 -0.5490150 0.5829952
## 5 -0.02871069 -2.686424e-05 0.0013766422 -0.7730837 0.4394728
## 6 -0.40053104 -1.848974e-03 0.1524357427 -1.0211353 0.3071903
LISA IDEB
## [1] 417 5
## Ii E.Ii Var.Ii Z.Ii Pr(z != E(Ii))
## 1 1.06260720 -0.0056265036 0.38415696 1.72350252 0.08479769
## 2 -0.08233491 -0.0079303128 1.63640502 -0.05816401 0.95361799
## 3 0.64766619 -0.0009185191 0.09497609 2.10455153 0.03533036
## 4 0.19355476 -0.0056265036 0.46211272 0.29300465 0.76951860
## 5 0.73618694 -0.0034095838 0.17413104 1.77237967 0.07633155
## 6 -0.14949265 -0.0003549796 0.02930954 -0.87112983 0.38368327
Local de Moran com Permutações para ajuste de P-valor
## Ii E.Ii Var.Ii Z.Ii Pr(z != E(Ii))
## 1 0.02229868 0.0006696886 0.0001871279 1.5811284 0.1138487
## 2 0.04827898 0.0103647071 0.1098007495 0.1144195 0.9089052
## 3 0.03113931 -0.0087347678 0.0849999486 0.1367670 0.8912150
## 4 -0.16401423 0.0012508104 0.0953047185 -0.5353327 0.5924198
## 5 -0.02871069 0.0018058814 0.0013413280 -0.8332364 0.4047114
## 6 -0.40053104 -0.0099764229 0.1527509219 -0.9992861 0.3176561
## Pr(z != E(Ii)) Sim Pr(folded) Sim Skewness Kurtosis
## 1 0.078 0.040 -0.6217566 0.7109007
## 2 0.784 0.402 1.0289476 1.9842300
## 3 0.956 0.483 -0.7084839 1.2363131
## 4 0.544 0.272 -0.7297872 1.1010526
## 5 0.408 0.203 0.5615668 0.4042496
## 6 0.290 0.145 -0.6679673 1.0455600
MCi2 <- localmoran_perm(Shapedados$`IDEB`, vizinhança, nsim = 999)
MCi.df2 <- as.data.frame(MCi2)
head(MCi.df2)
## Ii E.Ii Var.Ii Z.Ii Pr(z != E(Ii))
## 1 1.06260720 -0.001841505 0.40137035 1.68016562 0.09292510
## 2 -0.08233491 -0.054736344 1.41301921 -0.02321734 0.98147691
## 3 0.64766619 0.011229483 0.09369780 2.07917249 0.03760150
## 4 0.19355476 0.018502982 0.43539486 0.26529243 0.79078419
## 5 0.73618694 -0.022751910 0.18400967 1.76923884 0.07685402
## 6 -0.14949265 0.002829729 0.03084352 -0.86732471 0.38576412
## Pr(z != E(Ii)) Sim Pr(folded) Sim Skewness Kurtosis
## 1 0.116 0.059 0.2592691 0.117823696
## 2 0.970 0.497 0.4691218 0.240904453
## 3 0.020 0.012 -0.3307699 0.227023574
## 4 0.764 0.382 0.3449944 0.172007254
## 5 0.058 0.030 -0.2576639 -0.007560691
## 6 0.358 0.179 0.3051976 0.076219200
Shapedados$p2 <- MCi.df2$`Pr(folded)`
Na análise espacial, a identificação de hotsposts é usada para detectar padrões estatísticamente significativos de alta ou baixa concentração de uma variável em uma região geográfica. O Ajuste de P-valor é essencial para reduzir a ocorrência de Falsos Positivos ao interpretar esses clusters.
Áreas High-High: Municípios com alta escolarização
cercados por outros com alta escolarização.
Áreas Low-Low: Municípios com baixa escolarização
cercados por outros com baixa escolarização.
Áreas High-Low e Low-High: Municípios onde a
escolarização difere de seus vizinhos.
## Ii E.Ii Var.Ii Z.Ii Pr(z != E(Ii))
## 1 0.02229868 -2.890612e-06 0.0001984765 1.5830003 0.1134214
## 2 0.04827898 -5.013660e-04 0.1042306454 0.1510940 0.8799016
## 3 0.03113931 -8.545794e-04 0.0883703001 0.1076252 0.9142930
## 4 -0.16401423 -1.067644e-03 0.0880891036 -0.5490150 0.5829952
## 5 -0.02871069 -2.686424e-05 0.0013766422 -0.7730837 0.4394728
## 6 -0.40053104 -1.848974e-03 0.1524357427 -1.0211353 0.3071903
## Ii E.Ii Var.Ii Z.Ii Pr(z != E(Ii))
## 1 1.06260720 -0.0056265036 0.38415696 1.72350252 0.08479769
## 2 -0.08233491 -0.0079303128 1.63640502 -0.05816401 0.95361799
## 3 0.64766619 -0.0009185191 0.09497609 2.10455153 0.03533036
## 4 0.19355476 -0.0056265036 0.46211272 0.29300465 0.76951860
## 5 0.73618694 -0.0034095838 0.17413104 1.77237967 0.07633155
## 6 -0.14949265 -0.0003549796 0.02930954 -0.87112983 0.38368327
Os mapas permitem analisar visualmente as variáveis e a estatística de Moran local.
Interpretação esperada:
Padrões significativos:
Se muitas áreas tiverem p-valores baixos
(<0.05), significa que os padrões espaciais
são estatisticamente significativos.
Ausência de clusters:
Se houver grandes áreas brancas (p-valor
alto), isso sugere que não há evidências de clusters
espaciais significativos.
A análise espacial da escolarização e do IDEB nos municípios da Bahia revelou padrões relevantes na distribuição desses indicadores. Ambos apresentaram uma certa correlação positiva entre municípios vizinhos, indicando que o desempenho educacional de um município tende a influenciar o de seus vizinhos, tanto positiva quanto negativamente.
Além disso, a análise de autocorrelação espacial demonstrou uma forte dependência espacial, evidenciando a formação de clusters de municípios com altos e baixos níveis de escolarização e IDEB. Esse padrão reforça a necessidade de políticas educacionais regionais para reduzir desigualdades e promover um desenvolvimento mais equilibrado.
No entanto, a correlação entre a taxa de escolarização e o IDEB se mostrou relativamente fraca, indicando que nem todos os municípios com alta taxa de escolarização necessariamente apresentam melhores desempenhos no IDEB. Isso sugere que outros fatores, como qualidade do ensino, infraestrutura escolar e condições socioeconômicas, também desempenham um papel fundamental no desempenho educacional.
Por fim, essa análise é de extrema importância para o planejamento de políticas públicas voltadas à educação, fornecendo insights valiosos para a formulação de estratégias que busquem igualar as condições sociais e educacionais em todo o estado da Bahia.