Universidade Estadual da Paraíba-UEPB
Centro de Ciências e Tecnologia-CCT
Departamento de Estatística
Aluno: Hélder de Almeida Ferreira

Introdução

Este relatório apresenta a análise espacial dos dados de escolarização e do IDEB - (anos iniciais em escolas públicas) no estado da Bahia, utilizando as bibliotecas tmap para a criação de mapas e spdep para análises espaciais.

Objetivos

O objetivo dessa análise é explorar a distribuição espacial desse indicadores nos municípios baianos e verificar a autocorrelação espacial entre os municípios.

Características do Estado da Bahia

A Bahia é o maior estado da região Nordeste do Brasil, com 417 municípios e uma grande diversidade geográfica, econômica e social. O estado possui áreas metropolitanas desenvolvidas, como Salvador e Feira de Santana, mas também apresenta extensas regiões rurais e semiáridas, onde o acesso à educação e à infraestrutura é um desafio significativo. Essa heterogeneidade faz com que a taxa de escolarização e o IDEB - nos anos iniciais em escolas públicas variem consideravelmente entre os municípios.

O estudo da relação entre a taxa de escolarização e o IDEB é fundamental para compreender como as condições regionais influenciam a qualidade e o acesso à educação, além de identificar padrões espaciais que revelem desigualdades educacionais. Municípios com melhores indicadores socioeconômicos tendem a apresentar maior taxa de escolarização e melhores resultados no IDEB, enquanto áreas com menores recursos podem enfrentar desafios na oferta de ensino de qualidade.

Bibliotecas Necessárias

library(sf)
library(spdep)
library(tmap)
library(ggplot2)
library(RColorBrewer)
library(dplyr)
library(readxl)
library(ggspatial)
library(sp)
library(classInt)
library(mapview)
library(spData)

Carregando o Shapefile da Bahia

ShapeBA <- st_read("C:/Users/helde/Downloads/BA_Municipios_2023/BA_Municipios_2023.shp")
## Reading layer `BA_Municipios_2023' from data source 
##   `C:\Users\helde\Downloads\BA_Municipios_2023\BA_Municipios_2023.shp' 
##   using driver `ESRI Shapefile'
## Simple feature collection with 417 features and 3 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: -46.57728 ymin: -18.34856 xmax: -37.34115 ymax: -8.532821
## Geodetic CRS:  SIRGAS 2000

Visualizando as camadas do Shapefile

plot(ShapeBA)

Visualizando o Shape em estudo

Carregando e Mesclando a Base de Dados

dados <- read_excel("C:/Users/helde/Downloads/BA_Municipios_2023/dados_bahia.xls")
dados <- as.data.frame(dados)
Shapedados <- merge(ShapeBA, dados, by.x = "NM_MUN", by.y = "Município", all.x = TRUE)
Características do Banco de Dados

Os dados utilizados foram disponibilizados pelo IBGE. E pelo QEDU e possuem as seguintes variáveis:

  • IDEB - Anos iniciais em escolas públicas Índice de Desenvolvimento da Educação Básica que mede a qualidade do ensino no Brasil

  • Escolarização de Crianças de 6 a 14 anos (%): Representa o nível de escolaridade média na faixa etária.

Análise Descritiva

Nesta etapa iremos realizar uma análise descritiva dos indicadores para vizualizarmos melhor as váriaveis em estudo

Resumo Estatístico

summary(Shapedados$`IDEB`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.300   4.500   4.800   4.932   5.300   7.800
summary(Shapedados$`Escolarização 6 á 14 anos`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   89.90   96.50   97.40   97.15   98.10   99.70

Mapa do IDEB

O mapa mostra a distribuição do IDEB, destacando diferenças regionais. Podemos Observar Municipios com alto indíce de desnevolvimento (Tons cinza escuro) e Municípios com baixos indíces de desenvolvimento (Tons mais claros)

Municípios com Menor e Maior IDEB na Bahia

Municípios com Menor IDEB

Municípios IDEB
APORÁ 3.3
ARATACA 3.3
ITAPEBI 3.3
ESPLANADA 3.5
ITABELA 3.5

Municípios com Maior IDEB

Municípios IDEB
LICÍNIO DE ALMEIDA 7.8
ITATIM 7.7
JACARACI 7.3
NOVO HORIZONTE 7.1
MORTUGABA 7.0

Histograma do IDEB - anos iniciais em escolas públicas na bahia

Mapa da Taxa de Escolarização

O mapa mostra a distribuição da taxa de escolarização de crianças de 6 a 14 anos na Bahia, destacando diferenças regionais. Municípios litorâneos e próximos a centros urbanos apresentam taxas mais altas (tons mais escuros), indicando melhor infraestrutura educacional e acesso à escola. Já regiões mais afastadas e no interior têm taxas mais baixas (tons claros), sugerindo desafios estruturais e socioeconômicos.

Municípios com Menor e Maior Escolarização na Bahia

Municípios com Menor Escolarização(%)

Municípios (%)
Caatiba 89.9
Teolândia 90.5
Olindina 91.4
Buerarema 91.5
Jucuruçu 91.5

Municípios com Maior Escolarização(%)

Municípios (%)
Mortugaba 99.7
Santana 99.7
São Felipe 99.7
Elisio Medrado 99.6
Dom Macedo Costa 99.3

Histograma para Taxa de Escolarização de crianças de 6 a 14 anos O histograma apresenta uma distribuição assimétrica à esquerda, indicando que a maioria dos municípios possui taxas de escolarização elevadas.

Analise de Autocorrelação Espacial

Nesta etapa vamos investigar se as variaveis Escolarização de Crianças de 6 á 14 anos e IDEB - anos iniciais em escolas públicas no município da Bahia apresenta algum padrão espacial, ou seja se os municípios com taxas semelhantes de escolariação e do IDEB estão próximos uns aos outros. Sendo assim utilizaremos alguns métodos de analise espaçial. E realizar também uma análise entre os dois indicaodres para verificar se há correlação entre eles.

Estrutura de Vizinhança Espacial

Primeiro criamos uma estrutura de vizinhaça espacial, onde cada município é considerado vizinho se compartilha uma fronteira com outro. Utilizaremos o critério de vizinhaça de queen (ou método da rainha), que considera os municípios adjacentes.

rn_municipios.nb <- poly2nb(Shapedados, queen=TRUE)

Diagrama de Dispersão de Moran (Moran Scatterplot) Para Escolarização

O gráfico de dispersão (Moran Scatterplot) apresenta a relação entre a taxa de escolarização de cada município baiano e a taxa média de escolarização considerando seus municípios vizinhos.

Principais Observações

  • Observa-se uma leve inclinação positiva na linha da tendência, indicando que de forma geral, municípios com maior taxa de escolarização tendem a ter uma taxa média de escolarização levemente maior entre seus vizinhos. no entanto, a inclinação e sutíl,sugerindo uma correlação fraca.
  • A dispersão dos pontos ao redor da linha de tendência é significativa. Isso indica uma variabilidade considerável nos dados, sugerindo que há outros fatores além da taxa de escolarização que influenciam a média de escolarização dos municípios vizinhos.
  • Alguns municípios se destacam como outliers, ou seja, apresentam valores muito diferentes da tendência geral.

Distribuição dos Municípios nos Quadrantes

A análise do Moran Scatterplot mostra a seguinte distribuição dos municípios:

  • 161 municípios no quadrante (++): Municípios com taxas de escolarização altas, cercados por vizinhos com taxas também elevadas.
  • 101 municípios no quadrante (–): Municípios com baixa escolarização, cercados por vizinhos com desempenho igualmente baixo.
  • 79 municípios no quadrante (+-): Municípios com alta escolarização, cercados por vizinhos com baixa taxa de escolarização.
  • 76 municípios no quadrante (-+): Municípios com baixa escolarização, cercados por vizinhos com alta taxa de escolarização.

Interpretação da Distribuição

A presença de 161 municípios no quadrante (++) e 111 no quadrante (–) indica que há uma forte tendência de dependência espacial positiva, ou seja, municípios tendem a compartilhar padrões semelhantes com seus vizinhos.

Já os 79 municípios no quadrante (+-) e 76 no (-+) sugerem a existência de áreas de contraste, onde a escolarização de um município não segue a tendência de seus vizinhos, possivelmente devido a diferenças estruturais, políticas públicas locais ou condições socioeconômicas específicas.

Considerações Finais

Os resultados sugerem que há um padrão regional na escolarização dos municípios baianos, com alguns municípios destoando significativamente. Essas diferenças podem estar relacionadas a investimentos educacionais locais, condições socioeconômicas ou fatores geográficos.

Diagrama de dispersão de Moran Para IDEB - anos iniciais em escolas públicas O gráfico de dispersão (Moran Scatterplot) apresenta a relação entre a taxa do IDEB de cada município baiano e a taxa média do IDEB considerando seus municípios vizinhos.

Principais Observações

A presença de uma tendência positiva (linha preta inclinada para cima) sugere que há um certo efeito espacial positivo. Ou seja, municípios com IDEB alto tendem a estar próximos de outros municípios com IDEB alto, e municípios com IDEB baixo tendem a estar próximos de outros com IDEB baixo.

Isso indica que a qualidade da educação (medida pelo IDEB) não é distribuída de forma completamente aleatória no estado, mas sim que existem clusters regionais de municípios com desempenhos educacionais similares.

Distribuição dos Municípios nos Quadrantes

A análise do Moran Scatterplot mostra a seguinte distribuição dos municípios:

  • 116 municípios no quadrante (++): Municípios com taxas de escolarização altas, cercados por vizinhos com taxas também elevadas.
  • 153 municípios no quadrante (–): Municípios com baixa escolarização, cercados por vizinhos com desempenho igualmente baixo.
  • 65 municípios no quadrante (+-): Municípios com alta escolarização, cercados por vizinhos com baixa taxa de escolarização.
  • 83 municípios no quadrante (-+): Municípios com baixa escolarização, cercados por vizinhos com alta taxa de escolarização.
    ### Considerações Finais

Este gráfico sugere que há uma dependência espacial no IDEB dos anos iniciais na Bahia em escolas públicas. Isso significa que a qualidade da educação em um município pode estar influenciada pela qualidade educacional de seus municípios vizinhos. A identificação desses padrões pode ajudar na formulação de políticas públicas educacionais focadas em regiões que apresentam desempenho abaixo da média.

Correlação entre o IDEB e a taxa de escolarização na Bahia — O gráfico de dispersão apresenta a relação entre o IDEB (eixo X) e a Taxa de Escolarização (%) (eixo Y). A linha vermelha representa a tendência da correlação entre essas duas variáveis.

Principais Observações

1.Tendência Positiva:

A inclinação positiva da linha vermelha indica que há uma correlação positiva entre o IDEB e a Taxa de Escolarização. Ou seja, municípios com um IDEB mais alto tendem a apresentar uma taxa de escolarização maior. No entanto, essa correlação não parece ser muito forte, já que a dispersão dos pontos em torno da linha de tendência é grande.

2.Distribuição dos Dados:

A maioria dos municípios apresenta uma taxa de escolarização acima de 95%, o que sugere que o acesso à escola já é elevado na maior parte dos municípios analisados. Há alguns pontos abaixo dos 95%, indicando municípios com menor taxa de escolarização, mas eles são minoria.

3.Correlação Fraca a Moderada:

Apesar da tendência positiva, os pontos estão bastante dispersos ao redor da linha de tendência, o que sugere que o IDEB e a Taxa de Escolarização não estão fortemente correlacionados. Isso indica que, embora a escolarização seja um fator importante, outros elementos (como qualidade do ensino, infraestrutura escolar, investimento público, formação de professores, entre outros) também influenciam diretamente o IDEB.

Conclusão

Existe uma correlação positiva entre a taxa de escolarização e o IDEB, ou seja, municípios com maior escolarização tendem a ter melhores notas no IDEB.

No entanto, essa correlação não é muito forte, o que sugere que a qualidade da educação não depende apenas da escolarização, mas também de outros fatores estruturais e pedagógicos.

Para entender melhor essa relação, seria interessante calcular o coeficiente de correlação de Pearson e realizar análises complementares, como mapas espaciais ou regressões para verificar a influência de outras variáveis.

Índice de Moran Global

O Índice Global de Moran é uma medida que quantifica o nível de autocorrelação espacial em todo o conjunto de dados. Esse índice varia entre -1 e 1, onde valores positivos indicam agrupamento espacial (ou seja, municípios com taxas de escolarização semelhantes estão próximos uns dos outros), valores negativos sugerem um padrão de dispersão (municípios com taxas diferentes estão próximos), e valores próximos de zero indicam ausência de padrão espacial.

Ao calcular esse índice para a escolarização de crianças de 6 a 14 anos na Bahia e para o IDEB - anos iniciais em escolas públicas verificamos se há um padrão de agrupamento significativo, o que pode indicar desigualdades educacionais regionais. Um Moran Global positivo e significativo sugere que municípios com altas taxas de IDEB e escolarização tendem a estar próximos de outros com altas taxas, assim como os com baixas taxas tendem a estar próximos de outros com baixas taxas. Esse resultado pode refletir fatores socioeconômicos, acesso à infraestrutura educacional e políticas públicas locais

vizinhança <- nb2listw(rn_municipios.nb, style = "W", zero.policy = TRUE)
BAlobal <- moran.test(Shapedados$`Escolarização 6 á 14 anos`, listw = vizinhança)
print(BAlobal)
## 
##  Moran I test under randomisation
## 
## data:  Shapedados$`Escolarização 6 á 14 anos`  
## weights: vizinhança    
## 
## Moran I statistic standard deviate = 6.521, p-value = 3.491e-11
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##       0.191002275      -0.002403846       0.000879642
BAlobal_IDEB <- moran.test(Shapedados$`IDEB`, listw = vizinhança)
print(BAlobal_IDEB)
## 
##  Moran I test under randomisation
## 
## data:  Shapedados$IDEB  
## weights: vizinhança    
## 
## Moran I statistic standard deviate = 11.219, p-value < 2.2e-16
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##      0.3313983198     -0.0024038462      0.0008853164

Índice Local de Moran (LISA)

O Índice Local de Moran (LISA) expande o conceito do Índice Global de Moran, permitindo identificar clusters espaciais específicos dentro do conjunto de dados. Enquanto o Moran Global avalia o padrão espacial como um todo, o Moran Local permite analisar a distribuição espacial de cada município individualmente, indicando se há agrupamentos significativos de altas ou baixas taxas de escolarização.

LISA Escolarização

## [1] 417   5
##            Ii          E.Ii       Var.Ii       Z.Ii Pr(z != E(Ii))
## 1  0.02229868 -2.890612e-06 0.0001984765  1.5830003      0.1134214
## 2  0.04827898 -5.013660e-04 0.1042306454  0.1510940      0.8799016
## 3  0.03113931 -8.545794e-04 0.0883703001  0.1076252      0.9142930
## 4 -0.16401423 -1.067644e-03 0.0880891036 -0.5490150      0.5829952
## 5 -0.02871069 -2.686424e-05 0.0013766422 -0.7730837      0.4394728
## 6 -0.40053104 -1.848974e-03 0.1524357427 -1.0211353      0.3071903

LISA IDEB

## [1] 417   5
##            Ii          E.Ii     Var.Ii        Z.Ii Pr(z != E(Ii))
## 1  1.06260720 -0.0056265036 0.38415696  1.72350252     0.08479769
## 2 -0.08233491 -0.0079303128 1.63640502 -0.05816401     0.95361799
## 3  0.64766619 -0.0009185191 0.09497609  2.10455153     0.03533036
## 4  0.19355476 -0.0056265036 0.46211272  0.29300465     0.76951860
## 5  0.73618694 -0.0034095838 0.17413104  1.77237967     0.07633155
## 6 -0.14949265 -0.0003549796 0.02930954 -0.87112983     0.38368327

Local de Moran com Permutações para ajuste de P-valor

Ajustes Para a Escolarização

##            Ii          E.Ii       Var.Ii       Z.Ii Pr(z != E(Ii))
## 1  0.02229868  0.0006696886 0.0001871279  1.5811284      0.1138487
## 2  0.04827898  0.0103647071 0.1098007495  0.1144195      0.9089052
## 3  0.03113931 -0.0087347678 0.0849999486  0.1367670      0.8912150
## 4 -0.16401423  0.0012508104 0.0953047185 -0.5353327      0.5924198
## 5 -0.02871069  0.0018058814 0.0013413280 -0.8332364      0.4047114
## 6 -0.40053104 -0.0099764229 0.1527509219 -0.9992861      0.3176561
##   Pr(z != E(Ii)) Sim Pr(folded) Sim   Skewness  Kurtosis
## 1              0.078          0.040 -0.6217566 0.7109007
## 2              0.784          0.402  1.0289476 1.9842300
## 3              0.956          0.483 -0.7084839 1.2363131
## 4              0.544          0.272 -0.7297872 1.1010526
## 5              0.408          0.203  0.5615668 0.4042496
## 6              0.290          0.145 -0.6679673 1.0455600

Ajustes Para o IDEB

MCi2 <- localmoran_perm(Shapedados$`IDEB`, vizinhança, nsim = 999)
MCi.df2 <- as.data.frame(MCi2)
head(MCi.df2)
##            Ii         E.Ii     Var.Ii        Z.Ii Pr(z != E(Ii))
## 1  1.06260720 -0.001841505 0.40137035  1.68016562     0.09292510
## 2 -0.08233491 -0.054736344 1.41301921 -0.02321734     0.98147691
## 3  0.64766619  0.011229483 0.09369780  2.07917249     0.03760150
## 4  0.19355476  0.018502982 0.43539486  0.26529243     0.79078419
## 5  0.73618694 -0.022751910 0.18400967  1.76923884     0.07685402
## 6 -0.14949265  0.002829729 0.03084352 -0.86732471     0.38576412
##   Pr(z != E(Ii)) Sim Pr(folded) Sim   Skewness     Kurtosis
## 1              0.116          0.059  0.2592691  0.117823696
## 2              0.970          0.497  0.4691218  0.240904453
## 3              0.020          0.012 -0.3307699  0.227023574
## 4              0.764          0.382  0.3449944  0.172007254
## 5              0.058          0.030 -0.2576639 -0.007560691
## 6              0.358          0.179  0.3051976  0.076219200
Shapedados$p2 <- MCi.df2$`Pr(folded)`

variável de hotspots com ajuste de p-valor

Na análise espacial, a identificação de hotsposts é usada para detectar padrões estatísticamente significativos de alta ou baixa concentração de uma variável em uma região geográfica. O Ajuste de P-valor é essencial para reduzir a ocorrência de Falsos Positivos ao interpretar esses clusters.

Mapa de hotspots para Escolarização

Mapa de hotspots para O IDEB

Áreas High-High: Municípios com alta escolarização cercados por outros com alta escolarização.
Áreas Low-Low: Municípios com baixa escolarização cercados por outros com baixa escolarização.
Áreas High-Low e Low-High: Municípios onde a escolarização difere de seus vizinhos.

Calculando o Moran Local normal

Moran Local normal Para Escolarização

##            Ii          E.Ii       Var.Ii       Z.Ii Pr(z != E(Ii))
## 1  0.02229868 -2.890612e-06 0.0001984765  1.5830003      0.1134214
## 2  0.04827898 -5.013660e-04 0.1042306454  0.1510940      0.8799016
## 3  0.03113931 -8.545794e-04 0.0883703001  0.1076252      0.9142930
## 4 -0.16401423 -1.067644e-03 0.0880891036 -0.5490150      0.5829952
## 5 -0.02871069 -2.686424e-05 0.0013766422 -0.7730837      0.4394728
## 6 -0.40053104 -1.848974e-03 0.1524357427 -1.0211353      0.3071903

Moran Local normal Para o IDEB

##            Ii          E.Ii     Var.Ii        Z.Ii Pr(z != E(Ii))
## 1  1.06260720 -0.0056265036 0.38415696  1.72350252     0.08479769
## 2 -0.08233491 -0.0079303128 1.63640502 -0.05816401     0.95361799
## 3  0.64766619 -0.0009185191 0.09497609  2.10455153     0.03533036
## 4  0.19355476 -0.0056265036 0.46211272  0.29300465     0.76951860
## 5  0.73618694 -0.0034095838 0.17413104  1.77237967     0.07633155
## 6 -0.14949265 -0.0003549796 0.02930954 -0.87112983     0.38368327

Mapas interativos Escolarização

mapas interativos IDEB

Os mapas permitem analisar visualmente as variáveis e a estatística de Moran local.

  • O Z-score no mapa indica onde a autocorrelação espacial é mais forte.
  • O p-value revela a significância estatística dos padrões espaciais.(P <0.05 significa que o cluster ou outlier é relevante)

Interpretação esperada:

Padrões significativos:
Se muitas áreas tiverem p-valores baixos (<0.05), significa que os padrões espaciais são estatisticamente significativos.

Ausência de clusters:
Se houver grandes áreas brancas (p-valor alto), isso sugere que não há evidências de clusters espaciais significativos.

Conclusão

A análise espacial da escolarização e do IDEB nos municípios da Bahia revelou padrões relevantes na distribuição desses indicadores. Ambos apresentaram uma certa correlação positiva entre municípios vizinhos, indicando que o desempenho educacional de um município tende a influenciar o de seus vizinhos, tanto positiva quanto negativamente.

Além disso, a análise de autocorrelação espacial demonstrou uma forte dependência espacial, evidenciando a formação de clusters de municípios com altos e baixos níveis de escolarização e IDEB. Esse padrão reforça a necessidade de políticas educacionais regionais para reduzir desigualdades e promover um desenvolvimento mais equilibrado.

No entanto, a correlação entre a taxa de escolarização e o IDEB se mostrou relativamente fraca, indicando que nem todos os municípios com alta taxa de escolarização necessariamente apresentam melhores desempenhos no IDEB. Isso sugere que outros fatores, como qualidade do ensino, infraestrutura escolar e condições socioeconômicas, também desempenham um papel fundamental no desempenho educacional.

Por fim, essa análise é de extrema importância para o planejamento de políticas públicas voltadas à educação, fornecendo insights valiosos para a formulação de estratégias que busquem igualar as condições sociais e educacionais em todo o estado da Bahia.