Introdução

Esta é uma Exploratory Data Analysis, ou Análise Exploratória de Dados do conjunto de dado provenientes do senso educacional de 2025 agregados aos dados do IBGE sobre demografia dos municípios do Brasil. Atualmente, todas essas fontes estão no data_pipeline do projeto EduMaps, criado e codificado pelo mesmo autor.

Classificando porte de municipios

Metodologia de Agregação

Os scores médios municipais são calculados a partir dos indicadores individuais de cada escola pertencente ao município, extraídos do Censo Escolar. Portanto, o valor municipal representa a média aritmética simples do desempenho das unidades escolares daquela localidade.

Abaixo um rápido perfil do dataset.

Data summary
Name df_analise
Number of rows 5571
Number of columns 42
_______________________
Column type frequency:
character 15
factor 1
numeric 26
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
co_municipio 0 1 7 7 0 5571 0
no_municipio 0 1 3 32 0 5298 0
sg_uf 0 1 2 2 0 27 0
no_regiao 0 1 3 12 0 5 0
total_escolas 0 1 19 21 0 281 0
escolas_publicas 0 1 19 21 0 233 0
escolas_privadas 0 1 1 21 0 155 0
escolas_urbanas 0 1 1 21 0 254 0
escolas_rurais 0 1 1 21 0 139 0
total_alunos 0 1 18 21 0 4040 0
alunos_infantil 0 1 18 21 0 2247 0
alunos_fundamental 0 1 17 21 0 3344 0
alunos_medio 0 1 1 21 0 1957 0
alunos_eja 0 1 1 21 0 1273 0
total_docentes 0 1 18 21 0 1280 0

Variable type: factor

skim_variable n_missing complete_rate ordered n_unique top_counts
faixa_demografica 0 1 FALSE 5 5k–: 2533, 20k: 1414, Até: 1286, 100: 290

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
perc_docentes_superior 0 1.00 88.76 11.61 13.10 84.98 92.76 96.46 100.00 ▁▁▁▂▇
perc_docentes_concursados 0 1.00 48.65 15.83 3.62 37.42 47.99 59.20 100.00 ▁▆▇▃▁
score_infra_medio 0 1.00 7.38 2.02 0.69 6.00 7.74 9.04 10.00 ▁▂▃▆▇
score_tecnologia_medio 0 1.00 5.39 1.67 0.31 4.27 5.64 6.67 10.00 ▁▅▇▇▁
score_acessibilidade_medio 0 1.00 3.23 1.42 0.07 2.13 3.23 4.28 8.23 ▃▇▇▂▁
score_gestao_medio 0 1.00 3.27 1.36 0.00 2.34 3.31 4.24 10.63 ▃▇▃▁▁
ideb_fund_i 3 1.00 6.70 0.97 3.60 6.00 6.80 7.40 10.00 ▁▅▇▃▁
ideb_fund_ii 1 1.00 5.50 0.79 3.00 5.00 5.50 6.00 9.30 ▁▇▇▁▁
ideb_medio 184 0.97 4.65 0.84 1.90 4.10 4.60 5.10 8.40 ▁▇▇▂▁
ano_ideb 1 1.00 2022.99 0.10 2021.00 2023.00 2023.00 2023.00 2023.00 ▁▁▁▁▇
populacao_estimada.x 0 1.00 38309.29 217419.51 856.00 5348.50 11355.00 25299.00 11904961.00 ▇▁▁▁▁
pop_0_a_14 0 1.00 7203.24 36084.46 0.00 1009.00 2294.00 5307.50 1953306.00 ▇▁▁▁▁
pop_15_a_24 0 1.00 5356.74 28585.11 0.00 730.00 1662.00 3765.00 1565926.00 ▇▁▁▁▁
pop_25_a_59 0 1.00 15351.98 90150.59 0.00 2123.50 4482.00 9829.00 5026842.00 ▇▁▁▁▁
pop_60_mais 0 1.00 5660.34 35567.12 0.00 929.00 1792.00 3745.50 1980394.00 ▇▁▁▁▁
pib_total 1 1.00 1617978.82 13774580.53 18051.00 112636.00 253180.00 680951.50 828980747.00 ▇▁▁▁▁
pib_per_capita 1 1.00 33327.12 37812.94 5145.05 13227.82 23790.03 40370.85 881936.03 ▇▁▁▁▁
agro_percent 1 1.00 0.23 0.18 0.00 0.08 0.18 0.34 1.37 ▇▃▁▁▁
industria_percent 1 1.00 0.13 0.17 -6.87 0.04 0.07 0.17 0.91 ▁▁▁▁▇
servicos_percent 1 1.00 0.36 0.16 0.03 0.26 0.34 0.45 5.65 ▇▁▁▁▁
governo_percent 1 1.00 0.28 0.17 0.01 0.15 0.25 0.41 0.84 ▇▇▅▃▁
ano_pib 1 1.00 2021.00 0.00 2021.00 2021.00 2021.00 2021.00 2021.00 ▁▁▇▁▁
alunos_por_1000_hab 0 1.00 220.29 49.45 96.79 187.68 213.01 242.91 548.58 ▃▇▁▁▁
alunos_por_docente 0 1.00 13.93 3.60 4.80 11.40 13.60 16.10 36.30 ▃▇▂▁▁
alunos_por_escola 0 1.00 171.11 82.54 20.00 111.00 158.00 217.00 711.00 ▇▇▁▁▁
populacao_estimada.y 0 1.00 38309.29 217419.51 856.00 5348.50 11355.00 25299.00 11904961.00 ▇▁▁▁▁

Análises por faixas demográficas

Para a primeira etapa da análise, os municípios foram estratificados em cinco faixas populacionais:

Esta segmentação permite investigar como a escala urbana influencia a distribuição de recursos e indicadores educacionais.

Infraestrutura das escolas

O score de infraestrutura avalia itens críticos como acesso a serviços básicos (água, luz e saneamento), recursos tecnológicos (internet e laboratórios) e equipamentos esportivos (quadras e piscinas).

  • acesso à luz, água, saneamento básico.
  • acesso à internet e laboratórios.
  • acesso à quadras, piscinas, infraestrutura relacionadas ao esporte.

O gráfico indica que a infraestrutura mantém uma média consistente, em torno de 7.5, em todas as faixas. Nota-se, contudo, que:

  • Municípios pequenos (<5k): Apresentam maior dispersão (variabilidade), sugerindo uma desigualdade interna mais acentuada entre escolas.
  • Municípios de médio-grande porte (100k–500k): Demonstram maior homogeneidade (baixa variabilidade) e índices ligeiramente superiores, superando inclusive as metrópoles (>500k) em consistência de infraestrutura.

Índice Alunos por docentes (ou razão Alunos/Docente)

Este indicador revela um comportamento linear e diretamente proporcional ao tamanho da população: quanto maior o município, maior a razão aluno/docente. A baixa variabilidade dentro das faixas indica que esta é uma característica estrutural consolidada do modelo de organização escolar conforme o porte da cidade.

O gráfico é interessante, mostra uma relação bem comportada da média de alunos por docente de acordo com a faixa populacional, mostrando que à medida que os municípios crescem (maior população) cresce a razão de alunos/docente. E com pouca variabilidade dentro das faixas.

Demais variáveis

Aqui continuamos as análises via gráfico das demais variáveis sem nos deter em nenhum comentário.

Recorte regional

Agora vamos à mesma análise, porém fazendo o recorte regional.

Regiao e Faixa populacional lado-a-lado

Podemos agora fazer o recorte usando a Região como base, o que é geralmente o caso pois estamos interessados nas desigualdades regionais que são bem estudadas e conhecidas.

Para isso vamos utilizar os mesmos gráficos anteriores, colocando lado a lado cada um.