Esta é uma Exploratory Data Analysis, ou Análise Exploratória de Dados do conjunto de dado provenientes do senso educacional de 2025 agregados aos dados do IBGE sobre demografia dos municípios do Brasil. Atualmente, todas essas fontes estão no data_pipeline do projeto EduMaps, criado e codificado pelo mesmo autor.
Os scores médios municipais são calculados a partir dos indicadores individuais de cada escola pertencente ao município, extraídos do Censo Escolar. Portanto, o valor municipal representa a média aritmética simples do desempenho das unidades escolares daquela localidade.
Abaixo um rápido perfil do dataset.
| Name | df_analise |
| Number of rows | 5571 |
| Number of columns | 42 |
| _______________________ | |
| Column type frequency: | |
| character | 15 |
| factor | 1 |
| numeric | 26 |
| ________________________ | |
| Group variables | None |
Variable type: character
| skim_variable | n_missing | complete_rate | min | max | empty | n_unique | whitespace |
|---|---|---|---|---|---|---|---|
| co_municipio | 0 | 1 | 7 | 7 | 0 | 5571 | 0 |
| no_municipio | 0 | 1 | 3 | 32 | 0 | 5298 | 0 |
| sg_uf | 0 | 1 | 2 | 2 | 0 | 27 | 0 |
| no_regiao | 0 | 1 | 3 | 12 | 0 | 5 | 0 |
| total_escolas | 0 | 1 | 19 | 21 | 0 | 281 | 0 |
| escolas_publicas | 0 | 1 | 19 | 21 | 0 | 233 | 0 |
| escolas_privadas | 0 | 1 | 1 | 21 | 0 | 155 | 0 |
| escolas_urbanas | 0 | 1 | 1 | 21 | 0 | 254 | 0 |
| escolas_rurais | 0 | 1 | 1 | 21 | 0 | 139 | 0 |
| total_alunos | 0 | 1 | 18 | 21 | 0 | 4040 | 0 |
| alunos_infantil | 0 | 1 | 18 | 21 | 0 | 2247 | 0 |
| alunos_fundamental | 0 | 1 | 17 | 21 | 0 | 3344 | 0 |
| alunos_medio | 0 | 1 | 1 | 21 | 0 | 1957 | 0 |
| alunos_eja | 0 | 1 | 1 | 21 | 0 | 1273 | 0 |
| total_docentes | 0 | 1 | 18 | 21 | 0 | 1280 | 0 |
Variable type: factor
| skim_variable | n_missing | complete_rate | ordered | n_unique | top_counts |
|---|---|---|---|---|---|
| faixa_demografica | 0 | 1 | FALSE | 5 | 5k–: 2533, 20k: 1414, Até: 1286, 100: 290 |
Variable type: numeric
| skim_variable | n_missing | complete_rate | mean | sd | p0 | p25 | p50 | p75 | p100 | hist |
|---|---|---|---|---|---|---|---|---|---|---|
| perc_docentes_superior | 0 | 1.00 | 88.76 | 11.61 | 13.10 | 84.98 | 92.76 | 96.46 | 100.00 | ▁▁▁▂▇ |
| perc_docentes_concursados | 0 | 1.00 | 48.65 | 15.83 | 3.62 | 37.42 | 47.99 | 59.20 | 100.00 | ▁▆▇▃▁ |
| score_infra_medio | 0 | 1.00 | 7.38 | 2.02 | 0.69 | 6.00 | 7.74 | 9.04 | 10.00 | ▁▂▃▆▇ |
| score_tecnologia_medio | 0 | 1.00 | 5.39 | 1.67 | 0.31 | 4.27 | 5.64 | 6.67 | 10.00 | ▁▅▇▇▁ |
| score_acessibilidade_medio | 0 | 1.00 | 3.23 | 1.42 | 0.07 | 2.13 | 3.23 | 4.28 | 8.23 | ▃▇▇▂▁ |
| score_gestao_medio | 0 | 1.00 | 3.27 | 1.36 | 0.00 | 2.34 | 3.31 | 4.24 | 10.63 | ▃▇▃▁▁ |
| ideb_fund_i | 3 | 1.00 | 6.70 | 0.97 | 3.60 | 6.00 | 6.80 | 7.40 | 10.00 | ▁▅▇▃▁ |
| ideb_fund_ii | 1 | 1.00 | 5.50 | 0.79 | 3.00 | 5.00 | 5.50 | 6.00 | 9.30 | ▁▇▇▁▁ |
| ideb_medio | 184 | 0.97 | 4.65 | 0.84 | 1.90 | 4.10 | 4.60 | 5.10 | 8.40 | ▁▇▇▂▁ |
| ano_ideb | 1 | 1.00 | 2022.99 | 0.10 | 2021.00 | 2023.00 | 2023.00 | 2023.00 | 2023.00 | ▁▁▁▁▇ |
| populacao_estimada.x | 0 | 1.00 | 38309.29 | 217419.51 | 856.00 | 5348.50 | 11355.00 | 25299.00 | 11904961.00 | ▇▁▁▁▁ |
| pop_0_a_14 | 0 | 1.00 | 7203.24 | 36084.46 | 0.00 | 1009.00 | 2294.00 | 5307.50 | 1953306.00 | ▇▁▁▁▁ |
| pop_15_a_24 | 0 | 1.00 | 5356.74 | 28585.11 | 0.00 | 730.00 | 1662.00 | 3765.00 | 1565926.00 | ▇▁▁▁▁ |
| pop_25_a_59 | 0 | 1.00 | 15351.98 | 90150.59 | 0.00 | 2123.50 | 4482.00 | 9829.00 | 5026842.00 | ▇▁▁▁▁ |
| pop_60_mais | 0 | 1.00 | 5660.34 | 35567.12 | 0.00 | 929.00 | 1792.00 | 3745.50 | 1980394.00 | ▇▁▁▁▁ |
| pib_total | 1 | 1.00 | 1617978.82 | 13774580.53 | 18051.00 | 112636.00 | 253180.00 | 680951.50 | 828980747.00 | ▇▁▁▁▁ |
| pib_per_capita | 1 | 1.00 | 33327.12 | 37812.94 | 5145.05 | 13227.82 | 23790.03 | 40370.85 | 881936.03 | ▇▁▁▁▁ |
| agro_percent | 1 | 1.00 | 0.23 | 0.18 | 0.00 | 0.08 | 0.18 | 0.34 | 1.37 | ▇▃▁▁▁ |
| industria_percent | 1 | 1.00 | 0.13 | 0.17 | -6.87 | 0.04 | 0.07 | 0.17 | 0.91 | ▁▁▁▁▇ |
| servicos_percent | 1 | 1.00 | 0.36 | 0.16 | 0.03 | 0.26 | 0.34 | 0.45 | 5.65 | ▇▁▁▁▁ |
| governo_percent | 1 | 1.00 | 0.28 | 0.17 | 0.01 | 0.15 | 0.25 | 0.41 | 0.84 | ▇▇▅▃▁ |
| ano_pib | 1 | 1.00 | 2021.00 | 0.00 | 2021.00 | 2021.00 | 2021.00 | 2021.00 | 2021.00 | ▁▁▇▁▁ |
| alunos_por_1000_hab | 0 | 1.00 | 220.29 | 49.45 | 96.79 | 187.68 | 213.01 | 242.91 | 548.58 | ▃▇▁▁▁ |
| alunos_por_docente | 0 | 1.00 | 13.93 | 3.60 | 4.80 | 11.40 | 13.60 | 16.10 | 36.30 | ▃▇▂▁▁ |
| alunos_por_escola | 0 | 1.00 | 171.11 | 82.54 | 20.00 | 111.00 | 158.00 | 217.00 | 711.00 | ▇▇▁▁▁ |
| populacao_estimada.y | 0 | 1.00 | 38309.29 | 217419.51 | 856.00 | 5348.50 | 11355.00 | 25299.00 | 11904961.00 | ▇▁▁▁▁ |
Para a primeira etapa da análise, os municípios foram estratificados em cinco faixas populacionais:
Esta segmentação permite investigar como a escala urbana influencia a distribuição de recursos e indicadores educacionais.
O score de infraestrutura avalia itens críticos como acesso a serviços básicos (água, luz e saneamento), recursos tecnológicos (internet e laboratórios) e equipamentos esportivos (quadras e piscinas).
O gráfico indica que a infraestrutura mantém uma média consistente, em torno de 7.5, em todas as faixas. Nota-se, contudo, que:
Este indicador revela um comportamento linear e diretamente proporcional ao tamanho da população: quanto maior o município, maior a razão aluno/docente. A baixa variabilidade dentro das faixas indica que esta é uma característica estrutural consolidada do modelo de organização escolar conforme o porte da cidade.
O gráfico é interessante, mostra uma relação bem comportada da média de alunos por docente de acordo com a faixa populacional, mostrando que à medida que os municípios crescem (maior população) cresce a razão de alunos/docente. E com pouca variabilidade dentro das faixas.
Aqui continuamos as análises via gráfico das demais variáveis sem nos deter em nenhum comentário.
Agora vamos à mesma análise, porém fazendo o recorte regional.
Podemos agora fazer o recorte usando a Região como base, o que é geralmente o caso pois estamos interessados nas desigualdades regionais que são bem estudadas e conhecidas.
Para isso vamos utilizar os mesmos gráficos anteriores, colocando lado a lado cada um.