A educação básica é um dos pilares do desenvolvimento humano e social. Em Igarassu, município histórico do litoral norte de Pernambuco com aproximadamente 120 mil habitantes, compreender como funciona a rede escolar é essencial para orientar políticas públicas eficazes.
Este projeto analisa os Microdados do Censo Escolar da Educação Básica 2024, divulgados pelo INEP, com foco exclusivo nas escolas de Igarassu/PE. O Censo Escolar é o principal levantamento estatístico da educação básica brasileira e reúne informações detalhadas sobre infraestrutura, matrículas e docentes de todas as escolas do país.
Os principais problemas investigados são:
A análise é relevante para gestores públicos municipais e estaduais, secretarias de educação, pais e responsáveis e pesquisadores interessados em diagnósticos educacionais locais. Compreender esses padrões permite identificar onde concentrar investimentos e quais escolas demandam atenção prioritária.
A abordagem empregada envolve filtragem dos microdados nacionais, limpeza e padronização das variáveis, criação de novas variáveis derivadas e análise exploratória com visualizações interativas.
Os pacotes abaixo são utilizados para importar, limpar, transformar, visualizar e resumir os dados.
library(tidyverse) # Manipulação e transformação de dados (dplyr, tidyr, ggplot2, readr etc.)
library(janitor) # Padronização de nomes de colunas e limpeza de tabelas
library(plotly) # Gráficos interativos a partir de objetos ggplot2
library(DT) # Tabelas interativas com filtros, ordenação e paginação
library(rmdformats) # Templates visuais profissionais para relatórios RMarkdown
library(scales) # Formatação de eixos, rótulos e percentuais em gráficos
library(knitr) # Geração do relatório e exibição de tabelas estáticas com kable()Os dados utilizados neste projeto são os Microdados do Censo Escolar da Educação Básica 2024, disponibilizados publicamente pelo INEP — Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira.
O Censo Escolar é realizado anualmente pelo INEP em parceria com as secretarias estaduais e municipais de educação. A edição de 2024 foi coletada ao longo do ano letivo e publicada em fevereiro de 2025.
O arquivo original (microdados_ed_basica_2024.csv)
contém uma linha por escola e 426 variáveis, reunindo em um único
registro informações de infraestrutura física, quantitativo de
matrículas por nível e modalidade, perfil dos alunos e corpo docente.
Diferentemente de edições anteriores do Censo, que separavam essas
informações em tabelas distintas (Escolas, Turmas, Matrículas e
Docentes), o arquivo de 2024 consolida tudo em uma estrutura
desnormalizada por escola.
Algumas peculiaridades importantes da base:
;), não
vírgulalatin1 (ISO-8859-1)TP_DEPENDENCIA: 1 = Federal, 2 = Estadual, 3 = Municipal, 4
= Privada)TP_SITUACAO_FUNCIONAMENTO igual a 2 ou 3O município de Igarassu/PE é identificado pelo código IBGE 2606804, verificado diretamente na base.
O arquivo nacional possui mais de 200 MB e cobre todas as escolas do Brasil. O primeiro passo é ler o CSV e filtrar imediatamente apenas as escolas de Igarassu, evitando carregar dados desnecessários na memória.
# Leitura do arquivo bruto com filtro imediato pelo código IBGE de Igarassu/PE
# Código IBGE de Igarassu/PE: 2606804 — verificado diretamente no arquivo
igarassu_raw <- read_csv2(
file = "microdados_censo_escolar_2024/dados/microdados_ed_basica_2024.csv",
locale = locale(encoding = "latin1"),
show_col_types = FALSE
) |>
filter(CO_MUNICIPIO == 2606804)
# Verificação inicial: total de escolas e variáveis antes de qualquer limpeza
dim(igarassu_raw)## [1] 110 426
Antes da limpeza, o recorte de Igarassu contém 110 escolas (incluindo as inativas) e 426 variáveis.
Das 426 variáveis disponíveis, foram selecionadas aquelas relevantes para os três eixos de análise do projeto: infraestrutura escolar, perfil das matrículas e corpo docente.
igarassu_sel <- igarassu_raw |>
select(
# Identificação da escola
NO_ENTIDADE, CO_ENTIDADE,
# Classificação da escola
TP_DEPENDENCIA, # Rede (Federal, Estadual, Municipal, Privada)
TP_LOCALIZACAO, # Localização (Urbana, Rural)
TP_SITUACAO_FUNCIONAMENTO, # Situação (Ativa, Paralisada, Extinta)
# Infraestrutura — conectividade e tecnologia
IN_INTERNET,
IN_INTERNET_ALUNOS,
IN_COMPUTADOR,
IN_EQUIP_MULTIMIDIA,
IN_EQUIP_LOUSA_DIGITAL,
# Infraestrutura — espaços pedagógicos
IN_BIBLIOTECA,
IN_BIBLIOTECA_SALA_LEITURA,
IN_LABORATORIO_CIENCIAS,
IN_LABORATORIO_INFORMATICA,
IN_QUADRA_ESPORTES,
IN_COZINHA,
IN_PATIO_COBERTO,
# Infraestrutura — saneamento
IN_AGUA_POTAVEL,
IN_ENERGIA_REDE_PUBLICA,
IN_ESGOTO_REDE_PUBLICA,
# Acessibilidade
IN_ACESSIBILIDADE_RAMPAS,
IN_ACESSIBILIDADE_INEXISTENTE,
IN_BANHEIRO_PNE,
IN_SALA_ATENDIMENTO_ESPECIAL,
# Matrículas — por nível de ensino
QT_MAT_BAS, # Total educação básica
QT_MAT_INF, # Educação Infantil
QT_MAT_FUND, # Ensino Fundamental
QT_MAT_MED, # Ensino Médio
QT_MAT_EJA, # EJA
# Matrículas — por perfil de aluno
QT_MAT_BAS_FEM,
QT_MAT_BAS_MASC,
QT_MAT_BAS_BRANCA,
QT_MAT_BAS_PRETA,
QT_MAT_BAS_PARDA,
QT_MAT_BAS_AMARELA,
QT_MAT_BAS_INDIGENA,
# Docentes
QT_DOC_BAS, # Total de docentes na educação básica
QT_DOC_FUND,
QT_DOC_MED,
QT_DOC_EJA,
# Salas de aula
QT_SALAS_UTILIZADAS
)igarassu <- igarassu_sel |>
# Manter apenas escolas em funcionamento ativo (código 1)
# Escolas paralisadas (2) e extintas (3) não refletem a realidade atual
filter(TP_SITUACAO_FUNCIONAMENTO == 1) |>
# Converter códigos numéricos em categorias legíveis (fatores)
mutate(
DEPENDENCIA = factor(
TP_DEPENDENCIA,
levels = c(1, 2, 3, 4),
labels = c("Federal", "Estadual", "Municipal", "Privada")
),
LOCALIZACAO = factor(
TP_LOCALIZACAO,
levels = c(1, 2),
labels = c("Urbana", "Rural")
),
# Converter indicadores binários (0/1) em Não/Sim (fatores)
# Isso facilita tabelas e gráficos e evita interpretações numéricas
across(
c(IN_INTERNET, IN_INTERNET_ALUNOS, IN_COMPUTADOR,
IN_EQUIP_MULTIMIDIA, IN_EQUIP_LOUSA_DIGITAL,
IN_BIBLIOTECA, IN_BIBLIOTECA_SALA_LEITURA,
IN_LABORATORIO_CIENCIAS, IN_LABORATORIO_INFORMATICA,
IN_QUADRA_ESPORTES, IN_COZINHA, IN_PATIO_COBERTO,
IN_AGUA_POTAVEL, IN_ENERGIA_REDE_PUBLICA, IN_ESGOTO_REDE_PUBLICA,
IN_ACESSIBILIDADE_RAMPAS, IN_ACESSIBILIDADE_INEXISTENTE,
IN_BANHEIRO_PNE, IN_SALA_ATENDIMENTO_ESPECIAL),
~ factor(.x, levels = c(0, 1), labels = c("Não", "Sim"))
)
) |>
# Remover as colunas de código numérico originais (já temos os fatores)
select(-TP_DEPENDENCIA, -TP_LOCALIZACAO, -TP_SITUACAO_FUNCIONAMENTO)Para enriquecer a análise exploratória, foram criadas variáveis derivadas a partir das originais.
igarassu <- igarassu |>
mutate(
# Proporção de alunas (sexo feminino) em relação ao total de matrículas
# Permite identificar desequilíbrios de gênero por escola e rede
PROP_FEMININO = round(QT_MAT_BAS_FEM / QT_MAT_BAS, 3),
# Proporção de alunos autodeclarados pardos ou pretos
# Reflete o perfil racial predominante na rede pública municipal
PROP_PRETO_PARDO = round(
(QT_MAT_BAS_PRETA + QT_MAT_BAS_PARDA) / QT_MAT_BAS, 3
),
# Razão alunos por docente — indicador de carga de trabalho
RAZAO_ALUNO_DOCENTE = round(QT_MAT_BAS / QT_DOC_BAS, 1),
# Classificação do porte da escola pelo total de matrículas
PORTE = case_when(
QT_MAT_BAS <= 100 ~ "Pequena (até 100)",
QT_MAT_BAS <= 300 ~ "Média (101–300)",
QT_MAT_BAS <= 600 ~ "Grande (301–600)",
QT_MAT_BAS > 600 ~ "Muito grande (600+)",
TRUE ~ NA_character_
),
PORTE = factor(PORTE, levels = c(
"Pequena (até 100)", "Média (101–300)",
"Grande (301–600)", "Muito grande (600+)"
)),
# Indicador de infraestrutura básica completa
# Uma escola possui infraestrutura mínima se tiver água potável,
# energia da rede pública, esgoto e internet simultaneamente
INFRA_BASICA_COMPLETA = case_when(
IN_AGUA_POTAVEL == "Sim" &
IN_ENERGIA_REDE_PUBLICA == "Sim" &
IN_ESGOTO_REDE_PUBLICA == "Sim" &
IN_INTERNET == "Sim" ~ "Infraestrutura completa",
TRUE ~ "Infraestrutura incompleta"
)
)# Verificar quais variáveis possuem valores ausentes
resumo_ausentes <- igarassu |>
summarise(across(everything(), ~ sum(is.na(.)))) |>
pivot_longer(
cols = everything(),
names_to = "variavel",
values_to = "valores_ausentes"
) |>
filter(valores_ausentes > 0) |>
mutate(
percentual_ausente = percent(valores_ausentes / nrow(igarassu), accuracy = 0.1)
) |>
arrange(desc(valores_ausentes))
resumo_ausentes |>
kable(
col.names = c("Variável", "Valores Ausentes", "% Ausente"),
caption = "Variáveis com valores ausentes — Escolas ativas de Igarassu/PE"
)| Variável | Valores Ausentes | % Ausente |
|---|
Foram identificados valores ausentes em determinadas variáveis. Como a proporção de ausências foi baixa e concentrada em informações específicas de algumas escolas, optou-se por manter os registros e tratar os valores ausentes apenas nas variáveis derivadas quando necessário.
# Escolas privadas com 0 alunos ou sem informação de matrículas
# não têm docentes registrados, gerando NaN nas proporções criadas.
# Nesses casos, substituímos por NA para deixar explícito que
# a informação não está disponível, em vez de um valor inválido.
igarassu <- igarassu |>
mutate(
PROP_FEMININO = ifelse(is.nan(PROP_FEMININO), NA, PROP_FEMININO),
PROP_PRETO_PARDO = ifelse(is.nan(PROP_PRETO_PARDO), NA, PROP_PRETO_PARDO),
RAZAO_ALUNO_DOCENTE = ifelse(
is.nan(RAZAO_ALUNO_DOCENTE) | is.infinite(RAZAO_ALUNO_DOCENTE),
NA, RAZAO_ALUNO_DOCENTE
)
)Após as etapas de limpeza e transformação, a base final contém 85 escolas ativas em Igarassu/PE e 45 variáveis.
# Exibir amostra condensada do conjunto final
igarassu |>
select(
NO_ENTIDADE, DEPENDENCIA, LOCALIZACAO,
IN_INTERNET, QT_MAT_BAS, QT_DOC_BAS,
PORTE, INFRA_BASICA_COMPLETA
) |>
arrange(DEPENDENCIA, NO_ENTIDADE) |>
head(20) |>
kable(
col.names = c(
"Escola", "Rede", "Localização",
"Internet", "Matrículas", "Docentes",
"Porte", "Infraestrutura básica"
),
caption = "Amostra do conjunto de dados limpo — Escolas ativas de Igarassu/PE (2024)"
)| Escola | Rede | Localização | Internet | Matrículas | Docentes | Porte | Infraestrutura básica |
|---|---|---|---|---|---|---|---|
| IFPE - CAMPUS IGARASSU | Federal | Urbana | Sim | 191 | 25 | Média (101–300) | Infraestrutura incompleta |
| ESCOLA BARAO DE VERA CRUZ | Estadual | Urbana | Sim | 718 | 24 | Muito grande (600+) | Infraestrutura incompleta |
| ESCOLA DE REFERENCIA EM ENSINO FUNDAMENTAL DESEMBARGADOR CARLOS XAVIER PAES BARRETTO | Estadual | Urbana | Sim | 273 | 14 | Média (101–300) | Infraestrutura incompleta |
| ESCOLA DE REFERENCIA EM ENSINO FUNDAMENTAL E MEDIO NOVA CRUZ | Estadual | Rural | Sim | 765 | 52 | Muito grande (600+) | Infraestrutura incompleta |
| ESCOLA DE REFERENCIA EM ENSINO MEDIO BRASILINO JOSE DE CARVALHO | Estadual | Urbana | Sim | 497 | 25 | Grande (301–600) | Infraestrutura incompleta |
| ESCOLA DE REFERENCIA EM ENSINO MEDIO EURICO PFISTERER | Estadual | Urbana | Sim | 463 | 22 | Grande (301–600) | Infraestrutura incompleta |
| ESCOLA DE REFERENCIA EM ENSINO MEDIO JOAO PESSOA GUERRA | Estadual | Urbana | Sim | 1138 | 42 | Muito grande (600+) | Infraestrutura completa |
| ESCOLA DE REFERENCIA EM ENSINO MEDIO SANTOS COSME E DAMIAO | Estadual | Urbana | Sim | 1164 | 40 | Muito grande (600+) | Infraestrutura incompleta |
| ESCOLA DOM HELDER CAMARA | Estadual | Urbana | Sim | 348 | 11 | Grande (301–600) | Infraestrutura incompleta |
| ESCOLA PROFESSOR ADERBAL JUREMA - MN | Estadual | Urbana | Sim | 302 | 12 | Grande (301–600) | Infraestrutura incompleta |
| ESCOLA TECNICA ESTADUAL JURANDIR BEZERRA LINS | Estadual | Urbana | Sim | 655 | 31 | Muito grande (600+) | Infraestrutura completa |
| CENTRO DE EDUCACAO INTEGRAL DE IGARASSU CECILIA MARIA VAZ CURADO RIBEIRO | Municipal | Urbana | Sim | 450 | 19 | Grande (301–600) | Infraestrutura incompleta |
| CENTRO DE EDUCACAO INTEGRAL FERNANDO HENRIQUE LUCENA | Municipal | Urbana | Sim | 591 | 24 | Grande (301–600) | Infraestrutura incompleta |
| CENTRO DE EDUCACAO INTEGRAL SAO LUIZ | Municipal | Rural | Sim | 205 | 11 | Média (101–300) | Infraestrutura incompleta |
| CENTRO DE PRE ESCOLAR ARTUR CARLOS DE MELO | Municipal | Urbana | Sim | 187 | 10 | Média (101–300) | Infraestrutura incompleta |
| CRECHE TIA EMOCY KRAUSE | Municipal | Urbana | Sim | 149 | 9 | Média (101–300) | Infraestrutura incompleta |
| CRECHE TIA JANE MAGALHAES | Municipal | Urbana | Sim | 134 | 9 | Média (101–300) | Infraestrutura incompleta |
| CRECHE TIA NAI | Municipal | Rural | Sim | 89 | 5 | Pequena (até 100) | Infraestrutura completa |
| ESCOLA ADOLFO BROL | Municipal | Urbana | Sim | 262 | 11 | Média (101–300) | Infraestrutura incompleta |
| ESCOLA ANA BANDEIRA DE MENEZES | Municipal | Rural | Sim | 161 | 8 | Média (101–300) | Infraestrutura incompleta |
igarassu |>
select(
NO_ENTIDADE, DEPENDENCIA, LOCALIZACAO,
IN_INTERNET, IN_LABORATORIO_INFORMATICA,
IN_BIBLIOTECA, IN_QUADRA_ESPORTES,
QT_MAT_BAS, QT_DOC_BAS,
PORTE, INFRA_BASICA_COMPLETA
) |>
arrange(DEPENDENCIA, NO_ENTIDADE) |>
datatable(
caption = "Tabela interativa — Escolas ativas de Igarassu/PE (Censo Escolar 2024)",
colnames = c(
"Escola", "Rede", "Localização",
"Internet", "Lab. Informática",
"Biblioteca", "Quadra Esportiva",
"Matrículas", "Docentes",
"Porte", "Infraestrutura básica"
),
options = list(
pageLength = 10,
scrollX = TRUE,
language = list(
url = "//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese-Brasil.json"
)
)
)resumo_variaveis <- tibble(
variavel = c(
"NO_ENTIDADE", "DEPENDENCIA", "LOCALIZACAO",
"IN_INTERNET", "IN_LABORATORIO_INFORMATICA", "IN_BIBLIOTECA",
"IN_QUADRA_ESPORTES", "IN_AGUA_POTAVEL",
"IN_ENERGIA_REDE_PUBLICA", "IN_ESGOTO_REDE_PUBLICA",
"IN_ACESSIBILIDADE_INEXISTENTE", "IN_BANHEIRO_PNE",
"QT_MAT_BAS", "QT_MAT_INF", "QT_MAT_FUND",
"QT_MAT_MED", "QT_MAT_EJA",
"QT_DOC_BAS", "QT_SALAS_UTILIZADAS",
"PROP_FEMININO", "PROP_PRETO_PARDO",
"RAZAO_ALUNO_DOCENTE", "PORTE",
"INFRA_BASICA_COMPLETA"
),
descricao = c(
"Nome da escola",
"Rede de ensino (Federal, Estadual, Municipal ou Privada)",
"Localização da escola (Urbana ou Rural)",
"Possui acesso à internet",
"Possui laboratório de informática",
"Possui biblioteca ou sala de leitura",
"Possui quadra de esportes",
"Possui água potável",
"Possui energia elétrica da rede pública",
"Possui esgoto ligado à rede pública",
"Não possui nenhum recurso de acessibilidade",
"Possui banheiro adaptado para PNE",
"Total de matrículas na educação básica",
"Matrículas na Educação Infantil",
"Matrículas no Ensino Fundamental",
"Matrículas no Ensino Médio",
"Matrículas na EJA (Educação de Jovens e Adultos)",
"Total de docentes na educação básica",
"Número de salas de aula utilizadas",
"Proporção de alunas (criada a partir de QT_MAT_BAS_FEM / QT_MAT_BAS)",
"Proporção de alunos pretos e pardos (criada a partir das variáveis de raça)",
"Razão de alunos por docente (criada a partir de QT_MAT_BAS / QT_DOC_BAS)",
"Porte da escola por número de matrículas (variável criada)",
"Indica se a escola possui os 4 itens básicos de infraestrutura (variável criada)"
),
tipo = c(
"Categórica", "Categórica (fator)", "Categórica (fator)",
"Categórica (fator)", "Categórica (fator)", "Categórica (fator)",
"Categórica (fator)", "Categórica (fator)",
"Categórica (fator)", "Categórica (fator)",
"Categórica (fator)", "Categórica (fator)",
"Numérica inteira", "Numérica inteira", "Numérica inteira",
"Numérica inteira", "Numérica inteira",
"Numérica inteira", "Numérica inteira",
"Numérica decimal", "Numérica decimal",
"Numérica decimal", "Categórica ordinal (fator)",
"Categórica (fator)"
)
)
kable(
resumo_variaveis,
col.names = c("Variável", "Descrição", "Tipo"),
caption = "Descrição das variáveis de interesse após o pré-processamento"
)| Variável | Descrição | Tipo |
|---|---|---|
| NO_ENTIDADE | Nome da escola | Categórica |
| DEPENDENCIA | Rede de ensino (Federal, Estadual, Municipal ou Privada) | Categórica (fator) |
| LOCALIZACAO | Localização da escola (Urbana ou Rural) | Categórica (fator) |
| IN_INTERNET | Possui acesso à internet | Categórica (fator) |
| IN_LABORATORIO_INFORMATICA | Possui laboratório de informática | Categórica (fator) |
| IN_BIBLIOTECA | Possui biblioteca ou sala de leitura | Categórica (fator) |
| IN_QUADRA_ESPORTES | Possui quadra de esportes | Categórica (fator) |
| IN_AGUA_POTAVEL | Possui água potável | Categórica (fator) |
| IN_ENERGIA_REDE_PUBLICA | Possui energia elétrica da rede pública | Categórica (fator) |
| IN_ESGOTO_REDE_PUBLICA | Possui esgoto ligado à rede pública | Categórica (fator) |
| IN_ACESSIBILIDADE_INEXISTENTE | Não possui nenhum recurso de acessibilidade | Categórica (fator) |
| IN_BANHEIRO_PNE | Possui banheiro adaptado para PNE | Categórica (fator) |
| QT_MAT_BAS | Total de matrículas na educação básica | Numérica inteira |
| QT_MAT_INF | Matrículas na Educação Infantil | Numérica inteira |
| QT_MAT_FUND | Matrículas no Ensino Fundamental | Numérica inteira |
| QT_MAT_MED | Matrículas no Ensino Médio | Numérica inteira |
| QT_MAT_EJA | Matrículas na EJA (Educação de Jovens e Adultos) | Numérica inteira |
| QT_DOC_BAS | Total de docentes na educação básica | Numérica inteira |
| QT_SALAS_UTILIZADAS | Número de salas de aula utilizadas | Numérica inteira |
| PROP_FEMININO | Proporção de alunas (criada a partir de QT_MAT_BAS_FEM / QT_MAT_BAS) | Numérica decimal |
| PROP_PRETO_PARDO | Proporção de alunos pretos e pardos (criada a partir das variáveis de raça) | Numérica decimal |
| RAZAO_ALUNO_DOCENTE | Razão de alunos por docente (criada a partir de QT_MAT_BAS / QT_DOC_BAS) | Numérica decimal |
| PORTE | Porte da escola por número de matrículas (variável criada) | Categórica ordinal (fator) |
| INFRA_BASICA_COMPLETA | Indica se a escola possui os 4 itens básicos de infraestrutura (variável criada) | Categórica (fator) |
estatisticas <- tibble(
indicador = c(
"Escolas ativas em Igarassu/PE",
"Escolas da rede pública (Federal + Estadual + Municipal)",
"Escolas da rede privada",
"Escolas em zona urbana",
"Escolas em zona rural",
"Total de matrículas na educação básica",
"Total de docentes na educação básica",
"Média de alunos por escola",
"Média de docentes por escola",
"Média de alunos por docente",
"Escolas com internet",
"Escolas com laboratório de informática",
"Escolas com biblioteca",
"Escolas com infraestrutura básica completa"
),
valor = c(
nrow(igarassu),
sum(igarassu$DEPENDENCIA %in% c("Federal","Estadual","Municipal"), na.rm = TRUE),
sum(igarassu$DEPENDENCIA == "Privada", na.rm = TRUE),
sum(igarassu$LOCALIZACAO == "Urbana", na.rm = TRUE),
sum(igarassu$LOCALIZACAO == "Rural", na.rm = TRUE),
sum(igarassu$QT_MAT_BAS, na.rm = TRUE),
sum(igarassu$QT_DOC_BAS, na.rm = TRUE),
round(mean(igarassu$QT_MAT_BAS, na.rm = TRUE), 1),
round(mean(igarassu$QT_DOC_BAS, na.rm = TRUE), 1),
round(mean(igarassu$RAZAO_ALUNO_DOCENTE, na.rm = TRUE), 1),
paste0(sum(igarassu$IN_INTERNET == "Sim", na.rm = TRUE),
" (", percent(mean(igarassu$IN_INTERNET == "Sim", na.rm = TRUE), accuracy = 0.1), ")"),
paste0(sum(igarassu$IN_LABORATORIO_INFORMATICA == "Sim", na.rm = TRUE),
" (", percent(mean(igarassu$IN_LABORATORIO_INFORMATICA == "Sim", na.rm = TRUE), accuracy = 0.1), ")"),
paste0(sum(igarassu$IN_BIBLIOTECA == "Sim", na.rm = TRUE),
" (", percent(mean(igarassu$IN_BIBLIOTECA == "Sim", na.rm = TRUE), accuracy = 0.1), ")"),
paste0(sum(igarassu$INFRA_BASICA_COMPLETA == "Infraestrutura completa", na.rm = TRUE),
" (", percent(mean(igarassu$INFRA_BASICA_COMPLETA == "Infraestrutura completa", na.rm = TRUE), accuracy = 0.1), ")")
)
)
kable(
estatisticas,
col.names = c("Indicador", "Valor"),
caption = "Resumo geral da educação básica em Igarassu/PE — Censo Escolar 2024"
)| Indicador | Valor |
|---|---|
| Escolas ativas em Igarassu/PE | 85 |
| Escolas da rede pública (Federal + Estadual + Municipal) | 60 |
| Escolas da rede privada | 25 |
| Escolas em zona urbana | 59 |
| Escolas em zona rural | 26 |
| Total de matrículas na educação básica | 26561 |
| Total de docentes na educação básica | 1175 |
| Média de alunos por escola | 312.5 |
| Média de docentes por escola | 13.8 |
| Média de alunos por docente | 21.7 |
| Escolas com internet | 83 (97.6%) |
| Escolas com laboratório de informática | 19 (22.4%) |
| Escolas com biblioteca | 40 (47.1%) |
| Escolas com infraestrutura básica completa | 24 (28.2%) |
igarassu |>
count(DEPENDENCIA, LOCALIZACAO, name = "n_escolas") |>
mutate(
percentual = percent(n_escolas / sum(n_escolas), accuracy = 0.1)
) |>
kable(
col.names = c("Rede", "Localização", "Nº de Escolas", "% do Total"),
caption = "Distribuição das escolas ativas por rede e localização — Igarassu/PE (2024)"
)| Rede | Localização | Nº de Escolas | % do Total |
|---|---|---|---|
| Federal | Urbana | 1 | 1.2% |
| Estadual | Urbana | 9 | 10.6% |
| Estadual | Rural | 1 | 1.2% |
| Municipal | Urbana | 25 | 29.4% |
| Municipal | Rural | 24 | 28.2% |
| Privada | Urbana | 24 | 28.2% |
| Privada | Rural | 1 | 1.2% |
Nesta primeira etapa, os dados do Censo Escolar 2024 referentes ao
município de Igarassu/PE foram importados, filtrados e pré-processados.
O arquivo original contém informações de todas as escolas do Brasil em
um único CSV com 426 variáveis; após o filtro pelo código IBGE
2606804, obteve-se um recorte de 85 escolas ativas.
O pré-processamento incluiu a seleção das variáveis relevantes para os três eixos de análise (infraestrutura, matrículas e docentes), a conversão de códigos numéricos em fatores legíveis, o tratamento de valores ausentes e a criação de quatro variáveis derivadas: proporção de alunas, proporção de alunos pretos e pardos, razão aluno-docente e um indicador de infraestrutura básica completa.
A base limpa está adequada para a próxima etapa do projeto, que será dedicada à análise exploratória aprofundada. A partir desses dados, será possível investigar as disparidades de infraestrutura entre redes pública e privada, o perfil das matrículas por nível de ensino e localização, e a distribuição do corpo docente no município.