1 Introdução

A educação básica é um dos pilares do desenvolvimento humano e social. Em Igarassu, município histórico do litoral norte de Pernambuco com aproximadamente 120 mil habitantes, compreender como funciona a rede escolar é essencial para orientar políticas públicas eficazes.

Este projeto analisa os Microdados do Censo Escolar da Educação Básica 2024, divulgados pelo INEP, com foco exclusivo nas escolas de Igarassu/PE. O Censo Escolar é o principal levantamento estatístico da educação básica brasileira e reúne informações detalhadas sobre infraestrutura, matrículas e docentes de todas as escolas do país.

Os principais problemas investigados são:

A análise é relevante para gestores públicos municipais e estaduais, secretarias de educação, pais e responsáveis e pesquisadores interessados em diagnósticos educacionais locais. Compreender esses padrões permite identificar onde concentrar investimentos e quais escolas demandam atenção prioritária.

A abordagem empregada envolve filtragem dos microdados nacionais, limpeza e padronização das variáveis, criação de novas variáveis derivadas e análise exploratória com visualizações interativas.

2 Pacotes Requeridos

Os pacotes abaixo são utilizados para importar, limpar, transformar, visualizar e resumir os dados.

library(tidyverse)  # Manipulação e transformação de dados (dplyr, tidyr, ggplot2, readr etc.)
library(janitor)    # Padronização de nomes de colunas e limpeza de tabelas
library(plotly)     # Gráficos interativos a partir de objetos ggplot2
library(DT)         # Tabelas interativas com filtros, ordenação e paginação
library(rmdformats) # Templates visuais profissionais para relatórios RMarkdown
library(scales)     # Formatação de eixos, rótulos e percentuais em gráficos
library(knitr)      # Geração do relatório e exibição de tabelas estáticas com kable()

3 Preparação dos Dados

3.1 Fonte dos Dados

Os dados utilizados neste projeto são os Microdados do Censo Escolar da Educação Básica 2024, disponibilizados publicamente pelo INEP — Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira.

3.2 Descrição da Fonte Original

O Censo Escolar é realizado anualmente pelo INEP em parceria com as secretarias estaduais e municipais de educação. A edição de 2024 foi coletada ao longo do ano letivo e publicada em fevereiro de 2025.

O arquivo original (microdados_ed_basica_2024.csv) contém uma linha por escola e 426 variáveis, reunindo em um único registro informações de infraestrutura física, quantitativo de matrículas por nível e modalidade, perfil dos alunos e corpo docente. Diferentemente de edições anteriores do Censo, que separavam essas informações em tabelas distintas (Escolas, Turmas, Matrículas e Docentes), o arquivo de 2024 consolida tudo em uma estrutura desnormalizada por escola.

Algumas peculiaridades importantes da base:

  • O separador de campos é ponto-e-vírgula (;), não vírgula
  • A codificação do arquivo é latin1 (ISO-8859-1)
  • Variáveis categóricas são representadas por códigos numéricos (ex: TP_DEPENDENCIA: 1 = Federal, 2 = Estadual, 3 = Municipal, 4 = Privada)
  • Indicadores de infraestrutura são binários: 0 = ausente, 1 = presente
  • Valores ausentes aparecem como células vazias
  • Escolas paralisadas ou extintas constam na base com TP_SITUACAO_FUNCIONAMENTO igual a 2 ou 3

O município de Igarassu/PE é identificado pelo código IBGE 2606804, verificado diretamente na base.

3.3 Importação e Filtro Inicial

O arquivo nacional possui mais de 200 MB e cobre todas as escolas do Brasil. O primeiro passo é ler o CSV e filtrar imediatamente apenas as escolas de Igarassu, evitando carregar dados desnecessários na memória.

# Leitura do arquivo bruto com filtro imediato pelo código IBGE de Igarassu/PE
# Código IBGE de Igarassu/PE: 2606804 — verificado diretamente no arquivo
igarassu_raw <- read_csv2(
  file           = "microdados_censo_escolar_2024/dados/microdados_ed_basica_2024.csv",
  locale         = locale(encoding = "latin1"),
  show_col_types = FALSE
) |>
  filter(CO_MUNICIPIO == 2606804)

# Verificação inicial: total de escolas e variáveis antes de qualquer limpeza
dim(igarassu_raw)
## [1] 110 426

Antes da limpeza, o recorte de Igarassu contém 110 escolas (incluindo as inativas) e 426 variáveis.

3.4 Seleção das Variáveis de Interesse

Das 426 variáveis disponíveis, foram selecionadas aquelas relevantes para os três eixos de análise do projeto: infraestrutura escolar, perfil das matrículas e corpo docente.

igarassu_sel <- igarassu_raw |>
  select(
    # Identificação da escola
    NO_ENTIDADE, CO_ENTIDADE,
    
    # Classificação da escola
    TP_DEPENDENCIA,         # Rede (Federal, Estadual, Municipal, Privada)
    TP_LOCALIZACAO,         # Localização (Urbana, Rural)
    TP_SITUACAO_FUNCIONAMENTO, # Situação (Ativa, Paralisada, Extinta)
    
    # Infraestrutura — conectividade e tecnologia
    IN_INTERNET,
    IN_INTERNET_ALUNOS,
    IN_COMPUTADOR,
    IN_EQUIP_MULTIMIDIA,
    IN_EQUIP_LOUSA_DIGITAL,
    
    # Infraestrutura — espaços pedagógicos
    IN_BIBLIOTECA,
    IN_BIBLIOTECA_SALA_LEITURA,
    IN_LABORATORIO_CIENCIAS,
    IN_LABORATORIO_INFORMATICA,
    IN_QUADRA_ESPORTES,
    IN_COZINHA,
    IN_PATIO_COBERTO,
    
    # Infraestrutura — saneamento
    IN_AGUA_POTAVEL,
    IN_ENERGIA_REDE_PUBLICA,
    IN_ESGOTO_REDE_PUBLICA,
    
    # Acessibilidade
    IN_ACESSIBILIDADE_RAMPAS,
    IN_ACESSIBILIDADE_INEXISTENTE,
    IN_BANHEIRO_PNE,
    IN_SALA_ATENDIMENTO_ESPECIAL,
    
    # Matrículas — por nível de ensino
    QT_MAT_BAS,   # Total educação básica
    QT_MAT_INF,   # Educação Infantil
    QT_MAT_FUND,  # Ensino Fundamental
    QT_MAT_MED,   # Ensino Médio
    QT_MAT_EJA,   # EJA
    
    # Matrículas — por perfil de aluno
    QT_MAT_BAS_FEM,
    QT_MAT_BAS_MASC,
    QT_MAT_BAS_BRANCA,
    QT_MAT_BAS_PRETA,
    QT_MAT_BAS_PARDA,
    QT_MAT_BAS_AMARELA,
    QT_MAT_BAS_INDIGENA,
    
    # Docentes
    QT_DOC_BAS,   # Total de docentes na educação básica
    QT_DOC_FUND,
    QT_DOC_MED,
    QT_DOC_EJA,
    
    # Salas de aula
    QT_SALAS_UTILIZADAS
  )

3.5 Filtragem e Limpeza

igarassu <- igarassu_sel |>
  
  # Manter apenas escolas em funcionamento ativo (código 1)
  # Escolas paralisadas (2) e extintas (3) não refletem a realidade atual
  filter(TP_SITUACAO_FUNCIONAMENTO == 1) |>
  
  # Converter códigos numéricos em categorias legíveis (fatores)
  mutate(
    DEPENDENCIA = factor(
      TP_DEPENDENCIA,
      levels = c(1, 2, 3, 4),
      labels = c("Federal", "Estadual", "Municipal", "Privada")
    ),
    
    LOCALIZACAO = factor(
      TP_LOCALIZACAO,
      levels = c(1, 2),
      labels = c("Urbana", "Rural")
    ),
    
    # Converter indicadores binários (0/1) em Não/Sim (fatores)
    # Isso facilita tabelas e gráficos e evita interpretações numéricas
    across(
      c(IN_INTERNET, IN_INTERNET_ALUNOS, IN_COMPUTADOR,
        IN_EQUIP_MULTIMIDIA, IN_EQUIP_LOUSA_DIGITAL,
        IN_BIBLIOTECA, IN_BIBLIOTECA_SALA_LEITURA,
        IN_LABORATORIO_CIENCIAS, IN_LABORATORIO_INFORMATICA,
        IN_QUADRA_ESPORTES, IN_COZINHA, IN_PATIO_COBERTO,
        IN_AGUA_POTAVEL, IN_ENERGIA_REDE_PUBLICA, IN_ESGOTO_REDE_PUBLICA,
        IN_ACESSIBILIDADE_RAMPAS, IN_ACESSIBILIDADE_INEXISTENTE,
        IN_BANHEIRO_PNE, IN_SALA_ATENDIMENTO_ESPECIAL),
      ~ factor(.x, levels = c(0, 1), labels = c("Não", "Sim"))
    )
  ) |>
  
  # Remover as colunas de código numérico originais (já temos os fatores)
  select(-TP_DEPENDENCIA, -TP_LOCALIZACAO, -TP_SITUACAO_FUNCIONAMENTO)

3.6 Criação de Novas Variáveis

Para enriquecer a análise exploratória, foram criadas variáveis derivadas a partir das originais.

igarassu <- igarassu |>
  mutate(
    
    # Proporção de alunas (sexo feminino) em relação ao total de matrículas
    # Permite identificar desequilíbrios de gênero por escola e rede
    PROP_FEMININO = round(QT_MAT_BAS_FEM / QT_MAT_BAS, 3),
    
    # Proporção de alunos autodeclarados pardos ou pretos
    # Reflete o perfil racial predominante na rede pública municipal
    PROP_PRETO_PARDO = round(
      (QT_MAT_BAS_PRETA + QT_MAT_BAS_PARDA) / QT_MAT_BAS, 3
    ),
    
    # Razão alunos por docente — indicador de carga de trabalho
    RAZAO_ALUNO_DOCENTE = round(QT_MAT_BAS / QT_DOC_BAS, 1),
    
    # Classificação do porte da escola pelo total de matrículas
    PORTE = case_when(
      QT_MAT_BAS <= 100               ~ "Pequena (até 100)",
      QT_MAT_BAS <= 300               ~ "Média (101–300)",
      QT_MAT_BAS <= 600               ~ "Grande (301–600)",
      QT_MAT_BAS > 600                ~ "Muito grande (600+)",
      TRUE                            ~ NA_character_
    ),
    PORTE = factor(PORTE, levels = c(
      "Pequena (até 100)", "Média (101–300)",
      "Grande (301–600)", "Muito grande (600+)"
    )),
    
    # Indicador de infraestrutura básica completa
    # Uma escola possui infraestrutura mínima se tiver água potável,
    # energia da rede pública, esgoto e internet simultaneamente
    INFRA_BASICA_COMPLETA = case_when(
      IN_AGUA_POTAVEL      == "Sim" &
      IN_ENERGIA_REDE_PUBLICA == "Sim" &
      IN_ESGOTO_REDE_PUBLICA  == "Sim" &
      IN_INTERNET          == "Sim" ~ "Infraestrutura completa",
      TRUE                          ~ "Infraestrutura incompleta"
    )
  )

3.7 Tratamento de Valores Ausentes

# Verificar quais variáveis possuem valores ausentes
resumo_ausentes <- igarassu |>
  summarise(across(everything(), ~ sum(is.na(.)))) |>
  pivot_longer(
    cols = everything(),
    names_to  = "variavel",
    values_to = "valores_ausentes"
  ) |>
  filter(valores_ausentes > 0) |>
  mutate(
    percentual_ausente = percent(valores_ausentes / nrow(igarassu), accuracy = 0.1)
  ) |>
  arrange(desc(valores_ausentes))

resumo_ausentes |>
  kable(
    col.names = c("Variável", "Valores Ausentes", "% Ausente"),
    caption   = "Variáveis com valores ausentes — Escolas ativas de Igarassu/PE"
  )
Variáveis com valores ausentes — Escolas ativas de Igarassu/PE
Variável Valores Ausentes % Ausente

Foram identificados valores ausentes em determinadas variáveis. Como a proporção de ausências foi baixa e concentrada em informações específicas de algumas escolas, optou-se por manter os registros e tratar os valores ausentes apenas nas variáveis derivadas quando necessário.

# Escolas privadas com 0 alunos ou sem informação de matrículas
# não têm docentes registrados, gerando NaN nas proporções criadas.
# Nesses casos, substituímos por NA para deixar explícito que
# a informação não está disponível, em vez de um valor inválido.
igarassu <- igarassu |>
  mutate(
    PROP_FEMININO      = ifelse(is.nan(PROP_FEMININO),      NA, PROP_FEMININO),
    PROP_PRETO_PARDO   = ifelse(is.nan(PROP_PRETO_PARDO),   NA, PROP_PRETO_PARDO),
    RAZAO_ALUNO_DOCENTE = ifelse(
      is.nan(RAZAO_ALUNO_DOCENTE) | is.infinite(RAZAO_ALUNO_DOCENTE),
      NA, RAZAO_ALUNO_DOCENTE
    )
  )

3.8 Conjunto de Dados Final

Após as etapas de limpeza e transformação, a base final contém 85 escolas ativas em Igarassu/PE e 45 variáveis.

# Exibir amostra condensada do conjunto final
igarassu |>
  select(
    NO_ENTIDADE, DEPENDENCIA, LOCALIZACAO,
    IN_INTERNET, QT_MAT_BAS, QT_DOC_BAS,
    PORTE, INFRA_BASICA_COMPLETA
  ) |>
  arrange(DEPENDENCIA, NO_ENTIDADE) |>
  head(20) |>
  kable(
    col.names = c(
      "Escola", "Rede", "Localização",
      "Internet", "Matrículas", "Docentes",
      "Porte", "Infraestrutura básica"
    ),
    caption = "Amostra do conjunto de dados limpo — Escolas ativas de Igarassu/PE (2024)"
  )
Amostra do conjunto de dados limpo — Escolas ativas de Igarassu/PE (2024)
Escola Rede Localização Internet Matrículas Docentes Porte Infraestrutura básica
IFPE - CAMPUS IGARASSU Federal Urbana Sim 191 25 Média (101–300) Infraestrutura incompleta
ESCOLA BARAO DE VERA CRUZ Estadual Urbana Sim 718 24 Muito grande (600+) Infraestrutura incompleta
ESCOLA DE REFERENCIA EM ENSINO FUNDAMENTAL DESEMBARGADOR CARLOS XAVIER PAES BARRETTO Estadual Urbana Sim 273 14 Média (101–300) Infraestrutura incompleta
ESCOLA DE REFERENCIA EM ENSINO FUNDAMENTAL E MEDIO NOVA CRUZ Estadual Rural Sim 765 52 Muito grande (600+) Infraestrutura incompleta
ESCOLA DE REFERENCIA EM ENSINO MEDIO BRASILINO JOSE DE CARVALHO Estadual Urbana Sim 497 25 Grande (301–600) Infraestrutura incompleta
ESCOLA DE REFERENCIA EM ENSINO MEDIO EURICO PFISTERER Estadual Urbana Sim 463 22 Grande (301–600) Infraestrutura incompleta
ESCOLA DE REFERENCIA EM ENSINO MEDIO JOAO PESSOA GUERRA Estadual Urbana Sim 1138 42 Muito grande (600+) Infraestrutura completa
ESCOLA DE REFERENCIA EM ENSINO MEDIO SANTOS COSME E DAMIAO Estadual Urbana Sim 1164 40 Muito grande (600+) Infraestrutura incompleta
ESCOLA DOM HELDER CAMARA Estadual Urbana Sim 348 11 Grande (301–600) Infraestrutura incompleta
ESCOLA PROFESSOR ADERBAL JUREMA - MN Estadual Urbana Sim 302 12 Grande (301–600) Infraestrutura incompleta
ESCOLA TECNICA ESTADUAL JURANDIR BEZERRA LINS Estadual Urbana Sim 655 31 Muito grande (600+) Infraestrutura completa
CENTRO DE EDUCACAO INTEGRAL DE IGARASSU CECILIA MARIA VAZ CURADO RIBEIRO Municipal Urbana Sim 450 19 Grande (301–600) Infraestrutura incompleta
CENTRO DE EDUCACAO INTEGRAL FERNANDO HENRIQUE LUCENA Municipal Urbana Sim 591 24 Grande (301–600) Infraestrutura incompleta
CENTRO DE EDUCACAO INTEGRAL SAO LUIZ Municipal Rural Sim 205 11 Média (101–300) Infraestrutura incompleta
CENTRO DE PRE ESCOLAR ARTUR CARLOS DE MELO Municipal Urbana Sim 187 10 Média (101–300) Infraestrutura incompleta
CRECHE TIA EMOCY KRAUSE Municipal Urbana Sim 149 9 Média (101–300) Infraestrutura incompleta
CRECHE TIA JANE MAGALHAES Municipal Urbana Sim 134 9 Média (101–300) Infraestrutura incompleta
CRECHE TIA NAI Municipal Rural Sim 89 5 Pequena (até 100) Infraestrutura completa
ESCOLA ADOLFO BROL Municipal Urbana Sim 262 11 Média (101–300) Infraestrutura incompleta
ESCOLA ANA BANDEIRA DE MENEZES Municipal Rural Sim 161 8 Média (101–300) Infraestrutura incompleta

3.9 Tabela Interativa da Base Limpa

igarassu |>
  select(
    NO_ENTIDADE, DEPENDENCIA, LOCALIZACAO,
    IN_INTERNET, IN_LABORATORIO_INFORMATICA,
    IN_BIBLIOTECA, IN_QUADRA_ESPORTES,
    QT_MAT_BAS, QT_DOC_BAS,
    PORTE, INFRA_BASICA_COMPLETA
  ) |>
  arrange(DEPENDENCIA, NO_ENTIDADE) |>
  datatable(
    caption = "Tabela interativa — Escolas ativas de Igarassu/PE (Censo Escolar 2024)",
    colnames = c(
      "Escola", "Rede", "Localização",
      "Internet", "Lab. Informática",
      "Biblioteca", "Quadra Esportiva",
      "Matrículas", "Docentes",
      "Porte", "Infraestrutura básica"
    ),
    options = list(
      pageLength = 10,
      scrollX    = TRUE,
      language   = list(
        url = "//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese-Brasil.json"
      )
    )
  )

3.10 Resumo das Variáveis de Interesse

resumo_variaveis <- tibble(
  variavel = c(
    "NO_ENTIDADE", "DEPENDENCIA", "LOCALIZACAO",
    "IN_INTERNET", "IN_LABORATORIO_INFORMATICA", "IN_BIBLIOTECA",
    "IN_QUADRA_ESPORTES", "IN_AGUA_POTAVEL",
    "IN_ENERGIA_REDE_PUBLICA", "IN_ESGOTO_REDE_PUBLICA",
    "IN_ACESSIBILIDADE_INEXISTENTE", "IN_BANHEIRO_PNE",
    "QT_MAT_BAS", "QT_MAT_INF", "QT_MAT_FUND",
    "QT_MAT_MED", "QT_MAT_EJA",
    "QT_DOC_BAS", "QT_SALAS_UTILIZADAS",
    "PROP_FEMININO", "PROP_PRETO_PARDO",
    "RAZAO_ALUNO_DOCENTE", "PORTE",
    "INFRA_BASICA_COMPLETA"
  ),
  descricao = c(
    "Nome da escola",
    "Rede de ensino (Federal, Estadual, Municipal ou Privada)",
    "Localização da escola (Urbana ou Rural)",
    "Possui acesso à internet",
    "Possui laboratório de informática",
    "Possui biblioteca ou sala de leitura",
    "Possui quadra de esportes",
    "Possui água potável",
    "Possui energia elétrica da rede pública",
    "Possui esgoto ligado à rede pública",
    "Não possui nenhum recurso de acessibilidade",
    "Possui banheiro adaptado para PNE",
    "Total de matrículas na educação básica",
    "Matrículas na Educação Infantil",
    "Matrículas no Ensino Fundamental",
    "Matrículas no Ensino Médio",
    "Matrículas na EJA (Educação de Jovens e Adultos)",
    "Total de docentes na educação básica",
    "Número de salas de aula utilizadas",
    "Proporção de alunas (criada a partir de QT_MAT_BAS_FEM / QT_MAT_BAS)",
    "Proporção de alunos pretos e pardos (criada a partir das variáveis de raça)",
    "Razão de alunos por docente (criada a partir de QT_MAT_BAS / QT_DOC_BAS)",
    "Porte da escola por número de matrículas (variável criada)",
    "Indica se a escola possui os 4 itens básicos de infraestrutura (variável criada)"
  ),
  tipo = c(
    "Categórica", "Categórica (fator)", "Categórica (fator)",
    "Categórica (fator)", "Categórica (fator)", "Categórica (fator)",
    "Categórica (fator)", "Categórica (fator)",
    "Categórica (fator)", "Categórica (fator)",
    "Categórica (fator)", "Categórica (fator)",
    "Numérica inteira", "Numérica inteira", "Numérica inteira",
    "Numérica inteira", "Numérica inteira",
    "Numérica inteira", "Numérica inteira",
    "Numérica decimal", "Numérica decimal",
    "Numérica decimal", "Categórica ordinal (fator)",
    "Categórica (fator)"
  )
)

kable(
  resumo_variaveis,
  col.names = c("Variável", "Descrição", "Tipo"),
  caption   = "Descrição das variáveis de interesse após o pré-processamento"
)
Descrição das variáveis de interesse após o pré-processamento
Variável Descrição Tipo
NO_ENTIDADE Nome da escola Categórica
DEPENDENCIA Rede de ensino (Federal, Estadual, Municipal ou Privada) Categórica (fator)
LOCALIZACAO Localização da escola (Urbana ou Rural) Categórica (fator)
IN_INTERNET Possui acesso à internet Categórica (fator)
IN_LABORATORIO_INFORMATICA Possui laboratório de informática Categórica (fator)
IN_BIBLIOTECA Possui biblioteca ou sala de leitura Categórica (fator)
IN_QUADRA_ESPORTES Possui quadra de esportes Categórica (fator)
IN_AGUA_POTAVEL Possui água potável Categórica (fator)
IN_ENERGIA_REDE_PUBLICA Possui energia elétrica da rede pública Categórica (fator)
IN_ESGOTO_REDE_PUBLICA Possui esgoto ligado à rede pública Categórica (fator)
IN_ACESSIBILIDADE_INEXISTENTE Não possui nenhum recurso de acessibilidade Categórica (fator)
IN_BANHEIRO_PNE Possui banheiro adaptado para PNE Categórica (fator)
QT_MAT_BAS Total de matrículas na educação básica Numérica inteira
QT_MAT_INF Matrículas na Educação Infantil Numérica inteira
QT_MAT_FUND Matrículas no Ensino Fundamental Numérica inteira
QT_MAT_MED Matrículas no Ensino Médio Numérica inteira
QT_MAT_EJA Matrículas na EJA (Educação de Jovens e Adultos) Numérica inteira
QT_DOC_BAS Total de docentes na educação básica Numérica inteira
QT_SALAS_UTILIZADAS Número de salas de aula utilizadas Numérica inteira
PROP_FEMININO Proporção de alunas (criada a partir de QT_MAT_BAS_FEM / QT_MAT_BAS) Numérica decimal
PROP_PRETO_PARDO Proporção de alunos pretos e pardos (criada a partir das variáveis de raça) Numérica decimal
RAZAO_ALUNO_DOCENTE Razão de alunos por docente (criada a partir de QT_MAT_BAS / QT_DOC_BAS) Numérica decimal
PORTE Porte da escola por número de matrículas (variável criada) Categórica ordinal (fator)
INFRA_BASICA_COMPLETA Indica se a escola possui os 4 itens básicos de infraestrutura (variável criada) Categórica (fator)

3.11 Estatísticas Descritivas Iniciais

estatisticas <- tibble(
  indicador = c(
    "Escolas ativas em Igarassu/PE",
    "Escolas da rede pública (Federal + Estadual + Municipal)",
    "Escolas da rede privada",
    "Escolas em zona urbana",
    "Escolas em zona rural",
    "Total de matrículas na educação básica",
    "Total de docentes na educação básica",
    "Média de alunos por escola",
    "Média de docentes por escola",
    "Média de alunos por docente",
    "Escolas com internet",
    "Escolas com laboratório de informática",
    "Escolas com biblioteca",
    "Escolas com infraestrutura básica completa"
  ),
  valor = c(
    nrow(igarassu),
    sum(igarassu$DEPENDENCIA %in% c("Federal","Estadual","Municipal"), na.rm = TRUE),
    sum(igarassu$DEPENDENCIA == "Privada", na.rm = TRUE),
    sum(igarassu$LOCALIZACAO == "Urbana", na.rm = TRUE),
    sum(igarassu$LOCALIZACAO == "Rural",  na.rm = TRUE),
    sum(igarassu$QT_MAT_BAS,  na.rm = TRUE),
    sum(igarassu$QT_DOC_BAS,  na.rm = TRUE),
    round(mean(igarassu$QT_MAT_BAS, na.rm = TRUE), 1),
    round(mean(igarassu$QT_DOC_BAS, na.rm = TRUE), 1),
    round(mean(igarassu$RAZAO_ALUNO_DOCENTE, na.rm = TRUE), 1),
    paste0(sum(igarassu$IN_INTERNET == "Sim", na.rm = TRUE),
           " (", percent(mean(igarassu$IN_INTERNET == "Sim", na.rm = TRUE), accuracy = 0.1), ")"),
    paste0(sum(igarassu$IN_LABORATORIO_INFORMATICA == "Sim", na.rm = TRUE),
           " (", percent(mean(igarassu$IN_LABORATORIO_INFORMATICA == "Sim", na.rm = TRUE), accuracy = 0.1), ")"),
    paste0(sum(igarassu$IN_BIBLIOTECA == "Sim", na.rm = TRUE),
           " (", percent(mean(igarassu$IN_BIBLIOTECA == "Sim", na.rm = TRUE), accuracy = 0.1), ")"),
    paste0(sum(igarassu$INFRA_BASICA_COMPLETA == "Infraestrutura completa", na.rm = TRUE),
           " (", percent(mean(igarassu$INFRA_BASICA_COMPLETA == "Infraestrutura completa", na.rm = TRUE), accuracy = 0.1), ")")
  )
)

kable(
  estatisticas,
  col.names = c("Indicador", "Valor"),
  caption   = "Resumo geral da educação básica em Igarassu/PE — Censo Escolar 2024"
)
Resumo geral da educação básica em Igarassu/PE — Censo Escolar 2024
Indicador Valor
Escolas ativas em Igarassu/PE 85
Escolas da rede pública (Federal + Estadual + Municipal) 60
Escolas da rede privada 25
Escolas em zona urbana 59
Escolas em zona rural 26
Total de matrículas na educação básica 26561
Total de docentes na educação básica 1175
Média de alunos por escola 312.5
Média de docentes por escola 13.8
Média de alunos por docente 21.7
Escolas com internet 83 (97.6%)
Escolas com laboratório de informática 19 (22.4%)
Escolas com biblioteca 40 (47.1%)
Escolas com infraestrutura básica completa 24 (28.2%)

3.12 Distribuição por Rede de Ensino e Localização

igarassu |>
  count(DEPENDENCIA, LOCALIZACAO, name = "n_escolas") |>
  mutate(
    percentual = percent(n_escolas / sum(n_escolas), accuracy = 0.1)
  ) |>
  kable(
    col.names = c("Rede", "Localização", "Nº de Escolas", "% do Total"),
    caption   = "Distribuição das escolas ativas por rede e localização — Igarassu/PE (2024)"
  )
Distribuição das escolas ativas por rede e localização — Igarassu/PE (2024)
Rede Localização Nº de Escolas % do Total
Federal Urbana 1 1.2%
Estadual Urbana 9 10.6%
Estadual Rural 1 1.2%
Municipal Urbana 25 29.4%
Municipal Rural 24 28.2%
Privada Urbana 24 28.2%
Privada Rural 1 1.2%

4 Considerações Parciais

Nesta primeira etapa, os dados do Censo Escolar 2024 referentes ao município de Igarassu/PE foram importados, filtrados e pré-processados. O arquivo original contém informações de todas as escolas do Brasil em um único CSV com 426 variáveis; após o filtro pelo código IBGE 2606804, obteve-se um recorte de 85 escolas ativas.

O pré-processamento incluiu a seleção das variáveis relevantes para os três eixos de análise (infraestrutura, matrículas e docentes), a conversão de códigos numéricos em fatores legíveis, o tratamento de valores ausentes e a criação de quatro variáveis derivadas: proporção de alunas, proporção de alunos pretos e pardos, razão aluno-docente e um indicador de infraestrutura básica completa.

A base limpa está adequada para a próxima etapa do projeto, que será dedicada à análise exploratória aprofundada. A partir desses dados, será possível investigar as disparidades de infraestrutura entre redes pública e privada, o perfil das matrículas por nível de ensino e localização, e a distribuição do corpo docente no município.