1. Contextualização

Este documento tem como objetivo dar visibilidade ao processo de transformação de dados dos questionários aplicados às redes sobre o uso de tecnologia.

2. Importação dos dados a serem utilizados

O primeiro passo deste processo é importar os dados que serão utilizados neste exercício. Serão utilizadas as seguintes bases de dados:

Censo Escolar

A primeira base importada é a do Censo! Veja abaixo:

# Importação do arquivo
dt_censo_24 <- data.table::fread(here("dados", "microdados_ed_basica_2024.csv"), encoding="Latin-1")

Logo no início, realiza-se um tratamento inicial deste arquivo. Veja abaixo:

1- Filtro de escolas que possuem pelo menos 1 matrícula ativa;
2- Criação da variável DUMMY_INFANTIL_ANOS_INICIAIS_CENSO que assume 1 se a escola não atender nenhuma das etapas/modalidades: Anos Finais do Ensino Fundamental, Ensino Médio, Educação Profissional e EJA;
3- Seleção das variáveis CO_ENTIDADE e DUMMY_INFANTIL_ANOS_INICIAIS_CENSO.

# Tratamento inicial
dt_censo_24 <- dt_censo_24 %>%
  # Fitro para excluir as escolas que não possuem matrícula
  filter(QT_MAT_BAS > 0 & !(is.na(QT_MAT_BAS))) %>% 
  # Criação da variável que indica as escolas que atendem exclusivamente Educação Infantil e/ou Anos Iniciais do Ensino Fundamental
  mutate(
    DUMMY_INFANTIL_ANOS_INICIAIS_CENSO = ifelse(
      (IN_FUND_AF == 0) & (IN_MED == 0) & (IN_PROF == 0) & (IN_EJA == 0), 1, 0
    )
  ) %>% 
  # Seleção das variáveis CO_ENTIDADE e DUMMY_INFANTIL_ANOS_INICIAIS_CENSO, pois as demais não serão utilizadas
  select(CO_ENTIDADE, DUMMY_INFANTIL_ANOS_INICIAIS_CENSO)

Fonte única

Em seguida, importamos a Fonte Única! Veja abaixo:

# Importação do arquivo
fonteunica <- data.table::fread(here("dados", "20250915_fonteunica.csv"))
# Seleção de variáveis
fonteunica <- fonteunica %>% 
  select(
    CO_UF, SG_UF, CO_MUNICIPIO, NO_MUNICIPIO, CO_ENTIDADE, NO_ENTIDADE, TP_DEPENDENCIA_CENSO,
    QT_MAT_BAS, QT_MAT_INF, QT_MAT_FUND, QT_MAT_FUND_AI, QT_MAT_FUND_AF, QT_MAT_MED, QT_MAT_ESP, QT_MAT_MAIOR_TURNO
  )