Este documento tem como objetivo dar visibilidade ao processo de transformação de dados dos questionários aplicados às redes sobre o uso de tecnologia.
O primeiro passo deste processo é importar os dados que serão utilizados neste exercício. Serão utilizadas as seguintes bases de dados:
A primeira base importada é a do Censo! Veja abaixo:
# Importação do arquivo
dt_censo_24 <- data.table::fread(here("dados", "microdados_ed_basica_2024.csv"), encoding="Latin-1")
Logo no início, realiza-se um tratamento inicial deste arquivo. Veja abaixo:
1- Filtro de escolas que possuem pelo menos 1 matrícula ativa;
2-
Criação da variável DUMMY_INFANTIL_ANOS_INICIAIS_CENSO
que
assume 1 se a escola não atender nenhuma das etapas/modalidades: Anos
Finais do Ensino Fundamental, Ensino Médio, Educação Profissional e
EJA;
3- Seleção das variáveis CO_ENTIDADE
e
DUMMY_INFANTIL_ANOS_INICIAIS_CENSO
.
# Tratamento inicial
dt_censo_24 <- dt_censo_24 %>%
# Fitro para excluir as escolas que não possuem matrícula
filter(QT_MAT_BAS > 0 & !(is.na(QT_MAT_BAS))) %>%
# Criação da variável que indica as escolas que atendem exclusivamente Educação Infantil e/ou Anos Iniciais do Ensino Fundamental
mutate(
DUMMY_INFANTIL_ANOS_INICIAIS_CENSO = ifelse(
(IN_FUND_AF == 0) & (IN_MED == 0) & (IN_PROF == 0) & (IN_EJA == 0), 1, 0
)
) %>%
# Seleção das variáveis CO_ENTIDADE e DUMMY_INFANTIL_ANOS_INICIAIS_CENSO, pois as demais não serão utilizadas
select(CO_ENTIDADE, DUMMY_INFANTIL_ANOS_INICIAIS_CENSO)
Em seguida, importamos a Fonte Única! Veja abaixo:
# Importação do arquivo
fonteunica <- data.table::fread(here("dados", "20250915_fonteunica.csv"))
# Seleção de variáveis
fonteunica <- fonteunica %>%
select(
CO_UF, SG_UF, CO_MUNICIPIO, NO_MUNICIPIO, CO_ENTIDADE, NO_ENTIDADE, TP_DEPENDENCIA_CENSO,
QT_MAT_BAS, QT_MAT_INF, QT_MAT_FUND, QT_MAT_FUND_AI, QT_MAT_FUND_AF, QT_MAT_MED, QT_MAT_ESP, QT_MAT_MAIOR_TURNO
)