Resumo

Quais são os problemas prioritários do Ensino Médio que deveriam estar no foco da discussão sobre a reforma? Um dos grandes problemas é o abandono escolar, que é mais do que o dobro do Ensino Fundamental. Analisando os dados oficiais do ano passado, encontramos algumas possíveis causas do abandono escolar no Ensino Médio brasileiro. O principal fator é o nível socioeconômico: os alunos abandonam a escola porque precisam trabalhar prematuramente, dentre outras dificuldades. Isso reforça a importância das políticas de apoio e permanência, que não estão previstas no Novo Ensino Médio. Outro fator importante é o tempo integral, que ajuda a reter o aluno na escola, sendo assim um ponto positivo para o Novo Ensino Médio - embora possa gerar desigualdades. Já a Educação à Distância se mostrou um fator negativo, aumentando a tendência de abandono escolar. A profissionalização da carreira docente, ao contrário, ajuda a reter o aluno na escola. Mas este é outro ponto negativo do Novo Ensino Médio, que abre muitas brechas para a precarização do trabalho dos professores, como a validade do “notório saber” em lugar da formação adequada, o aumento do esforço sem aumento de recursos, além da “plataformização” do ensino via EAD.

Objetivo

Para contribuir com as discussões sobre a reforma do Ensino Médio, vamos dar um passo atrás e investigar as causas dos problemas. E quais são os problemas do Ensino Médio? Além de qualidade, equidade, infraestrutura e subfinanciamento, que são problemas comuns a todas as etapas da Educação Básica, no Ensino Médio há também a questão do acesso e permanência, ou seja, há muitos adolescentes fora da escola nessa etapa de ensino. A taxa de abandono é muito maior no Ensino Médio do que nas etapas anteriores. Mas quais são as principais causas do abandono nas escolas estaduais de Ensino Médio? É isso que investigamos neste estudo.

Destaques

  • O nível socioeconômico dos alunos é o fator mais associado ao abandono escolar, tendo controlado o efeito dos estados. Isso reflete diversos fenômenos conhecidos e aponta para a importância das políticas de apoio e permanência, que não estão previstas no Novo Ensino Médio.

  • Na maior parte das escolas, a reprovação tende a aumentar o abandono escolar, o que é um problema conhecido e mostra a ineficácia da reprovação na maioria dos casos.

  • O Ensino à Distância (EAD) se concentra em São Paulo e também tende a aumentar o abandono escolar, mesmo controlando o efeito do nível socioeconômico e outras variáveis. Esta é uma evidência contra um aspecto importante da reforma em andamento, que é o estímulo à EAD no Ensino Médio.

  • A adequação da formação docente é um fator que tende a reduzir o abandono escolar, mesmo controlando nível socioeconômico e outras variáveis. Esta pode ser considerada uma evidência contra o “notório saber” como qualificação para a função de professor, como propõe o Novo Ensino Médio.

  • De modo geral, a profissionalização da carreira docente tende a reduzir o abandono escolar, o que é uma confirmação do que já se sabe e também um alerta sobre a precarização do trabalho docente, potencializada por diversos aspectos da reforma.

  • Escolas de tempo integral (ao menos 7h por dia) em geral apresentam menor abandono escolar, controlando efeito do nível socioeconômico e outras variáveis. Esta é uma evidência a favor de um ponto importante do Novo Ensino Médio - o tempo integral - cuja origem na verdade é a meta 6 do Plano Nacional de Educação de 2014. Mas, por outro lado, há questões importantes relacionadas à produção de desigualdade na rede.

  • Há grande variação entre os estados, o que evidencia a importância das políticas estaduais, além dos fatores contextuais.

Método

Utilizamos modelos de regressão linear tendo a taxa de abandono escolar como variável resposta. Para a definição das variáveis preditoras, foi ajustado um modelo inicial com 26 variáveis. Esse modelo passou por um processo de otimização, com critérios objetivos (AIC e p-valor), para seleção das variáveis mais associadas ao abandono escolar. As variáveis foram padronizadas para permitir a comparação dos coeficientes dos modelos.

O método utilizado não permite a inferência de causalidade, como em métodos experimentais e quase-experimentais. Mas os resultados servem como evidências que podem ser complementadas por outras informações, pela lógica e pela teoria.

Para garantir a transparência e reprodutibilidade dos resultados aqui apresentados, disponibilizamos todos os códigos de programação. Para acessar os códigos, clique nos botões “code” que aparecem à direita. Como os dados utilizados também são abertos, qualquer pessoa pode reproduzir os resultados deste estudo, desde que tenha instalado em seu computador o software livre R.

Preparação do dados

Foi utilizada a base de dados de escolas de Ensino Médio disponibilizada no repositório Novo-Ensino-Medio_dados_abertos, que contém dados do Censo Escolar 2022 e indicadores educacionais do INEP.

Neste estudo, incluímos apenas as escolas estaduais, que são 18.556 no total. De todas as variáveis disponíveis, selecionamos 26 candidatas a variável preditora do abandono escolar, a serem testadas na modelagem estatística. Maiores detalhes no código (clique no botão à direita).

No Anexo há uma descrição dessas variáveis, onde se nota que 11% das escolas têm EAD, 23% tem tempo integral e 35% tem atendimento educacional especializado. Além disso, embora 95% tenha acesso à internet, apenas 78% disponibiliza a internet para aprendizagem dos alunos. E há 12% de escolas sem nenhum material pedagógico.

clique para ver o código

library(tidyverse)
library(rmarkdown)
library(sjPlot)
library(SignifReg)
library(formattable)
library(knitr)
library(kableExtra)
library(openxlsx)
library(geobr)
library(ggthemes)
library(ggtext)

ee=read_csv2('https://github.com/travitzki/Novo-Ensino-Medio_dados_abertos/raw/main/dados/escolasEM2022.csv.gz')
# ee=read_csv2('../dados/escolasEM2022.csv.gz')

# criar variaveis ------------------

ee=ee %>% 
  mutate(tempo_integral = QT_MAT_MED_INT / QT_MAT_MED) # prpporcao de matriculas
# ee[,c('QT_MAT_MED','QT_MAT_MED_INT','tempo_integral')] # check

# filtrar dados -------------------

# deixar apenas escolas estaduais
ee2 <- ee %>% 
  filter(DEPENDENCIA=='Estadual')

# selecionar variaveis iniciais
ee2 <- ee2 %>% 
  select(taxa_abandono,nivel_socioeconomico,IN_EJA,
         starts_with('IN_MEDIACAO_'), 
         tem_atendimento_educacional_especializado=TP_AEE,IN_EXAME_SELECAO,
         adequacao_formacao_docente, esforco_docente, regularidade_docente,
         IN_MATERIAL_PED_DESPORTIVA:IN_MATERIAL_PED_NENHUM, 
         IN_COMPUTADOR:tempo_integral, UF=SG_UF)

# tirar dos nomes
names(ee2)=gsub('IN_','',names(ee2))

# padronizar variaveis para modelos
ee3 <- ee2 %>% 
  mutate_if(.predicate = is.numeric, .funs = function(x) as.numeric(scale(x))) %>% 
  select(-MEDIACAO_PRESENCIAL) %>% # sem variancia, tudo 1
  na.omit() # para otimizacao

Abandono e evasão

A taxa de abandono de uma escola se refere ao percentual de alunos que saíram da escola em certo ano, sem terem sido aprovados nem reprovados. Mas esse aluno pode ter ido para outra escola, nesse caso se trataria de abandono mas não de evasão. A evasão se refere ao aluno que saiu da rede escolar e nunca mais voltou.

Um indicador bastante utilizado para evasão escolar é o percentual de crianças e jovens fora da escola. Em relação ao Ensino Médio, no início da década de 90, cerca de 40% dos jovens de 15 a 17 anos estavam fora da escola (dados do IBGE). Em 2000, esse número passou para 20%, o que foi um grande feito. Desde então, a evasão continua diminuindo, só que mais lentamente, chegando a 7,2% em 2021.

Por que as crianças e jovens desistem da escola? Segundo pesquisa da Unicef no ano passado, 21% dos alunos entre 11 e 19 anos pensaram em desistir da escola nos últimos três meses. Os principais motivos apontados por eles foram:

  • Dificuldades em acompanhar as explicações e atividades na sala de aula

  • Consideram a escola desinteressante e pouco útil

  • Não se sentem acolhidos pela escola

  • Precisam trabalhar

Abandono escolar por série

O gráfico abaixo mostra a taxa de abandono escolar em cada série do Ensino Fundamental e do Ensino Médio em 2022. Como seria esperado, as escolas públicas têm uma taxa de abandono maior do que as privadas. O abandono começa a aumentar nos anos finais do ensino fundamental. Na passagem para o ensino médio, o abandono mais do que dobra, ultrapassando 6% dos alunos.

Uma informação importante é que até 2020, o abandono escolar era maior na 1a série do Ensino Médio do que nas outras duas (confira nesse painel do Cenpec). Mas como vemos no gráfico, essa tendência parece ter mudado, o que merece investigação.

ufs <- read.xlsx('https://github.com/travitzki/Novo-Ensino-Medio_dados_abertos/raw/main/dados/tx_rend_brasil_regioes_ufs_2022.xlsx', startRow = 9, na.strings = c('--',' '))
# ufs <- read.xlsx('../dados/tx_rend_brasil_regioes_ufs_2022.xlsx', startRow = 9, na.strings = c('--',' '))

uf5 <- ufs %>% 
  filter(NO_CATEGORIA=='Total',
         UNIDGEO=="Brasil",
         NO_DEPENDENCIA%in%c("Privada",'Pública')) %>% 
  select(NO_DEPENDENCIA, `3_CAT_FUN_01`:`3_CAT_MED_03`) %>% 
  select(-`3_CAT_MED`)

names(uf5)=gsub('3_CAT_','',names(uf5))
names(uf5)=gsub('FUN_','Ens_Fund_',names(uf5))
names(uf5)=gsub('MED_','Ens_Medio_',names(uf5))
names(uf5)=gsub('_0','_',names(uf5))

dtt=uf5 %>% pivot_longer(cols = -NO_DEPENDENCIA)

dtt %>% ggplot(aes(x=value, y= fct_rev(name), fill=NO_DEPENDENCIA))+
  geom_bar(stat = 'identity', position =  position_dodge2())+
  labs(x='Taxa de abandono (%)', y=NULL, 
       fill='Tipo de escola', caption='Fonte: Indicadores educacionais 2022 / INEP')+
  theme_clean()+
  theme(axis.text.y = element_text(size=11),
        plot.caption = element_markdown(hjust = 0.5))

Abandono e reprovação

Na maioria dos casos, as escolas de Ensino Médio com maior taxa de reprovação também tem maior taxa de abandono. No gráfico abaixo, à esquerda da linha pontilhada se concentra 90% das escolas de Ensino Médio. Nessa faixa, nota-se a correlação entre abandono e reprovação, exceto, curiosamente, nas escolas federais. Nas estaduais, a correlação se inverte à direita da linha pontilhada, o que merece investigação.

# muda padrão no quantil 90% das estaduais - atenção a esse 10%
pontox=quantile(ee$taxa_reprovacao, probs = .9, na.rm = T) 

ee %>% ggplot(aes(x=taxa_reprovacao, y=taxa_abandono, color=DEPENDENCIA))+
  # geom_point(color='gray70')+
  geom_smooth(se = FALSE)+
  geom_vline(xintercept = pontox, linetype="dashed", size=1)+
  theme_bw()+
  theme(panel.grid.minor = element_blank())

Abandono escolar por estado

Abaixo há um mapa com a taxa de abandono nas escolas estaduais de ensino médio em cada estado brasileiro. Os estados com maior taxa de abandono escolar são Bahia, Rio Grande do Norte e Pará. Os estados com menor taxa de abandono são Pernambuco, Goiás e Espírito Santo.

Dá para notar que há uma variação grande, o que sugere diferenças importantes nas políticas estaduais referentes ao ensino médio, além de diferenças de contexto.

uf1 <- ufs %>% 
  filter(NO_CATEGORIA=='Total', NO_DEPENDENCIA=="Estadual") %>% 
  select(name_state=UNIDGEO, taxa_abandono=`3_CAT_MED`)

## esse codigo reproduz esses numeros mas tem algum problema de missing no Mato Grosso
# agg = ee %>% 
#   group_by(SG_UF) %>% 
#   filter(DEPENDENCIA=='Estadual') %>% 
#   # media ponderada
#   summarise(taxa_abandono=round(weighted.mean(x=taxa_abandono, w=QT_MAT_MED, na.rm = TRUE),1))

# pegar dados geograficos 
uf2 <- read_state(code_state = "all", year = 2020, showProgress = FALSE)
# fix
uf2$name_state=gsub(' Do ',' do ',uf2$name_state, fixed = T)
uf2$name_state=gsub(' De ',' de ',uf2$name_state, fixed = T)
uf2$name_state=gsub('Amazônas','Amazonas',uf2$name_state, fixed = T)

uf3 <- uf2 %>% 
  left_join(uf1)

uf3$taxa_abandono=uf3$taxa_abandono/100

# mapa
uf3 %>% ggplot() +
  geom_sf(aes(geometry=geom, fill=taxa_abandono)) +
  scale_fill_gradient(high = 'red', low='white', labels = scales::percent) +
  labs(fill = 'Taxa de abandono\nnas escolas estaduais\nde Ensino Médio',
       caption = 'Fonte: Indicadores educacionais 2022 / INEP')+
  theme_map()

Fatores mais associados ao abandono escolar

O gráfico abaixo mostra mostra o grau de associação das diferentes variáveis no modelo final, que também inclui o estado (não está na figura mas está no Anexo). As barras vermelhas indicam os fatores que tendem a aumentar o abandono escolar. As barras verdes indicam aqueles que tendem a diminuir o abandono escolar. O tamanho da barra representa a importância de cada fator, ou seja, o grau de associação com o abandono.

# otimizar modelo

lm1 <- lm(taxa_abandono ~ ., data = ee3)
# otimizar modelo segundo AIC
lm1 <- step(lm1, trace = FALSE)
# ajuste fino retirando variaveis com p-valor alto
lm1 <- SignifReg::SignifReg(lm1, direction = "both", criterion = 'p-value')

save(lm1, file = 'lm1.rda')
# load('lm1.rda')

# pegar coeficientes do modelo
cf=coef(lm1)[2:11]
cf=data.frame(variavel=names(cf), cf)
cf$cor2='1ajuda'
cf$cor2[cf$cf>0]='2piora'

# plotar coef
cf %>% ggplot(aes(x=cf, y= reorder(variavel, desc(variavel)), fill=cor2))+
  geom_bar(stat = 'identity', width = .7)+
  scale_fill_manual(values = c('#23d400', '#d40000'))+
  # scale_y_discrete(limits = rev(levels(cf$variavel)))+
  labs(x='associação com abandono escolar (coeficiente do modelo)', y=NULL, title = 'Fatores mais associados ao abandono escolar\nno Brasil')+
  geom_vline(xintercept=0)+
  theme_bw()+
  theme(legend.position = 'none',
        axis.text.y = element_text(size = 11))

É impressionante como o nível socioeconômico se destaca de todos os outros fatores. Isso significa que, nas escolas com alunos mais pobres, o abandono escolar tende a ser muito maior, mesmo quando controlamos todas as outras variáveis. Em parte, isso reflete limitações da escola e da sociedade, como a necessidade de muitos trabalharem prematuramente, mas também reforça a importância das políticas de apoio e permanência para que os alunos não abandonem o Ensino Médio.

O segundo fator mais importante no modelo é a proporção de alunos de ensino médio que estudam em tempo integral (no mínimo 7 horas por dia). Considerando que o nível socioeconômico já está sendo controlado, isto poderia ser explicado por pelo menos duas hipóteses, não excludentes: 1) o ensino médio de tempo integral é mais atrativo e por isso retém mais os alunos; 2) os alunos que fizeram essa opção sabiam o que estavam fazendo, e como investiram mais tempo na escola, desistiram menos. Em ambos os casos, parece ser uma evidência a favor do ensino de tempo integral, previsto na meta 6 do Plano Nacional de Educação e mais recentemente no Novo Ensino Médio. No entanto, também há evidências de que as políticas para o tempo integral muitas vezes geram mais desigualdade, o que é tratado mais à frente neste estudo.

No gráfico notamos também que os três indicadores sobre profissionalização da carreira docente estão presentes. A adequação da formação e a regularidade docente contribuem para a diminuição do abandono escolar. Já o esforço docente aumenta o abandono, o que mostra a importância de boas condições de trabalho para que o trabalho possa ser bem feito.

Também vale notar que a presença de um exame de seleção (que pode ser uma prova ou uma análise de currículo) tende a diminuir o abandono escolar. Embora, nesse caso, também seja possível imaginar a relação inversa, ou seja, que o fato dos alunos abandonarem menos a escola aumenta as chances da escola precisar selecionar novos alunos, por limitação de vagas.


Educação à Distância e abandono escolar

Como vemos na tabela abaixo, quase todas as escolas com EAD estão no Estado de São Paulo. Fazendo a conta, 97%. E dentro do Estado de São Paulo, 56% das escolas tem EAD. Talvez haja subnotificação em outros estados, mas isso não vem ao caso no momento.

agg = ee2 %>% 
  group_by(UF) %>% 
  summarise(percentual_de_escolas_com_EAD=round(mean(MEDIACAO_EAD, na.rm = T),3),
            numero_de_escolas_com_EAD=sum(MEDIACAO_EAD, na.rm = T)) %>% 
  filter(numero_de_escolas_com_EAD!=0)

# prop.table(agg$numero_de_escolas_com_EAD) # sp=97%

agg1 = ee2 %>% 
  summarise(percentual_de_escolas_com_EAD=round(mean(MEDIACAO_EAD, na.rm = T),3),
            numero_de_escolas_com_EAD=sum(MEDIACAO_EAD, na.rm = T)) %>% 
  filter(numero_de_escolas_com_EAD!=0) %>% 
  mutate(UF='Total')

agg1 = bind_rows(agg, agg1)

agg1$percentual_de_escolas_com_EAD = formattable::percent(agg1$percentual_de_escolas_com_EAD, digits = 1)

knitr::kable(agg1) %>%
  kableExtra::kable_styling(full_width = F)
UF percentual_de_escolas_com_EAD numero_de_escolas_com_EAD
AC 0.4% 1
DF 1.0% 1
GO 6.1% 45
MA 0.1% 1
MS 1.8% 6
PE 0.1% 1
PI 1.6% 8
RJ 0.2% 2
SP 55.7% 2213
Total 11.4% 2278

Sendo assim, partindo desses dados, a melhor estratégia para analisar a Educação à Distância é ajustar um modelo apenas para as escolas de São Paulo. Usamos o mesmo método de otimização aplicado para as escolas brasileiras. As variáveis mais associadas ao abandono escolar em São Paulo podem ser vistas na figura abaixo.

# filtrar
ee4 <- ee3 %>%
  filter(UF=='SP') %>%
  select(-UF)

# otimizar modelo - repetir metodo anterior

lm2 <- lm(taxa_abandono ~ ., data = ee4)
# otimizar modelo segundo AIC
lm2 <- step(lm2, trace = FALSE)
# ajuste fino retirando variaveis com p-valor alto
lm2 <- SignifReg::SignifReg(lm2, direction = "both", criterion = 'p-value')

save(lm2, file = 'lm2.rda')
# load('lm2.rda')

# pegar coeficientes
cf=coef(lm2)[2:8]
cf=data.frame(variavel=names(cf), cf)
cf$cor2='1ajuda'
cf$cor2[cf$cf>0]='2piora'

# plotar coef
cf %>% ggplot(aes(x=cf, y= reorder(variavel, desc(variavel)), fill=cor2))+
  geom_bar(stat = 'identity', width = .7)+
  scale_fill_manual(values = c('#23d400', '#d40000'))+
  # scale_y_discrete(limits = rev(levels(cf$variavel)))+
  labs(x='associação com abandono escolar (coeficiente do modelo)', y=NULL, title = 'Fatores mais associados ao abandono escolar\nem SP')+
  geom_vline(xintercept=0)+
  theme_bw()+
  theme(legend.position = 'none',
        axis.text.y = element_text(size = 11))

Note como a mediação EAD está associada ao aumento do abandono escolar. Isso é importante no contexto da reforma do Ensino Médio. Vale lembrar que São Paulo tem uma rede estadual muito madura e autônoma, não dá para dizer que houve problemas de implementação da EAD pela falta de coordenação do Governo Federal, nem tampouco pela pandemia, que impulsionou a EAD como nunca. Não parece se tratar de um problema de implementação, mas sim de concepção.

É importante frisar que EAD é diferente de ensino híbrido. No ensino híbrido, o professor planeja atividades não presenciais para complementar o trabalho em classe e enriquecer a experiêcia digital dos alunos. Já a Educação à Distância, no contexto do Ensino Médio e da “plataformização” de diversas atividades humanas, representa a gradual substituição do professor e da experiência presencial por sistemas automatizados de ensino, com baixo custo e baixa eficácia. No caso, a baixa eficácia se traduz nessa tendência da EAD a aumentar o abandono escolar, como se vê na figura.

Outro aspecto relevante na figura, comparando os resultados de São Paulo com os do Brasil, é que em São Paulo a adequação da formação docente está mais fortemente associada ao abandono escolar.

Tempo integral e desigualdade

Embora as escolas de tempo integral apresentem diversas características positivas e estejam previstas no Plano Nacional de Educação, também há evidências de que elas aumentam a desigualdade nas redes educacionais (confira aqui e aqui).

Confirmando essas evidências, o gráfico abaixo mostra que na maior parte dos estados, as escolas com tempo integral costumam ter alunos de maior nível socioeconômico. O Amapá foi o estado com maior correlação entre tempo integral e nível socioeconômico. As barras vermelhas representam as correlações estatisticamente significativas (p<0,05). Nesses casos, espera-se um aumento das desigualdades já existentes, o que é uma questão importante a ser tratada.

Por outro lado, em vários estados essa correlação não foi significativa (barras cinzas). Com uma análise mais aprofundada, é possível que se aprenda coisas úteis com esses estados, em especial os que estão mais abaixo do gráfico, como Paraíba e Minas Gerais.

dados=data.frame()
ufs.todas=unique(ee2$UF)
# lop.uf="MS"
for(lop.uf in ufs.todas){
  # filtrar
  ee4 <- ee %>%
    filter(SG_UF==lop.uf) %>% 
    filter(DEPENDENCIA=='Estadual')
  
  cc=cor.test(ee4$nivel_socioeconomico, ee4$tempo_integral)
  correlacao=round(as.numeric(cc$estimate),2)
  pvalor=round(cc$p.value,3)
  tempo_integral=round(weighted.mean(ee4$tempo_integral, ee4$QT_MAT_MED, na.rm = T),2)
  nse=round(weighted.mean(ee4$nivel_socioeconomico, ee4$QT_MAT_MED, na.rm = T),2)
  abandono=round(weighted.mean(ee4$taxa_abandono, ee4$QT_MAT_MED, na.rm = T)/100,2)
  num_escolas=nrow(ee4)
  
  dados.desse=data.frame(UF=lop.uf, correlacao, pvalor, tempo_integral, nse, abandono, num_escolas)
  dados=bind_rows(dados, dados.desse)
  
}
dados$significativo='Significativa'
dados$significativo[dados$pvalor>0.05]='Não significativa'

dados %>% 
  # filter(pvalor<0.05) %>% 
  # filter(correlacao>0.1) %>%
  ggplot(aes(x=correlacao, y=reorder(UF, correlacao), fill=significativo))+
  geom_bar(stat = 'identity', width = .8)+
  scale_fill_manual(values=c('gray','red'))+
  labs(y=NULL, x='Correlação entre tempo integral e NSE')+
  theme_bw()+
  theme(legend.position = 'bottom',
        legend.title = element_blank(),
        axis.title.x = element_text(size=9))

Referências

Anexo

Descrição dos dados

Abaixo podemos ver algumas variáveis dos dados analisados e os respectivos percentuais relativos às escolas estaduais de Ensino Médio.

# descricao dos dados


descr=ee2 %>% 
  # deixar só porcentagens
  select(-adequacao_formacao_docente, -esforco_docente,
         -regularidade_docente, -nivel_socioeconomico,
         -UF) %>% 
  skimr::skim()

descr=descr %>% 
  select(variavel=skim_variable, percentual=numeric.mean)

descr$percentual[1]=descr$percentual[1] / 100
descr$percentual = formattable::percent(descr$percentual, digits = 0)

knitr::kable(descr) %>%
  kableExtra::kable_styling(full_width = F)
variavel percentual
taxa_abandono 6%
EJA 36%
MEDIACAO_PRESENCIAL 100%
MEDIACAO_SEMIPRESENCIAL 0%
MEDIACAO_EAD 11%
tem_atendimento_educacional_especializado 35%
EXAME_SELECAO 4%
MATERIAL_PED_DESPORTIVA 77%
MATERIAL_PED_ARTISTICAS 42%
MATERIAL_PED_JOGOS 66%
MATERIAL_PED_DIFUSAO 63%
MATERIAL_PED_MULTIMIDIA 52%
MATERIAL_PED_CIENTIFICO 40%
MATERIAL_PED_NENHUM 12%
COMPUTADOR 94%
INTERNET_APRENDIZAGEM 78%
INTERNET 95%
PATIO_COBERTO 61%
ALMOXARIFADO 57%
tempo_integral 23%

Modelo de regressão: Brasil

# mostrar resultados com escalas padronizadas
sjPlot::tab_model(lm1, show.ci=FALSE)
  taxa_abandono
Predictors Estimates p
(Intercept) 0.11 0.165
nivel socioeconomico -0.22 <0.001
EJA 0.06 <0.001
EXAME SELECAO -0.03 <0.001
adequacao formacao
docente
-0.03 <0.001
esforco docente 0.02 0.006
regularidade docente -0.03 <0.001
MATERIAL PED NENHUM 0.02 0.004
INTERNET APRENDIZAGEM -0.03 <0.001
INTERNET -0.02 0.005
tempo integral -0.07 <0.001
UF [AL] -0.32 0.001
UF [AM] -0.26 0.003
UF [AP] 0.11 0.288
UF [BA] 0.36 <0.001
UF [CE] -0.61 <0.001
UF [DF] -0.14 0.197
UF [ES] -0.68 <0.001
UF [GO] -0.58 <0.001
UF [MA] -0.60 <0.001
UF [MG] -0.02 0.828
UF [MS] -0.18 0.043
UF [MT] 0.29 0.001
UF [PA] 0.07 0.447
UF [PB] 0.19 0.035
UF [PE] -0.79 <0.001
UF [PI] 0.09 0.278
UF [PR] -0.28 0.001
UF [RJ] -0.11 0.202
UF [RN] 0.53 <0.001
UF [RO] -0.06 0.574
UF [RR] 0.40 <0.001
UF [RS] 0.58 <0.001
UF [SC] -0.03 0.686
UF [SE] -0.46 <0.001
UF [SP] -0.23 0.005
UF [TO] -0.53 <0.001
Observations 18556
R2 / R2 adjusted 0.262 / 0.261

Modelo de regressão: São Paulo

# mostrar resultados com escalas padronizadas
sjPlot::tab_model(lm2, show.ci=FALSE)
  taxa_abandono
Predictors Estimates p
(Intercept) -0.20 <0.001
nivel socioeconomico -0.22 <0.001
EJA 0.02 0.013
MEDIACAO EAD 0.03 0.006
EXAME SELECAO -0.03 0.005
adequacao formacao
docente
-0.07 <0.001
regularidade docente -0.03 0.004
tempo integral -0.06 <0.001
Observations 3842
R2 / R2 adjusted 0.127 / 0.126