Introdução

O Ministério da Educação junto ao IBGE, investiga informações que permitem conhecer e dimensionar os fatores de risco e proteção à saúde dos adolescentes. Estudos feitos sobre o tema revelam que muitos fatores contribuem para o desinteresse dos alunos: como número excessivo de alunos nas salas de aula, falta de recursos pedagógicos ou tecnológicos que despertem o interesse dos alunos ou quando estes existem não são utilizados de forma correta pelo professor, fatores internos do aluno como problemas emocionais ou psicológicos, a desestrutura familiar, as políticas de governo, o desemprego, a desnutrição, a dificuldade de absorção do conteúdo passado em sala de aula, conflitos com colegas, desentendimento com professores e também a repetência do ano letivo (A pesquisa é realizada por amostragem, utilizando como referência para seleção o cadastro das escolas públicas e privadas do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira - INEP.

Objetivo

O objetivo da pesquisa é produzir informações que permitam conhecer a magnitude da evasão escolar e os fatores de risco e proteção à saúde, orientar e avaliar as intervenções em saúde adequadas ao adolescente, contribuindo para o monitoramento da saúde do escolar.

Metodologia

O plano amostral da pesquisa foi definido como uma amostra de conglomerados em dois estágios. O primeiro estágio de seleção é dividido por sexo (Masculino e Feminino) e o segundo por escolas públicas e privadas. O conjunto dos estudantes das turmas selecionadas formaram a amostra de alunos.

O cadastro de seleção da amostra da PeNSE 2019 foi construído com base nas informações disponíveis do Censo Escolar 2017 , realizado pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira - INEP. A seleção de turmas se concentrou nas etapas de ensino que abrangem a maior parte dos escolares com idade de 13 a 17 anos, que é a população-alvo da pesquisa, desconsiderando as escolas com menos de 20 alunos matriculados.

# Carregar base de dados usado na pesquisa

library(readr)
Tema02 <- read_delim("C:/Users/Wellen Dutra/Downloads/Tema02.csv", 
                     delim = ";", escape_double = FALSE, col_types = cols(TAXA_ENTRE_HOMENS = col_number(), 
                                                                          TAXA_ENTRE_MULHERES = col_number(), 
                                                                          TAXA_EM_ESCOLA_PUBLICA = col_number(), 
                                                                          TAXA_EM_ESCOLA_PRIVADA = col_number()), 
                     trim_ws = TRUE)



# Carregar tabela para visualização dos dados

library (kableExtra)
kable(Tema02, row.names = FALSE)%>%
  kable_styling( full_width = FALSE,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")
ESTADO REGIAO TAXA_ENTRE_HOMENS TAXA_ENTRE_MULHERES TAXA_EM_ESCOLA_PUBLICA TAXA_EM_ESCOLA_PRIVADA
Rondonia Norte 211 183 202 116
Acre Norte 18 124 155 89
Amazonas Norte 188 173 184 113
Roraima Norte 199 159 185 98
Para Norte 164 166 17 117
Amapa Norte 215 202 216 132
Tocantins Norte 202 169 191 94
Maranhao Nordeste 203 155 185 104
Piaui Nordeste 144 112 131 108
Ceara Nordeste 203 171 201 92
Rio Grande do Norte Nordeste 187 164 191 98
Paraiba Nordeste 183 154 182 10
Pernambuco Nordeste 213 178 208 119
Alagoas Nordeste 218 162 199 143
Sergipe Nordeste 149 126 145 108
Bahia Nordeste 157 139 155 93
Minas Gerais Sudeste 226 167 21 99
Espirito Santo Sudeste 199 166 193 10
Rio de Janeiro Sudeste 274 245 30 148
Sao Paulo Sudeste 224 218 248 102
Parana Sul 203 193 213 106
Santa Catarina Sul 207 144 186 86
Rio Grande do Sul Sul 173 143 168 87
Mato Grosso do Sul Centro-Oeste 216 188 214 108
Mato Grosso Centro-Oeste 209 172 199 101
Goias Centro-Oeste 209 152 192 115
Distrito Federal Centro-Oeste 187 215 232 104

Dicionário dos dados utilizados na pesquisa

library(readxl)
Dicionario <- read_excel("C:/Users/Wellen Dutra/Downloads/Dicionario.xlsx")
View(Dicionario)

 # Carregar tabela para visualização do dicionário


library(DT)
datatable(Dicionario,iris, rownames = FALSE,
           extensions = 'Buttons', options = list(dom = 'Bfrtip', buttons = I('colvis')))

Análise descritiva dos dados

Conferindo as classificações dos dados utilizados no relatório.

str(Tema02)
## spec_tbl_df [27 x 6] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ ESTADO                : chr [1:27] "Rondonia" "Acre" "Amazonas" "Roraima" ...
##  $ REGIAO                : chr [1:27] "Norte" "Norte" "Norte" "Norte" ...
##  $ TAXA_ENTRE_HOMENS     : num [1:27] 211 18 188 199 164 215 202 203 144 203 ...
##  $ TAXA_ENTRE_MULHERES   : num [1:27] 183 124 173 159 166 202 169 155 112 171 ...
##  $ TAXA_EM_ESCOLA_PUBLICA: num [1:27] 202 155 184 185 17 216 191 185 131 201 ...
##  $ TAXA_EM_ESCOLA_PRIVADA: num [1:27] 116 89 113 98 117 132 94 104 108 92 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   ESTADO = col_character(),
##   ..   REGIAO = col_character(),
##   ..   TAXA_ENTRE_HOMENS = col_number(),
##   ..   TAXA_ENTRE_MULHERES = col_number(),
##   ..   TAXA_EM_ESCOLA_PUBLICA = col_number(),
##   ..   TAXA_EM_ESCOLA_PRIVADA = col_number()
##   .. )
##  - attr(*, "problems")=<externalptr>
summary(Tema02)
##     ESTADO             REGIAO          TAXA_ENTRE_HOMENS TAXA_ENTRE_MULHERES
##  Length:27          Length:27          Min.   : 18.0     Min.   :112.0      
##  Class :character   Class :character   1st Qu.:185.0     1st Qu.:153.0      
##  Mode  :character   Mode  :character   Median :203.0     Median :166.0      
##                                        Mean   :191.9     Mean   :168.1      
##                                        3rd Qu.:212.0     3rd Qu.:180.5      
##                                        Max.   :274.0     Max.   :245.0      
##  TAXA_EM_ESCOLA_PUBLICA TAXA_EM_ESCOLA_PRIVADA
##  Min.   : 17.0          Min.   : 10.0         
##  1st Qu.:161.5          1st Qu.: 93.5         
##  Median :191.0          Median :104.0         
##  Mean   :172.0          Mean   :100.0         
##  3rd Qu.:201.5          3rd Qu.:114.0         
##  Max.   :248.0          Max.   :148.0

Variáveis utilizadas e análises

Será utilizado as variáveis entre gênero x região do Brasil para saber o percentual de homens e mulheres que está fora do espaço escolar. Após, será explorado as regiões do Brasil entre escolas públicas e privadas, onde será feito uma análise estatística dessa comparação.

Será utilizado os seguintes métodos estatísticos para as análises:

1. gráficos Boxplot;

2. Diagrama de dispersão;

3. Matriz de correlação;

A Solução das análises e seus resultados

A primeira amostra, tradicional da PeNSE, não só permite a comparação da evasão escolar entre meninos por região do Brasil, mas também com as meninas e seguimos a pesquisa comparativa entre as escolas privadas e públicas, onde será feita uma análise estatística conforme as informações coletadas.

Boxplot 1

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:kableExtra':
## 
##     group_rows
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
## 
## Attaching package: 'flextable'
## The following objects are masked from 'package:kableExtra':
## 
##     as_image, footnote
# Boxplot 1 - Evasão de meninos de 13 a 17 anos
boxplot(TAXA_ENTRE_HOMENS~REGIAO, data = Tema02,
        col=c ("orange", "green"),
        main= "Grafico de faltas de meninos por região",
        ylab = "Taxa de meninos")

Primeiramente, notamos que a região Sudeste concentra um número maior de evasão escolar entre os meninos. Porém, é possível identificar a existência de outliers na região Norte comparado as outras regiões do país.

Boxplot 2

Ao passo que vamos para a segunda análise, notamos também que a região Sudeste ainda concentra esse número alto em relação as meninas. Ainda assim, identificamos outliers na região Norte. contudo, no nordeste esse número é ainda maior comparado aos meninos.

#Boxplot 2 - Evasão de meninas de 13 a 17 anos

boxplot(TAXA_ENTRE_MULHERES~REGIAO, data = Tema02,
        col=c ("yellow", "pink"),
        main= "Grafico de faltas de meninas por região",
        ylab = "Taxa de meninas")

Boxplot 3

Entretanto, nas escolas privadas esse número é relativamente parecido nas regiões distribuídas pelos Brasil, destacando os outliers da região Nordeste , destacando apenas na região Sudeste novamente, onde é possível notar uma concentração relativamente com maior intensidade

#Boxplot 3 - Evasão em escolas privadas

boxplot(TAXA_EM_ESCOLA_PRIVADA~REGIAO, data = Tema02,
        col=c ("red", "blue"),
        main= "Gráfico de faltas em escolas privada por região",
        ylab= "Escolas Privadas")

Boxplot 4

Por fim, analisamos as escolas Públicas onde esse número é bem maior comparado as escolas privadas. Olhar para características que estão mais associadas ao risco de insucesso não significa que apenas um grupo deve ser objeto de atenção dos gestores ou políticas públicas. Pelo contrário, quando se trata do direito à educação, a única meta aceitável a ser perseguida é ter todos os alunos completando sua trajetória. A identificação de grupos mais vulneráveis, porém, permite refletir sobre as razões que podem estar afetando em especial aquele grupo e promover mudanças tanto nas práticas de sala de aula como nas políticas educacionais em curso.

#Boxplot 4 - Evasão em escolas públicas 

boxplot(TAXA_EM_ESCOLA_PUBLICA~REGIAO, data = Tema02,
        col=c ("purple", "brown"),
        main= "Gráfico de faltas em escolas públicas",
        ylab= "Escolas Públicas")

É importante destacar que evasão se diferencia de abandono. Abandono é a interrupção de um momento na vida escolar, em geral um ano letivo, quando um aluno deixa de frequentar as aulas nesse período. A evasão consiste no abandono permanente, ou seja, o aluno deixa de frequentar a escola e deixa também de fazer a (re)matrícula.

Disgrama de dispersão

####Utilizaremos o diagrama de dispersão para comparar a evasão entre escolas Públicas e Privadas.

par(bg="lightyellow")
plot(Tema02$TAXA_EM_ESCOLA_PUBLICA, Tema02$TAXA_EM_ESCOLA_PRIVADA, pch=16, col="blue",
     main = "Gráfico entre de faltas entre escolas Públicas e Privadas",
     ylab = "Escolas Privadas", xlab = "Escolas Públicas")
abline(lsfit(Tema02$TAXA_EM_ESCOLA_PUBLICA, Tema02$TAXA_EM_ESCOLA_PRIVADA),col="darkred")

cor(Tema02$TAXA_EM_ESCOLA_PUBLICA, Tema02$TAXA_EM_ESCOLA_PRIVADA)
## [1] -0.1643802

Notamos que essas duas variáveis quantitativas possivelmente tem uma correlação negativa fraca, onde os pontos estão dispersos

Matriz de Correlação

Faremos essa confirmação da evasão escolar na matriz de correlação, identificando que as escolas privadas tem um percentual bem baixo, comparado as escolas públicas.

selecao = c("TAXA_EM_ESCOLA_PUBLICA", "TAXA_EM_ESCOLA_PRIVADA")

cor_escola = cor(Tema02[,selecao])
cor_escola
##                        TAXA_EM_ESCOLA_PUBLICA TAXA_EM_ESCOLA_PRIVADA
## TAXA_EM_ESCOLA_PUBLICA              1.0000000             -0.1643802
## TAXA_EM_ESCOLA_PRIVADA             -0.1643802              1.0000000
library(corrplot)
## corrplot 0.92 loaded
par(cex=0.92)
corrplot(cor_escola)

corrplot(cor_escola, method = "number")

Conclusão

O termo evasão escolar é utilizado em vários contextos com diferentes significados; são tantas variações que acabam dificultando o entendimento dos motivos reais que influenciam e constituem-se como dificuldade para ações efetivas no combate ao problema.

No entanto, a evasão escolar é um problema que atinge todos os níveis de ensino da educação no Brasil, onde muitos jovens e crianças abandonam a escola para ingressar no mercado de trabalho, pois a prioridade para eles não é a educação, mas a própria sobrevivência, tendo como base que o Brasil é um dos países mais desiguais em distribuição de renda no continente.

Em linhas gerais, o tratamento da base de dados teve como objetivo definir quais dos questionários existentes na base seriam considerados válidos para efeito de análise, partindo das informações registradas sobre a concordância em participar da pesquisa, sexo comunidade escolar.