Notas de corte para acesso em cursos na Universidade Federal do Oeste do Pará
O presente artigo apresenta uma sucinta exploração a respeito das notas de acesso ao curso de Licenciatura Integrada em Matemática e Física na Universidade Federal do Oeste do Pará (UFOPA). O objetivo é fazer uma análise no número de acertos nas provas de Matemática e Ciências da Natureza e apresentar uma relação acertos vs notas das provas e também relacionar a média simples das notas de acesso à Universidade. No estudo é feito apenas um comparativo, bem geral, de possíveis candidatos que se enquadram na faixa de notas e que concorreram ao curso mencionado. Fizemos um levantamento desde o ano de 2015 até 2021.
Destacamos que o valor que um candidato recebe em cada acerto é definido segundo o perfil de erros e acertos dele em toda a prova. Assim, o que está em análise de fato, no ENEM, é a competência do aluno e não quantas questões ele acerta propriamente.
Desde de 2015 a Universidade passou a aderir as notas do Enem como meio de acesso aos cursos da Instituição através do Processo Seletivo Regular (PSR). A partir deste ano, a Universidade considerou as notas do ENEM dos dois anos anteriores ao ano em que se esta pleiteando, i.e, para ingresso pelo PSR de 2015 os candidatos deveriam estar inscritos no Enem do ano de 2013 ou 2014 (e ter participado as provas), considerando a maior nota destes exames e respeitando outros critérios estabelecidos em Edital. Neste ano o Edital previa que para pleitear a uma vaga o candidato deveria ter nota maior que 400 pontos em uma ou mais áreas temáticas do Enem e ter nota da Redação maior ou igual a 500 pontos (escala de 0-1000 em ambos os casos), inclusive para o ingresso pelo sistema de cotas sociais. Para acesso aos cursos, foram estabelecidas as notas de corte. No curso de Licenciatura Integrada em Matemática e Física no PSR de 2015, a nota de corte para os candidatos da ampla concorrência era de 616.82 pontos, na primeira chamada. Neste comparativo realizado não levamos em consideração as notas de corte dos Grupos(cotas) e também da segunda chamada, que em geral, a nota é mais baixa. Esse comparativo será apresentado em outro link. A tabela a seguir apresenta um resumo quanto a nota de corte da primeira chamada e os critérios estabelecidos nos editais do PSR da Universidade.
No ano de 2021, a Instituição usou notas do ENEM dos anos de 2019 e 2020, como critério de acesso para os candidatos interessados em um dos seus cursos. Neste caso o critério de eliminação se aplicou aos respectivos anos. Conforme previa o edital, “caso o candidato tenha participado dos dois processos (2019 e 2020), seria escolhida automaticamente a maior nota, desde que esta atenda os outros critérios,” conforme apresentado na tabela a seguir.
Ano | Nota de Corte (1ª chamada) | Critérios do PSR | Número de chamadas no PSR |
---|---|---|---|
2015 | 616.82 | Red>=500 e Nota>=400* | 4 |
2016 | 603.14 | Red>=450 e Med>=400 | 4 |
2017 | 597.74 | Red>=450 e Med>=400 | 5 |
2018 | 615.42 | Red>=450 e Med>=400 | 2 |
2019 | 628.60 | Red>=450 e Med>=400** | 2 |
2020 | 644.00 | Red>=450 e Med>=400** | 2 |
2021 | 594.64 | Red>=450 e Med>=400** | 2 |
*Nota em cada uma ou mais área. **Não ter faltado em alguma das provas no(s) ano(s) anterior(es) ao pleito.
Com os dados salvos, usarei os dados a partir do arquivo. Na leitura do arquivo estou usando o “encoding Latin” (Wickham 2016) devido aos acentos presentes na variável “NO_MUNICIPIO_RESIDENCIA.”
df2 <- fread("MICRODADOS_ENEM_2018_FILTRO.csv", encoding = "Latin-1")#"UTF-8"
Selecionamos apenas quem participou das quatro provas e retiramos as linhas vazias. O canditato pode ter comparecido, mais nao respondeu (0 ou NA)). Observa-se que um dos critérios de eliminacao da UFOPA no PSR de 2019 era se canditato não tivesse participado em um dos dias da prova.
Foram filtrados todas as cidades do Estádo do Pará. Posteriormente poderei minerar por cidades. Neste estudo apresentaremos apenas um quadro geral dos candidatos do município de Santarém
Na linha a seguir é feito a média das quatro provas objetivas e inserida na tabela. Para que o canditato participe do PSR de 2019, um dos pre-requisitos é ter média das quatro provas maior ou igual 400 e que a nota da Redação seja >= 450. Todos os candidatos que não se encaixam nesta exigência são excluídos do arquivo.
dfs<-get.filter%>%add_column(MEDIAPROVAS = rowSums(get.filter[,9:12])/4.0, .before = "NU_NOTA_LC")
set.filter<-dfs[dfs$MEDIAPROVAS>=400 & dfs$NU_NOTA_REDACAO>=450,]
Agora faço a inserção da media simples para posterior análise da nota de corte da(s) Universidade(s). A média simples é composta pela média das notas de Liguagem e Comunicação, Ciências Humanas, Matemática, Ciências da Natureza e Redação.
get.data<-set.filter%>%add_column(MEDIASIMPLES = rowSums(set.filter[,10:14])/5.0, .after = "NU_NOTA_REDACAO")
Deve-se verificar se a Universidade usou media simples ou por peso como nota de corte. Iremos salvar esses dados em arquivo e usamos as variáveis a partir dele. Não é necessário guarda-la, se você quizer continuar usando a variável anterior.
Considerando que os dados foram salvos em arquivo, posso chama-lo para utilizar em qualquer momento. Agora faço o filtro contendo apenas das notas da prova de Ciências da Natureza e demais variáveis correspondentes.
ProveAzul<-447
Proveamar<-448
Provecinz<-449
Proverosa<-450
# Gabarito da prova azul.
set_gabarito <- get.data.filt[CO_PROVA_CN==ProveAzul, .(TX_GABARITO_CN)]
# Inserindo nomes nas colunas
my_into<-paste('Q',91:135,sep="")
#### Split: Separa as respostas e gabaritos por colunas. Pacote "tidyr" ####
get.split.all<-set_all %>% separate(TX_RESPOSTAS_CN, into=as.character(my_into), sep=1:length(my_into)) # numero de questoes
get.split.gab.cn<-set_gabarito %>% separate(TX_GABARITO_CN, into=as.character(my_into), sep= 1:length(my_into)) # numero de questoes
A prova de cor azul é escolhida como a padrão. Então vamos selecionar a cor da prova e ordenar-las de acordo com esta. Dessa forma, usamos o gabarito desta como espelho para as demais. A organização das questões pode ser feita com o comando a seguir e essa reordenação é feita a partir dos arquivos disponíveis na pasta PLANILHAS.
set_cor_prova<-get.split.all[(CO_PROVA_CN==COR_DA_PROVA), .(NO_MUNICIPIO_RESIDENCIA, TP_SEXO, MEDIASIMPLES, NU_NOTA_REDACAO, NU_NOTA_CN, ORDEM_DAS_QUESTOES)]
Feito isso, utilizamos o comando setnames para organizar as provas com um único header na seguinte ordem.
header<-c("NO_MUNICIPIO_RESIDENCIA","TP_SEXO", "MEDIASIMPLES", "NU_NOTA_REDACAO", "NU_NOTA_CN", my_into)
Juntamos as provas em um único arquivo usando o rbindlist
#### Conferindo o gabarito e resposntas ####
# Capturando apenas a primeira linha do gabarito
set.only.line<-get.gabarito_all[1,]
# Transformando em caracterx
key_azul<-as.character(set.only.line)
# Set matrix de resposta
set.respost<-as.matrix(get.respostas_all[,6:50]) # Set coluna onde estao as respostas
# Compara o gabarito
as.binary<-mult.choice(set.respost, key_azul) #(1: acerto 0: erro)
n.acert.by.partip <-data.frame(rowSums(as.binary))
#n.acert.by.partip <-data.table(rowSums(as.binary))
setnames(n.acert.by.partip, "Acertos")
Agora podemos filtar por cidades e nesta caso filtramos os canditatos residentes no município de Santarém. Desfinimos uma escala de notas como Baixa, Regular, Média, Bom e Alta.
O gráfico a seguir apresenta uma relação de acertos e notas correspondente a prova de Ciências da Natureza, apenas.
ggplotly(p1, dynamicTicks = TRUE)
#grid.arrange(p1, nrow = 1, ncol=1)
Figure 1: Boxplot dos a certos, correspondente a prova de Ciências da Natureza
A representação gráfica seguinte ilustra a densidade de probabilidade de notas dos candidatos, excluindo as menores que a nota de corte. Também representamos as notas por sexo dos candidatos.
O gráfico a seguir apresenta a relação nas questões de Ciências da Natureza e a nota de Redação dos canditados.
Observando o gráfico acima e também o gráfico a seguir, nota-se que há candidato que não teve acertos, porém, ainda assim pontuou. De acordo com seu banco de resposta, o candidato fez dupla marcação em várias questões da prova. Não foi possível afirmar, entretanto, o proveniência da pontuação adquirida. No gráfico seguinte verifica-se a nota de redação do canditado.
Já gráfico seguinte representamos a densidade de acertos. Verifica-se que há uma representatividade significativa de candidatos que tiveram entre 8 a 10 acertos na prova de Ciências da Natureza, que contempla questões de Física.
#library(psych) #score.multiple.choice(my_df2, set.respost, score =TRUE)
ACERTOS E ERROS POR QUESTAO
output_acert <- data.frame(as.binary) n.acert.by.question<-colSums(output_acert) df.n.acert.by.question<-data.frame(n.acert.by.question)
questoes<-my_into acertos<-df.n.acert.by.question$n.acert.by.question erros<-nrow(output_acert)- acertos perc_acerto<-round((acertos/(acertos+erros))100.0) perc_erro<-round((erros/(acertos+erros))100.0)
df.teste<-data.frame(questoes, acertos, perc_acerto, erros, perc_erro)
#library(summarytools) #summarytools::freq(output_acert, order=“freq”) #library(questionr) #questionr::freq(output_acert$Type, cum=TRUE, sort = “dec,” total = TRUE)