Análise dos Microdados do ENEM para o município de Sorocaba/SP

Autor

Beatriz Leal

Resumo

Levando em consideração a imutabilidade das questões de raça no Brasil, A Lei nº 12.711/2012, também chamada Lei de Cotas, determina que as instituições de ensino superiores públicas reservem 50% (cinquenta por cento) de suas vagas para estudantes negros que tenham cursado o ensino médio integralmente em escolas públicas. Contudo, baseando-se em argumentos meritocráticos, ainda há muita resistência por parte da sociedade acerca da adoção desse dispositivo. Diante desse cenário, o presente trabalho visou analisar os resultados do enem de 2022 para uma amostra de 1.000 candidatos da cidade de Sorocaba/SP a fim de entender se as variáveis raça e tipo de escola exercem influência no desempenho desses candidatos. Utilizando técnicas de análise descritiva e exploratória de dados, buscou-se apurar se haveria disparidades nas pontuações obtida pelos candidatos que justifiquem a implementação do sistema de cotas no Brasil. Os resultados aqui encontrados corroboram as determinações previstas em lei ao apresentar indícios de desigualdades raciais no campo do ensino brasileiro.

Introdução

Instituído em 1998 com a finalidade de avaliar o desempenho dos estudantes brasileiros ao concluírem a educação básica, o Exame Nacional do Ensino Médio (Enem) tornou-se a principal via de acesso dos estudantes às instituições públicas de ensino superior. Esse acesso é viabilizado por meio da participação do candidato no Sistema de Seleção Unificada (Sisu), que basea-se na pontuação do candidato para critérios de classifcação e aprovação.

Embora o Sisu tenha por finalidade democratizar o acesso dos estudantes às instituições de ensino superior público, em sua versão preliminar era facultado às universidades participantes decidir se adotariam medidas de ações afirmativas para a inclusão das camadas sociais mais desfavorecidas — isso a despeito de todos os indícios da desigualdade racial e social em curso no país. Esse cenário muda em 2012, com a promulgação da Lei nº 12.711, que tornou obrigatória a reserva de 50% das vagas para alunos egressos de escolas públicas, transformando essa política em uma das principais ferramentas de inserção de jovens pretos, pardos e indígenas nos espaços de ensino superior.

Diante desse contexto, o presente trabalho objetiva analisar os resultados do enem 2022 para uma amostra de 1.000 candidatos a fim de entender se as variáveis raça e tipo de escola exercem influência no desempenho desses candidatos. Utilizando métodos de análise descritiva e exploratória de dados, buscou-se apurar possíveis disparidades nos resultados obtidos pelos candidatos que evidenciassem a necessidade de implementação do sistema de cotas no Brasil.

Materias e métodos

Para realização desse estudo foi utilizado os dados do ENEM 2022 disponibilizados pelo INEP para o município de Sorocaba/SP. Essa base de dados contém informações detalhadas a respeito de cada candidato inscrito, como o gabarito da prova, a nota final obtida, o tipo de escola frequentada, dentre outras. Neste estudo, foram considerados os dados referentes a 1.000 candidatos da cidade de Sorocaba/SP selecionados por meio de amostragem aleatória simples.

As etapas metodológicas englobaram a realização de análises descritivas e exploratórias, tendo como referência teórica os pressupostos de Moretin e Bussab (2017) para gerar métricas simples, como estimativas de localização e variabilidade, como também análises bidimensionais e suas representações de visuais. O estudo contou ainda com apoio do software estatístico R, aliado aos pacotes do Tidyverse, Janitor, Desctools, etc.

Resultados

Esta seção apresenta os resultados obtidos a partir da análise dos resultados do Enem 2022 para uma amostra aleatória com 1.000 candidatos da cidade de Sorocoba/SP. Como o objetivo desse trabalho é averiguar se as variáveis raça e tipo de escola exercem influencia na nota do enem, se faz necessário, primeiramente, entender como essas variáveis estão expressas na amostra.

O resultados dispostos nas Tabelas 1 buscam elucidar essa questão. A partir delas, podemos verificar que para essa amostra, o contingente de candidatos presentes auto-declarados brancos (73,3%) é maior que o contingente de candidatos auto-declarados negros1 (23,3%). Além disso, conforme demonstra a Tabela 1 (b), observamos que a maioria desses candidatos são provenientes de instituições públicas, embora mais da metade dos respondentes (55%) optaram por não declarar a natureza de sua instituição de ensino.

Tabela 1: Tabelas de distribuição de frequências.
(a) Raça
Raça Frequência Porcentagem
Amarela 21 2.1%
Branca 733 73.3%
Indígena 3 0.3%
Não declarado 10 1.0%
Parda 178 17.8%
Preta 55 5.5%
Total 1000 100.0%
(b) Tipo de escola
Tipo de escola Frequência Porcentagem
Privada 158 15.8%
Pública 289 28.9%
Não respondeu 553 55.3%
Total 1000 100.0%

Indo mais afundo nos nossos objetivos, a etapa subsequente tem como propósito entender como esses diferentes estratos sociais tem desempenhado no enem, sobretudo levando em consideração a sua nota em matemática. Segundo os resultados da Tabela 2, verifica-se que os candidatos Amarelos obtiveram os melhores desempenhos em termos de média, seguido pelos candidatos Brancos. Além disso, é possível verificar a tendência de decrescimento da média conforme analisamos os grupos mais vulneráveis socialmente, como é o caso dos pardos e mais atenuemente, os pretos. Por fim, a Tabela 2 ainda evidencia outra condição para os participantes de pele negra: além de sua média geral estar abaixo da média dos demais participantes, a análise do desvio-padrão revela que esses candidatos também obtêm desempenho muito similares, com a nota final variando pouco entre seus candidatos.

Tabela 2: Nota em matemática por raça
Raça Média Mediana Variância Desvio Padrão Desvio Médio Amostra
Amarela 603.7619 623.00 39510.88 198.7734 145.34467 21
Branca 598.9600 596.40 12366.61 111.2053 89.13831 733
Parda 560.6702 558.35 10954.36 104.6631 86.28337 178
Não declarado 551.0000 548.90 13959.73 118.1513 81.96000 10
Preta 540.2164 543.50 10889.61 104.3533 84.62698 55
Indígena 530.4000 588.80 10911.88 104.4599 80.40000 3
Desempenho geral 588.3291 586.25 12905.23 113.6012 90.70000 1000

Por fim, cabe pontuar, que embora incluam-se na amostra candidatos indígenas, a presença de apenas três representantes dessa etnia compreende-se incipiente para sustentar afirmações a respeito de todo esse grupo.

Analisando mais de perto a distribuição da nota desses candidatos ao entorno da média, verifica-se curvas de assimetria bastante distintas entre os diferentes grupos raciais. Por exemplo, para os candidatos Amarelos, a cauda mais longa da distribuição fica à esquerda, em assimetria negativa, demonstrando que a densidade das notas desses candidatos é maior que a média geral deles. Observando atentamente a @Figura-1, nota-se também a presença de valores externos muito abaixo do limite inferior desse substrato e o formato platicúrtico de sua distribuição confirma a presença de um outlier, o que explica a média abaixo do esperado. No caso dos candidatos pardos, a cauda mais longa da distribuição fica à direita, indicando a ocorrência de notas mais altas em frequência menor, o que implica na assimetria positiva e em seu formato leptocúrtico. Os candidatos pretos seguem condições parecidas a dos pardos, porém com curva leptocúrtica mais acentuada (indicando a frequência de notas altas ainda mais baixa), e os indígenas, como mencionado, não apresentam tamanho de amostra passível de análise.

Tabela 3: Assimetria e Curtose

Raça Amostra Assimetria Curtose
Amarela 21 -1.0003200 1.7785984
Branca 733 0.1720804 -0.2588526
Parda 178 0.3672596 -0.2380373
Preta 55 0.2641990 -0.8076670

A Tabela 3 ratifica essas tendências ao demonstrar o Coeficiente de Assimetria para cada um desses agrupamentos. A fórmula do coeficiente é dada por ada por \(b1 = \sum_{i=1}^{n} \frac{Z_{i}^{3}}{n} = \frac{m_{3}}{S_{3}}\), onde \(Z_{i} = \frac{x_{i}-\bar{x}}{S}\), \(i = 1, 2, ..., n\) e corresponde a melhor estimativa em contexto de normalidade. Enquanto os candidatos Brancos tem um coefieciente de assimetria positivo leve, os candidatos negros tem assimetria positiva muito mais proeminente, indicando a concentração das notas nos valores mais baixos.

Além disso, as questões relativas as desigualdades no âmbito educacional tornam-se ainda mais eminentes ao observamos os resultados da nota de matemática em função da escola que o candidato frequentou. Ao examinarmos Tabela 4 com os resumos abaixo, nota-se que o desempenho dos alunos da rede pública está muito abaixo quando comparado à média dos candidatos oriúndos da rede particular.

Tabela 4: Nota de matemática por tipo de escola
Tipo de Escola Média Mediana Variância Desvio Padrão Desvio Médio Amostra
Pública 561.5519 564.1 9852.743 99.26098 81.84373 289
Não respondeu 592.7850 585.6 12564.456 112.09128 90.06212 553
Privada 621.7120 625.6 17355.945 131.74196 102.45714 158

Comparando-se o resultado das notas de matemática por raça e por tipo de escola em termos de sua distribuição, obtemos os gráficos Quantil-Quantil abaixo. Utilizando o método de padronização para quando \(X_m<Y_n\), onde \(Y\) é o quantil de ordem \(\frac{j}{m}\) na variável \(x\), verificamos que em ambos os casos, os dados se distanciam da diagonal, indicando que há diferenças significativas em termos de desempenho dos alunos em função de sua raça e de sua instituição de ensino. Isso sugere que esses candidatos não poderiam concorrer as mesmas vagas em pés de igualdade.

Por fim, analisando a composição das escolas pelo raça de seus candidatos, verifica-se que em termos de proporção, a população negra é a mais prevalescente nas instituições públicas. O resultado do teste de qui-quadrado indica que há associação estatisticamente significativa entre as duas variáveis - raça/cor e tipo de escola, embora o Coeficiente de Cramer, definido por \(C = \sqrt{\frac{x^2}{(k-1).n}}\) na Tabela 5, indique uma associação leve entre as duas variáveis.

Tabela 5: Coeficiente de Cramer
P-value Cramer V lwr.ci upr.ci
0.001198 0.18978094 0.07804337 0.27313223

Conclusão

No decurso desse estudo foram reiteradamente observadas discrepâncias no desempenho alcançado entre os candidatos da rede pública e da rede privada para esta amostra. Ao considerarmos o tipo de escola frequentada pelos alunos, nota-se que os candidatos da rede privada obtiveram notas mais altas do que os candidatos da rede pública. Isso fortalece a hipótese aqui estudada de que as instituições de ensino exercem influência sobre o desempenho dos candidatos. Em consonância a essa verificação, ao estudarmos a distribuição racial dos candidatos que estudam em escolas públicas, os resultados encontrados também apontam para a existência de desigualdades de oportunidades no acesso educacional em função da cor da pele.

As métricas aqui observadas podem ser somadas a tantas outras relativas a fatores históricos, políticos, sociais e economicos, de modo a comprovar que essas desigualdes existem e que o sistema racial de cotas é extremamente necessário. É diante dessas evidências que o presente trabalho enxerga que as cotas possuem um potencial transformador indiscútivel para garantir a inclusão desses estudantes no ensino superior do país.

Referências

BRASIL. Lei nº 12.711, de 29 de agosto de 2012. Dispõe sobre o ingresso nas universidades federais e nas instituições federais de ensino técnico de nível médio e dá outras providências. Diário Oficial da União, Brasília, 30 ago. 2012. Seção 1, p. 1.

MORETTIN, Pedro A.; BUSSAB, Wilton O.Estatística básica. Saraiva Educação SA, 2017.

Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Microdados do ENEM. Ministério da Educação, 2022. Disponível em: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/enem.

Notas de rodapé

  1. Conforme convenção do IBGE, no Brasil, negro é o somatório da população pretos e pardo↩︎