| Raça | Média | Mediana | Variância | Desvio Padrão | Desvio Médio | Amostra |
|---|---|---|---|---|---|---|
| Amarela | 603.7619 | 623.00 | 39510.88 | 198.7734 | 145.34467 | 21 |
| Branca | 598.9600 | 596.40 | 12366.61 | 111.2053 | 89.13831 | 733 |
| Parda | 560.6702 | 558.35 | 10954.36 | 104.6631 | 86.28337 | 178 |
| Não declarado | 551.0000 | 548.90 | 13959.73 | 118.1513 | 81.96000 | 10 |
| Preta | 540.2164 | 543.50 | 10889.61 | 104.3533 | 84.62698 | 55 |
| Indígena | 530.4000 | 588.80 | 10911.88 | 104.4599 | 80.40000 | 3 |
| Desempenho geral | 588.3291 | 586.25 | 12905.23 | 113.6012 | 90.70000 | 1000 |
Análise dos Microdados do ENEM para o município de Sorocaba/SP
Resumo
Levando em consideração a imutabilidade das questões de raça no Brasil, A Lei nº 12.711/2012, também chamada Lei de Cotas, determina que as instituições de ensino superiores públicas reservem 50% (cinquenta por cento) de suas vagas para estudantes negros que tenham cursado o ensino médio integralmente em escolas públicas. Contudo, baseando-se em argumentos meritocráticos, ainda há muita resistência por parte da sociedade acerca da adoção desse dispositivo. Diante desse cenário, o presente trabalho visou analisar os resultados do enem de 2022 para uma amostra de 1.000 candidatos da cidade de Sorocaba/SP a fim de entender se as variáveis raça e tipo de escola exercem influência no desempenho desses candidatos. Utilizando técnicas de análise descritiva e exploratória de dados, buscou-se apurar se haveria disparidades nas pontuações obtida pelos candidatos que justifiquem a implementação do sistema de cotas no Brasil. Os resultados aqui encontrados corroboram as determinações previstas em lei ao apresentar indícios de desigualdades raciais no campo do ensino brasileiro.
Introdução
Instituído em 1998 com a finalidade de avaliar o desempenho dos estudantes brasileiros ao concluírem a educação básica, o Exame Nacional do Ensino Médio (Enem) tornou-se a principal via de acesso dos estudantes às instituições públicas de ensino superior. Esse acesso é viabilizado por meio da participação do candidato no Sistema de Seleção Unificada (Sisu), que basea-se na pontuação do candidato para critérios de classifcação e aprovação.
Embora o Sisu tenha por finalidade democratizar o acesso dos estudantes às instituições de ensino superior público, em sua versão preliminar era facultado às universidades participantes decidir se adotariam medidas de ações afirmativas para a inclusão das camadas sociais mais desfavorecidas — isso a despeito de todos os indícios da desigualdade racial e social em curso no país. Esse cenário muda em 2012, com a promulgação da Lei nº 12.711, que tornou obrigatória a reserva de 50% das vagas para alunos egressos de escolas públicas, transformando essa política em uma das principais ferramentas de inserção de jovens pretos, pardos e indígenas nos espaços de ensino superior.
Diante desse contexto, o presente trabalho objetiva analisar os resultados do enem 2022 para uma amostra de 1.000 candidatos a fim de entender se as variáveis raça e tipo de escola exercem influência no desempenho desses candidatos. Utilizando métodos de análise descritiva e exploratória de dados, buscou-se apurar possíveis disparidades nos resultados obtidos pelos candidatos que evidenciassem a necessidade de implementação do sistema de cotas no Brasil.
Materias e métodos
Para realização desse estudo foi utilizado os dados do ENEM 2022 disponibilizados pelo INEP para o município de Sorocaba/SP. Essa base de dados contém informações detalhadas a respeito de cada candidato inscrito, como o gabarito da prova, a nota final obtida, o tipo de escola frequentada, dentre outras. Neste estudo, foram considerados os dados referentes a 1.000 candidatos da cidade de Sorocaba/SP selecionados por meio de amostragem aleatória simples.
As etapas metodológicas englobaram a realização de análises descritivas e exploratórias, tendo como referência teórica os pressupostos de Moretin e Bussab (2017) para gerar métricas simples, como estimativas de localização e variabilidade, como também análises bidimensionais e suas representações de visuais. O estudo contou ainda com apoio do software estatístico R, aliado aos pacotes do Tidyverse, Janitor, Desctools, etc.
Resultados
Esta seção apresenta os resultados obtidos a partir da análise dos resultados do Enem 2022 para uma amostra aleatória com 1.000 candidatos da cidade de Sorocoba/SP. Como o objetivo desse trabalho é averiguar se as variáveis raça e tipo de escola exercem influencia na nota do enem, se faz necessário, primeiramente, entender como essas variáveis estão expressas na amostra.
O resultados dispostos nas Tabelas 1 buscam elucidar essa questão. A partir delas, podemos verificar que para essa amostra, o contingente de candidatos presentes auto-declarados brancos (73,3%) é maior que o contingente de candidatos auto-declarados negros1 (23,3%). Além disso, conforme demonstra a Tabela 1 (b), observamos que a maioria desses candidatos são provenientes de instituições públicas, embora mais da metade dos respondentes (55%) optaram por não declarar a natureza de sua instituição de ensino.
| Raça | Frequência | Porcentagem |
|---|---|---|
| Amarela | 21 | 2.1% |
| Branca | 733 | 73.3% |
| Indígena | 3 | 0.3% |
| Não declarado | 10 | 1.0% |
| Parda | 178 | 17.8% |
| Preta | 55 | 5.5% |
| Total | 1000 | 100.0% |
| Tipo de escola | Frequência | Porcentagem |
|---|---|---|
| Privada | 158 | 15.8% |
| Pública | 289 | 28.9% |
| Não respondeu | 553 | 55.3% |
| Total | 1000 | 100.0% |
Indo mais afundo nos nossos objetivos, a etapa subsequente tem como propósito entender como esses diferentes estratos sociais tem desempenhado no enem, sobretudo levando em consideração a sua nota em matemática. Segundo os resultados da Tabela 2, verifica-se que os candidatos Amarelos obtiveram os melhores desempenhos em termos de média, seguido pelos candidatos Brancos. Além disso, é possível verificar a tendência de decrescimento da média conforme analisamos os grupos mais vulneráveis socialmente, como é o caso dos pardos e mais atenuemente, os pretos. Por fim, a Tabela 2 ainda evidencia outra condição para os participantes de pele negra: além de sua média geral estar abaixo da média dos demais participantes, a análise do desvio-padrão revela que esses candidatos também obtêm desempenho muito similares, com a nota final variando pouco entre seus candidatos.
Por fim, cabe pontuar, que embora incluam-se na amostra candidatos indígenas, a presença de apenas três representantes dessa etnia compreende-se incipiente para sustentar afirmações a respeito de todo esse grupo.
Analisando mais de perto a distribuição da nota desses candidatos ao entorno da média, verifica-se curvas de assimetria bastante distintas entre os diferentes grupos raciais. Por exemplo, para os candidatos Amarelos, a cauda mais longa da distribuição fica à esquerda, em assimetria negativa, demonstrando que a densidade das notas desses candidatos é maior que a média geral deles. Observando atentamente a @Figura-1, nota-se também a presença de valores externos muito abaixo do limite inferior desse substrato e o formato platicúrtico de sua distribuição confirma a presença de um outlier, o que explica a média abaixo do esperado. No caso dos candidatos pardos, a cauda mais longa da distribuição fica à direita, indicando a ocorrência de notas mais altas em frequência menor, o que implica na assimetria positiva e em seu formato leptocúrtico. Os candidatos pretos seguem condições parecidas a dos pardos, porém com curva leptocúrtica mais acentuada (indicando a frequência de notas altas ainda mais baixa), e os indígenas, como mencionado, não apresentam tamanho de amostra passível de análise.
| Raça | Amostra | Assimetria | Curtose |
|---|---|---|---|
| Amarela | 21 | -1.0003200 | 1.7785984 |
| Branca | 733 | 0.1720804 | -0.2588526 |
| Parda | 178 | 0.3672596 | -0.2380373 |
| Preta | 55 | 0.2641990 | -0.8076670 |
A Tabela 3 ratifica essas tendências ao demonstrar o Coeficiente de Assimetria para cada um desses agrupamentos. A fórmula do coeficiente é dada por ada por \(b1 = \sum_{i=1}^{n} \frac{Z_{i}^{3}}{n} = \frac{m_{3}}{S_{3}}\), onde \(Z_{i} = \frac{x_{i}-\bar{x}}{S}\), \(i = 1, 2, ..., n\) e corresponde a melhor estimativa em contexto de normalidade. Enquanto os candidatos Brancos tem um coefieciente de assimetria positivo leve, os candidatos negros tem assimetria positiva muito mais proeminente, indicando a concentração das notas nos valores mais baixos.
Além disso, as questões relativas as desigualdades no âmbito educacional tornam-se ainda mais eminentes ao observamos os resultados da nota de matemática em função da escola que o candidato frequentou. Ao examinarmos Tabela 4 com os resumos abaixo, nota-se que o desempenho dos alunos da rede pública está muito abaixo quando comparado à média dos candidatos oriúndos da rede particular.
| Tipo de Escola | Média | Mediana | Variância | Desvio Padrão | Desvio Médio | Amostra |
|---|---|---|---|---|---|---|
| Pública | 561.5519 | 564.1 | 9852.743 | 99.26098 | 81.84373 | 289 |
| Não respondeu | 592.7850 | 585.6 | 12564.456 | 112.09128 | 90.06212 | 553 |
| Privada | 621.7120 | 625.6 | 17355.945 | 131.74196 | 102.45714 | 158 |
Comparando-se o resultado das notas de matemática por raça e por tipo de escola em termos de sua distribuição, obtemos os gráficos Quantil-Quantil abaixo. Utilizando o método de padronização para quando \(X_m<Y_n\), onde \(Y\) é o quantil de ordem \(\frac{j}{m}\) na variável \(x\), verificamos que em ambos os casos, os dados se distanciam da diagonal, indicando que há diferenças significativas em termos de desempenho dos alunos em função de sua raça e de sua instituição de ensino. Isso sugere que esses candidatos não poderiam concorrer as mesmas vagas em pés de igualdade.
Por fim, analisando a composição das escolas pelo raça de seus candidatos, verifica-se que em termos de proporção, a população negra é a mais prevalescente nas instituições públicas. O resultado do teste de qui-quadrado indica que há associação estatisticamente significativa entre as duas variáveis - raça/cor e tipo de escola, embora o Coeficiente de Cramer, definido por \(C = \sqrt{\frac{x^2}{(k-1).n}}\) na Tabela 5, indique uma associação leve entre as duas variáveis.
| P-value | Cramer V | lwr.ci | upr.ci |
|---|---|---|---|
| 0.001198 | 0.18978094 | 0.07804337 | 0.27313223 |
Conclusão
No decurso desse estudo foram reiteradamente observadas discrepâncias no desempenho alcançado entre os candidatos da rede pública e da rede privada para esta amostra. Ao considerarmos o tipo de escola frequentada pelos alunos, nota-se que os candidatos da rede privada obtiveram notas mais altas do que os candidatos da rede pública. Isso fortalece a hipótese aqui estudada de que as instituições de ensino exercem influência sobre o desempenho dos candidatos. Em consonância a essa verificação, ao estudarmos a distribuição racial dos candidatos que estudam em escolas públicas, os resultados encontrados também apontam para a existência de desigualdades de oportunidades no acesso educacional em função da cor da pele.
As métricas aqui observadas podem ser somadas a tantas outras relativas a fatores históricos, políticos, sociais e economicos, de modo a comprovar que essas desigualdes existem e que o sistema racial de cotas é extremamente necessário. É diante dessas evidências que o presente trabalho enxerga que as cotas possuem um potencial transformador indiscútivel para garantir a inclusão desses estudantes no ensino superior do país.
Referências
BRASIL. Lei nº 12.711, de 29 de agosto de 2012. Dispõe sobre o ingresso nas universidades federais e nas instituições federais de ensino técnico de nível médio e dá outras providências. Diário Oficial da União, Brasília, 30 ago. 2012. Seção 1, p. 1.
MORETTIN, Pedro A.; BUSSAB, Wilton O.Estatística básica. Saraiva Educação SA, 2017.
Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Microdados do ENEM. Ministério da Educação, 2022. Disponível em: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/enem.
Notas de rodapé
Conforme convenção do IBGE, no Brasil, negro é o somatório da população pretos e pardo↩︎