A Distribuição Desigual da Educação

Um estudo entre a relação da renda e dos pré-vestibulares populares nas zonas do Rio de Janeiro

Por Lucas Justin Pesara Drummond e Manuela Martins Parente de Mello

Matrículas: 20211520007 e 20192520011

#Para iniciar todo o trabalho carregam-se todas as bibliotecas que serão usadas em algum momento da pesquisa

library(kableExtra)
library(readxl)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:kableExtra':
## 
##     group_rows
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(RColorBrewer)
library(corrplot)
## corrplot 0.92 loaded
#Foi pré definido a seguinte paleta de cores para ilustrar os gráficos apresentados:

brewer.pal(4, "Reds")
## [1] "#FEE5D9" "#FCAE91" "#FB6A4A" "#CB181D"
brewer.pal(4, "Blues")
## [1] "#EFF3FF" "#BDD7E7" "#6BAED6" "#2171B5"

1. Introdução

A realidade do Rio de Janeiro é muito dura. Há muita pouca gente em universidade pública. Há poucas vagas e elas são destinadas, em sua grande maioria, a pessoas de alta renda, que tendem a ter um estudo melhor durante o ensino médio.Um exemplo de políticas públicas que tenta mudar essa realidade é a lei de cotas, que separa uma parte das vagas em universidades públicas para pessoas de baixa renda. Porém, ela sozinha não é o suficiente.

Diante dessa ideia, os pré-vestibulares sociais/comunitários/populares atuam. Seu objetivo principal é dar a oportunidade para pessoas de baixa renda a entrar em uma universidade e realizar o sonho de muitas famílias. Através de um grupo de voluntários que têm alguma ligação com as matérias do ensino médio, em sua maioria focados na prova do ENEM, e um local favorável, essas pessoas se disponibilizam para dar aula, sem qualquer tipo de recompensa financeira, para pessoas que não tiveram a oportunidade de estudarem em bons colégios e não tem condições de pagar um curso preparatório.

Esses aspectos escancaram que o Rio de Janeiro é extremamente desigual e essa desigualdade é marcada geograficamente. O município foi estrategicamente planejado para separar os “pobres dos ricos”. A “alta sociedade” não tem interesse em se misturar com a “ralé”. Os interesses públicos e as redes de comunicação e a maioria dos investimentos públicos costumam se concentrar nas regiões mais ricas. Mas isso não pode ser assim.

As políticas públicas e assistências sociais devem estar onde precisa e não onde são mais bem vistas pela mídia ou onde fica mais cômodo para o burguês. Não adianta investir em zonas ricas que já têm bastante suporte de capital privado, o Estado tem o dever de garantir educação para todos e para isso é necessário prestar mais atenção em áreas que necessitam.

2. Objetivo

O objetivo do presente estudo é contribuir para a pesquisa e ampliar o conhecimento dos pré-vestibulares da cidade do Rio de Janeiro. Através de dados de renda per capita e da explanação dos pré-vestibulares pelas Zonas do Rio, pretende-se entender se eles estão distribuídos corretamente, atendendo a população que mais precisa (de baixa renda), ou conforme os interesses do corpo escolar.

2.1 Hipótese

A hipótese do trabalho consiste primeiramente no entendimento de alguns fatos. Como já explicado antes a baixa renda está diretamente ligada a pouca escolaridade, devido ao fato da defasagem do ensino público e até mesmo de alguns colégio particulares com mensalidades baixas. Justamente por pré-vestibulares atuarem no setor de desigualdade de ensino, que precisam estar localizados onde essas pessoas que necessitam deste serviço estão. Portanto, cria-se a hipótese: Os pré-vestibulares da cidade do Rio de Janeiro estão localizados corretamente com as regiões de menor renda per capita da cidade? Ou, em linguagem estatística: As variáveis Quantidade de pré-vestibulares e Renda per Capita (R$) tem correlação? Se sim, esta relação é forte?

3. Metodologia

Por se tratarem de iniciativas autônomas, coletivas, não institucionalizadas, sem financiamento e que dependem do trabalho voluntário, existem poucas pesquisas e poucos estudos sobre o assunto, visto que o município do Rio de Janeio não existe uma organização, coletivo ou grupo de pesquisa que faça esse levantamento e acompanhamento periódico. Assim, a pesquisadora Angela Cristina da Silva Santos, sob a orientação de Priscila Saemi Matsunaga, no Programa de Pós-graduação em Tecnologia para o Desenvolvimento Social - NIDES/UFRJ, desenvolveram o Pensando estratégias para o enfrentamento da evasão em pré-vestibulares populares: um estudo de caso na Maré – Rio de Janeiro/RJ que tem como extensão um mapeamento dos pré-vestibulares voluntário do RJ e que servirá de base para esta pesquisa, disponível no link.O mapeamento, de onde foi tirada a tabela utilizada pode ser acessado através do link

#Carregar base de dados objeto da pesquisa

PreVest_Zonas <- read_excel("C:/Users/manue/Base_de_dados-master/PreVest_Zonas.xlsx")
View(PreVest_Zonas)
#Execução e manipulação da tabela

kable(PreVest_Zonas, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T)
Zoneamento da Cidade do Rio de Janeiro Quantidades de pre vestibulares
Zona Norte 83
Zona Oeste 55
Zona Sul 20
Zona Central 19
Total 177

Para estudo de comparação, foi utilizado uma planilha disponibilizada pela Wikipédia e manipulada para que pudesse ser devidamente comparada com as (escassas) informações a respeito do mapeamento dos pré-vestibulares. A planilha disponibilizada apresentava a renda per capita por bairro e ainda apresentava qual região cada bairro estava presente. Sendo assim foi condensada e formou a planilha abaixo.

#Carregar base de dados objeto da pesquisa

ZonasRenda <- read_excel("C:/Users/manue/Base_de_dados-master/ZonasRenda.xlsx")
View(ZonasRenda)
#Execução e manipulação da tabela

PreVestRenda = ZonasRenda %>% inner_join(PreVest_Zonas)
## Joining, by = "Zoneamento da Cidade\r\ndo Rio de Janeiro"
View (PreVestRenda)

kable(ZonasRenda, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T)
Zoneamento da Cidade do Rio de Janeiro Renda per Capita (R$)
Zona Norte 1610.0
Zona Oeste 1856.0
Zona Sul 3542.0
Zona Central 1234.0
Média Total 2060.5

A partir dessa tabela partirá o presente estudo. Entretanto é necessário condensá-las para que facilite a comparação dos dados. Formando então uma nova tabela.

kable(PreVestRenda, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T)
Zoneamento da Cidade do Rio de Janeiro Renda per Capita (R$) Quantidades de pre vestibulares
Zona Norte 1610 83
Zona Oeste 1856 55
Zona Sul 3542 20
Zona Central 1234 19

4. Resultados e Discussões

#Para facilitar na manipulação de todos os dados vamos renomear a planilha

PreVestRenda <- rename(PreVestRenda, Renda = 'Renda per Capita (R$)')

PreVestRenda <- rename(PreVestRenda, Qnt = 'Quantidades de pre vestibulares')

PreVestRenda <- rename(PreVestRenda, Zona = `Zoneamento da Cidade\r\ndo Rio de Janeiro`)

4.1 Barplot

Primeiramente as variáveis serão analisadas separadamente, confirmando a ideia de que as zonas apresentam rendas e quantidades de pré-vestibulares diferentes entre si.

4.1.1 Quantidade por Zonas

Foram utilizadas duas variáveis, qualitativa e quantitativa e elaborados gráficos Barplot´ para visualização da relação entre os dados.

barplot(Qnt ~ Zona, data=PreVestRenda, col= c("#FEE5D9", "#FCAE91", "#FB6A4A", "#CB181D"), 
        main= "Gráfico de Qnt de PreVest por Zonas",
        vert=T, xlim=c(0,5), ylim=c(0,90))
## Warning in plot.window(xlim, ylim, log = log, ...): "vert" não é um parâmetro
## gráfico
## Warning in axis(if (horiz) 2 else 1, at = at.l, labels = names.arg, lty =
## axis.lty, : "vert" não é um parâmetro gráfico
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...): "vert"
## não é um parâmetro gráfico
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): "vert" não é um
## parâmetro gráfico

A partir da análise dos gráficos observamos que há uma diferença entre a quantidade de pré-vestibulares populares pelas zonas da cidade. Sendo claramente a Zona Norte a região contendo a maior quantidade desses pré-vestibulares, depois a Zona Oeste seguida da Zona Sul e, por último, a região contendo o menor número de prévestibulares populares, a Zona Central.

4.1.2 Renda por Zonas

A segunda análise foi com as variáveis Renda e Zona

barplot(Renda ~ Zona, data=PreVestRenda, col= c("#EFF3FF", "#BDD7E7", "#6BAED6", "#2171B5"), 
        main= "Gráfico de Renda por Zona",
        vert=T,xlim=c(0,5), ylim=c(0,4000))
## Warning in plot.window(xlim, ylim, log = log, ...): "vert" não é um parâmetro
## gráfico
## Warning in axis(if (horiz) 2 else 1, at = at.l, labels = names.arg, lty =
## axis.lty, : "vert" não é um parâmetro gráfico
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...): "vert"
## não é um parâmetro gráfico
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): "vert" não é um
## parâmetro gráfico

É possível observar que a Zona Sul é de longe a região com a maior renda per capita, depois dela vem a Zona Oeste, seguida da Zona Norte e, por último, a Zona Central.

4.2 Teste de Hipótese

Para entender se a hipótese é provida de sentido, ou seja, se as variáveis têm correlação, já com o entendimento que elas estão distribuídas desigualmente pelas zonas, é feito um Teste de Hipótese.

Serão utilizadas as variáveis quantitativas de Renda e Quantidade de pré-vestibulares para fazer essa comparação. O objetivo desse teste é descobrir se tais variáveis estão correlacionadas.

  1. Primeiramente, para fazer o teste de hipótese é preciso verificar se a distribuição do dados é normal. Começa-se a fazer isso através do Teste de Normalidade da quantidade de pré-vestibulares.

Vale ressaltar que o alpha é equivalente a aproximadamente 0,05 devido probabilidade irrelevante abaixo dela retirada da curva da normal.

  • A quantidade de pré-vestibulares tem distribuição normal?

H0: Os dados seguem uma distribuição normal

H1: Os dados não seguem uma distribuição normal

alpha: 0, 05

Se pvalor < alpha, rejeita H0

Se pvalor > alpha, não rejeita H0*

shapiro.test(PreVestRenda$Qnt)
## 
##  Shapiro-Wilk normality test
## 
## data:  PreVestRenda$Qnt
## W = 0.87264, p-value = 0.3082

pvalor (lê-se, p-value) = 0.3082

Portanto a quantidade de pré-vestibulares tem distribuição normal!

  1. Em seguida faz-se o mesmo processo para a Renda per Capita.
  • A renda tem distribuição normal?

H0: Os dados seguem uma distribuição normal

H1: Os dados não seguem uma distribuição normal

alpha: 0, 05

Se pvalor < alpha, rejeita H0

Se pvalor > alpha, não rejeita H0

shapiro.test(PreVestRenda$Renda)
## 
##  Shapiro-Wilk normality test
## 
## data:  PreVestRenda$Renda
## W = 0.84783, p-value = 0.2192

pvalor (lê-se, p-value) = 0.2192

Portanto, a renda tem distribuição normal!

  1. Visto que as duas variáveis são normais aplica-se o Teste de Pearson, que tem as seguintes premissas:

H0: rho = 0

H1: rho != 0

alpha: 0, 05

Se pvalor < alpha, rejeita H0

Se pvalor > alpha, não rejeita H0

cor.test (PreVestRenda$Renda,PreVestRenda$Qnt,
          method = "pearson", conf.level = 0.95)
## 
##  Pearson's product-moment correlation
## 
## data:  PreVestRenda$Renda and PreVestRenda$Qnt
## t = -0.56046, df = 2, p-value = 0.6316
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.9818503  0.9175591
## sample estimates:
##        cor 
## -0.3684261

pvalor (lê-se, p-value) = 0.6316

Portanto, diferente de 0, logo as variáveis têm correlação!

Em seguida se avaliará quais as taxas de correlação e se elas fazem sentido de fato.

4.3 Diagrama de dispersão

Para melhor entendimento da hipótese que está sendo avaliada é feito um Diagrama de Dispersão com as variáveis quantitativas Renda e Quantidade de Pré-vestibulares.

par(bg="#EFF3FF")
par(cex=1.4)
plot(PreVestRenda$Qnt, PreVestRenda$Renda, pch=16, col = "#CB181D",
     main = "Diagrama Dispersão - Renda/Quantidad Pré-Vest",
     ylab = "Renda", xlab = "Quantidade Pré-Vestibulares")
abline(lsfit(PreVestRenda$Qnt, PreVestRenda$Renda),col= "#CB181D")

No plano cartesiano temos quatro pontos que representam as zonas da cidade, sendo elas as Zonas Central, Sul, Oeste e Norte, lidas da esquerda para a direita. Analisando o diagrama percebe-se que a zona com menor renda per capita (Zona Central) é também a zona com a menor quantidade de pré-vestibulares populares, evidenciando uma incoerência, pois partimos do pressuposto de que uma zona mais carente de renda deveria ser a que mais necessita do auxílio que o pré-vestibular popular oferece. Ou seja, por mais que as variáveis estejam correlacionadas, ainda existem diversas incoerências quanto a essa correlação.

O diagrama também ressalta que na verdade elas se apresentam bastante dispersas, visto que, enquanto tem dois pontos praticamente em cima da reta, outros dois aparecem bastante distantes.

4.4 Matriz de Correlação

Pelo fato de tanto o Diagrama de Dispersão quanto o Teste de Correlação ainda não terem explicado perfeitamente a hipótese, é produzido então uma Matriz de Correlação que explanará de fato qual a correlação entre cada uma das variáveis, esclarecendo o índice de relação que aparece no Teste de Hipótese com certa confusão.

selecao = c("Qnt","Renda")

cor_prevest = cor(PreVestRenda[,selecao])
cor_prevest
##              Qnt      Renda
## Qnt    1.0000000 -0.3684261
## Renda -0.3684261  1.0000000
par(cex=1)
corrplot(cor_prevest, method="number")

Por se tratarem apenas de duas variáveis a análise do gráfico é mais clara. O primeiro fato que agora fica claro e que chama atenção logo de cara é das variáveis terem um correlação negativa. Isso significa que a correlação é inversamente proporcional, ou seja, enquanto uma é maior a outra é proporcionalemente menor, o que faz bastante sentido para o estudo já que quanto menor a renda, maior a necessidade de pré-vestibulares na região e vice-versa.

Outro ponto que também fica claro é como o número é baixo, enquanto a correlação máxima é 1(como Qnt e Qnt) ou -1, caso não houvesse nenhuma correlação estaria próximo a zero. Renda e Qnt estão com -0,37, que está bem mais próximo de 0 do que de 1, mostrando novamente que mesmo que haja correlação, ela é abaixo do esperado.

5. Conclusão

Pode-se tirar de todas essas análises a resposta da hipótese inicial e até ir além. As variáveis Renda e Quantidade de pré-vestibulares tem relação, porém essa relação é fraca.

Primeiro, apenas para confirmar se a hipótese tinha validação, foi verificado se as variáveis estavam distribuídas desigualmente entre zonas, pois caso contrário a introdução e o objetivo da pesquisa não teriam sentido. Após a primeira afirmação ser verídica foi visto no Teste de Hipótese que as variáveis apresentaram correlação, após esse momento pôde-se dar início às investigações de como e porque isso ocorreu.

O Diagrama de Dispersão começou a dar indícios que essa correlação não era tão homogênea como era esperado, ou seja, algumas zonas de fato tinham a renda e a quantidade de pré-vestibulares “ideal”, porém outras pareciam estar longe disso. A Zona Central, por exemplo, apresenta índice baixo nos dois casos.

Por fim foi feito uma Matriz de Correlação que apresentou novas conclusões e esclareceu algumas coisas a respeito do Teste de Hipótese. Ela mostrou que a correlação era inversamente proporcional, como requisitado na hipótese e mostrou o fraco grau de correlação.

Dessa maneira, com base na análise das informações, gráficos e dados, percebe-se que há uma correlação entre as variáveis Renda e Qnt de Pré-Vest Populares, mas que essa correlação ainda apresenta incoerências. Como visto antes, os pré-vestibulares populares devem ser localizados de maneira estratégica nas zonas da cidade, onde as zonas mais carentes, logo, as que mais necessitam de auxílio, tenham maior número de pré-vestibulares visando atender de maneira mais efetiva a população local, algo que, conforme analisado, não é sempre atendido.

Ainda que a distribuição de pré-vestibulares seja relativamente boa, é preciso permanecer fortalecendo as regiões de menor renda pois o aumento da desigualdade é de consequência direta com a educação municipal.

6. Referências Bibliográficas

LISTA DE BAIRROS DO RIO DE JANEIRO POR RENDA PER CAPITA. Wikipedia, 2020. Acesso em: https://pt.wikipedia.org/wiki/Lista_de_bairros_do_Rio_de_Janeiro_por_renda_per_capita 17/02/2022

VESTIBULARES POPULARES DO ESTADO DO RIO DE JANEIRO. Nides.ufrj.br Acesso em: http://nides.ufrj.br/images/PPGTDS/Produtos/Mapeamento_de_Pr%C3%A9-vestibulares_Populares_do_Estado_do_Rio_de_Janeiro.pdf 17/02/2022