Por Lucas Justin Pesara Drummond e Manuela Martins Parente de Mello
Matrículas: 20211520007 e 20192520011
#Para iniciar todo o trabalho carregam-se todas as bibliotecas que serão usadas em algum momento da pesquisa
library(kableExtra)
library(readxl)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:kableExtra':
##
## group_rows
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(RColorBrewer)
library(corrplot)
## corrplot 0.92 loaded
#Foi pré definido a seguinte paleta de cores para ilustrar os gráficos apresentados:
brewer.pal(4, "Reds")
## [1] "#FEE5D9" "#FCAE91" "#FB6A4A" "#CB181D"
brewer.pal(4, "Blues")
## [1] "#EFF3FF" "#BDD7E7" "#6BAED6" "#2171B5"
A realidade do Rio de Janeiro é muito dura. Há muita pouca gente em universidade pública. Há poucas vagas e elas são destinadas, em sua grande maioria, a pessoas de alta renda, que tendem a ter um estudo melhor durante o ensino médio.Um exemplo de políticas públicas que tenta mudar essa realidade é a lei de cotas, que separa uma parte das vagas em universidades públicas para pessoas de baixa renda. Porém, ela sozinha não é o suficiente.
Diante dessa ideia, os pré-vestibulares sociais/comunitários/populares atuam. Seu objetivo principal é dar a oportunidade para pessoas de baixa renda a entrar em uma universidade e realizar o sonho de muitas famílias. Através de um grupo de voluntários que têm alguma ligação com as matérias do ensino médio, em sua maioria focados na prova do ENEM, e um local favorável, essas pessoas se disponibilizam para dar aula, sem qualquer tipo de recompensa financeira, para pessoas que não tiveram a oportunidade de estudarem em bons colégios e não tem condições de pagar um curso preparatório.
Esses aspectos escancaram que o Rio de Janeiro é extremamente desigual e essa desigualdade é marcada geograficamente. O município foi estrategicamente planejado para separar os “pobres dos ricos”. A “alta sociedade” não tem interesse em se misturar com a “ralé”. Os interesses públicos e as redes de comunicação e a maioria dos investimentos públicos costumam se concentrar nas regiões mais ricas. Mas isso não pode ser assim.
As políticas públicas e assistências sociais devem estar onde precisa e não onde são mais bem vistas pela mídia ou onde fica mais cômodo para o burguês. Não adianta investir em zonas ricas que já têm bastante suporte de capital privado, o Estado tem o dever de garantir educação para todos e para isso é necessário prestar mais atenção em áreas que necessitam.
O objetivo do presente estudo é contribuir para a pesquisa e ampliar o conhecimento dos pré-vestibulares da cidade do Rio de Janeiro. Através de dados de renda per capita e da explanação dos pré-vestibulares pelas Zonas do Rio, pretende-se entender se eles estão distribuídos corretamente, atendendo a população que mais precisa (de baixa renda), ou conforme os interesses do corpo escolar.
A hipótese do trabalho consiste primeiramente no entendimento de alguns fatos. Como já explicado antes a baixa renda está diretamente ligada a pouca escolaridade, devido ao fato da defasagem do ensino público e até mesmo de alguns colégio particulares com mensalidades baixas. Justamente por pré-vestibulares atuarem no setor de desigualdade de ensino, que precisam estar localizados onde essas pessoas que necessitam deste serviço estão. Portanto, cria-se a hipótese: Os pré-vestibulares da cidade do Rio de Janeiro estão localizados corretamente com as regiões de menor renda per capita da cidade? Ou, em linguagem estatística: As variáveis Quantidade de pré-vestibulares e Renda per Capita (R$) tem correlação? Se sim, esta relação é forte?
Por se tratarem de iniciativas autônomas, coletivas, não institucionalizadas, sem financiamento e que dependem do trabalho voluntário, existem poucas pesquisas e poucos estudos sobre o assunto, visto que o município do Rio de Janeio não existe uma organização, coletivo ou grupo de pesquisa que faça esse levantamento e acompanhamento periódico. Assim, a pesquisadora Angela Cristina da Silva Santos, sob a orientação de Priscila Saemi Matsunaga, no Programa de Pós-graduação em Tecnologia para o Desenvolvimento Social - NIDES/UFRJ, desenvolveram o Pensando estratégias para o enfrentamento da evasão em pré-vestibulares populares: um estudo de caso na Maré – Rio de Janeiro/RJ que tem como extensão um mapeamento dos pré-vestibulares voluntário do RJ e que servirá de base para esta pesquisa, disponível no link.O mapeamento, de onde foi tirada a tabela utilizada pode ser acessado através do link
#Carregar base de dados objeto da pesquisa
PreVest_Zonas <- read_excel("C:/Users/manue/Base_de_dados-master/PreVest_Zonas.xlsx")
View(PreVest_Zonas)
#Execução e manipulação da tabela
kable(PreVest_Zonas, row.names = FALSE)%>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T)
| Zoneamento da Cidade do Rio de Janeiro | Quantidades de pre vestibulares |
|---|---|
| Zona Norte | 83 |
| Zona Oeste | 55 |
| Zona Sul | 20 |
| Zona Central | 19 |
| Total | 177 |
Para estudo de comparação, foi utilizado uma planilha disponibilizada pela Wikipédia e manipulada para que pudesse ser devidamente comparada com as (escassas) informações a respeito do mapeamento dos pré-vestibulares. A planilha disponibilizada apresentava a renda per capita por bairro e ainda apresentava qual região cada bairro estava presente. Sendo assim foi condensada e formou a planilha abaixo.
#Carregar base de dados objeto da pesquisa
ZonasRenda <- read_excel("C:/Users/manue/Base_de_dados-master/ZonasRenda.xlsx")
View(ZonasRenda)
#Execução e manipulação da tabela
PreVestRenda = ZonasRenda %>% inner_join(PreVest_Zonas)
## Joining, by = "Zoneamento da Cidade\r\ndo Rio de Janeiro"
View (PreVestRenda)
kable(ZonasRenda, row.names = FALSE)%>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T)
| Zoneamento da Cidade do Rio de Janeiro | Renda per Capita (R$) |
|---|---|
| Zona Norte | 1610.0 |
| Zona Oeste | 1856.0 |
| Zona Sul | 3542.0 |
| Zona Central | 1234.0 |
| Média Total | 2060.5 |
A partir dessa tabela partirá o presente estudo. Entretanto é necessário condensá-las para que facilite a comparação dos dados. Formando então uma nova tabela.
kable(PreVestRenda, row.names = FALSE)%>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T)
| Zoneamento da Cidade do Rio de Janeiro | Renda per Capita (R$) | Quantidades de pre vestibulares |
|---|---|---|
| Zona Norte | 1610 | 83 |
| Zona Oeste | 1856 | 55 |
| Zona Sul | 3542 | 20 |
| Zona Central | 1234 | 19 |
#Para facilitar na manipulação de todos os dados vamos renomear a planilha
PreVestRenda <- rename(PreVestRenda, Renda = 'Renda per Capita (R$)')
PreVestRenda <- rename(PreVestRenda, Qnt = 'Quantidades de pre vestibulares')
PreVestRenda <- rename(PreVestRenda, Zona = `Zoneamento da Cidade\r\ndo Rio de Janeiro`)
Primeiramente as variáveis serão analisadas separadamente, confirmando a ideia de que as zonas apresentam rendas e quantidades de pré-vestibulares diferentes entre si.
Foram utilizadas duas variáveis, qualitativa e quantitativa e elaborados gráficos Barplot´ para visualização da relação entre os dados.
barplot(Qnt ~ Zona, data=PreVestRenda, col= c("#FEE5D9", "#FCAE91", "#FB6A4A", "#CB181D"),
main= "Gráfico de Qnt de PreVest por Zonas",
vert=T, xlim=c(0,5), ylim=c(0,90))
## Warning in plot.window(xlim, ylim, log = log, ...): "vert" não é um parâmetro
## gráfico
## Warning in axis(if (horiz) 2 else 1, at = at.l, labels = names.arg, lty =
## axis.lty, : "vert" não é um parâmetro gráfico
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...): "vert"
## não é um parâmetro gráfico
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): "vert" não é um
## parâmetro gráfico
A partir da análise dos gráficos observamos que há uma diferença entre a quantidade de pré-vestibulares populares pelas zonas da cidade. Sendo claramente a Zona Norte a região contendo a maior quantidade desses pré-vestibulares, depois a Zona Oeste seguida da Zona Sul e, por último, a região contendo o menor número de prévestibulares populares, a Zona Central.
A segunda análise foi com as variáveis Renda e Zona
barplot(Renda ~ Zona, data=PreVestRenda, col= c("#EFF3FF", "#BDD7E7", "#6BAED6", "#2171B5"),
main= "Gráfico de Renda por Zona",
vert=T,xlim=c(0,5), ylim=c(0,4000))
## Warning in plot.window(xlim, ylim, log = log, ...): "vert" não é um parâmetro
## gráfico
## Warning in axis(if (horiz) 2 else 1, at = at.l, labels = names.arg, lty =
## axis.lty, : "vert" não é um parâmetro gráfico
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...): "vert"
## não é um parâmetro gráfico
## Warning in axis(if (horiz) 1 else 2, cex.axis = cex.axis, ...): "vert" não é um
## parâmetro gráfico
É possível observar que a Zona Sul é de longe a região com a maior renda per capita, depois dela vem a Zona Oeste, seguida da Zona Norte e, por último, a Zona Central.
Para entender se a hipótese é provida de sentido, ou seja, se as variáveis têm correlação, já com o entendimento que elas estão distribuídas desigualmente pelas zonas, é feito um Teste de Hipótese.
Serão utilizadas as variáveis quantitativas de Renda e Quantidade de pré-vestibulares para fazer essa comparação. O objetivo desse teste é descobrir se tais variáveis estão correlacionadas.
Vale ressaltar que o alpha é equivalente a aproximadamente 0,05 devido probabilidade irrelevante abaixo dela retirada da curva da normal.
H0: Os dados seguem uma distribuição normal
H1: Os dados não seguem uma distribuição normal
alpha: 0, 05
Se pvalor < alpha, rejeita H0
Se pvalor > alpha, não rejeita H0*
shapiro.test(PreVestRenda$Qnt)
##
## Shapiro-Wilk normality test
##
## data: PreVestRenda$Qnt
## W = 0.87264, p-value = 0.3082
pvalor (lê-se, p-value) = 0.3082
Portanto a quantidade de pré-vestibulares tem distribuição normal!
H0: Os dados seguem uma distribuição normal
H1: Os dados não seguem uma distribuição normal
alpha: 0, 05
Se pvalor < alpha, rejeita H0
Se pvalor > alpha, não rejeita H0
shapiro.test(PreVestRenda$Renda)
##
## Shapiro-Wilk normality test
##
## data: PreVestRenda$Renda
## W = 0.84783, p-value = 0.2192
pvalor (lê-se, p-value) = 0.2192
Portanto, a renda tem distribuição normal!
H0: rho = 0
H1: rho != 0
alpha: 0, 05
Se pvalor < alpha, rejeita H0
Se pvalor > alpha, não rejeita H0
cor.test (PreVestRenda$Renda,PreVestRenda$Qnt,
method = "pearson", conf.level = 0.95)
##
## Pearson's product-moment correlation
##
## data: PreVestRenda$Renda and PreVestRenda$Qnt
## t = -0.56046, df = 2, p-value = 0.6316
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.9818503 0.9175591
## sample estimates:
## cor
## -0.3684261
pvalor (lê-se, p-value) = 0.6316
Portanto, diferente de 0, logo as variáveis têm correlação!
Em seguida se avaliará quais as taxas de correlação e se elas fazem sentido de fato.
Para melhor entendimento da hipótese que está sendo avaliada é feito um Diagrama de Dispersão com as variáveis quantitativas Renda e Quantidade de Pré-vestibulares.
par(bg="#EFF3FF")
par(cex=1.4)
plot(PreVestRenda$Qnt, PreVestRenda$Renda, pch=16, col = "#CB181D",
main = "Diagrama Dispersão - Renda/Quantidad Pré-Vest",
ylab = "Renda", xlab = "Quantidade Pré-Vestibulares")
abline(lsfit(PreVestRenda$Qnt, PreVestRenda$Renda),col= "#CB181D")
No plano cartesiano temos quatro pontos que representam as zonas da cidade, sendo elas as Zonas Central, Sul, Oeste e Norte, lidas da esquerda para a direita. Analisando o diagrama percebe-se que a zona com menor renda per capita (Zona Central) é também a zona com a menor quantidade de pré-vestibulares populares, evidenciando uma incoerência, pois partimos do pressuposto de que uma zona mais carente de renda deveria ser a que mais necessita do auxílio que o pré-vestibular popular oferece. Ou seja, por mais que as variáveis estejam correlacionadas, ainda existem diversas incoerências quanto a essa correlação.
O diagrama também ressalta que na verdade elas se apresentam bastante dispersas, visto que, enquanto tem dois pontos praticamente em cima da reta, outros dois aparecem bastante distantes.
Pelo fato de tanto o Diagrama de Dispersão quanto o Teste de Correlação ainda não terem explicado perfeitamente a hipótese, é produzido então uma Matriz de Correlação que explanará de fato qual a correlação entre cada uma das variáveis, esclarecendo o índice de relação que aparece no Teste de Hipótese com certa confusão.
selecao = c("Qnt","Renda")
cor_prevest = cor(PreVestRenda[,selecao])
cor_prevest
## Qnt Renda
## Qnt 1.0000000 -0.3684261
## Renda -0.3684261 1.0000000
par(cex=1)
corrplot(cor_prevest, method="number")
Por se tratarem apenas de duas variáveis a análise do gráfico é mais clara. O primeiro fato que agora fica claro e que chama atenção logo de cara é das variáveis terem um correlação negativa. Isso significa que a correlação é inversamente proporcional, ou seja, enquanto uma é maior a outra é proporcionalemente menor, o que faz bastante sentido para o estudo já que quanto menor a renda, maior a necessidade de pré-vestibulares na região e vice-versa.
Outro ponto que também fica claro é como o número é baixo, enquanto a correlação máxima é 1(como Qnt e Qnt) ou -1, caso não houvesse nenhuma correlação estaria próximo a zero. Renda e Qnt estão com -0,37, que está bem mais próximo de 0 do que de 1, mostrando novamente que mesmo que haja correlação, ela é abaixo do esperado.
Pode-se tirar de todas essas análises a resposta da hipótese inicial e até ir além. As variáveis Renda e Quantidade de pré-vestibulares tem relação, porém essa relação é fraca.
Primeiro, apenas para confirmar se a hipótese tinha validação, foi verificado se as variáveis estavam distribuídas desigualmente entre zonas, pois caso contrário a introdução e o objetivo da pesquisa não teriam sentido. Após a primeira afirmação ser verídica foi visto no Teste de Hipótese que as variáveis apresentaram correlação, após esse momento pôde-se dar início às investigações de como e porque isso ocorreu.
O Diagrama de Dispersão começou a dar indícios que essa correlação não era tão homogênea como era esperado, ou seja, algumas zonas de fato tinham a renda e a quantidade de pré-vestibulares “ideal”, porém outras pareciam estar longe disso. A Zona Central, por exemplo, apresenta índice baixo nos dois casos.
Por fim foi feito uma Matriz de Correlação que apresentou novas conclusões e esclareceu algumas coisas a respeito do Teste de Hipótese. Ela mostrou que a correlação era inversamente proporcional, como requisitado na hipótese e mostrou o fraco grau de correlação.
Dessa maneira, com base na análise das informações, gráficos e dados, percebe-se que há uma correlação entre as variáveis Renda e Qnt de Pré-Vest Populares, mas que essa correlação ainda apresenta incoerências. Como visto antes, os pré-vestibulares populares devem ser localizados de maneira estratégica nas zonas da cidade, onde as zonas mais carentes, logo, as que mais necessitam de auxílio, tenham maior número de pré-vestibulares visando atender de maneira mais efetiva a população local, algo que, conforme analisado, não é sempre atendido.
Ainda que a distribuição de pré-vestibulares seja relativamente boa, é preciso permanecer fortalecendo as regiões de menor renda pois o aumento da desigualdade é de consequência direta com a educação municipal.
LISTA DE BAIRROS DO RIO DE JANEIRO POR RENDA PER CAPITA. Wikipedia, 2020. Acesso em: https://pt.wikipedia.org/wiki/Lista_de_bairros_do_Rio_de_Janeiro_por_renda_per_capita 17/02/2022
VESTIBULARES POPULARES DO ESTADO DO RIO DE JANEIRO. Nides.ufrj.br Acesso em: http://nides.ufrj.br/images/PPGTDS/Produtos/Mapeamento_de_Pr%C3%A9-vestibulares_Populares_do_Estado_do_Rio_de_Janeiro.pdf 17/02/2022