Mapeando a Desigualdade Na Cidade do Rio de Janeiro

1. Relatório Final

Ana Luiza Maximino Ribeiro - Matrícula: 20212520019 - E-mail: analuizamaximinoribeiro@edu.unirio.br
Lucas Scott Marcomini Conceição - Matrícula: 20212520033 - E-mail: lucas.m.scott@edu.unirio.br
Paulo Vitor Ferreira de Oliveira - Matrícula: 20212520016 - E-mail: paulo.vitor@edu.unirio.br
Roberta Matos Gomes - Matrícula: 20212520032 - E-mail: robertajatoba16@edu.unirio.br

2. Introdução

A desigualdade social é um processo existente dentro das relações da maioria das sociedades presente em todos os países do mundo. Ela faz parte das relações sociais, pois determina um lugar aos desiguais, seja por questões econômicas, de gênero, cor, crença, círculo ou grupo social. Essa forma de desigualdade prejudica e limita o status social dessas pessoas, além de seu acesso a direitos básicos, como: educação e saúde de qualidade, direito à propriedade, direito ao trabalho, direito à moradia, ter boas condições de transporte e locomoção, entre outros.

Um estudo realizado pela radioagencia nacional no ano de 2020, mostrou um mapa das desigualdades em locais vizinhos na cidade do Rio de Janeiro. Para exemplificar esse caso, foi citado o bairro de São Conrado e a favela da Rocinha. Dois lugares extremamente próximos que enfatizam a enorme segregação social na cidade. Segundo o estudo nessas duas regiões, os pesquisadores chegaram a uma conclusão de que os moradores da rocinha possuem uma queda na expectativa de vida de até 23 anos comparado aos moradores da rocinha.

Nesse artigo, foram levadas em consideração os seguintes aspectos: segurança, saúde, educação e saneamento básico.
A pesquisa das desigualdades em bairros vizinhos não se destaca como um caso isolado. Existem, também, as segregações por zonas (oeste, central, sul e norte). Visto que a Zona Sul possui privilégios às demais zonas, em nosso estudo foram realizadas hipóteses para comprovar essa desigualdade, de modo a trazer mais consciência à sociedade e, por consequência, lutar contra problema tão presente em nosso estado.

3. Objetivos

A desigualdade social é uma realidade presente na vida de todos os brasileiros. Diante dessa certeza, o trabalho a seguir, irá mapear essa questão na “Cidade Maravihosa”. Apesar de receber esse carinhoso título, sabe-se que, para nossa cidade realmente ser maravilhosa para todos os cariocas, muito ainda há de ser feito.

Dessa maneira, realizaremos um estudo englobando os anos de 2016, 2018 e 2020, em dois bairros de cada Zona do Rio de Janeiro, afim de comprovar que essa cidade, tão linda e cheia de graça, possui altos índices de desigualdades e segregação social.

Sendo assim, nosso relatório irá, atravrés de bloxpot, verificar se a Zona Norte, Zona Oeste e Zona Central, do Rio de Janeiro, são, de fato, negligênciadas em relação a Zona Sul.

4. Metodologia

O site utilizado para encontrar a base de dados foi basedosdados.org, onde encontramos o Índice de Progresso Social (IPS) do Rio de Janeiro e selecionamos a base “indicadores”, que fou publicada por Pedro Castro e possui cobertura temporal de 2016-2020. Diante disso, selecionamos dois bairros de cada zona (sul,norte,central e oeste) e uma variável de cada tema (saúde, educação, segurança e saneamento básico) para trabalhar.

Diante do extenso grupo de informações que a base possuía, foram feitas alterações, no próprio R, de modo que, os dados que iríamos cruzar, se transformassem em microdados.

Desenvolvemos os microdados da seguinte maneira:

Microdados b - ANO X REGIÃO X TAXA DE INCIDÊNCIA DE DENGUE

Microdados d - ANO X REGIÂO X TAXA DE ALFABETIZAÇÃO

Microdados f - ANO X REGIÃO X TAXA DE ROUBOS NA RUA

Microdados h - ANO X REGIÃO X TAXA DE COLETA SELETIVA DE LIXO

Dicionário de Dados

ano - Ano

região_administrativa - Região Administrativa

taxa_incidencia_dengue - Taxa de incidência de dengue por 100.000 habitantes. O número de casos notificados de dengue foi obtido no Sistema Nacional de Agravos Notificáveis do Sistema de Informações em Saúde da SMS-RJ, enquanto o número de habitantes foi obtido dos resultados do Censo Demográfico 2010.

prop_alfabetizacao - Proporção de crianças alfabetizadas até o terceiro ano do Ensino Fundamental em escolas públicas. Crianças alfabetizadas são as que têm nota acima do nível 2 na Avaliação Nacional de Alfabetização (ANA) do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), em relação ao número total de crianças da rede pública de ensino do Município do Rio de Janeiro que participaram da ANA.

taxa_roubos_rua - Taxas de ocorrências de roubo a transeunte, roubo de aparelho celular e roubo em coletivo por 1.000 habitantes. Número de ocorrências foi obtido por meio dos boletins de divulgação mensal do ISP, enquanto o número de habitantes foi obtido dos resultados do Censo Demográfico 2010.

prop_coleta_seletiva_lixo - Proporção do lixo potencialmente reciclável recolhido pela Coleta Seletiva Domiciliar. Os dados de potencial reciclado e resíduo sólido coletado foram fornecidos para a elaboração do IPS pela Companhia Municipal de Limpeza Urbana (COMLURB).

library(readr)
bd <- read_csv("C:/Users/rober/Downloads/indicadores.zip")
View(bd)

library(dplyr)
library(ggplot2)
library(flextable)
library(readr)
library(corrplot)
library(DT)
library(ggthemes)
library(readxl)
library(tidyverse)
library(RColorBrewer)


datatable(bd)

5. Indicador de Saúde: Taxa de Incidência de Casos de Dengue

a <- subset(bd,bd$regiao_administrativa=="Botafogo"|bd$regiao_administrativa=="Copacabana"|bd$regiao_administrativa=="Maré"|bd$regiao_administrativa=="Inhaúma"|bd$regiao_administrativa=="Centro"|bd$regiao_administrativa=="Santa Teresa"|bd$regiao_administrativa=="Campo Grande"|bd$regiao_administrativa=="Bangu")

b <- a %>%
  select(ano,regiao_administrativa,taxa_incidencia_dengue)

Média e Mediana

b %>% select(taxa_incidencia_dengue,regiao_administrativa) %>% group_by(regiao_administrativa) %>%
  summarise(Mediana=median(taxa_incidencia_dengue), Minimo=min(taxa_incidencia_dengue), Maximo=max(taxa_incidencia_dengue), Média=mean(taxa_incidencia_dengue),
            desvio_padrao=round(sd(taxa_incidencia_dengue),2))%>% flextable() %>% theme_zebra()

regiao_administrativa	Mediana	Minimo	Maximo	Média	desvio_padrao
Bangu	753.93	657.31	821.49	744.24333	82.52
Botafogo	117.84	69.49	233.70	140.34333	84.39
Campo Grande	169.91	129.38	524.81	274.70000	217.55
Centro	201.87	183.72	310.69	232.09333	68.67
Copacabana	101.74	53.98	201.00	118.90667	75.00
Inhaúma	302.71	285.53	474.16	354.13333	104.30
Maré	19.87	19.87	34.08	24.60667	8.20
Santa Teresa	399.10	170.13	467.97	345.73333	155.93

Gráfico

cores <- brewer.pal(10, "Set2")

boxplot(b$taxa_incidencia_dengue ~ b$regiao_administrativa,
        data=b, col=(cores),
        main="Gráfico: Região X Taxa Dengue",
        xlab="Regiões",
        ylab="Taxa de Incidência de Dengue")

A análise do primeiro bloxplot representa o cruzamento entre as regiões escolhidas e a taxa de casos de dengue nos anos de 2016, 2018 e 2020. Pode-se constatar que, comparando com outras zonas, a Zona Oeste teve altos índices de dengue nesses anos, e logo em seguida, temos a Zona Central.

O bairro de Campo Grande apresentou a maior amplitude e alta dispersão em seus dados, no entanto, Bangu possui os maiores casos de dengue, sendo seu máximo, aproximadamente, 821 casos de dengue por 100.000 habitantes.

Além disso, através do gráfico, pode-se perceber que, a Zonal Sul e Zona Norte tiveram menos casos, dando ênfase para os dados da Maré que, foram os menores da análise, possuindo índice de aproximadamente 20.

Ademais, o gráfico não contém outliers e, vale ressaltar que, todos apresentam uma concentração de dados assimétricos.

6. Indicador de Educação: Alfabetização

c <- subset(bd,bd$regiao_administrativa=="Botafogo"|bd$regiao_administrativa=="Copacabana"|bd$regiao_administrativa=="Maré"|bd$regiao_administrativa=="Inhaúma"|bd$regiao_administrativa=="Centro"|bd$regiao_administrativa=="Santa Teresa"|bd$regiao_administrativa=="Campo Grande"|bd$regiao_administrativa=="Bangu")

d <- c %>%
  select(ano,regiao_administrativa,prop_alfabetizacao)

Média e Mediana

d %>% select(prop_alfabetizacao,regiao_administrativa) %>% group_by(regiao_administrativa) %>%
  summarise(Mediana=median(prop_alfabetizacao), Minimo=min(prop_alfabetizacao), Maximo=max(prop_alfabetizacao), Média=mean(prop_alfabetizacao),
            desvio_padrao=round(sd(prop_alfabetizacao),2))%>% flextable() %>% theme_zebra()

regiao_administrativa	Mediana	Minimo	Maximo	Média	desvio_padrao
Bangu	42.15	42.15	57.52	47.27333	8.87
Botafogo	54.31	42.55	54.31	50.39000	6.79
Campo Grande	49.71	49.71	52.92	50.78000	1.85
Centro	40.51	40.51	52.70	44.57333	7.04
Copacabana	59.00	34.44	59.00	50.81333	14.18
Inhaúma	41.91	41.91	55.50	46.44000	7.85
Maré	45.45	45.45	59.50	50.13333	8.11
Santa Teresa	57.86	41.82	57.86	52.51333	9.26

Gráfico

cores <- brewer.pal(10, "Set2")

boxplot(d$prop_alfabetizacao ~ d$regiao_administrativa,
        data=b, col=(cores),
        main="Gráfico: Região X Alfabetização",
        xlab="Regiões",
        ylab="Alfabetização")

De acordo com o segundo bloxpot, são explicitadas as taxas de crianças alfabetizadas até o terceiro ano do Ensino Fundamental em escolas públicas, nos três anos, por cada bairro estabelecida.

Com isso, observamos que, os bairros da Zona Sul, Copacabana e Botafogo, ocupam o primeiro e terceiro lugar, respectivamente, na ordem dos bairros mais alfabetizados. Nota-se, também, que, Copacabana possui variabilidade e desvio padrão altos, com mediana 59, e, Botafogo com mediana 54, possui dados mais homogêneos.

Se tratando de Santa Teresa (Zona Central), seus resultados foram bons, ficando na segunda posição, no entanto, o Centro (Zona Central), obteve os piores resultados nesses três anos, com sua mediana ficando em aproximadamente 41.

Diante disso, com a Zona Norte e Zona Oeste apresentando resultados medianos na tabela, podemos afirmar que, Copacabana, Botafogo e Santa Teresa são os bairros mais alfabetizados que os demais trabalhados. Além disso, as variáveis são assimétricas e seus dados não possuem outliers.

7. Indicador de Segurança: Taxa de Roubos

e <- subset(bd,bd$regiao_administrativa=="Botafogo"|bd$regiao_administrativa=="Copacabana"|bd$regiao_administrativa=="Maré"|bd$regiao_administrativa=="Inhaúma"|bd$regiao_administrativa=="Centro"|bd$regiao_administrativa=="Santa Teresa"|bd$regiao_administrativa=="Campo Grande"|bd$regiao_administrativa=="Bangu")

f <- e %>%
  select(ano,regiao_administrativa,taxa_roubos_rua)

Média e Mediana

f %>% select(taxa_roubos_rua,regiao_administrativa) %>% group_by(regiao_administrativa) %>%
  summarise(Mediana=median(taxa_roubos_rua), Minimo=min(taxa_roubos_rua), Maximo=max(taxa_roubos_rua), Média=mean(taxa_roubos_rua),
            desvio_padrao=round(sd(taxa_roubos_rua),2))%>% flextable() %>% theme_zebra()

regiao_administrativa	Mediana	Minimo	Maximo	Média	desvio_padrao
Bangu	10.02	6.84	10.16	9.006667	1.88
Botafogo	9.66	8.16	11.40	9.740000	1.62
Campo Grande	4.27	3.50	4.38	4.050000	0.48
Centro	54.73	31.17	69.90	51.933333	19.52
Copacabana	6.73	3.34	9.95	6.673333	3.31
Inhaúma	10.60	8.68	10.72	10.000000	1.14
Maré	9.40	5.16	10.76	8.440000	2.92
Santa Teresa	10.13	9.10	16.52	11.916667	4.02

Gráfico

cores <- brewer.pal(10, "Set2")

boxplot(f$taxa_roubos_rua ~ d$regiao_administrativa,
        data=b, col=(cores),
        main="Gráfico: Região X Taxa de Roubos",
        xlab="Regiões",
        ylab="Taxa de Roubos")

No terceiro bloxpot, foi realizado o cruzamento da taxa de roubos pelas regiões, nos mesmos três anos. Dessa forma, foi possível observar que, o Centro possui variabilidade e desvio padrão altos, tendo sua mediana em 55, indicando que, nessa região a taxa de roubo é maior do que nas restantes. Enquanto isso, Santa Teresa, que, também, faz parte da Zona Central, tem índice menor de roubos, sendo sua mediana 10.

Em seguida, observando os bairros da Zona Norte, Inhaúma e Maré, pode-se dizer que, possuem índices melhores que a Zona Central, sendo suas medianas, respectivamente, 10.6 e 9.4. Se tratando da Zonal Sul, é visto uns valores consideráveis, enquanto Botafogo tem o índice de 9.6, Copacabana tem de 6.7.

O bairro de Campo Grande, Zona Oeste, apresenta os melhores resultados desse mapeamento, com índice de 4.2, possui baixo desvio padrão e dados mais homogêneos, representando resultados melhores que Copacabana e Botafogo. No entanto, Bangu, têm seu índice de roubo no valor de 10. Sendo assim, não podemos afirmar que a Zona Oeste possui maior segurança que a Zona Sul.

Nesse sentido, podemos afirmar que, o Centro, um bairro da Zona Central, é a região com maior índice de roubos, seguido de Inhaúma, bairro da Zona Norte. Enquanto, Campo Grande, bairro da Zona Oeste, possui menor índice. Além disso, nesse gráfico não há outliers e a maioria dos bairros tem dados assimétricos, com exceção de Copacabana, que possui simetria.

8. Indicador de Saneamento Básico: Coleta Seletiva de Lixo

g <- subset(bd,bd$regiao_administrativa=="Botafogo"|bd$regiao_administrativa=="Copacabana"|bd$regiao_administrativa=="Maré"|bd$regiao_administrativa=="Inhaúma"|bd$regiao_administrativa=="Centro"|bd$regiao_administrativa=="Santa Teresa"|bd$regiao_administrativa=="Campo Grande"|bd$regiao_administrativa=="Bangu")

h <- g %>%
  select(ano,regiao_administrativa,prop_coleta_seletiva_lixo)

Média e Mediana

h %>% select(prop_coleta_seletiva_lixo,regiao_administrativa) %>% group_by(regiao_administrativa) %>%
  summarise(Mediana=median(prop_coleta_seletiva_lixo), Minimo=min(prop_coleta_seletiva_lixo), Maximo=max(prop_coleta_seletiva_lixo), Média=mean(prop_coleta_seletiva_lixo),
            desvio_padrao=round(sd(prop_coleta_seletiva_lixo),2))%>% flextable() %>% theme_zebra()

regiao_administrativa	Mediana	Minimo	Maximo	Média	desvio_padrao
Bangu	0.66	0.41	1.03	0.700000	0.31
Botafogo	9.69	8.98	9.72	9.463333	0.42
Campo Grande	2.36	2.04	2.50	2.300000	0.24
Centro	2.81	1.31	5.72	3.280000	2.24
Copacabana	8.66	8.12	10.09	8.956667	1.02
Inhaúma	1.39	0.87	1.72	1.326667	0.43
Maré	0.00	0.00	0.00	0.000000	0.00
Santa Teresa	6.95	5.84	8.55	7.113333	1.36

Gráfico

cores <- brewer.pal(10, "Set2")

boxplot(h$prop_coleta_seletiva_lixo ~ d$regiao_administrativa,
        data=b, col=(cores),
        main="Gráfico: Região X Coleta Seletiva de Lixo",
        xlab="Regiões",
        ylab="Coleta Seletiva de Lixo")

No que tange a análise do Boxplot “Coleta seletiva de lixo”, pode-se constatar que, quando comparado às outras regiões, a Zona Sul tem clara vantagem nos índices de coleta, o bairro de Copacabana obteve o maior índice de coleta, com 10.09, e o bairro Botafogo obteve a melhor mediana nos índices, sendo o bairro mais constante.

Podemos afirmar, também que, o Centro apresentou maior disperção e amplitude que os demais, e Santa Teresa obteve bons resultados, tendo, também, altos índices de disperção e mediana de 6.95.

Os bairros da Zona Oeste obtiveram resultados ruins, sendo a segunda região analisada com menos coleta seletiva de lixo, com Bangu obtendo mediana de 0.66 e Campo Grande com 2.36.

Além disso, os bairros da Zona Norte, Inhaúma e Maré, obtiveram os piores resultados, com Inhaúma tendo mediana próxima a 1 e Maré tendo dados zerados, constando que não existe nenhuma coleta na região.

9. Testes de Hipótese

Teste de Hipótese: Região X Taxa de Incidência de Casos de Dengue

Teste de Shapiro

Inicialmente, realizamos o Teste de Shapiro para analisar a variável de saúde, educação, segurança e saneamento básico em cada uma das regiões escolhidas. Esse teste diz respeito sobre a normalidade da distribuição dos dados. Dessa maneira:

H0: distribuição normal

H1: dstribuição não normal

alpha: 0,05

Se pvalor < alpha REJ H0

Se pvalor > alpha NÃO REJ H0

teste1 <- aov(taxa_incidencia_dengue ~ regiao_administrativa, data = b)
residos1 <- residuals(teste1)
shapiro.test(residos1)

## 
##  Shapiro-Wilk normality test
## 
## data:  residos1
## W = 0.97096, p-value = 0.6908

options(scipen = 999)

pvalor = 0.6908

alpha = 0,05

pvalor > alpha

Logo, a taxa de dengue tem uma distribuição normal.

Teste de Bartlett

Em seguida, foi realizado o Teste de Bartlett, onde, dessa vez, analisamos a variável região, com o intuito de saber se seus dados são ou não homogêneos.

HO: todas as variáveis são iguais.

H1: pelo menos uma variável é diferente.

alpha: 0,05

Se pvalor < alpha REJ H0

Se pvalor > alpha NÃO REJ H0

bartlett.test(residos1 ~ b$regiao_administrativa)

## 
##  Bartlett test of homogeneity of variances
## 
## data:  residos1 by b$regiao_administrativa
## Bartlett's K-squared = 11.521, df = 7, p-value = 0.1175

pvalor = 0.1175

alpha = 0,05

pvalor > alpha

As variâncias são homogêneas.

Teste Anova

A partir do teste anterior, descobriu-se que, a variância das regiões são homogênea. Sendo assim, utilizaremos o Teste Anova para comparar se há diferença nas médias ou medianas dos diferentes grupos.

H0: médias das regiões são iguais

H1: há pelo menos uma média diferente

alpha: 0,05

Se pvalor < alpha REJ H0

Se pvalor > NÃO REJ H0

modelo1 <- aov(taxa_incidencia_dengue ~ regiao_administrativa, data = b)
modelo1

## Call:
##    aov(formula = taxa_incidencia_dengue ~ regiao_administrativa, 
##     data = b)
## 
## Terms:
##                 regiao_administrativa Residuals
## Sum of Squares              1015017.0  213712.7
## Deg. of Freedom                     7        16
## 
## Residual standard error: 115.5727
## Estimated effects may be unbalanced

summary(modelo1)

##                       Df  Sum Sq Mean Sq F value    Pr(>F)    
## regiao_administrativa  7 1015017  145002   10.86 0.0000489 ***
## Residuals             16  213713   13357                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor = 0.0000489

alpha = 0,05

pvalor < alpha

Existe pelo menos uma média diferente entre as regiões.

Teste de Tukey

Por último, foi realizado o Teste de Tukey, que nos ajudou a sinalizar as diferentes médias entre as regiôes.

alpha: 0,05

Se pvalor < média diferente

Se pvalor > média semelhante

#Qual a média que é diferente das demais?
TukeyHSD(modelo1)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = taxa_incidencia_dengue ~ regiao_administrativa, data = b)
## 
## $regiao_administrativa
##                                 diff          lwr         upr     p adj
## Botafogo-Bangu            -603.90000  -930.604781 -277.195219 0.0001870
## Campo Grande-Bangu        -469.54333  -796.248115 -142.838552 0.0026787
## Centro-Bangu              -512.15000  -838.854781 -185.445219 0.0011279
## Copacabana-Bangu          -625.33667  -952.041448 -298.631885 0.0001248
## Inhaúma-Bangu             -390.11000  -716.814781  -63.405219 0.0137832
## Maré-Bangu                -719.63667 -1046.341448 -392.931885 0.0000227
## Santa Teresa-Bangu        -398.51000  -725.214781  -71.805219 0.0115892
## Campo Grande-Botafogo      134.35667  -192.348115  461.061448 0.8338760
## Centro-Botafogo             91.75000  -234.954781  418.454781 0.9722477
## Copacabana-Botafogo        -21.43667  -348.141448  305.268115 0.9999975
## Inhaúma-Botafogo           213.79000  -112.914781  540.494781 0.3669486
## Maré-Botafogo             -115.73667  -442.441448  210.968115 0.9121276
## Santa Teresa-Botafogo      205.39000  -121.314781  532.094781 0.4125629
## Centro-Campo Grande        -42.60667  -369.311448  284.098115 0.9997397
## Copacabana-Campo Grande   -155.79333  -482.498115  170.911448 0.7156379
## Inhaúma-Campo Grande        79.43333  -247.271448  406.138115 0.9874703
## Maré-Campo Grande         -250.09333  -576.798115   76.611448 0.2077929
## Santa Teresa-Campo Grande   71.03333  -255.671448  397.738115 0.9934589
## Copacabana-Centro         -113.18667  -439.891448  213.518115 0.9206950
## Inhaúma-Centro             122.04000  -204.664781  448.744781 0.8886699
## Maré-Centro               -207.48667  -534.191448  119.218115 0.4009015
## Santa Teresa-Centro        113.64000  -213.064781  440.344781 0.9192110
## Inhaúma-Copacabana         235.22667   -91.478115  561.931448 0.2652246
## Maré-Copacabana            -94.30000  -421.004781  232.404781 0.9679193
## Santa Teresa-Copacabana    226.82667   -99.878115  553.531448 0.3024475
## Maré-Inhaúma              -329.52667  -656.231448   -2.821885 0.0472736
## Santa Teresa-Inhaúma        -8.40000  -335.104781  318.304781 1.0000000
## Santa Teresa-Maré          321.12667    -5.578115  647.831448 0.0558316

Sendo assim, o resultado das médias diferentes ficou: Botafogo-Bangu, Campo Grande-Bangu, Centro-Bangu, Copacabana-Bangu, Inhaúma-Bangu, Maré-Bangu, Santa Teresa-Bangu e Maré-Inhaúma.

Teste de Hipótese: Região X Alfabetização

Teste de Shapiro

teste2 <- aov(prop_alfabetizacao ~ regiao_administrativa, data = d)
residos2 <- residuals(teste2)
shapiro.test(residos2)

## 
##  Shapiro-Wilk normality test
## 
## data:  residos2
## W = 0.9311, p-value = 0.1032

options(scipen = 999)

pvalor= 0.1032

alpha = 0,05

pvalor > alpha

Logo, a taxa de alfabetização possui uma distribuição normal.

Teste de Bartlett

bartlett.test(residos2 ~ d$regiao_administrativa)

## 
##  Bartlett test of homogeneity of variances
## 
## data:  residos2 by d$regiao_administrativa
## Bartlett's K-squared = 5.1151, df = 7, p-value = 0.6459

pvalor = 0.6459

alpha = 0,05

pvalor > alpha

As variâncias são homogêneas.

Teste Anova

modelo2 <- aov(prop_alfabetizacao ~ regiao_administrativa, data = d)
modelo2

## Call:
##    aov(formula = prop_alfabetizacao ~ regiao_administrativa, data = d)
## 
## Terms:
##                 regiao_administrativa Residuals
## Sum of Squares               153.1259 1184.0003
## Deg. of Freedom                     7        16
## 
## Residual standard error: 8.602326
## Estimated effects may be unbalanced

summary(modelo2)

##                       Df Sum Sq Mean Sq F value Pr(>F)
## regiao_administrativa  7  153.1   21.88   0.296  0.946
## Residuals             16 1184.0   74.00

pvalor = 0.946

alpha = 0,05

pvalor > alpha

As médias das regiões são iguais.

Teste de Hipótese: Região X Taxa de Roubos

Teste de Shapiro

teste3 <- aov(taxa_roubos_rua ~ regiao_administrativa, data = f)
residos3 <- residuals(teste3)
shapiro.test(residos3)

## 
##  Shapiro-Wilk normality test
## 
## data:  residos3
## W = 0.72339, p-value = 0.00002086

options(scipen = 999)

pvalor = 0.00002086

alpha = 0,05

pvalor < alpha

Logo, a taxa de roubos não tem uma distribuição normal.

Teste Kruskal

Após realizar o Teste de Shapiro, foi desenvolvido o Teste de Kruskal para saber se a variável região influencia na variável taxa de roubos.

H0: os grupos são amostrados com distribuições idênticas.

H1: os grupos são amostrados com diferentes distribuições.

alpha: 0,05

Se pvalor < alpha REJ H0

Se pvalor > NÃO REJ H0

kruskal.test(taxa_roubos_rua ~ regiao_administrativa, data = f)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  taxa_roubos_rua by regiao_administrativa
## Kruskal-Wallis chi-squared = 14.92, df = 7, p-value = 0.03704

pvalor = 0.03704

alpha = 0,05

pvalor < alpha

Dessa maneira, podemos afirmar que, a taxa de dengue possui uma diferente distribuição entre os bairros. Logo, a variável região (bairro) influência na variável taxa de roubos.

Teste de Comparações

comparacoes3 <- pairwise.wilcox.test(f$taxa_roubos_rua, f$regiao_administrativa)
comparacoes3

## 
##  Pairwise comparisons using Wilcoxon rank sum exact test 
## 
## data:  f$taxa_roubos_rua and f$regiao_administrativa 
## 
##              Bangu Botafogo Campo Grande Centro Copacabana Inhaúma Maré
## Botafogo     1     -        -            -      -          -       -   
## Campo Grande 1     1        -            -      -          -       -   
## Centro       1     1        1            -      -          -       -   
## Copacabana   1     1        1            1      -          -       -   
## Inhaúma      1     1        1            1      1          -       -   
## Maré         1     1        1            1      1          1       -   
## Santa Teresa 1     1        1            1      1          1       1   
## 
## P value adjustment method: holm

Teste de Hipótese: Região X Coleta Seletiva de Lixo

Teste de Shapiro

teste4 <- aov(prop_coleta_seletiva_lixo ~ regiao_administrativa, data = h)
residos4 <- residuals(teste4)
shapiro.test(residos4)

## 
##  Shapiro-Wilk normality test
## 
## data:  residos4
## W = 0.90954, p-value = 0.03447

options(scipen = 999)

pvalor = 0.03447

alpha = 0,05

pvalor < alpha

Logo, a taxa de coleta seletiva de lixo não possui uma distribuição normal.

Teste Kruskal

Após realizar o Teste de Shapiro, foi desenvolvido o Teste de Kruskal para saber se a variável região influencia na variável taxa de coleta seletiva de lixo.

H0: os grupos são amostrados com distribuições idênticas.

H1: os grupos são amostrados com diferentes distribuições.

alpha: 0,05

Se pvalor < alpha REJ H0

Se pvalor > NÃO REJ H0

kruskal.test(prop_coleta_seletiva_lixo ~ regiao_administrativa, data = h)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  prop_coleta_seletiva_lixo by regiao_administrativa
## Kruskal-Wallis chi-squared = 21.611, df = 7, p-value = 0.002964

pvalor = 0.002964

alpha = 0,05

pvalor < alpha

Dessa maneira, podemos afirmar que, a taxa de coleta seletiva de lixo, possui, também, uma diferente distribuição entre os bairros. Logo, a variável região (bairro) influência na variável taxa de coleta seletiva de lixo.

Teste de Comparações

comparacoes4 <- pairwise.wilcox.test(h$prop_coleta_seletiva_lixo, h$regiao_administrativa)
comparacoes4

## 
##  Pairwise comparisons using Wilcoxon rank sum exact test 
## 
## data:  h$prop_coleta_seletiva_lixo and h$regiao_administrativa 
## 
##              Bangu Botafogo Campo Grande Centro Copacabana Inhaúma Maré
## Botafogo     1     -        -            -      -          -       -   
## Campo Grande 1     1        -            -      -          -       -   
## Centro       1     1        1            -      -          -       -   
## Copacabana   1     1        1            1      -          -       -   
## Inhaúma      1     1        1            1      1          -       -   
## Maré         1     1        1            1      1          1       -   
## Santa Teresa 1     1        1            1      1          1       1   
## 
## P value adjustment method: holm

Com a matriz do Teste de Comparação Wilcoxon, é possível analisar todos os pares de regiões e a distribuição da variável, que, em média, torna-se semelhante, uma vez que, comparada uma outra com o pvalor > 0.05.

10. Conclusão

Após a análise profunda e cautelosa dos testes de hipótese, suas respectivas tabelas valor médio e seus p valores, foi possível inferir que as hipóteses propostas foram comprovadas e confirmadas. Dessa forma, tornou-se explícita a desigualdade de atenção governamental entre as zonas de periferia e as zonas de prestígio social. As Zonas Oeste, Central e Norte se encontram em desvantagem em diversos critérios das variáveis estudadas, entretanto a Zona Sul tem uma particularidade e possui áreas de periferia que apresentam um grande abismo em relação às zonas de maior poder aquisitivo.

Ao analisar os Indicadores de Saúde, foi escolhida a Taxa de Incidência de Casos de Dengue para avaliar o alcance das políticas de saúde e profilaxia. Em específico, as Zonas Oeste e Central sofrem com altos índices da doença e assim, torna-se nítida a falta de qualidade de vida e sua situação de vulnerabilidade a infecções e doenças. Assim, confirma-se a hipótese de que a desigualdade acelera e torna mais propensa a proliferação de doenças.

Sobre os Indicadores de Educação, foi analisada a taxa de crianças até o terceiro ano do Ensino Fundamental em escolas públicas. Com isso, foi comprovado que a Zonas Sul é a zona de maior taxa de alfabetização, destacando os bairros de Copacabana e Botafogo, comprovando que as zonas de maior prestígio social possuem um acesso maior à educação pública e às políticas de educação. Em contrapartida, a Zona Oeste apresenta uma taxa mediana e a Zona Central possui as piores taxas de alfabetização. Assim, nota-se que as zonas de subúrbio não possuem uma boa gestão da educação e da assistência social.

A respeito dos Indicadores de Segurança, foi analisada a Taxa de Roubos. A partir dessa análise, nota-se que a Zona Central é a zona com a maior incidência de roubos, mostrando que o fato de ser uma zona com uma população economicamente favorecida e estar cercada por zonas de vulnerabilidade, repressão e conflitos sociais (comunidades) exibe que mesmo sendo uma zona de atenção governamental, a desorganização social afeta a sociedade como um todo.

Por fim, com relação aos Indicadores de Saneamento Básico, foi analisada a Taxa de Coleta Seletiva. Com ela, nota-se a clara vantagem da Zona Sul na taxa de coleta e as baixíssimas taxas das Zonas Central, Oeste e principalmente a Norte (cuja taxa de coleta do bairro da Maré foi 0) confirma que as medidas públicas de saúde, saneamento e higiene estão concentradas na zona de maior valor econômico.

A partir de todas as análises dos dados escolhidos, torna-se explícita a vulnerabilidade das Zonas Central, Norte e Oeste com relação às políticas públicas e a garantias dos direitos básicos do cidadão e a urgente necessidade de uma atenção governamental à essas questões, bem como a discussão sobre a baixíssima qualidade de vida das populações de periferia.

11. Referências Bibliográficas

Base de dados: https://basedosdados.org/dataset/br-rj-rio-de-janeiro-ipp-ips?bdm_table=indicadores

Saiki Junior, Wilson. Sete Indicadores que Revelam Desigualdades na Região Metropolitana do Rio de Janeiro. Rio On Watch. Rio de Janeiro. 29 de Julho de 2020. Disponível em: https://rioonwatch.org.br/?p=48870 Acesso em: 06 de Agosto de 2022

Regueira, Chico. Rio está entre as 10 metrópoles mais desiguais do mundo, diz estudo da Casa Fluminense. G1. Rio de Janeiro. 13 de julho de 2020. Disponível em: https://g1.globo.com/rj/rio-de-janeiro/noticia/2020/07/13/rio-esta-entre-as-10-metropoles-mais-desiguais-do-mundo-diz-estudo-da-casa-fluminense.ghtml Acesso em: 06 de Agosto de 2022

Valporto, Oscar. Retrato de um Rio muito desigual onde raça e gênero ampliam disparidades. Projeto Colabora. Rio de Janeiro. 15 de julho de 2020. Disponível em: https://projetocolabora.com.br/ods1/mapa-da-desigualdade/ Acesso em: 06 de Agosto de 2022