Relatório Final

 

Universidade Federal do Estado do Rio de Janeiro - CCJP
Disciplina: Estatística aplicada às ciências humanas e sociais
Professor: Steven Dutt-Ross

 

Nome: Juliana do Nascimento Roberto
matrícula: 20192520022
e-mail:
Nome: Sandra Beatriz de Moura Arueira
matrícula: 20192520048
e-mail:

 

Introdução

A desigualdade racial é um dos principais problemas enfrentado no Brasil e é uma consequência dos tempos de escravidão. Mesmo depois de muitos anos da abolição da escravidão, as pessoas negras continuam enfrentando o preconceito e a violência, em muitos casos essas pessoas são mortas apenas pela sua cor de pele. Vale destacar principalmente a violência sofrida por mulheres negras, entrando em pauta mais uma desigualdade, que é a de gênero. Sendo assim, será apresentado no presente trabalho as análises da base de dados sobre os homicídios ocorridos no território brasileiro, será dada a ênfase na desigualdade racial e na diferença de gênero, fazendo uso da análise comparada de homicídios entre negros e não negros, e entre homens e mulheres.

 

Objetivo

O objetivo do estudo é avaliar a desigualdade racial assim como a de gênero evidenciada nos homicídios ocorridos no território brasileiro em 2019. O intuito é demonstrar, através de análises de taxas de homicídios de negros e sua relação com outras variáveis, que a violência no Brasil é predominante por raça e gênero.

 

Metodologia

Os dados utilizados para as análises possuem como fonte o Atlas da Violência, com referência do ano de 2019, fornecido pelo Instituto de Pesquisa Econômica Aplicada (IPEA) e o Fórum Brasileiro de Segurança Pública (FBSP). Os dados utilizado se baseiam na unidade de taxa de homicídios por 100 mil habitantes, disponibilizados no Atlas da Violência, edição de 2019, os quais foram usados para montar o banco de dados com informações referentes a taxa de homicídios por Unidades federativas, Estados, Regiões, por gênero (homem e mulher), raça (negros e não negros). O banco de dados possui 27 linhas de observações e 10 variáveis.

#Carregando base de dados utilizada na análise

library(readr)
homicidios2 <- read_delim("C:/Users/julia/Downloads/homicidios2.csv", 
                          delim = ";", escape_double = FALSE, col_types = cols(`TAXA DE HOMICIDIOS` = col_number(), 
                                                                               `TAXA DE HOMICIDIOS DE NEGROS` = col_number(), 
                                                                               `TAXA DE HOMICIDIOS DE MULHERES NEGRAS` = col_number(), 
                                                                               `TAXA DE HOMICIDIO MULHERES NAO NEGRAS` = col_number(), 
                                                                               `TAXA DE HOMICIDIOS DE HOMENS NEGROS` = col_number(), 
                                                                               `TAXA DE HOMICIDIOS DE HOMENS NAO NEGROS` = col_number()), 
                          trim_ws = TRUE)

#CRIAR TABELA PARA VISUALIZAÇÃO DOS DADOS 
library (kableExtra)
kable(homicidios2, row.names = FALSE)%>%
  kable_styling( full_width = FALSE,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")
UF ESTADO COD REGIAO TAXA DE HOMICIDIOS TAXA DE HOMICIDIOS DE NEGROS TAXA DE HOMICIDIOS DE MULHERES NEGRAS TAXA DE HOMICIDIO MULHERES NAO NEGRAS TAXA DE HOMICIDIOS DE HOMENS NEGROS TAXA DE HOMICIDIOS DE HOMENS NAO NEGROS
DF Distrito Federal 53 Centro-Oeste 15.92 21.12 3.85 2.72 40.37 14.41
GO Goias 52 Centro-Oeste 32.10 39.00 5.08 3.15 73.85 35.45
MT Mato Grosso 51 Centro-Oeste 25.69 28.99 4.70 5.24 52.77 30.55
MS Mato Grosso do Sul 50 Centro-Oeste 17.67 20.48 3.44 5.74 37.96 24.11
RS Rio Grande do Sul 43 Sul 19.20 22.02 4.51 3.78 39.06 33.30
SC Santa Catarina 42 Sul 10.71 13.77 3.88 2.88 23.20 17.47
PR Parana 41 Sul 18.32 14.75 2.82 3.79 26.55 37.72
SP Sao Paulo 35 Sudeste 7.32 9.09 1.58 1.71 16.81 10.73
RJ Rio de Janeiro 33 Sudeste 20.57 27.47 2.67 1.99 54.83 23.75
ES Espirito Santo 32 Sudeste 25.95 35.66 5.78 1.57 67.38 12.32
MG Minas Gerais 31 Sudeste 13.67 16.62 3.16 2.03 30.53 16.16
BA Bahia 29 Nordeste 41.13 47.22 5.86 1.94 90.85 21.75
SE Sergipe 28 Nordeste 42.33 51.51 5.26 1.20 102.42 15.31
AL Alagoas 27 Nordeste 33.41 44.08 7.02 0.00 83.73 2.17
PE Pernambuco 26 Nordeste 36.35 45.25 4.75 2.71 88.66 33.71
PB Paraiba 25 Nordeste 23.72 31.80 3.84 1.58 61.46 7.28
RN Rio Grande do Norte 24 Nordeste 38.38 55.58 7.67 1.47 105.40 19.01
CE Ceara 23 Nordeste 26.47 33.99 5.87 1.52 63.91 12.66
PI Piaui 22 Nordeste 17.38 18.49 2.57 3.31 35.46 14.56
MA Maranhao 21 Nordeste 24.08 26.18 3.23 2.73 49.32 26.40
TO Tocantins 17 Norte 28.99 30.25 5.27 1.70 54.95 44.82
AP Amapa 16 Norte 42.68 51.14 4.90 1.08 99.53 12.12
PA Para 15 Norte 39.58 44.84 5.87 2.40 84.40 25.47
RR Roraima 14 Norte 38.63 41.99 9.64 19.40 73.78 68.68
AM Amazonas 13 Norte 38.41 42.19 5.72 6.64 78.36 50.17
AC Acre 12 Norte 36.85 40.02 7.11 5.38 74.00 37.35
RO Rondonia 11 Norte 25.15 26.30 4.95 4.05 26.29 40.95

 

Dicionário de dados:
Conforme os dados em questão, abaixo consta o dicionário de dados referente a base de dados utilizada para análise do trabalho. As colunas e seus significados presentes de modo resumido e de fácil compreensão.

#DICIONARIO DE DADOS
#carregando base de dados com o dicionario 

library(readxl)
DICIODADOS2 <- read_excel("C:/Users/julia/Downloads/DICIODADOS2.xlsx")


#criando tabela com a base de dados diciodados2  

library(DT)
datatable(DICIODADOS2,iris, rownames = FALSE,
  extensions = 'Buttons', options = list(dom = 'Bfrtip', buttons = I('colvis')))

Análise descritiva dos dados

Conferindo a especificação dos dados utilizados no relatório.

#analise descritiva da base de dados 

summary(homicidios2)
##       UF               ESTADO               COD           REGIAO         
##  Length:27          Length:27          Min.   :11.00   Length:27         
##  Class :character   Class :character   1st Qu.:19.00   Class :character  
##  Mode  :character   Mode  :character   Median :27.00   Mode  :character  
##                                        Mean   :29.11                     
##                                        3rd Qu.:38.00                     
##                                        Max.   :53.00                     
##  TAXA DE HOMICIDIOS TAXA DE HOMICIDIOS DE NEGROS
##  Min.   : 7.32      Min.   : 9.09               
##  1st Qu.:18.76      1st Qu.:21.57               
##  Median :25.95      Median :31.80               
##  Mean   :27.43      Mean   :32.59               
##  3rd Qu.:37.62      3rd Qu.:43.13               
##  Max.   :42.68      Max.   :55.58               
##  TAXA DE HOMICIDIOS DE MULHERES NEGRAS TAXA DE HOMICIDIO MULHERES NAO NEGRAS
##  Min.   :1.580                         Min.   : 0.000                       
##  1st Qu.:3.640                         1st Qu.: 1.640                       
##  Median :4.900                         Median : 2.710                       
##  Mean   :4.852                         Mean   : 3.397                       
##  3rd Qu.:5.820                         3rd Qu.: 3.785                       
##  Max.   :9.640                         Max.   :19.400                       
##  TAXA DE HOMICIDIOS DE HOMENS NEGROS TAXA DE HOMICIDIOS DE HOMENS NAO NEGROS
##  Min.   : 16.81                      Min.   : 2.17                          
##  1st Qu.: 38.51                      1st Qu.:14.48                          
##  Median : 61.46                      Median :23.75                          
##  Mean   : 60.59                      Mean   :25.50                          
##  3rd Qu.: 81.05                      3rd Qu.:34.58                          
##  Max.   :105.40                      Max.   :68.68

Variáveis utilizadas e análises:

Serão análisadas as relações da variável homicídios de negros com as variáveis: Unidade Federativa, Estado, Região, taxa de homicídios, taxa de homicídios por gênero (homem e mulher).

Por intermédio de uma análise estatística será investigado a relação das variáveis anteriormente citadas para:

  • Análise para encontrar as regiões com a maior taxa de homicídios para negros, a fim de mapear as regiões mais violentas para a população negra;

  • Examinar e elucidar a disparidade das taxas de homicídios entre raça e gênero, referente a mulheres negras e não negras, homens negros e não negros;

  • Analisar as correlações entre a taxa de homicídios e a taxa de homicídios de negros;

  • Teste de hipótese para analisar se a raça (taxa de homicídios de negros) possui correlação com a taxa de homicídios, onde:

  • H0: a raça (taxa de homicídio de negros) não interfere com a taxa de homicídios.

  • H1: a raça (taxa de homicídio de negros) interfere com a taxa de homicídios.

Para o teste de hipóteses será utilizado o alpha = 0,05. Para tal teste, adota-se também a regra de decisão com a premissa de que se o p-valor for menor que o valor de alpha, será rejeitada a H0, porém se o p-valor for maior que o valor de alpha, não será rejeitada a H0. Inicilamente será utilizado o teste de Shapiro Wilk para identificar se a distribuição dos dados é normal, após identificado o pressuposto de normalidade, foi utilizado o teste de Bartlett para encontrar se há homogeneidade entre as variâncias, e após atestada a igualdade das variâncias, foi feito o teste de análise das variâncias, teste ANOVA.

Estaremos utilizando para as análises estatísticas desse relatório os seguintes métodos:

1. gráficos Boxplot;
2. Diagrama de dispersão;         
3. Matriz de correlação;
4. Elaboração de mapas para visualização dos dados e resultados; 
5. Teste de hipóteses.     
     
 

 

Análise de resultados e discussão

Inicialmente, conforme as informações do Atlas da violência (2019), iremos analisar a relação da váriavel região com as taxas de homicídios de negros (boxplot 1), taxas de homicídios de mulheres negras (boxplot 2) e taxas de homicídios de homens negros (boxplot 3).

Boxplot 1: Regiões mais violentas para população negra no Brasil

#boxplot 1: regioes mais violentas para populacao negra no Brasil 
par(cex=0.8)  
par(bg="lightgrey")
boxplot(`TAXA DE HOMICIDIOS DE NEGROS`~REGIAO, data=homicidios2,
        col=c("royalblue","red"),
        horizontal = F,
        ylim = c(0,100),
        main= "Taxa de homicídios de negros por regiões do Brasil")

A princípio identificamos que não há outliers em nenhuma região para a variável taxa de homicídios de negros. Além disso, identifica-se que as regiões mais violentas para a população negra são as Norte e Nordeste, e possuem média muito próximas entre si, porém a região Nordeste possui a maior mediana. As regiões Sul, Nordeste, Norte e Centro-Oeste possuem grande amplitude interquartil, exceto a Sudeste, indicando menor dispersão de dados nessa região. A região Sul apresenta a menor mediana, e os valores da mínima e do primeiro quartil estão muito próximos entre si, é a região com as menores taxas.

Ao caminharmos para a segunda análise, averiguamos a relação da variável região com a taxa de homicídios de mulheres negras, através da análise do boxplot.

Boxplot 2: Regiões mais violentas para mulheres negras no Brasil

#boxplot 2: regioes mais violentas para mulheres negras no Brasil 
#reforca a violencia contra a mulher negra 

par(cex=0.8)  
par(bg="lightgrey")
boxplot(`TAXA DE HOMICIDIOS DE MULHERES NEGRAS`~REGIAO, data=homicidios2,
        col=c("lightblue","purple"),
        horizontal = F,
        ylim = c(0,10),
        main= "Taxa de homicídios de mulheres negras por regiões do Brasil")

Primeiramente, é possível identificar a existência de outliers na região Norte, indicando que existe um estado com maior taxa quando comparado aos demais da mesma região. Em consonância com a análise do boxplot anterior, as regiões mais violentas para mulheres negras são as Norte e Nordeste, ambas com medianas próximas entre si. A região que apresenta a maior média é a Norte, possuindo uma taxa de 6,21 homicídios para cada 100 mil habitantes negras do sexo feminino. É possível observar que no Centro-Oeste, Nordeste e Norte, mais de 50% dos homicídios de mulheres nessas regiões são de mulheres negras. Contudo, diferente da análise anterior, boxplot 1, que apresenta a região Sul com as menores taxas de homicídios para a população negra, ao fazer o recorte de gênero, a região Sudeste é a que apresenta a menor mediana, e possui uma taxa média de 3,30 homicídios para cada 100 mil habitantes negras do sexo feminino.

A próxima análise tratará da relação da variável região com a variável homicídios de homens negros.

Boxplot 3: Regiões mais violentas para homens negros no Brasil

#boxplot 3: regiões mais violentas para homens negros no brasil 

par(cex=0.8)  
par(bg="lightgrey")
boxplot(`TAXA DE HOMICIDIOS DE HOMENS NEGROS`~REGIAO, data=homicidios2,
        col=c("darkgreen","orange"),
        horizontal = F,
        main= "Taxa de homicídios de homens negros por regiões do Brasil")

Em primeiro lugar identifica-se a existência de outliers na região Norte, indicando que há um estado com a taxa inferior aos demais estados situados na mesma região. A região Nordeste possui a maior mediana, seguida da região Norte. É possível identificar que mais de 90% dos homicídios de homens na região Nordeste são de homens negros, e mais de 60% para as regiões Centro-Oeste e Sudeste. Por outro lado, a região Sul apresenta a menor mediana, e também possui os valores da mediana e do primeiro quartil mais próximos entre si, corroborando com os dados do boxplot 1 que indicam a região Sul com as menores taxas de homícidos para a população negra, quanto ao recorte de gênero, também é a que apresenta menores taxas para negros do sexo masculino.

Ademais, iniciaremos a análise utilizando o diagrama de dispersão para analisar a correlação entre as variáveis taxa de homicídios e taxa de homicídios de negros.

Diagrama de dispersão

Estaremos utilizando o diagrama de dispersão para analisar as variáveis quantitativas taxa de homicídios e taxa de homicídios de negros.

#DIAGRAMA DE DISPERSAO ENTRE HOMICIDIOS E RACA 

par(cex=0.8)
par(bg="skyblue")
plot(homicidios2$`TAXA DE HOMICIDIOS`, homicidios2$`TAXA DE HOMICIDIOS DE NEGROS`, pch=16, col="darkred",
     main="Diagrama de dispersao entre taxa de homicidios e taxa de homicidios de negros",
     ylab = "taxa de homicidios", xlab= "taxa de homicidios de negros")

abline(lsfit(homicidios2$`TAXA DE HOMICIDIOS`, homicidios2$`TAXA DE HOMICIDIOS DE NEGROS`), col= "red" )

 

Ao analisar o diagrama de dispersão entre as duas variáveis quantitativas, é possível verificar que existe correlação entre elas e está é positiva, visto que a concentração dos pontos segue uma inclinação crescente. E ainda apresenta uma correlação forte, já que os pontos estão próximos entre si, e não dispersos.

Matriz de correlação

Para essa análise, iremos criar a matriz de correlação entre as variáveis taxa de homicídios, taxa de homicídios de mulheres negras e não negras.

#manipulando os dados para a criação da matriz de correlação 

names(homicidios2)
##  [1] "UF"                                     
##  [2] "ESTADO"                                 
##  [3] "COD"                                    
##  [4] "REGIAO"                                 
##  [5] "TAXA DE HOMICIDIOS"                     
##  [6] "TAXA DE HOMICIDIOS DE NEGROS"           
##  [7] "TAXA DE HOMICIDIOS DE MULHERES NEGRAS"  
##  [8] "TAXA DE HOMICIDIO MULHERES NAO NEGRAS"  
##  [9] "TAXA DE HOMICIDIOS DE HOMENS NEGROS"    
## [10] "TAXA DE HOMICIDIOS DE HOMENS NAO NEGROS"
selecao <- c("TAXA DE HOMICIDIOS","TAXA DE HOMICIDIOS DE MULHERES NEGRAS", 
             "TAXA DE HOMICIDIO MULHERES NAO NEGRAS")

cor_homicidios <- cor(homicidios2[,selecao])

#matriz para analise de correlacao de homicidios entre mulheres negras e nao negras
library(corrplot)
## corrplot 0.92 loaded
par(cex = 0.7)
corrplot(cor_homicidios, method = "number")

Ao analisar a matriz de correlação, podemos verificar que o coeficiente de correlação entre as variáveis taxa de homicídios e taxa de homicídios de mulheres negras é de 0,75, mostrando a correlação positiva e forte entre as variáveis, já o coeficiente de correlação entre as variáveis taxa de homicídios e taxa de homicídios de mulheres não negras é de 0,15, mostrando uma correlação positiva, mas fraca entre as variáveis. Portanto, podemos constatar que a taxa de homicídios de mulheres negras apresenta uma incidência mais forte na taxa de homicídios total do que a taxa de homicídios de mulheres não negras.

Matriz de correlação 2

Para essa análise, iremos criar a matriz de correlação entre as variáveis taxa de homicídios, taxa de homicídios de homens negros e não negros.

selecao2 <- c("TAXA DE HOMICIDIOS", "TAXA DE HOMICIDIOS DE HOMENS NEGROS", 
              "TAXA DE HOMICIDIOS DE HOMENS NAO NEGROS")

cor_homicidios2 <- cor(homicidios2[,selecao2] )

#matriz para analise de correlacao de homicidios entre homens negros e nao negros
par(cex = 0.7)
corrplot(cor_homicidios2, method = "number")

Ao analisar essa matriz de correlação, é possível constatar que o coeficiente de correlação entre as variáveis taxa de homicídios e taxa homicídios de homens negros é de 0,93, demonstrando uma correlação positiva e bem forte, se aproximando bastante de 1,0. Já o coeficiente de correlação entre as variáveis taxa de homicídios e taxa de homicídios de homens não negros é de 0,27. Podendo verificar, que a taxa de homicídios de homens negros tem uma incidência maior na taxa de homicídios total.

Conclui-se que com a análise das duas matrizes de correlação, que a taxa de homicídios de homens negros é mais forte que a de mulheres negras.

 

Mapas para visualização e interpretação

Estaremos utilizando o pacote rgdal para criação de mapas com as malhas dos estados e do Distrito Federal fornecidos pelo IBGE. Os mapas irão auxiliar na visualização e interpretação dos dados anteriormente encontrados nos resultados dos boxplots analisados.

#MAPAS - carregando a base com o shape file 
library(rgdal)
## Carregando pacotes exigidos: sp
## Please note that rgdal will be retired by the end of 2023,
## plan transition to sf/stars/terra functions using GDAL and PROJ
## at your earliest convenience.
## 
## rgdal: version: 1.5-28, (SVN revision 1158)
## Geospatial Data Abstraction Library extensions to R successfully loaded
## Loaded GDAL runtime: GDAL 3.2.1, released 2020/12/29
## Path to GDAL shared files: C:/Users/julia/OneDrive/Documents/R/win-library/4.1/rgdal/gdal
## GDAL binary built with GEOS: TRUE 
## Loaded PROJ runtime: Rel. 7.2.1, January 1st, 2021, [PJ_VERSION: 721]
## Path to PROJ shared files: C:/Users/julia/OneDrive/Documents/R/win-library/4.1/rgdal/proj
## PROJ CDN enabled: FALSE
## Linking to sp version:1.4-6
## To mute warnings of possible GDAL/OSR exportToProj4() degradation,
## use options("rgdal_show_exportToProj4_warnings"="none") before loading sp or rgdal.
## Overwritten PROJ_LIB was C:/Users/julia/OneDrive/Documents/R/win-library/4.1/rgdal/proj
meu_shape <- readOGR(dsn= "C:/Users/julia/Downloads/mapas/UFEBRASIL.shp", 
                     layer = "UFEBRASIL",
                     verbose=FALSE )
## Warning in OGRSpatialRef(dsn, layer, morphFromESRI =
## morphFromESRI, dumpSRS = dumpSRS, : Discarded datum
## Sistema_de_Referencia_Geocentrico_para_las_AmericaS_2000 in Proj4 definition:
## +proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs
#plotando o shape 
plot(meu_shape)

#manipulando o nome das colunas 
colnames(homicidios2)[3]<-"CD_GEOCODU"

#manipulando os dados para adicionar o conteúdo ao shape 
dados <-merge(meu_shape,homicidios2)
remove(meu_shape)

# Paleta com 4 cores
library(RColorBrewer)
my_colors1 <- brewer.pal(6, "Blues") 
my_colors1 <- colorRampPalette(my_colors1)(6)
my_colors2 <- brewer.pal(6, "Purples") 
my_colors2 <- colorRampPalette(my_colors2)(6)
my_colors3 <- brewer.pal(6, "Reds") 
my_colors3 <- colorRampPalette(my_colors3)(6)

 

Mapa (1)

# mapa 1 - homicidios de negros por estado e DF 
#atribuindo as cores para cada estado 
faixas <- cut(dados@data$`TAXA DE HOMICIDIOS DE NEGROS`,6)
my_colors1 <- my_colors1[as.numeric(faixas)]

# plotando o mapa

plot(dados, col=my_colors1, axes=FALSE, bg="white")
  title(main = "Mapa 1 - Taxa de homicídios de negros por estado e Distrito Federal")

Conforme os resultados encontrados no mapa 1, é possível identificar que as taxas mais altas estão concentradas na região Norte e Nordeste, conforme os tons de azul escuro predominantes, em destaque o estado do Amapá na região Norte, e os estados do Rio Grande do Norte e Sergipe, na região Nordeste. Nota-se ainda que, na região Sudeste, que possui as taxas mais baixas, destacam-se os estados de São Paulo e Minas Gerais. Já na região Centro-Oeste, é possível destacar o estado de Goiás com uma coloração mais escura que os demais da mesma região, indicando ser o estado com a maior taxa nessa região.

 

Mapa (2)

#mapa 2 - homicidios de mulheres negras por estado e DF
   
#atribuindo as cores para cada estado    
faixas2 <- cut(dados@data$`TAXA DE HOMICIDIOS DE MULHERES NEGRAS`,6)
my_colors2 <- my_colors2[as.numeric(faixas2)]
   
#plotando o mapa 
plot(dados, col=my_colors2, axes=FALSE, bg="white")
  title(main = "Mapa 2 - Taxa de homicídios de mulheres negras por estado e Distrito Federal")

É possível identificar que no mapa 2 há concentração de tons mais escuros na região Norte e Nordeste, mostrando que nessas regiões as taxas são maiores. Na região Norte é possível destacar o estado de Roraima com o tom mais escuro entre todos os demais estados, indicando a maior taxa nessa região, sendo um valor que se destoa dos demais, conforme apresentado no boxplot 2, quando mencionado a presença de outliers nessa região. Ademais, a coloração presente no estado do Acre indica-o como o segundo com as maiores taxas da região Norte. Na região Nordeste, destacam-se os estados do Rio Grande do Norte e Alagoas, indicando as maiores taxas dessa região. Os estados que apresentam menores taxas estão concentrados nas regiões Sudeste e Sul. Na região Sudeste destaca-se São Paulo, já na região Sul destaca-se Paraná, ambos estados com as menores taxas em suas regiões. Contudo, apesar das menores taxas estarem concentradas na região Sudeste, é possível ver que o estado de Espirito Santo possui um tom mais escuro, indicando que possui a maior taxa dessa região.

 

Mapa (3)

#mapa 3 - homicidios de homens negros por estado e DF

#atribuindo as cores para cada estado 
faixas3 <- cut(dados@data$`TAXA DE HOMICIDIOS DE HOMENS NEGROS`,6)
my_colors3 <- my_colors3[as.numeric(faixas3)]

#plotando o mapa

plot(dados, col=my_colors3, axes=FALSE, bg="white")
  title(main = "Mapa 3 - Taxa de homicídios de homens negros por estado e Distrito Federal")

Os resultados do mapa 3 identificam que há maior concentração na região Nordeste, seguida pela região Norte. Na região Nordeste se destacam com tons mais escuros os estados do Rio Grande do Norte, Sergipe e Bahia, indicando que as maiores taxas encontram-se presentes nesses estados. Já na região Norte, o estado com coloração mais escura é o Amapá, indicando que nesse estado encontra-se a maior taxa da região. Ademais, os estados do Pará e Amazonas também concentram grandes taxas nessa região. Contudo, o estado de Rondonia destaca-se como o estado do Norte com as menores taxas, e destoa dos demais, conforme apresentado no boxplot 3, quando mencionado a presença de outliers. Outrossim, a região Sul apresenta uma coloração mais clara, indicando que os estados dessa região possuem a menor concentração de taxa, porém que dentre os estados dessa região, Rio Grande do Sul possui as maiores taxas de homicídios de homens negros.

Teste de hipóteses

Primeiramente, será feito o teste de shapiro wilk para avaliar o pressuposto de normalidade na distribuição dos dados utilizando as variáveis taxa de homícidios de negros e região.

Teste de Shapiro Wilk

#Teste de normalidade: shapiro wilk para avaliar o pressuposto de normalidade

#H0: os dados seguem uma distribuicao normal
#H1: os dados nao seguem uma distribuicao normal
#alpha: 0,05
#se pvalor < alpha REJ H0
#se pvalor > alpha NAO REJ H0


modelo1 <- aov(`TAXA DE HOMICIDIOS DE NEGROS` ~ REGIAO, data=homicidios2)
residuos1 <- residuals(modelo1)

#formular teste de normalidade com os residuos

shapiro.test(residuos1)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos1
## W = 0.97299, p-value = 0.6822

Conforme o resultado encontrado, o pvalor > alpha, logo, a hipótese nula não é rejeitada. Isso implica dizer que os dados seguem uma distribuição normal, e que o pressuposto de normalidade foi atendido.

Após o teste de normalidade, e a confirmação do pressuposto de normalidade atendido, será preciso realizar o teste de Bartlett para descobrir se há igualdade entre as variâncias. O teste parte do pressuposto que as amostras são independentes.

 

Teste de Bartlett

# Teste para descobrir se ha igualdade entre as variancias

#H0: sigma2 = ha igualdade entre as varianciais 
#H1: sigma2THNR != as variancias sao desiguais para pelo menos dois grupos
#alpha: 0,05
#se pvalor < alpha REJ H0
#se pvalor > alpha NAO REJ H0


bartlett.test(residuos1 ~ homicidios2$REGIAO)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  residuos1 by homicidios2$REGIAO
## Bartlett's K-squared = 2.6352, df = 4, p-value = 0.6206

O resultado indica que o pvalor > alpha, logo, a hipótese nula não é rejeitada. Nesse sentido, as regiões possuem variâncias homogêneas para com a variável taxa de homicídios de negros.

Após identificado que os dados seguem distribuição normal e que os grupos amostrados têm variâncias iguais, é preciso aplicar o teste de análise de variância, o ANOVA. Iremos comparar as taxas para descobrir se existem diferenças entre elas e se são significativas.

 

Teste ANOVA

# TESTE ANOVA

#H0: as taxas são iguais para todas as regioes
#H1: pelo menos uma das taxas é diferente em relacao a regiao
#alpha: 0,05
#se pvalor < alpha REJ H0
#se pvalor > alpha NAO REJ H0

modelo1 <- aov(`TAXA DE HOMICIDIOS DE NEGROS` ~ REGIAO, data=homicidios2)
modelo1
## Call:
##    aov(formula = `TAXA DE HOMICIDIOS DE NEGROS` ~ REGIAO, data = homicidios2)
## 
## Terms:
##                   REGIAO Residuals
## Sum of Squares  2030.408  2339.216
## Deg. of Freedom        4        22
## 
## Residual standard error: 10.31155
## Estimated effects may be unbalanced
summary(modelo1)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## REGIAO       4   2030   507.6   4.774 0.00632 **
## Residuals   22   2339   106.3                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Segundo o resultado, o pvalor (pr(>F)) < alpha, logo, a hipótese nula é rejeitada. Dessa forma, a variável racial (taxa de homicídios de negros) tem impacto na taxa de homicídios, pois as taxas são diferentes, existindo uma diferença significativa entre as taxas. Portanto, implica dizer que ocorrem mais homicídios contra a população negra.

 

Conclusão

Pode-se concluir depois da análise feita neste trabalho que é possível observar que a taxa de homicídios de negros no território brasileiro é relativamente alta em comparação com os não negros, o que sustenta a tese levantada de que o racismo ainda está presente na sociedade brasileira. Pelos mapas e boxplots apresentados, é possível observar que as regiões com maiores índices de homicídios, tanto de mulheres negras como de homens negros, são as regiões Norte e Nordeste, o que pode ser explicado pela não eficiência das políticas públicas adotadas nessas regiões.
Além disso, pode-se observar que a região com o índice mais baixo de homicídios é a região Sul, o que talvez seja explicado pela menor miscigenação na região, entrando em pauta os dados históricos de grande imigração de pessoas provenientes de países como Alemanha e Itália.
Ademais, com relação ao gênero, é possível observar pelos boxplots e pelas matrizes de correlação que a taxa de homicídios de homens negros é mais evidente do que a de mulheres negras.
Portanto, tanto os resultados dos testes de hipóteses, diagrama de dispersão, matriz de correlação, boxplots e mapas corroboram para incidência da variável racial como impactante nas taxas de homicídios no Brasil.

 

Referências

Todas as colunas utilizadas na montagem do banco de dados pertencem ao Atlas da Violência, e estão separadas por tópicos no site do Atlas da Violência, conforme referência abaixo.

Atlas da violência, v.2.7. Disponível em:
https://www.ipea.gov.br/atlasviolencia/filtros-series
Acesso em: 16 de janeiro de 2022.

Regiões do Brasil - Wikipédia. Disponível em: https://pt.wikipedia.org/wiki/Regi%C3%B5es_do_Brasil
Acesso em: 16 de janeiro de 2022.

Manual de Análise de Dados. Disponível em:
https://livro.metodosquantitativos.com/docs/
Acesso em: 13 de fevereiro de 2022.