Análise Descritiva

A Segurança Pública é um assunto que vem ganhando cada vez mais destaque no que diz respeito às questões da sociedade e do bem estar social da população brasileira. Esse tema é ligado diretamente ao crescimento em larga escala da violência nas metrópoles do país.

Diretamente vinculado ao aumento generalizado da violência nos grandes centros urbanos do país nos últimos anos, este debate, embora muito recorrente no cotidiano da maioria da população, é ainda assistemático. Na verdade, muito pouco ou quase nada deste debate tem frutificado em termos de políticas públicas e, na maioria das vezes, as políticas que existem são construídas sobre critérios de senso comum e de racionalidade duvidosa, absolutamente refratários a quaisquer ideias ou práticas de monitoramento e avaliação.

Segundo a 13ª. Edição do Anuário Brasileiro de Segurança Pública de 2019, no que diz respeito ao financiamento da política de segurança, já foram gastos R$91 bilhões, 3,9% a mais, comparado ao período anterior, o que corresponde a 1,34% do PIB nacional.

Muitos conflitos que resultam em morte têm tido como pano de fundo o tráfico de drogas, principalmente no Rio de Janeiro. Este novo aspecto da criminalidade urbana tem sido motivo de atenção por parte de vários pesquisadores na busca por um melhor entendimento do fenômeno, uma vez que estes conflitos interferem diretamente nas relações e interações dos indivíduos dentro de uma realidade.

A presente pesquisa tem por objetivo principal analisar e avaliar os dados sobre homicídios no Estado do Rio de Janeiro. Também tem como objetivo secundário analisar qual região é mais marginalizada.

Metodologia e Análises

Resumo dos Dados

##       ano           mes               regiao              fmun          
##  Min.   :2014   Length:7636        Length:7636        Length:7636       
##  1st Qu.:2015   Class :character   Class :character   Class :character  
##  Median :2017   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :2017                                                           
##  3rd Qu.:2019                                                           
##  Max.   :2020                                                           
##                                                                         
##    hom_doloso       latrocinio    hom_por_interv_policial  hom_culposo    
##  Min.   : 0.000   Min.   :0.000   Min.   : 0.000          Min.   : 0.000  
##  1st Qu.: 1.220   1st Qu.:0.000   1st Qu.: 0.000          1st Qu.: 0.290  
##  Median : 2.325   Median :0.000   Median : 0.000          Median : 0.860  
##  Mean   : 2.710   Mean   :0.073   Mean   : 0.439          Mean   : 1.246  
##  3rd Qu.: 3.788   3rd Qu.:0.000   3rd Qu.: 0.610          3rd Qu.: 1.690  
##  Max.   :24.870   Max.   :3.490   Max.   :11.090          Max.   :15.760  
##  NA's   :4482     NA's   :4482    NA's   :4482            NA's   :4482

Em um planejamento ou na tomada de decisão é indispensável que exista um sistema de informação, alimentado com dados absolutos que posteriormente devem ser transformados em dados relativos. Esse dados são valores obtidos através da transformação de dados absolutos, geralmente através de razões (divisões). Quando há necessidade de se fazer comparações entre duas grandezas, pode-se obter tanto um índice quanto um coeficiente ou uma taxa, nesse caso o cálculo da taxa é feito por 100 mil habitantes.

A partir da base de dados escolhida, foram destacadas quatro variáveis com as informações das taxas de homicídio por intervenção policial; doloso (quando há intenção de matar); culposo (quando não há intenção de matar) e latrocínio (roubo seguido de morte) do Estado do Rio de Janeiro. Os registros estão subdivididos por mês de ocorrência, ano, de 2014 a 2020, região e município. A fim de reduzir a variável qualitativa a ser inserida na análise, optou-se por fazer um comparativo entre as regiões Baixada Fluminense, Capital, Grande Niterói e Interior, usualmente conhecidas. Complementando essas informações, também busca-se analisar a evolução de cada uma das taxas escolhida durante os anos de registro, a fim de identificar um aumento ou diminuição dos crimes ocorridos no Rio de Janeiro e, consequentemente levantar hipóteses sobre o que ocasionou e se tais conclusões se aplicam a toda a população.

As taxas mais altas, calculadas por 100 mil habitantes, são para homicídio doloso e latrocínio, em que a mediana indica que aproximadamente 3 a cada 100 mi habitantes foram vítimas. Pode-se observar, pelos valores máximos na descrição dos dados acima, que há taxas muito discrepantes em relação as demais, como por exemplo a já citadas, em que o máximo indica que aproximadamento 25 a cada 100 mil habitantes são vítimas de homicídio doloso e latrocínio.

É interessante ressaltar que há muitos dados faltantes, representando aproximadamente 59% dos dados. Isso dificulta possíveis interpretações e resultados relevantes.

## 
##  One Sample t-test
## 
## data:  base$hom_doloso
## t = 0.25783, df = 3153, p-value = 0.3983
## alternative hypothesis: true mean is greater than 2.7
## 95 percent confidence interval:
##  2.646407      Inf
## sample estimates:
## mean of x 
##  2.709959
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## NOTE: Either Arial Narrow or Roboto Condensed fonts are required to use these themes.
##       Please use hrbrthemes::import_roboto_condensed() to install Roboto Condensed and
##       if Arial Narrow is not on your system, please see https://bit.ly/arialnarrow

Gráficos comparativos entre Regiões

Homicídio Doloso

## Baixada Fluminense            Capital     Grande Niterói           Interior 
##           3.508007           1.579639           2.282249           2.330855

A média de homicídios dolosos na Baixada Fluminense é a maior quando comparada às outras regiões.Grande Niterói e Interior aparentemente possuem médias amostrais semelhantes, porém o Interior tem maior dispersão dos dados. A capital possui valores bem concetrados próximo a média e é a única região que não apresenta pontos discrepantes. Em contrapartida, a Baixada Fluminense é a região que apresenta maiores pontos discrepantes. Foi identificado na base de dados que o município de Queimados apresentou a maior taxa de homicídios dolosos no mês de Outubro de 2016 (24,87), o que o caracteriza como um outlier. Isso afeta diretamente a média amostral e a superestima.

Homicídio Culposo

## Baixada Fluminense            Capital     Grande Niterói           Interior 
##          0.9568767          0.7306024          1.2063454          1.4552151

Ao contrário das taxas de homicídio doloso, onde á intenção de matar, o interior do Estado possui a maior média de homicídios culposos e muitos pontos discrepantes que, conforme dito anteriormente, superestimam a média amostral. Capital se mantém com índices inferiores ao demais.

Latrocínio

## Baixada Fluminense            Capital     Grande Niterói           Interior 
##         0.10158480         0.07445783         0.11008032         0.05003442

Mantendo-se a mesma escala para a taxa de latrocínio, tem-se índices muito baixos, próximos a zero ou nulos. A região que apresenta a maior média de latrocínios é a Grande Niterói, apesar da difícil visualização dos dados. Porém, não se sabe se essa diferença é significativa.

Intervenção Policial

## Baixada Fluminense            Capital     Grande Niterói           Interior 
##          0.6932067          0.5865060          0.7665060          0.2275846

Novamente para as taxas de ocorrência de homicídio por intervenção policial, assim como as taxas de latrocínio no estado do Rio de Janeiro, possuem valores muito próximos de zero, o que dificulta a visualização. A Grande Niterói também apresenta a maior média quando se trata de homicídio decorrente de intervenção policial.

Testes de Hipóteses para Comparação de Médias

Teste t-Student

O teste t (de Student) foi desenvolvido por Willian Sealy Gosset em 1908 que usou o pseudônimo “Student” em função da confidencialidade requerida por seu empregador (cervejaria Guiness) que considerava o uso de estatística na manutenção da qualidade como uma vantagem competitiva. Esse teste tem diversas variações de aplicação, mas sempre há a limitação do mesmo ser usado na comparação de duas (e somente duas) médias e as variações dizem respeito às hipóteses que são testadas. Utiliza-se essa técnica quando a variância populacional é desconhecida. Porém, para grandes amostras, aproxima-se da distribuição Normal Padrão. Nesse trabalho, deseja-se testar a igualdade das médias tendo variâncias desconhecidas e distintas (\(\sigma_1\neq \sigma_2\)).

Para isto consideramos a variável T tal que \[T=\dfrac {(\bar{X}−\bar{Y})−(\mu_1−\mu_2)}{\sqrt{s^2_1 n_1 + s_2^{2} n_2}}∼t_v\]

Para facilitar a execução do teste, podemos seguir os passos:

  1. Estabelecer as hipóteses:

Fixamos \(H_0:\mu_1 =\mu_2\). Dependendo da informação que fornece o problema que estamos estudando, a hipótese alternativa pode ter uma das três formas abaixo:

\(H_1:\mu_1 \neq \mu_2\)(teste bilateral); \(H_1:\mu_1 > \mu_2\)(teste unilateral à direita); \(H_1:\mu_1 < \mu_2\)(teste unilateral à esquerda).

  1. Fixar o nível de significância \(\alpha\).

  2. Determinar a região crítica.

Se o teste é bilateral, determinamos os pontos críticos \(−t_{\alpha/2}\) e \(t_{\alpha/2}\) tais que \(P[T > t_{\alpha/2}]=P[T < −t_{\alpha/2}]= \alpha/2\) a partir da distribuição t de Student com \(n−1\) graus de liberdade.

Se o teste é unilateral, determinamos o ponto crítico \(t_\alpha\) tal que \(P[T > t_\alpha]= \alpha\).

Se o teste é unilateral à esquerda, determinamos o ponto \(-t_\alpha\) tal que \(P[T < -t_\alpha]= \alpha\).

  1. Calcular, sob a hipótese nula, o valor:

\[T_{obs} = \dfrac{(\bar{X}-\bar{Y})}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\]

  1. Conclusão:

Teste bilateral: Se \(T_{obs} < −t_{\alpha/2}\) ou \(T_{obs} > t_{\alpha/2}\), rejeitamos \(H_0\). Caso contrário, não rejeitamos H0. Teste unilateral à esquerda: Se \(T_{obs} < −t_{\alpha}\) rejeitamos \(H_0\). Caso contrário, não rejeitamos \(H_0\). Teste unilateral à direita: Se \(T_{obs} > t_{\alpha}\) rejeitamos \(H_0\). Caso contrário, não rejeitamos \(H_0\).

  1. Temos que o p-valor é dado por \[p-valor= P[|t| > |T_{obs}||H_0]=2~P[t > |T_{obs}||H_0]\]

se o teste é bilateral. Se o teste é unilateral à direita o p-valor é dado por \[p-valor= P[t > T_{obs}|H_0]\]

e se o teste é unilateral à esquerda, o p-valor é dado por \[p-valor= P[t < T_{obs}|H_0]\]

onde \(t\) tem distribuição t de Student com \(ν\) graus de liberdade.

  1. O intervalo de confiança, como visto na Seção 4.6.3 é dado por \[IC(\mu_1−\mu_2 , 1−\alpha)=\left(\bar{X}-\bar{Y}) - t_{(v,\alpha/2)} \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}} ; (\bar{X}-\bar{Y}) + t_{(v,\alpha/2)} \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right)\]

se o teste é bilateral. Caso o teste seja unilateral à esquerda, o intervalo de confiança é dado por \[IC(\mu_1−\mu_2 , 1−\alpha)=\left( \infty ; (\bar{X}-\bar{Y}) + t_{(v,\alpha/2)} \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right)\]

e, se o teste é unilateral à direita, então o intervalo de confiança é dado por \[IC(\mu_1−\mu_2 , 1−\alpha)=\left(\bar{X}-\bar{Y}) - t_{(v,\alpha)} \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}} ; \infty \right)\] ### Homicídio Doloso

## 
##  Welch Two Sample t-test
## 
## data:  baixada$hom_doloso and capital$hom_doloso
## t = 23.911, df = 1025, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  1.770117 2.086621
## sample estimates:
## mean of x mean of y 
##  3.508007  1.579639
## 
##  Welch Two Sample t-test
## 
## data:  interior$hom_doloso and niteroi$hom_doloso
## t = 0.53195, df = 465.62, p-value = 0.595
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.1309479  0.2281596
## sample estimates:
## mean of x mean of y 
##  2.330855  2.282249
## 
##  Welch Two Sample t-test
## 
## data:  interior$hom_doloso and baixada$hom_doloso
## t = -13.365, df = 1971.4, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.349893 -1.004412
## sample estimates:
## mean of x mean of y 
##  2.330855  3.508007

Conforme observado nas análise anteriores, apenas para o Interior e Niterói há evidências suficientes para não rejeitar a igualdade de taxas médias de homicídio doloso. As comparações entre as demais regiões rejeitam a hipótese de igualdade das médias. Essas colocações reafirmam o que foi colocado anteriormente. Logo, pode-se concluir que a região da Baixada é a de maior taxa de homicídio doloso no Ria de Janeiro, com aproximadamente 3 a cada 100 mil habitantes vítimas desse crime.

Homicídio Culposo

## 
##  Welch Two Sample t-test
## 
## data:  baixada$hom_culposo and capital$hom_culposo
## t = 5.3528, df = 1101.4, p-value = 1.053e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.1433316 0.3092171
## sample estimates:
## mean of x mean of y 
## 0.9568767 0.7306024
## 
##  Welch Two Sample t-test
## 
## data:  interior$hom_culposo and niteroi$hom_culposo
## t = 3.5703, df = 494.15, p-value = 0.0003915
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.1119122 0.3858273
## sample estimates:
## mean of x mean of y 
##  1.455215  1.206345
## 
##  Welch Two Sample t-test
## 
## data:  interior$hom_culposo and baixada$hom_culposo
## t = 9.074, df = 2622.7, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.3906486 0.6060282
## sample estimates:
## mean of x mean of y 
## 1.4552151 0.9568767

Para as taxas de homicídio Culposo, rejeita-se a hipótese de igualdade das médias entre todas as cidades testadas acima, ou seja, há evidências significaivas que refletem os gráficos boxplot anteriores. A região do Interior possui maior taxa de homicídio culposo.

Latrocínio

## 
##  Welch Two Sample t-test
## 
## data:  baixada$latrocinio and capital$latrocinio
## t = 2.69, df = 598.17, p-value = 0.007345
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.007321903 0.046932036
## sample estimates:
##  mean of x  mean of y 
## 0.10158480 0.07445783
## 
##  Welch Two Sample t-test
## 
## data:  interior$latrocinio and niteroi$latrocinio
## t = -4.6782, df = 350.33, p-value = 4.14e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.08528976 -0.03480203
## sample estimates:
##  mean of x  mean of y 
## 0.05003442 0.11008032
## 
##  Welch Two Sample t-test
## 
## data:  interior$latrocinio and baixada$latrocinio
## t = -5.2685, df = 1889.6, p-value = 1.533e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.07074022 -0.03236053
## sample estimates:
##  mean of x  mean of y 
## 0.05003442 0.10158480

Homicídio por Intervenção Policial

## 
##  Welch Two Sample t-test
## 
## data:  baixada$hom_por_interv_policial and capital$hom_por_interv_policial
## t = 2.304, df = 459.66, p-value = 0.02167
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.01569479 0.19770650
## sample estimates:
## mean of x mean of y 
## 0.6932067 0.5865060
## 
##  Welch Two Sample t-test
## 
## data:  interior$hom_por_interv_policial and niteroi$hom_por_interv_policial
## t = -10.702, df = 290.85, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.6380355 -0.4398073
## sample estimates:
## mean of x mean of y 
## 0.2275846 0.7665060
## 
##  Welch Two Sample t-test
## 
## data:  interior$hom_por_interv_policial and baixada$hom_por_interv_policial
## t = -11.983, df = 1403.2, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.5418483 -0.3893958
## sample estimates:
## mean of x mean of y 
## 0.2275846 0.6932067

O mesmo se aplica tanto às taxas de Latrocínio, quanto às taxas de homicídio por intervenção policial, em que não há evidências significativas para não rejeitar a hipótese de igualdade de médias. Concluindo, com exceção das taxas de homicídio doloso das regiões de Niterói e Interior, os demias testes mostram que há diferentes comportamentos e padrões de vida nas regiões estudadas, que pode ser causado pela diferença de renda per capita, poilicamento, iluminação, população entre outros fatoras, que podem contribuir para o aumento ou diminuição dos crimes citados.

Evolução das Taxas desde 2014

Conclusão

Vale destacar um aspecto importante dessas análises: no ano de 2020 várias prefeituras no Estado do Rio de Janeiro decretaram lockdown (total ou parcial) dos municípios do Rio de Janeiro. Isso pode ser uma das explicações para os números desse ano estarem muito abaixo do “normal”. De acordo com uma análise do trabalho, podemos concluir que não há como encontrar respostas sobre a criminalidade do Rio de Janeiro sob uma única perspectiva. É necessário que haja o incentivo da Segurança Pública cada vez maior por parte das autoridades, com políticas públicas integradas e que valorizem o profissional da área de segurança. Porém, os gestores não devem deixar de lado o fato de todo esse processo ser ofertado para a população, e medidas que possam prejudicar a sociedade devem ser repensadas e ajustadas de uma maneira melhor. Para finalizar, é possível sugerir que para aprimorar, de maneira eficaz, a qualidade dos serviços prestados à população através da Segurança Pública, são necessárias ações coordenadas de planejamento, criação de metas e acompanhamento e monitoramento dos resultados.