Taxa de Crimes nos Estados Unidos entre 1960-2014

Este conjunto de dados tem como objetivo fornecer informações sobre tendências de crime, homicídio, população, padrões e taxas para análise e modelação preditiva. O conjunto de dados é particularmente valioso para as agências de aplicação da lei, como o FBI, podem beneficiar das informações obtidas através deste conjunto de dados para melhorar a prevenção do crime e as estratégias de afetação de recursos, então nosso objetivo é extrair informações úteis através da análise, saber quais os crimes mais comuns, qual a década mais perigosa e etc.

Link da Base de dados –> link

Começando as análises…

Importando a base de dados
library(readr)
base = read_csv("C:/Users/Windows/Desktop/US_Crime_Rates_1960_2014.csv")
Ano Populacao Total Violento Propriedade Homicidio Estupro Roubo_Residencia Assalto_Agravante Furto_Residencia Furto_Roubo_Geral Roubo_Veiculo
1960 179323175 3384200 288460 3095700 9110 17190 107840 154320 912100 1855400 328200
1961 182992000 3488000 289390 3198600 8740 17220 106670 156760 949600 1913000 336000
1962 185771000 3752200 301510 3450700 8530 17550 110860 164570 994300 2089600 366800

Ano Populacao Total Violento Propriedade Homicidio Estupro Roubo_Residencia Assalto_Agravante Furto_Residencia Furto_Roubo_Geral Roubo_Veiculo
2012 313873685 10219059 1217067 9001992 14866 85141 355051 762009 2109932 6168874 723186
2013 316497531 9850445 1199684 8650761 14319 82109 345095 726575 1931835 6018632 700294
2014 318857056 9475816 1197987 8277829 14249 84041 325802 741291 1729806 5858496 689527

Sumário básico dos Dados
##       Ano         Populacao             Total             Violento        Propriedade         Homicidio    
##  Min.   :1960   Min.   :179323175   Min.   : 3384200   Min.   : 288460   Min.   : 3095700   Min.   : 8530  
##  1st Qu.:1974   1st Qu.:210621500   1st Qu.: 9096958   1st Qu.: 925315   1st Qu.: 8060014   1st Qu.:14819  
##  Median :1987   Median :242282918   Median :11401511   Median :1322390   Median :10182586   Median :17030  
##  Mean   :1987   Mean   :246155586   Mean   :10603146   Mean   :1188806   Mean   : 9412499   Mean   :17317  
##  3rd Qu.:2000   3rd Qu.:283369732   3rd Qu.:13084486   3rd Qu.:1432762   3rd Qu.:11605088   3rd Qu.:20562  
##  Max.   :2014   Max.   :318857056   Max.   :14872900   Max.   :1932270   Max.   :12961100   Max.   :24700
##     Estupro       Roubo_Residencia Assalto_Agravante Furto_Residencia  Furto_Roubo_Geral Roubo_Veiculo    
##  Min.   : 17190   Min.   :106670   Min.   : 154320   Min.   : 912100   Min.   :1855400   Min.   : 328200  
##  1st Qu.: 53400   1st Qu.:354912   1st Qu.: 438430   1st Qu.:2105336   1st Qu.:4843350   1st Qu.: 789626  
##  Median : 84230   Median :423557   Median : 741291   Median :2329950   Median :6591900   Median :1032200  
##  Mean   : 72715   Mean   :416450   Mean   : 681182   Mean   :2424017   Mean   :5959947   Mean   :1028614  
##  3rd Qu.: 92930   3rd Qu.:512137   3rd Qu.: 900215   3rd Qu.:3073600   3rd Qu.:7168450   3rd Qu.:1239303  
##  Max.   :109060   Max.   :687730   Max.   :1135610   Max.   :3795200   Max.   :8142200   Max.   :1661700

Os crimes cresceram juntamente com o aumento da população?

Agora vamos criar um gráfico de comparação entre a população e o total de crimes usando a função ggplot


Total de Crime conforme os Anos

Um gráfico do Total de crimes pelo passar dos anos, usando novamente a função ggplot


Porcentagem dos Crimes por todo o período

Um gráfico de pizza geral de todos os crimes, usando a função ggplot com coord_polar, para uma análise mais específica de quais crimes são mais cometidos


Há mais crimes Violentos ou de Propriedade?

Novamente uma análise usando gráfico de pizza, mas agora sobre a quantidade de crimes Violentos e de Propriedade


Agrupando por Décadas

Agrupando por décadas usando a função group_by conseguimos ter uma análise de um período de 10 anos

Decada Soma_Total
1960 49295900
1970 100991600
1980 131123369
1990 136582146
2000 115012044
2010 50167967

Previsão de anos seguintes

Agora para uma previsão gráfica de crimes dos próximos 3 anos (2015, 2016 e 2017), precisamos usar do time series e forecast

## Series: serie_temporal 
## ARIMA(2,2,1) 
## 
## Coefficients:
##          ar1      ar2      ma1
##       0.6643  -0.5954  -0.7556
## s.e.  0.1238   0.1089   0.1254
## 
## sigma^2 = 1.134e+11:  log likelihood = -748.97
## AIC=1505.94   AICc=1506.77   BIC=1513.82
## 
## Training set error measures:
##                     ME     RMSE      MAE         MPE    MAPE      MASE        ACF1
## Training set -31439.61 321037.4 226692.7 -0.03604527 2.24756 0.5584393 -0.01556006

Conclusão

Através da análise de gráficos, conseguimos o que queríamos, além de sabermos os principais crimes no período de 1960-2014 nos Estados Unidos e sabermos algumas informações sobre cada década, também conseguimos estimar uma previsão para oos próximos 3 anos (2015, 2016 e 2017).