Este conjunto de dados tem como objetivo fornecer informações sobre tendências de crime, homicídio, população, padrões e taxas para análise e modelação preditiva. O conjunto de dados é particularmente valioso para as agências de aplicação da lei, como o FBI, podem beneficiar das informações obtidas através deste conjunto de dados para melhorar a prevenção do crime e as estratégias de afetação de recursos, então nosso objetivo é extrair informações úteis através da análise, saber quais os crimes mais comuns, qual a década mais perigosa e etc.
Link da Base de dados –> link
library(readr)
base = read_csv("C:/Users/Windows/Desktop/US_Crime_Rates_1960_2014.csv")
| Ano | Populacao | Total | Violento | Propriedade | Homicidio | Estupro | Roubo_Residencia | Assalto_Agravante | Furto_Residencia | Furto_Roubo_Geral | Roubo_Veiculo |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 1960 | 179323175 | 3384200 | 288460 | 3095700 | 9110 | 17190 | 107840 | 154320 | 912100 | 1855400 | 328200 |
| 1961 | 182992000 | 3488000 | 289390 | 3198600 | 8740 | 17220 | 106670 | 156760 | 949600 | 1913000 | 336000 |
| 1962 | 185771000 | 3752200 | 301510 | 3450700 | 8530 | 17550 | 110860 | 164570 | 994300 | 2089600 | 366800 |
…
| Ano | Populacao | Total | Violento | Propriedade | Homicidio | Estupro | Roubo_Residencia | Assalto_Agravante | Furto_Residencia | Furto_Roubo_Geral | Roubo_Veiculo |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 2012 | 313873685 | 10219059 | 1217067 | 9001992 | 14866 | 85141 | 355051 | 762009 | 2109932 | 6168874 | 723186 |
| 2013 | 316497531 | 9850445 | 1199684 | 8650761 | 14319 | 82109 | 345095 | 726575 | 1931835 | 6018632 | 700294 |
| 2014 | 318857056 | 9475816 | 1197987 | 8277829 | 14249 | 84041 | 325802 | 741291 | 1729806 | 5858496 | 689527 |
## Ano Populacao Total Violento Propriedade Homicidio
## Min. :1960 Min. :179323175 Min. : 3384200 Min. : 288460 Min. : 3095700 Min. : 8530
## 1st Qu.:1974 1st Qu.:210621500 1st Qu.: 9096958 1st Qu.: 925315 1st Qu.: 8060014 1st Qu.:14819
## Median :1987 Median :242282918 Median :11401511 Median :1322390 Median :10182586 Median :17030
## Mean :1987 Mean :246155586 Mean :10603146 Mean :1188806 Mean : 9412499 Mean :17317
## 3rd Qu.:2000 3rd Qu.:283369732 3rd Qu.:13084486 3rd Qu.:1432762 3rd Qu.:11605088 3rd Qu.:20562
## Max. :2014 Max. :318857056 Max. :14872900 Max. :1932270 Max. :12961100 Max. :24700
## Estupro Roubo_Residencia Assalto_Agravante Furto_Residencia Furto_Roubo_Geral Roubo_Veiculo
## Min. : 17190 Min. :106670 Min. : 154320 Min. : 912100 Min. :1855400 Min. : 328200
## 1st Qu.: 53400 1st Qu.:354912 1st Qu.: 438430 1st Qu.:2105336 1st Qu.:4843350 1st Qu.: 789626
## Median : 84230 Median :423557 Median : 741291 Median :2329950 Median :6591900 Median :1032200
## Mean : 72715 Mean :416450 Mean : 681182 Mean :2424017 Mean :5959947 Mean :1028614
## 3rd Qu.: 92930 3rd Qu.:512137 3rd Qu.: 900215 3rd Qu.:3073600 3rd Qu.:7168450 3rd Qu.:1239303
## Max. :109060 Max. :687730 Max. :1135610 Max. :3795200 Max. :8142200 Max. :1661700
Agora vamos criar um gráfico de comparação entre a população e o total de crimes usando a função ggplot
Um gráfico do Total de crimes pelo passar dos anos, usando novamente a função ggplot
Um gráfico de pizza geral de todos os crimes, usando a função ggplot com coord_polar, para uma análise mais específica de quais crimes são mais cometidos
Novamente uma análise usando gráfico de pizza, mas agora sobre a quantidade de crimes Violentos e de Propriedade
Agrupando por décadas usando a função group_by conseguimos ter uma análise de um período de 10 anos
| Decada | Soma_Total |
|---|---|
| 1960 | 49295900 |
| 1970 | 100991600 |
| 1980 | 131123369 |
| 1990 | 136582146 |
| 2000 | 115012044 |
| 2010 | 50167967 |
Agora para uma previsão gráfica de crimes dos próximos 3 anos (2015, 2016 e 2017), precisamos usar do time series e forecast
## Series: serie_temporal
## ARIMA(2,2,1)
##
## Coefficients:
## ar1 ar2 ma1
## 0.6643 -0.5954 -0.7556
## s.e. 0.1238 0.1089 0.1254
##
## sigma^2 = 1.134e+11: log likelihood = -748.97
## AIC=1505.94 AICc=1506.77 BIC=1513.82
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set -31439.61 321037.4 226692.7 -0.03604527 2.24756 0.5584393 -0.01556006
Através da análise de gráficos, conseguimos o que queríamos, além de sabermos os principais crimes no período de 1960-2014 nos Estados Unidos e sabermos algumas informações sobre cada década, também conseguimos estimar uma previsão para oos próximos 3 anos (2015, 2016 e 2017).