Case Study : Jenis Kejahatan berat di US
Studi kasus jenis kejahatan berat di US diawali dengan menggunakan dataset yang tersedia yaitu USArrests yang sudah dikoreksi berdasasarkan catatan pada USArrests. Dataset dipanggil dengan perintah sebagai berikut
USArrests_tbl<-rownames_to_column(USArrests_tbl, var = "State")
USArrests_tbl<-tibble::as_tibble(USArrests_tbl)deskripsi data USArrests dapat diketahui melalui perintah ??USArrests. Data USArrests merupakan dataset yang memuat penangkapan penduduk dikarenakan kasus pembunuhan (Murder), penyerangan (Assault), pemerkosaan (Rape) per 100.000 penduduk dan persentase penduduk yang tinggal di daerah perkotaan (UrbanPop) masing-masing 50 negara bagian AS pada tahun 1973.
Eksplorasi Data
ukuran data USArrests diperoleh dari fungsi dim sehingga diketahui jumlah baris dan kolomnya.
dim(USArrests_tbl)## [1] 50 5
data USArrests terdiri atas 50 baris dan 5 kolom atau peubah yang berupa nama negara-negara bagian (State), jenis kejahatan berat di AS yaitu Murder, Assault, Rape, dan Persentase penduduk yang tinggal di daerah perkotaan. Pratinjau data USArrests dapat ditunjukkan dengan mengggunakan fungsi glimpse.
glimpse(USArrests_tbl)## Rows: 50
## Columns: 5
## $ State <chr> "Alabama", "Alaska", "Arizona", "Arkansas", "California", "Co~
## $ Murder <dbl> 13.2, 10.0, 8.1, 8.8, 9.0, 7.9, 3.3, 5.9, 15.4, 17.4, 5.3, 2.~
## $ Assault <int> 236, 263, 294, 190, 276, 204, 110, 238, 335, 211, 46, 120, 24~
## $ UrbanPop <dbl> 58.0, 48.0, 80.0, 50.0, 91.0, 78.5, 77.0, 72.0, 80.5, 60.0, 8~
## $ Rape <dbl> 21.2, 44.5, 31.0, 19.5, 40.6, 38.7, 11.1, 15.8, 31.9, 25.8, 2~
untuk menampilkan urutan teratas dataset dapat digunakan fungsi head.
head(USArrests_tbl)## # A tibble: 6 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 Alabama 13.2 236 58 21.2
## 2 Alaska 10 263 48 44.5
## 3 Arizona 8.1 294 80 31
## 4 Arkansas 8.8 190 50 19.5
## 5 California 9 276 91 40.6
## 6 Colorado 7.9 204 78.5 38.7
Mutation
pada data USArrests dapat ditambahkan peubah baru yaitu peubah Cases yang merupakan jumlah keseluruhan kejahatan berat yang terjadi di negara bagian AS pada tahun 1973. Penambahan peubah baru dapat dilakukan dengan menggunakan fungsi mutate().
USArrests_tbl %>% mutate(Cases=Murder+Assault+Rape)## # A tibble: 50 x 6
## State Murder Assault UrbanPop Rape Cases
## <chr> <dbl> <int> <dbl> <dbl> <dbl>
## 1 Alabama 13.2 236 58 21.2 270.
## 2 Alaska 10 263 48 44.5 318.
## 3 Arizona 8.1 294 80 31 333.
## 4 Arkansas 8.8 190 50 19.5 218.
## 5 California 9 276 91 40.6 326.
## 6 Colorado 7.9 204 78.5 38.7 251.
## 7 Connecticut 3.3 110 77 11.1 124.
## 8 Delaware 5.9 238 72 15.8 260.
## 9 Florida 15.4 335 80.5 31.9 382.
## 10 Georgia 17.4 211 60 25.8 254.
## # ... with 40 more rows
Summarization
Berdasarkan data USArrests dapat diketahui nilai rata-rata dan variansi dari masing-msaing peubah dengan fungsi summarize()
- Summary untuk peubah Murder
USArrests_tbl %>% summarize(Mean=mean(Murder), Var=var(Murder), .groups='drop')## # A tibble: 1 x 2
## Mean Var
## <dbl> <dbl>
## 1 7.79 19.0
nilai rata-rata kasus Pembunuhan (Murder) di 50 negara bagian AS pada tahun 1973 adalah 7.79 dengan nilai sebarannya sebesar 19.
- Summary untuk peubah Assault
USArrests_tbl %>% summarize(Mean=mean(Assault), Var=var(Assault), .groups='drop')## # A tibble: 1 x 2
## Mean Var
## <dbl> <dbl>
## 1 171. 6945.
nilai rata-rata kasus Pembunuhan (Assault) di 50 negara bagian AS pada tahun 1973 adalah 171 dengan nilai sebarannya sebesar 6945.
- Summary untuk peubah Rape
USArrests %>% summarize(Mean=mean(Rape), Var=var(Rape), .groups='drop')## Mean Var
## 1 21.232 87.72916
nilai rata-rata kasus Pembunuhan (Rape) di 50 negara bagian AS pada tahun 1973 adalah 21.232 dengan nilai sebarannya sebesar 87.72916.
- Summary untuk peubah UrbanPop
USArrests_tbl %>% summarize(Mean=mean(UrbanPop), Var=var(UrbanPop), .groups='drop')## # A tibble: 1 x 2
## Mean Var
## <dbl> <dbl>
## 1 65.8 212.
nilai rata-rata penduduk yang tinggal di daerah perkotaan di 50 negara bagian AS pada tahun 1973 adalah 65.8 dengan nilai sebarannya sebesar 212.
Arrangement
Data USArrestsdapat diurutkan berdasarkan kasus Murder, Assault, dan Rape menggunakan fungsi arrange.
- Arrangement berdasarkan kasus Murder
USArrests_tbl %>% arrange(Murder)## # A tibble: 50 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 North Dakota 0.8 45 44 7.3
## 2 Maine 2.1 83 51 7.8
## 3 New Hampshire 2.1 57 56 9.5
## 4 Iowa 2.2 56 57 11.3
## 5 Vermont 2.2 48 32 11.2
## 6 Idaho 2.6 120 54 14.2
## 7 Wisconsin 2.6 53 66 10.8
## 8 Minnesota 2.7 72 66 14.9
## 9 Utah 3.2 120 80 22.9
## 10 Connecticut 3.3 110 77 11.1
## # ... with 40 more rows
kasus pembunuhan (Murder) paling sedikit terjadi pada negara bagian North Dakota dengan persentase populasi penduduk yang tinggal di daerah perkotaan sebesar 44%.
- Arrangement berdasarkan kasus Assault
USArrests_tbl %>% arrange(Assault)## # A tibble: 50 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 North Dakota 0.8 45 44 7.3
## 2 Hawaii 5.3 46 83 20.2
## 3 Vermont 2.2 48 32 11.2
## 4 Wisconsin 2.6 53 66 10.8
## 5 Iowa 2.2 56 57 11.3
## 6 New Hampshire 2.1 57 56 9.5
## 7 Minnesota 2.7 72 66 14.9
## 8 West Virginia 5.7 81 39 9.3
## 9 Maine 2.1 83 51 7.8
## 10 South Dakota 3.8 86 45 12.8
## # ... with 40 more rows
kasus penyerangan (Assault) paling sedikit terjadi pada negara bagian North Dakota dengan persentase populasi penduduk yang tinggal di daerah perkotaan sebesar 44%.
- Arrangement berdasarkan kasus Rape
USArrests_tbl %>% arrange(Rape)## # A tibble: 50 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 North Dakota 0.8 45 44 7.3
## 2 Maine 2.1 83 51 7.8
## 3 Rhode Island 3.4 174 87 8.3
## 4 West Virginia 5.7 81 39 9.3
## 5 New Hampshire 2.1 57 56 9.5
## 6 Wisconsin 2.6 53 66 10.8
## 7 Connecticut 3.3 110 77 11.1
## 8 Vermont 2.2 48 32 11.2
## 9 Iowa 2.2 56 57 11.3
## 10 South Dakota 3.8 86 45 12.8
## # ... with 40 more rows
kasus pemerkosaan (Rape) paling sedikit juga terjadi pada negara bagian North Dakota dengan persentase populasi penduduk yang tinggal di daerah perkotaan sebesar 44%. Sehingga dapat diketahui bahwa pada tahun 1973 negara bagian North Dakota merupakan negara dengan kasus kejahatan berat paling sedikit diantara negara bagian lainnya.
Filtering
Berdasarkan data USArrests dapat dipilih sebagian data dengan nilai tertentu menggunakan fungsi filter(). Oleh karena itu akan diketahui negara-negara bagian yang memiliki kasus-kasus kejahatan terberat berdasarkan nilai tertentu banyak kejadian.
- Negara-negara bagian dengan kasus Murder > 10
USArrests_tbl %>% filter(Murder > 10)## # A tibble: 15 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 Alabama 13.2 236 58 21.2
## 2 Florida 15.4 335 80.5 31.9
## 3 Georgia 17.4 211 60 25.8
## 4 Illinois 10.4 249 83 24
## 5 Louisiana 15.4 249 66 22.2
## 6 Maryland 11.3 300 76.6 27.8
## 7 Michigan 12.1 255 74 35.1
## 8 Mississippi 16.1 259 44.5 17.1
## 9 Nevada 12.2 252 81 46
## 10 New Mexico 11.4 285 70 32.1
## 11 New York 11.1 254 86 26.1
## 12 North Carolina 13 337 45 16.1
## 13 South Carolina 14.4 279 48 22.5
## 14 Tennessee 13.2 188 59 26.9
## 15 Texas 12.7 201 80 25.5
diketahui pada tahun 1973 bahwa terdapat 15 negara bagian yang memiliki kasus kejahatan pembunuhan (Murder) dengan banyak kejadian lebih >10 dengan nilai yang bervariasi pada interval 11-17.
- Negara-negara bagian dengan kasus Assault > 250
USArrests_tbl %>% filter(Assault > 250) ## # A tibble: 12 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 Alaska 10 263 48 44.5
## 2 Arizona 8.1 294 80 31
## 3 California 9 276 91 40.6
## 4 Florida 15.4 335 80.5 31.9
## 5 Maryland 11.3 300 76.6 27.8
## 6 Michigan 12.1 255 74 35.1
## 7 Mississippi 16.1 259 44.5 17.1
## 8 Nevada 12.2 252 81 46
## 9 New Mexico 11.4 285 70 32.1
## 10 New York 11.1 254 86 26.1
## 11 North Carolina 13 337 45 16.1
## 12 South Carolina 14.4 279 48 22.5
pada tahun 1973 kasus penyerangan (Assault) terdapat 12 negara bagian yang memiliki kejadian >250, yaitu berkisar pada 252-337 kejadian.
- Negara-negara bagian dengan kasus Rape > 30
USArrests_tbl %>% filter(Rape > 30) ## # A tibble: 8 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 Alaska 10 263 48 44.5
## 2 Arizona 8.1 294 80 31
## 3 California 9 276 91 40.6
## 4 Colorado 7.9 204 78.5 38.7
## 5 Florida 15.4 335 80.5 31.9
## 6 Michigan 12.1 255 74 35.1
## 7 Nevada 12.2 252 81 46
## 8 New Mexico 11.4 285 70 32.1
8 negara bagian memiliki kasus pemerkosaan (Rape) > 30 pada tahun 1973. Banyak kejadian pada 8 negara tersebut berkisar sebanyak 32-46 kejadian.
- Negara-negara bagian dengan persentase penduduk yang tinggal di daerah perkotaan (UrbanPop) > 80%
USArrests_tbl %>% filter(UrbanPop > 80) ## # A tibble: 9 x 5
## State Murder Assault UrbanPop Rape
## <chr> <dbl> <int> <dbl> <dbl>
## 1 California 9 276 91 40.6
## 2 Florida 15.4 335 80.5 31.9
## 3 Hawaii 5.3 46 83 20.2
## 4 Illinois 10.4 249 83 24
## 5 Massachusetts 4.4 149 85 16.3
## 6 Nevada 12.2 252 81 46
## 7 New Jersey 7.4 159 89 18.8
## 8 New York 11.1 254 86 26.1
## 9 Rhode Island 3.4 174 87 8.3
Persentase penduduk yang tinggal di daerah perkotaan yang mencapai 80% terdapat pada setidaknya 9 negara bagian. Persentase penduduk pada 9 negara bagian tersebut berkisar 81%-91%.
Selecting
Berdasarkan informasi terkait banyaknya kasus kejahatan berat yang telah diperoleh menggunakan fungsi-fungsi sebelumnya kemudian dapat diamati peubah-peubah tertentu pada data USArrests menggunakan fungsi Select(). Penggunaan fungsi tersebut pada data ini adalah sebagai berikut.
- Banyaknya kasus pembunuhan (Murder) di Negara-negara bagian dengan persentase penduduk yang tinggal di daerah perkotaan
murder <- USArrests_tbl%>% select(State,Murder,UrbanPop)
murder %>% arrange(desc(Murder))## # A tibble: 50 x 3
## State Murder UrbanPop
## <chr> <dbl> <dbl>
## 1 Georgia 17.4 60
## 2 Mississippi 16.1 44.5
## 3 Florida 15.4 80.5
## 4 Louisiana 15.4 66
## 5 South Carolina 14.4 48
## 6 Alabama 13.2 58
## 7 Tennessee 13.2 59
## 8 North Carolina 13 45
## 9 Texas 12.7 80
## 10 Nevada 12.2 81
## # ... with 40 more rows
output menunjukkan bahwa negara bagian Georgia memiliki kasus pembunuhan (Murder) yang cukup tinggi dengan persentase penduduk yang tinggal di daerah perkotaannya mencapai 60%.
- Banyaknya kasus penyerangan (Assault) di Negara-negara bagian dengan persentase penduduk yang tinggal di daerah perkotaan
assault <- USArrests_tbl%>% select(State,Assault,UrbanPop)
assault %>% arrange(desc(Assault))## # A tibble: 50 x 3
## State Assault UrbanPop
## <chr> <int> <dbl>
## 1 North Carolina 337 45
## 2 Florida 335 80.5
## 3 Maryland 300 76.6
## 4 Arizona 294 80
## 5 New Mexico 285 70
## 6 South Carolina 279 48
## 7 California 276 91
## 8 Alaska 263 48
## 9 Mississippi 259 44.5
## 10 Michigan 255 74
## # ... with 40 more rows
berdasarkan banyaknya kasus penyerangan (Assault) negara North Carolina merupakan negara bagian yang memiliki kasus penyerangan (Assault) terbanyak dengan persentase penduduk yang tinggal di daerah perkotaannya kurang dari 50%.
- Banyaknya kasus pemerkosaan (Rape) di Negara-negara bagian dengan persentase penduduk yang tinggal di daerah perkotaan
rape <- USArrests_tbl%>% select(State,Rape,UrbanPop)
rape %>% arrange(desc(rape))## # A tibble: 50 x 3
## State Rape UrbanPop
## <chr> <dbl> <dbl>
## 1 Wyoming 15.6 60.5
## 2 Wisconsin 10.8 66
## 3 West Virginia 9.3 39
## 4 Washington 26.2 73
## 5 Virginia 20.7 63
## 6 Vermont 11.2 32
## 7 Utah 22.9 80
## 8 Texas 25.5 80
## 9 Tennessee 26.9 59
## 10 South Dakota 12.8 45
## # ... with 40 more rows
negara bagian Wyoming merupakan negara bagian dengan kasus pemerkosaan (Rape) yang cukup banyak yaitu >10 dengan dengan persentase penduduk yang tinggal di daerah perkotaannya sudah mencapai 60.5%.
Fungsi mutate dan summarize
fungsi-fungsi yang sudah diterapkan secara terpisah pada data USArrests akan diterapkan kembali secara bersamaan.
crime<- USArrests_tbl %>% mutate(Cases=Murder+Assault+Rape) %>%
summarize(murder=sum(Murder), assault=sum(Assault), rape=sum(Rape), cases=sum(Cases))
crime## # A tibble: 1 x 4
## murder assault rape cases
## <dbl> <int> <dbl> <dbl>
## 1 389. 8538 1062. 9989
sehingga diperoleh informasi bahwa pada tahun 1973, kasus kejahatan berat yang terjadi di 50 negara bagian AS sebanyak 9989 kasus yang terdiri atas kasus pembunuhan (Murder), Penyerangan (Assault) dan pemerkosaan (Rape).