Case Study : Jenis Kejahatan berat di US

Studi kasus jenis kejahatan berat di US diawali dengan menggunakan dataset yang tersedia yaitu USArrests yang sudah dikoreksi berdasasarkan catatan pada USArrests. Dataset dipanggil dengan perintah sebagai berikut

USArrests_tbl<-rownames_to_column(USArrests_tbl, var = "State")
USArrests_tbl<-tibble::as_tibble(USArrests_tbl)

deskripsi data USArrests dapat diketahui melalui perintah ??USArrests. Data USArrests merupakan dataset yang memuat penangkapan penduduk dikarenakan kasus pembunuhan (Murder), penyerangan (Assault), pemerkosaan (Rape) per 100.000 penduduk dan persentase penduduk yang tinggal di daerah perkotaan (UrbanPop) masing-masing 50 negara bagian AS pada tahun 1973.

Eksplorasi Data

ukuran data USArrests diperoleh dari fungsi dim sehingga diketahui jumlah baris dan kolomnya.

dim(USArrests_tbl)
## [1] 50  5

data USArrests terdiri atas 50 baris dan 5 kolom atau peubah yang berupa nama negara-negara bagian (State), jenis kejahatan berat di AS yaitu Murder, Assault, Rape, dan Persentase penduduk yang tinggal di daerah perkotaan. Pratinjau data USArrests dapat ditunjukkan dengan mengggunakan fungsi glimpse.

glimpse(USArrests_tbl)
## Rows: 50
## Columns: 5
## $ State    <chr> "Alabama", "Alaska", "Arizona", "Arkansas", "California", "Co~
## $ Murder   <dbl> 13.2, 10.0, 8.1, 8.8, 9.0, 7.9, 3.3, 5.9, 15.4, 17.4, 5.3, 2.~
## $ Assault  <int> 236, 263, 294, 190, 276, 204, 110, 238, 335, 211, 46, 120, 24~
## $ UrbanPop <dbl> 58.0, 48.0, 80.0, 50.0, 91.0, 78.5, 77.0, 72.0, 80.5, 60.0, 8~
## $ Rape     <dbl> 21.2, 44.5, 31.0, 19.5, 40.6, 38.7, 11.1, 15.8, 31.9, 25.8, 2~

untuk menampilkan urutan teratas dataset dapat digunakan fungsi head.

head(USArrests_tbl)
## # A tibble: 6 x 5
##   State      Murder Assault UrbanPop  Rape
##   <chr>       <dbl>   <int>    <dbl> <dbl>
## 1 Alabama      13.2     236     58    21.2
## 2 Alaska       10       263     48    44.5
## 3 Arizona       8.1     294     80    31  
## 4 Arkansas      8.8     190     50    19.5
## 5 California    9       276     91    40.6
## 6 Colorado      7.9     204     78.5  38.7

Mutation

pada data USArrests dapat ditambahkan peubah baru yaitu peubah Cases yang merupakan jumlah keseluruhan kejahatan berat yang terjadi di negara bagian AS pada tahun 1973. Penambahan peubah baru dapat dilakukan dengan menggunakan fungsi mutate().

USArrests_tbl %>% mutate(Cases=Murder+Assault+Rape)
## # A tibble: 50 x 6
##    State       Murder Assault UrbanPop  Rape Cases
##    <chr>        <dbl>   <int>    <dbl> <dbl> <dbl>
##  1 Alabama       13.2     236     58    21.2  270.
##  2 Alaska        10       263     48    44.5  318.
##  3 Arizona        8.1     294     80    31    333.
##  4 Arkansas       8.8     190     50    19.5  218.
##  5 California     9       276     91    40.6  326.
##  6 Colorado       7.9     204     78.5  38.7  251.
##  7 Connecticut    3.3     110     77    11.1  124.
##  8 Delaware       5.9     238     72    15.8  260.
##  9 Florida       15.4     335     80.5  31.9  382.
## 10 Georgia       17.4     211     60    25.8  254.
## # ... with 40 more rows

Summarization

Berdasarkan data USArrests dapat diketahui nilai rata-rata dan variansi dari masing-msaing peubah dengan fungsi summarize()

USArrests_tbl %>% summarize(Mean=mean(Murder), Var=var(Murder),  .groups='drop')
## # A tibble: 1 x 2
##    Mean   Var
##   <dbl> <dbl>
## 1  7.79  19.0

nilai rata-rata kasus Pembunuhan (Murder) di 50 negara bagian AS pada tahun 1973 adalah 7.79 dengan nilai sebarannya sebesar 19.

USArrests_tbl %>% summarize(Mean=mean(Assault), Var=var(Assault), .groups='drop')
## # A tibble: 1 x 2
##    Mean   Var
##   <dbl> <dbl>
## 1  171. 6945.

nilai rata-rata kasus Pembunuhan (Assault) di 50 negara bagian AS pada tahun 1973 adalah 171 dengan nilai sebarannya sebesar 6945.

USArrests %>% summarize(Mean=mean(Rape), Var=var(Rape), .groups='drop')
##     Mean      Var
## 1 21.232 87.72916

nilai rata-rata kasus Pembunuhan (Rape) di 50 negara bagian AS pada tahun 1973 adalah 21.232 dengan nilai sebarannya sebesar 87.72916.

USArrests_tbl %>% summarize(Mean=mean(UrbanPop), Var=var(UrbanPop), .groups='drop')
## # A tibble: 1 x 2
##    Mean   Var
##   <dbl> <dbl>
## 1  65.8  212.

nilai rata-rata penduduk yang tinggal di daerah perkotaan di 50 negara bagian AS pada tahun 1973 adalah 65.8 dengan nilai sebarannya sebesar 212.

Arrangement

Data USArrestsdapat diurutkan berdasarkan kasus Murder, Assault, dan Rape menggunakan fungsi arrange.

USArrests_tbl %>% arrange(Murder)
## # A tibble: 50 x 5
##    State         Murder Assault UrbanPop  Rape
##    <chr>          <dbl>   <int>    <dbl> <dbl>
##  1 North Dakota     0.8      45       44   7.3
##  2 Maine            2.1      83       51   7.8
##  3 New Hampshire    2.1      57       56   9.5
##  4 Iowa             2.2      56       57  11.3
##  5 Vermont          2.2      48       32  11.2
##  6 Idaho            2.6     120       54  14.2
##  7 Wisconsin        2.6      53       66  10.8
##  8 Minnesota        2.7      72       66  14.9
##  9 Utah             3.2     120       80  22.9
## 10 Connecticut      3.3     110       77  11.1
## # ... with 40 more rows

kasus pembunuhan (Murder) paling sedikit terjadi pada negara bagian North Dakota dengan persentase populasi penduduk yang tinggal di daerah perkotaan sebesar 44%.

USArrests_tbl %>% arrange(Assault)
## # A tibble: 50 x 5
##    State         Murder Assault UrbanPop  Rape
##    <chr>          <dbl>   <int>    <dbl> <dbl>
##  1 North Dakota     0.8      45       44   7.3
##  2 Hawaii           5.3      46       83  20.2
##  3 Vermont          2.2      48       32  11.2
##  4 Wisconsin        2.6      53       66  10.8
##  5 Iowa             2.2      56       57  11.3
##  6 New Hampshire    2.1      57       56   9.5
##  7 Minnesota        2.7      72       66  14.9
##  8 West Virginia    5.7      81       39   9.3
##  9 Maine            2.1      83       51   7.8
## 10 South Dakota     3.8      86       45  12.8
## # ... with 40 more rows

kasus penyerangan (Assault) paling sedikit terjadi pada negara bagian North Dakota dengan persentase populasi penduduk yang tinggal di daerah perkotaan sebesar 44%.

USArrests_tbl %>% arrange(Rape)
## # A tibble: 50 x 5
##    State         Murder Assault UrbanPop  Rape
##    <chr>          <dbl>   <int>    <dbl> <dbl>
##  1 North Dakota     0.8      45       44   7.3
##  2 Maine            2.1      83       51   7.8
##  3 Rhode Island     3.4     174       87   8.3
##  4 West Virginia    5.7      81       39   9.3
##  5 New Hampshire    2.1      57       56   9.5
##  6 Wisconsin        2.6      53       66  10.8
##  7 Connecticut      3.3     110       77  11.1
##  8 Vermont          2.2      48       32  11.2
##  9 Iowa             2.2      56       57  11.3
## 10 South Dakota     3.8      86       45  12.8
## # ... with 40 more rows

kasus pemerkosaan (Rape) paling sedikit juga terjadi pada negara bagian North Dakota dengan persentase populasi penduduk yang tinggal di daerah perkotaan sebesar 44%. Sehingga dapat diketahui bahwa pada tahun 1973 negara bagian North Dakota merupakan negara dengan kasus kejahatan berat paling sedikit diantara negara bagian lainnya.

Filtering

Berdasarkan data USArrests dapat dipilih sebagian data dengan nilai tertentu menggunakan fungsi filter(). Oleh karena itu akan diketahui negara-negara bagian yang memiliki kasus-kasus kejahatan terberat berdasarkan nilai tertentu banyak kejadian.

USArrests_tbl %>% filter(Murder > 10)
## # A tibble: 15 x 5
##    State          Murder Assault UrbanPop  Rape
##    <chr>           <dbl>   <int>    <dbl> <dbl>
##  1 Alabama          13.2     236     58    21.2
##  2 Florida          15.4     335     80.5  31.9
##  3 Georgia          17.4     211     60    25.8
##  4 Illinois         10.4     249     83    24  
##  5 Louisiana        15.4     249     66    22.2
##  6 Maryland         11.3     300     76.6  27.8
##  7 Michigan         12.1     255     74    35.1
##  8 Mississippi      16.1     259     44.5  17.1
##  9 Nevada           12.2     252     81    46  
## 10 New Mexico       11.4     285     70    32.1
## 11 New York         11.1     254     86    26.1
## 12 North Carolina   13       337     45    16.1
## 13 South Carolina   14.4     279     48    22.5
## 14 Tennessee        13.2     188     59    26.9
## 15 Texas            12.7     201     80    25.5

diketahui pada tahun 1973 bahwa terdapat 15 negara bagian yang memiliki kasus kejahatan pembunuhan (Murder) dengan banyak kejadian lebih >10 dengan nilai yang bervariasi pada interval 11-17.

USArrests_tbl %>% filter(Assault > 250) 
## # A tibble: 12 x 5
##    State          Murder Assault UrbanPop  Rape
##    <chr>           <dbl>   <int>    <dbl> <dbl>
##  1 Alaska           10       263     48    44.5
##  2 Arizona           8.1     294     80    31  
##  3 California        9       276     91    40.6
##  4 Florida          15.4     335     80.5  31.9
##  5 Maryland         11.3     300     76.6  27.8
##  6 Michigan         12.1     255     74    35.1
##  7 Mississippi      16.1     259     44.5  17.1
##  8 Nevada           12.2     252     81    46  
##  9 New Mexico       11.4     285     70    32.1
## 10 New York         11.1     254     86    26.1
## 11 North Carolina   13       337     45    16.1
## 12 South Carolina   14.4     279     48    22.5

pada tahun 1973 kasus penyerangan (Assault) terdapat 12 negara bagian yang memiliki kejadian >250, yaitu berkisar pada 252-337 kejadian.

USArrests_tbl %>% filter(Rape > 30) 
## # A tibble: 8 x 5
##   State      Murder Assault UrbanPop  Rape
##   <chr>       <dbl>   <int>    <dbl> <dbl>
## 1 Alaska       10       263     48    44.5
## 2 Arizona       8.1     294     80    31  
## 3 California    9       276     91    40.6
## 4 Colorado      7.9     204     78.5  38.7
## 5 Florida      15.4     335     80.5  31.9
## 6 Michigan     12.1     255     74    35.1
## 7 Nevada       12.2     252     81    46  
## 8 New Mexico   11.4     285     70    32.1

8 negara bagian memiliki kasus pemerkosaan (Rape) > 30 pada tahun 1973. Banyak kejadian pada 8 negara tersebut berkisar sebanyak 32-46 kejadian.

USArrests_tbl %>% filter(UrbanPop > 80) 
## # A tibble: 9 x 5
##   State         Murder Assault UrbanPop  Rape
##   <chr>          <dbl>   <int>    <dbl> <dbl>
## 1 California       9       276     91    40.6
## 2 Florida         15.4     335     80.5  31.9
## 3 Hawaii           5.3      46     83    20.2
## 4 Illinois        10.4     249     83    24  
## 5 Massachusetts    4.4     149     85    16.3
## 6 Nevada          12.2     252     81    46  
## 7 New Jersey       7.4     159     89    18.8
## 8 New York        11.1     254     86    26.1
## 9 Rhode Island     3.4     174     87     8.3

Persentase penduduk yang tinggal di daerah perkotaan yang mencapai 80% terdapat pada setidaknya 9 negara bagian. Persentase penduduk pada 9 negara bagian tersebut berkisar 81%-91%.

Selecting

Berdasarkan informasi terkait banyaknya kasus kejahatan berat yang telah diperoleh menggunakan fungsi-fungsi sebelumnya kemudian dapat diamati peubah-peubah tertentu pada data USArrests menggunakan fungsi Select(). Penggunaan fungsi tersebut pada data ini adalah sebagai berikut.

murder <- USArrests_tbl%>% select(State,Murder,UrbanPop)
murder %>% arrange(desc(Murder))
## # A tibble: 50 x 3
##    State          Murder UrbanPop
##    <chr>           <dbl>    <dbl>
##  1 Georgia          17.4     60  
##  2 Mississippi      16.1     44.5
##  3 Florida          15.4     80.5
##  4 Louisiana        15.4     66  
##  5 South Carolina   14.4     48  
##  6 Alabama          13.2     58  
##  7 Tennessee        13.2     59  
##  8 North Carolina   13       45  
##  9 Texas            12.7     80  
## 10 Nevada           12.2     81  
## # ... with 40 more rows

output menunjukkan bahwa negara bagian Georgia memiliki kasus pembunuhan (Murder) yang cukup tinggi dengan persentase penduduk yang tinggal di daerah perkotaannya mencapai 60%.

assault <- USArrests_tbl%>% select(State,Assault,UrbanPop)
assault %>% arrange(desc(Assault))
## # A tibble: 50 x 3
##    State          Assault UrbanPop
##    <chr>            <int>    <dbl>
##  1 North Carolina     337     45  
##  2 Florida            335     80.5
##  3 Maryland           300     76.6
##  4 Arizona            294     80  
##  5 New Mexico         285     70  
##  6 South Carolina     279     48  
##  7 California         276     91  
##  8 Alaska             263     48  
##  9 Mississippi        259     44.5
## 10 Michigan           255     74  
## # ... with 40 more rows

berdasarkan banyaknya kasus penyerangan (Assault) negara North Carolina merupakan negara bagian yang memiliki kasus penyerangan (Assault) terbanyak dengan persentase penduduk yang tinggal di daerah perkotaannya kurang dari 50%.

rape <- USArrests_tbl%>% select(State,Rape,UrbanPop)
rape %>% arrange(desc(rape))
## # A tibble: 50 x 3
##    State          Rape UrbanPop
##    <chr>         <dbl>    <dbl>
##  1 Wyoming        15.6     60.5
##  2 Wisconsin      10.8     66  
##  3 West Virginia   9.3     39  
##  4 Washington     26.2     73  
##  5 Virginia       20.7     63  
##  6 Vermont        11.2     32  
##  7 Utah           22.9     80  
##  8 Texas          25.5     80  
##  9 Tennessee      26.9     59  
## 10 South Dakota   12.8     45  
## # ... with 40 more rows

negara bagian Wyoming merupakan negara bagian dengan kasus pemerkosaan (Rape) yang cukup banyak yaitu >10 dengan dengan persentase penduduk yang tinggal di daerah perkotaannya sudah mencapai 60.5%.

Fungsi mutate dan summarize

fungsi-fungsi yang sudah diterapkan secara terpisah pada data USArrests akan diterapkan kembali secara bersamaan.

crime<- USArrests_tbl %>% mutate(Cases=Murder+Assault+Rape) %>%
  summarize(murder=sum(Murder), assault=sum(Assault), rape=sum(Rape), cases=sum(Cases))
crime
## # A tibble: 1 x 4
##   murder assault  rape cases
##    <dbl>   <int> <dbl> <dbl>
## 1   389.    8538 1062.  9989

sehingga diperoleh informasi bahwa pada tahun 1973, kasus kejahatan berat yang terjadi di 50 negara bagian AS sebanyak 9989 kasus yang terdiri atas kasus pembunuhan (Murder), Penyerangan (Assault) dan pemerkosaan (Rape).