install library

Beberapa library yang perlu diinstall sebagai berikut:

library(ggplot2)
library(readxl)
library(ggthemes)
library(gridExtra)

Input Data

Data diinput dari Microsoft Excel dengan syntax seperti berikut:

setwd("C:/Users/UseR/Desktop/SEMESTER 2/PROBABILITAS STATISTIKA")
data<-read_excel("Tingkat_Kriminal_Indonesia(1).xlsx")
head(data)
## # A tibble: 6 × 7
##   `Jenis Kriminalitas` `Jenis Kejahatan` `Jumlah Kasus 2022` `Jumlah Kasus 2023`
##   <chr>                <chr>                           <dbl>               <dbl>
## 1 Kesusilaan           Pemerkosaan                      1443                1023
## 2 Kejahatan Fisik      KDRT                             5526               10783
## 3 Kesusilaan           Kekerasan Seksual                 235                1041
## 4 Kejahatan Hak Milik  Pencurian                        4335                6573
## 5 Narkotika            Edar Obat Bebas                  2161                3034
## 6 Korupsi              Penggelapan Uang                11689               27049
## # ℹ 3 more variables: `Tahun Dipenjara (minimal)` <dbl>, Wilayah <chr>,
## #   `Waktu Kejadian` <chr>
colnames(data) <- trimws(colnames(data))
data$`Jumlah Kasus 2023` <- as.numeric(data$`Jumlah Kasus 2023`)

Pie Chart

Dari data tersebut akan disajikan visualisasi data dalam bentuk Pie Chart. Berikut terlampir hasil visualisasi data distribusi kasus kriminal dari 4 wilayah di Indonesia pada tahun 2023.

ggplot(data, aes(x = "", y = `Jumlah Kasus 2023`, fill = `Wilayah`)) +
  geom_bar(stat = "identity", width = 1) +
  coord_polar("y", start = 0) +
  theme_void() +
  labs(title = "Distribusi Wilayah Kasus Kriminal di Indonesia (2023)")

Dari hasil visualisasi diatas dengan menggunakan Pie Chart dapat dijelaskan bahwa distribusi wilayah kasus kriminal pada tahun 2023 paling banyak berada di Jakarta dengan kasus penggelapan uang sebanyak 11.689 kasus di tahun 2022 dan 27.049 kasus di tahun 2023. Sementara itu, kasus kriminal paling sedikit berada di Aceh dengan kasus pengedaran obat bebas sebanyak 2.161 kasus di tahun 2022 dan 3.034 kasus di tahun 2023.

Bar Chart

Dari data tersebut akan disajikan visualisasi data dalam bentuk bar chart. Berikut terlampir hasil visualisasi data jumlah kasus kriminal per jenis kejahatan di Indonesia di tahun 2023.

ggplot(data, aes(x = `Jenis Kejahatan`, y = `Jumlah Kasus 2023`, fill = `Jenis Kejahatan`)) +
  geom_bar(stat = "identity") +
  theme_minimal() +
  labs(title = "Jumlah Kasus Kriminal per Jenis di Indonesia (2023)",
       x = "Jenis Kejahatan", y = "Jumlah Kasus") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Dari hasil visualisasi diatas dengan menggunakan Bar Chart dapat dijelaskan bahwa jumlah kasus kriminal tertinggi terdapat pada kasus kejahatan penggelapan uang dengan 27.049 kasus. Sementara itu jumlah kasus kriminal terendah terdapat pada kasus kejahatan pemerkosaan dengan 1.023 kasus di tahun 2023.

4. Histogram

Dari data tersebut akan disajikan visualisasi data dalam bentuk Histogram. Berikut terlampir hasil visualisasi data frekuensi durasi hukuman penjara minimal pada tahun 2023.

ggplot(data, aes(x = `Tahun Dipenjara (minimal)`)) +
  geom_histogram(binwidth = 0.5, fill = "blue", color = "black", alpha = 0.7) +
  theme_minimal() +
  labs(title = "Histogram Durasi Hukuman Penjara Minimal (2023)", x = "Tahun Dipenjara(minimal)", y = "Frekuensi")

Dari hasil visualisasi diatas dengan menggunakan Histogram dapat dijelaskan bahwa paling minimal durasi hukuman penjara untuk kasus kriminal selama 4 sampai 5 tahun di tahun 2023.

Dot Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Dot Plot. Berikut terlampir hasil visualisasi data jumlah kasus kriminal pada tahun 2023 berdasarkan jenis kejahatannya

ggplot(data, aes(x = `Jumlah Kasus 2023`, y = `Jenis Kejahatan`)) +
  geom_point(color = "blue", size = 3) +
  theme_minimal() +
  labs(title = "Dot Plot Jumlah Kasus Kriminal (2023)", x = "Jumlah Kasus", y = "Jenis Kejahatan")

Dari hasil visualisasi diatas dengan menggunakan Dot Plot dapat dijelaskan bahwa titik-titik yan tersebar menunjukkan jumlah kasus memiliki hubungan langsung dengan jenis kejahatan. Dalam rentang 0-10.000 memiliki jumlah kasus kriminal yang tinggi pada jenis kejahatan pada tahun 2023.

Box Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Box Plot. Berikut terlampir hasil visualisasi data jumlah kasus kriminal pada tahun 2023

ggplot(data, aes(x = "", y = `Jumlah Kasus 2023`)) +
  geom_boxplot(fill = "pink", color = "black") +
  theme_minimal() +
  labs(title = "Boxplot Jumlah Kasus Kriminal (2023)",y = "Jumlah Kasus")

Dari hasil visualisasi diatas dengan menggunakan Box Plot dapat dijelaskan bahwa adanya pencilan (outlier) di bagian atas boxplot yang disertai dengan whisker bagian atas yang lebih panjang ini menunjukkan bahwa distribusi data jumlah kasus pada tahun 2023 cenderung ke right-sweked

Density Plot

Dari data tersebut akan disajikan visualisasi data dalam bentuk Box Plot. Berikut terlampir hasil visualisasi data jumlah kasus kriminal pada tahun 2023

ggplot(data, aes(x = `Jumlah Kasus 2023`)) +
  geom_density(fill = "purple", alpha = 0.5) +
  theme_minimal() +
  labs(title = "Density Plot Jumlah Kasus Kriminal (2023)", x = "Jumlah Kasus", y = "Density")

Dari hasil visualisasi diatas dengan menggunakan Density Plot dapat dijelaskan bahwa ini pola right-sweked dengan panjang ke kanan yang menandakan bahwa beberapa wilayah memiliki jumlah kasus yang lebih tinggi. Puncak distribusi berada di sekitar 0-10.000 kasus yang menunjukkan frekuensi tertinggi di rentang tersebut

Ukuran Pemusatan

1.1 Menghitung Rata-Rata (mean) Tahun 2022.

Berikut terlampir syntax untuk menghitung rata-rata (mean) kasus kriminal.

mean(data$`Jumlah Kasus 2022`)
## [1] 4231.5

1.2 Menghitung Rata-Rata (mean) Tahun 2023.

Berikut terlampir syntax untuk menghitung rata-rata (mean) kasus kriminal.

mean(data$`Jumlah Kasus 2023`)
## [1] 8250.5

Kasus meningkat dari 4.231,5 kasus (2022) menjadi 8.250,5 kasus (2023), menunjukkan lonjakan signifikan.

2.1 Menghitung Median tahun 2022

Berikut terlampir syntax untuk menghitung median kasus kriminal

median(data$`Jumlah Kasus 2022`)
## [1] 3248

2.2 Menghitung Median tahun 2023

Berikut terlampir syntax untuk menghitung median kasus kriminal

median(data$`Jumlah Kasus 2023`)
## [1] 4803.5

Median juga naik dari 3.248 kasus di 2022 menjadi 4803,5 kasus di 2023, artinya separuh jumlah kasus kriminal di 2023 lebih tinggi dibandingkan tahun sebelumnya.

2.3 Menghitung Median tahun dipenjara

Berikut terlampir syntax untuk menghitung median lama kasus kriminal

median(data$`Tahun Dipenjara (minimal)`)
## [1] 4

3.1 Menghitung Modus Tahun 2022

Berikut terlampir syntax untuk menghitung modus kasus kriminal

x <- data$`Jumlah Kasus 2022`

modus <- function(x) {
  uniqx <- unique(x)
  uniqx[which.max(tabulate(match(x, uniqx)))]
}

modus(data$`Jumlah Kasus 2022`)
## [1] 1443

3.1 Menghitung Modus Tahun 2023

Berikut terlampir syntax untuk menghitung modus kasus kriminal

y <- data$`Jumlah Kasus 2023`

modus <- function(y) {
  uniqx <- unique(y)
  uniqx[which.max(tabulate(match(y, uniqx)))]
}

modus(data$`Jumlah Kasus 2023`)
## [1] 1023

Modus (kasus yang paling sering terjadi) menurun dari 1.443 (2022) ke 1.023 (2023), menunjukkan distribusi kasus yang lebih beragam.

Menampilkan ringkasan data (Statistik 5 Serangkai)

Berikut terlampir syntax untuk menghitung Statistik 5 Serangkai pada variabel jumlah kasus ### 1.Tahun 2022

summary(data$`Jumlah Kasus 2022`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     235    1622    3248    4232    5228   11689

2.Tahun 2023

summary(data$`Jumlah Kasus 2023`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1023    1539    4804    8250    9730   27049

Ukuran Penyebaran data

1.1 Menghitung Keragaman Data Tahun 2022

Berikut terlampir syntax untuk menghitung keragaman data pada variabel kasus kriminal

var(data$`Jumlah Kasus 2022`)
## [1] 17067093

Keragaman data pada tahun 2022 didapatkan hasil 17067093

1.2 Menghitung Keragaman Data Tahun 2023

var(data$`Jumlah Kasus 2023`)
## [1] 98807337

Keragaman data pada tahun 2023 didapatlan hasil

2.1 Menghitung standar deviasi dari data Tahun 2022

Berikut terlampir syntax untuk menghitung Standar Deviasi data pada variabel kasus kriminal

sd(data$`Jumlah Kasus 2022`)
## [1] 4131.234

2.2 Menghitung standar deviasi dari data Tahun 2023

Berikut terlampir syntax untuk menghitung Standar Deviasi data pada variabel kasus kriminal

sd(data$`Jumlah Kasus 2023`) 
## [1] 9940.188

Penyebaran data lebih besar di 2023, dengan variansi dan standar deviasi meningkat drastis. Artinya, ada wilayah atau kategori tertentu dengan kenaikan kasus yang jauh lebih tinggi dibandingkan yang lain. Dapat disimpulkan Kasus kriminal meningkat signifikan pada 2023, dengan jumlah yang lebih bervariasi dibandingkan 2022. Peningkatan ini bisa disebabkan oleh berbagai faktor seperti kondisi sosial-ekonomi atau kebijakan hukum yang berubah.

Kelompok 6: 1. Poppy Novita (3337240093) 2. Linda Rahmasari (3337240075) 3. Raenuha (3337240023)