1 PENDAHULUAN

1.1 Latar Belakang

Tindakan kriminalitas dapat dipicu oleh berbagai faktor, termasuk masalah ekonomi dan tingkat kesadaran masyarakat dalam melaporkan tindak kejahatan. Pertambahan jumlah penduduk seringkali memunculkan berbagai persoalan sosial, seperti kemiskinan dan pengangguran, yang pada akhirnya dapat mendorong sebagian orang melakukan tindak kriminal. Kriminalitas, yang merupakan tindakan atau perilaku melanggar hukum, dapat menimbulkan kerugian dan dampak negatif bagi masyarakat. Pelaku kriminal disebut sebagai kriminal, dan tindak kejahatan ini tidak hanya terjadi di negara lain tetapi juga di Indonesia. Jenis-jenis kriminalitas yang umum terjadi di Indonesia mencakup pembunuhan, penganiayaan, pemerkosaan, pencurian, penyalahgunaan narkoba, penipuan, hingga korupsi (Supratman, 2020). Berdasarkan survei tingkat kriminalitas, Indonesia berada di peringkat keempat di ASEAN pada tahun 2020 (Asia, 2020).

Rasa aman adalah hak asasi yang dijamin dalam Pasal 28G Ayat 1 UUD 1945, yang menyatakan bahwa setiap orang berhak atas perlindungan terhadap diri, keluarga, kehormatan, harta benda, serta rasa aman dari ancaman untuk berbuat atau tidak berbuat sesuatu yang merupakan haknya. Selama periode 2018–2020, jumlah kasus kejahatan di Indonesia mengalami fluktuasi. Data Badan Pusat Statistik menunjukkan adanya 294.281 kasus pada tahun 2018, yang kemudian menurun menjadi 269.324 kasus pada tahun 2019, dan kembali menurun menjadi 247.218 kasus pada tahun 2020.

Dengan banyaknya kejadian kriminalitas tersebut, diperlukan langkah untuk mengelompokkan daerah-daerah rawan kejahatan di Indonesia berdasarkan data dari Polda atau Provinsi. Pendekatan yang dapat digunakan adalah analisis klaster, yang bertujuan untuk mengelompokkan objek-objek dengan karakteristik yang serupa ke dalam satu klaster (Ediyanto, Muhlahsal, & Neva, 2013). Metode ini diharapkan membantu masyarakat lebih waspada dan pemerintah meningkatkan keamanan di wilayah-wilayah dengan tingkat kriminalitas tinggi.

1.2 Rumusan Masalah

  1. Bagaimana tingkat kriminalitas berbeda di antara provinsi-provinsi di Indonesia berdasarkan analisis cluster?
  2. Faktor-faktor apa saja yang mendominasi tingkat kriminalitas di setiap cluster?
  3. Bagaimana karakteristik masing-masing cluster berdasarkan tingkat kriminalitasnya?

1.3 Tujuan

  1. Menganalisis perbedaan tingkat kriminalitas antar provinsi di Indonesia dengan menggunakan metode cluster.
  2. Mengidentifikasi faktor dominan yang memengaruhi tingkat kriminalitas di setiap cluster.
  3. Mendeskripsikan karakteristik masing-masing cluster berdasarkan tingkat kriminalitas yang dimiliki.

1.4 Batasan Masalah

  1. Penelitian hanya berfokus pada kasus tindakan kriminalitas di Indonesia pada tahun 2020, dengan variabel Kejahatan Terhadap Nyawa, Kejahatan Terhadap Fisik, Kejahatan Terhadap Kesusilaan, Kejahatan Terhadap Kemerdekaan Orang, Kejahatan Terhadap Hak Milik dengan Penggunaan Kekerasan, Kejahatan Terhadap Hak Milik dengan Tanpa Penggunaan Kekerasan, Kejahatan Terkait Narkotika, Kejahatan Terkait Penipuan, Penggelapan, Korupsi.
  2. Data yang digunakan adalah data sekunder yang diperoleh dari Badan Pusat Statistik.
  3. Metode analisis yang digunakan adalah Principal Component Analysis (PCA), Cluster Hierarki, dan Cluster Nonhierarki (K-Means).

1.5 Data

Data yang digunakan adalah data sekunder yang berasal dari website Badan Pusat Statistik (BPS). Data yang digunakan yaitu Data Kriminalitas di Indonesia pada Tahun 2020. Adapun variabel yang digunakan, yaitu:

X1: Kejahatan Terhadap Nyawa (Pembunuhan)

X2: Kejahatan Terhadap Fisik (Penganiayaan, KDRT)

X3: Kejahatan Terhadap Kesusilaan (Pemerkosaan, Pencabulan)

X4: Kejahatan Terhadap Kemerdekaan Orang (Penculikan, Mempekerjakan anak dibawah umur)

X5: Kejahatan Terhadap Hak Milik dengan Penggunaan Kekerasan (Pencurian dengan Kekerasan, Pencurian dengan Kekerasan Menggunakan Senjata Api, Pencurian dengan Kekerasan Menggunakan Senjata Tajam, dll)

X6: Kejahatan Terhadap Hak Milik dengan Tanpa Penggunaan Kekerasan (Pencurian, dll)

X7: Kejahatan Terkait Narkotika

X8: Kejahatan Terkait Penipuan, Penggelapan, Korupsi

1.6 Latar Belakang Metode

PCA merupakan suatu teknik seleksi data multivariat (multivariable) yang mengubah atau mengtransformasi suatu matriks data asli menjadi sekumpulan kombinasi homogen yang lebih sedikit namun menyerap sejumlah besar carian pada data awal (M. Zulfahmi, 2019). Pada analisis faktor ini, PCA mengidentifikasi pola dan kumpulan data serta menemukan persamaan dan perbedaan yang terdapat pada masing-masing faktor. Pendeketan pada analisis PCA yaitu dilakukan untuk menyederhanakan dan menghilangkan faktor-faktor yang kurang dominan atau relevan yang mempengaruhi terhadap variabe yang akan di teliti. Sehingga dengan analisis PCA diharapkan memberikan hasil yang terbaik ketika diterapkan pada setiap atribut yang berkorelasi.

Analisis cluster mengklasifikasi objek sehingga objek-objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. (Ediyanto, Muhlahsal, & Neva, 2013). Analisis cluster dengan metode hierarchical adalah analisis yang pengclusteran datanya dilakukan dengan cara mengukur jarak kedekatan pada setiap objek yang kemudian membentuk sebuah dendrogram. Berbeda dengan metode hierarchical, metode non-hierarchical dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan. Setelah jumlah cluster diketahui baru proses cluster dilakukan. Dalam metode non-hierarchical terdapat dua cara analisis yaitu K-means Clustering dan K-Medoids Clustering. Dalam penelitian ini menggunakan K-Means Clustering.

PCA menjadi langkah awal untuk mengidentifikasi faktor utama dari kriminalitas di Indonesia, sehingga memungkinkan pengembangan solusi yang sesuai untuk menjaga stabilitas keamnanan di Indonesia. Oleh karena itu, akan dilakukan analisis untuk mengelompokkan provinsi di Indonesia dengan data jumlah kriminalitas berdasarkan bentuknya pada tahun 2020. Dengan adanya pengelompokkan ini, diharapkan masyarakat bisa lebih waspada dan pemerintah serta apparat setempat dapat lebih siaga dan menerapkan kebijakan yang tepat untuk terciptanya keamanan dan kesejahteraan rakyat.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Menurut Sholikhah (2016), statistika deskriptif adalah metode statistika yang berfokus pada pengumpulan, pengorganisasian, dan pengolahan data untuk menyajikan informasi yang jelas mengenai suatu kondisi atau peristiwa tertentu berdasarkan data yang diperoleh. Dengan demikian, statistika deskriptif berfungsi untuk menyajikan data secara terstruktur, sehingga dapat memberikan pemahaman atau interpretasi tertentu melalui representasi visual yang disajikan.

2.2 Standarisasi Data

Standarisasi adalah proses menyesuaikan skala data sehingga setiap variabel memiliki nilai rata-rata sebesar 0 dan simpangan baku sebesar 1. Proses ini sering dilakukan menggunakan metode Z-Score. Standarisasi menjadi langkah penting, terutama dalam penerapan metode yang melibatkan pengukuran jarak antar data. Jika skala variabel berbeda-beda, variabel dengan skala lebih besar cenderung mendominasi perhitungan, yang dapat mengurangi keakuratan hasil analisis.

2.3 Principal Component Analysis (PCA)

PCA merupakan kombinasi linear dari variabel awal yang secara geometris, kombinasi linear ini merupakan sistem koordinat baru yang diperoleh dari rotasi sisetem semula. Metode PCA sangat berguna digunakan jika data yang dimiliki jumlah variabelnya besar dan memiliki korelasi antar variabelnya. Perhitungan dari principal component analysis didasarkan pada perhitungan nilai eigen dan eigenvector yang penyebaran data dari suatu dataset (Johnson & Wichen, 2007). Tujuan dari analisis PCA adalah untuk mereduksi variabel yang ada menjadi lebih sedikit tanpa harus kehilangan informasi yang termuat dari data asli. Langkah-langkah untuk melakukan analisis PCA yaitu pertama dengan melakukan standarisasi data. Langkah ini bertujuan agar interval data menjadi lebih proporsional dengan menyamakan rentang nilai pada data.

Kemudian menghitung matriks varian kovarian sebagai langkah awal dalam melakukan analisis PCA untuk mendapatkan kedekatan hubungan antar variabel penelitian. Selanjutnya, menghitung eigenvalue dan eigenvector yang didapatkan dari matriks kovarian yang diperoleh. Perhitungan nilai eigen dengan menggunakan persamaan:

[𝜆𝐼 − 𝐴] = 0

dengan 𝜆 adalah eigenvalue, 𝐼 adalah matriks identitas, dan 𝐴 adalah matriks data. Kemudian menghitung eigen vector dengan menggunakan persamaan:

[𝜆𝐼 − 𝐴][𝑋] = 0

dengan 𝜆 adalah eigenvalue, 𝐼 adalah matriks identitas, dan 𝐴 adalah matriks data, dan 𝑋 adalah eigenvector. Setelah itu, mengurutkan eigenvalue secara descending dan Principal Component (PC) didapatkan dari deretan eigenvector. Jumlah principal component yang terpilih adalah nilai 𝜆 > 1. Selanjutnya, didapatkanlah dataset baru.

2.4 Analisis Cluster

Analisis cluster adalah suatu teknik multivariat yang digunakan untuk mengelompokkan objek ke dalam dua atau lebih kelompok berdasarkan kesamaan karakteristik objek tersebut. Tujuan dari analisis ini adalah untuk mengidentifikasi kelompok-kelompok yang memiliki kesamaan tinggi di dalamnya (homogenitas), sementara kelompok yang berbeda menunjukkan perbedaan yang signifikan antar kelompok (heterogenitas) (Simamora, 2005). Dengan demikian, analisis cluster membantu dalam mengelompokkan objek penelitian berdasarkan kemiripan yang dimilikinya.

2.4.1 Analisis Cluster Hierarki

Metode hierarki dimulai dengan mengelompokkan objek-objek yang memiliki kesamaan atau kedekatan terbesar terlebih dahulu. Setelah itu, objek-objek yang memiliki kedekatan berikutnya akan dikelompokkan, dan seterusnya. Proses ini berlanjut hingga terbentuk beberapa kelompok atau cluster, yang dapat digambarkan dalam bentuk struktur hierarkis, mirip dengan pohon yang menunjukkan hubungan atau tingkatan antar cluster.

Metode agglomerative adalah pendekatan yang memulai dengan menganggap setiap objek sebagai sebuah cluster terpisah, kemudian menggabungkan objek-objek tersebut berdasarkan jarak tertentu hingga semua objek terkumpul dalam satu cluster. Proses penggabungan ini melibatkan pembaruan matriks jarak pada setiap langkah dan sering kali digambarkan dalam bentuk dendrogram (Simamora, 2005). Terdapat empat metode dalam Agglomerative:

  • Single Linkage (Nearest Neighbor): Objek-objek yang memiliki jarak terdekat akan digabungkan terlebih dahulu.
    \[d(ij)_k = \min(dik, djk)\]

  • Complete Linkage (Farthest Neighbor): Jarak antar cluster dihitung berdasarkan objek dengan jarak terjauh antara kedua cluster.
    \[d(ij)_k = \max(dik, djk)\]

  • Average Linkage: Jarak antar cluster dihitung dengan rata-rata jarak semua pasangan objek yang berasal dari kedua cluster.
    \[ d(ij)_k = \frac{\sum_a \sum_b d_{ab}}{n_(ij_)n_k} \]

  • Ward’s Method: Metode ini berfokus pada optimisasi varians internal cluster dengan meminimalkan peningkatan jumlah kuadrat kesalahan (sum of squares) pada setiap tahap penggabungan.

Keempat metode ini memberikan fleksibilitas dalam memilih pendekatan yang paling sesuai dengan karakteristik data dan tujuan analisis.

2.4.2 Analisis Cluster Non-Hierarki (K-Means)

Metode non hierarchical merupakan pengelompokkan objek dimana banyaknya cluster yang akan dibentuk dapat ditentukan terlebih dahulu sebagai bagian dari prosedur pengerombolan. Pengelompokan berbasis partitioning menghasilkan sebuah partisi dari data mengakibatkan objek dalam kelompok lebih mirip satu sama lain daripada objek yang ada dalam kelompok lain (Triaynto,2015). Terdapat beberapa metode yang termasuk dalam Clustering Non-Hierarchical salah satunya yaitu Clustering K- Means.

Pengelompokan K-Means merupakan metode analisis kelompok yang mengarah pada pemartisian N objek pengamatan ke dalam kelompok cluster, dimana setiap objek pengamatan dimiliki oleh sebuah kelompok dengan mean (rata-rata) terdekat. Keduanya mencoba untuk menemukan pusat dari kelompok dalam data sebanyak iterasi perbaikan yang dilakukan oleh kedua algoritma (Prasetyo, 2012). Prinsip utama dari teknik ini adalah menyusun k buah partisi/pusat massa (centroid)/rata-rata (mean) dari sekumpulan data. Tujuan dari pengelompokan data ini adalah untuk meminimalkan fungsi objektif yang diset dalam proses pengelompokan, yang pada intinya adalah untuk berusaha meminimalkan variasi dalam suatu kelompok dan memaksimalkan variasi antar kelompok.

Langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut: 1.Tentukan keluaran k sebagai jumlah cluster yang akan dibentuk.

2.Inisialisasi pusat cluster (centroid) setiap keluaran k dengan cara random yang diambil dari data yang ada.

3.Menghitung jarak setiap data input terhadap masing – masing centroid menggunakan rumus jarak Euclidean atau Manhattan hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. jarak Euclidean: \[ D_e = \sqrt{(x_i - s_i)^2 + (y_i - t_i)^2} \]

4.Mengklasifikasikan setiap data berdasarkan kedekatannya dengan centroid (jarak terkecil).

5.Memperbaharui nilai centroid. Nilai centroid baru di peroleh dari rata-rata tiap cluster yang bersangkutan

6.Melakukan perulangan dari langkah 2 hingga 5, sampai centroid tiap cluster tidak ada yang berubah.

3 SOURCE CODE

3.1 Library

library(readxl)
library(corrplot)
## corrplot 0.94 loaded
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ggplot2)
library(gridExtra)
library(NbClust)
library(purrr)
library(cluster)
library(clValid)

readxl: Untuk membaca file Excel.

corrplot: Untuk membuat visualisasi matriks korelasi.

factoextra: Untuk visualisasi analisis faktor dan PCA.

ggplot2: Untuk membuat grafik menggunakan pendekatan grammar of graphics.

gridExtra: Untuk menggabungkan beberapa plot dalam satu grid.

NbClust: Untuk menentukan jumlah optimal cluster.

purrr: Untuk manipulasi data berbasis fungsional.

cluster: Untuk analisis cluster hierarki.

clValid: untuk mengevaluasi validitas hasil klasterisasi.

3.2 Input Data

projekAnmul <- read_excel("C:/Users/ASUS/Downloads/Data rpubs Anmul.xlsx")
head(projekAnmul)
## # A tibble: 6 × 9
##   Provinsi         Pembunuhan Penganiayaan `Pemerkosaan, Pencabulan` Penculikan
##   <chr>                 <dbl>        <dbl>                     <dbl>      <dbl>
## 1 Aceh                     15         1206                       232         29
## 2 Sumatera Utara           99         6207                       774         55
## 3 Sumatera Barat           20         1724                       294         97
## 4 Riau                     13         1013                       143         11
## 5 Jambi                    11          531                        69          9
## 6 Sumatera Selatan         77         1551                       172        141
## # ℹ 4 more variables: `Pencurian dengan Kekerasan` <dbl>, Pencurian <dbl>,
## #   Narkotika <dbl>, `Penipuan, Penggelapan, Korupsi` <dbl>

read_excel: Membaca data Excel.

head(projekAnmul): Menampilkan enam baris pertama data.

3.3 Tipe Data

str(projekAnmul)
## tibble [34 × 9] (S3: tbl_df/tbl/data.frame)
##  $ Provinsi                      : chr [1:34] "Aceh" "Sumatera Utara" "Sumatera Barat" "Riau" ...
##  $ Pembunuhan                    : num [1:34] 15 99 20 13 11 77 33 21 10 13 ...
##  $ Penganiayaan                  : num [1:34] 1206 6207 1724 1013 531 ...
##  $ Pemerkosaan, Pencabulan       : num [1:34] 232 774 294 143 69 172 108 247 52 109 ...
##  $ Penculikan                    : num [1:34] 29 55 97 11 9 141 1 41 47 1 ...
##  $ Pencurian dengan Kekerasan    : num [1:34] 145 780 185 413 87 563 106 399 42 103 ...
##  $ Pencurian                     : num [1:34] 2408 10916 3732 3152 1770 ...
##  $ Narkotika                     : num [1:34] 1596 5932 913 1646 619 ...
##  $ Penipuan, Penggelapan, Korupsi: num [1:34] 1130 5562 989 1095 767 ...

str(projekAnmul): Menampilkan struktur data, termasuk tipe data tiap kolom.

3.4 Statistika Deskriptif

statdes <- summary(projekAnmul)

summary: Menampilkan statistik deskriptif (mean, median, min, max, dll.) untuk setiap kolom data.

3.5 Principal Component Analysis (PCA)

3.5.1 Korelasi

kor_visual <- cor(projekAnmul[,2:9])
corrplot(kor_visual, method = "number",type = "lower", tl.col = "red", tl.srt = 35)

cor: Menghitung matriks korelasi antara kolom 2 sampai 9.

corrplot: Membuat plot korelasi dengan angka dan format visual “lower triangle.”

3.5.2 Normalisasi Data

projek_scalled <- scale(projekAnmul[,2:9])

scale: Menormalkan data sehingga memiliki mean = 0 dan standar deviasi = 1.

3.5.3 Nilai Eigen

matrix_cov <- cov(projek_scalled)
nilaivektoreigen_cov = eigen(matrix_cov)

cov: Membuat matriks kovarians dari data yang sudah dinormalisasi.

eigen: Menghitung nilai eigen dan vektor eigen dari matriks kovarians.

3.5.4 Scree Plot Eigen

plot(nilaivektoreigen_cov$values, xlab="Eigenvalue Number", ylab = "Eigenvalue Size", main = "Scree Plot",lwd = 1)+lines(nilaivektoreigen_cov$values)
## integer(0)
axis(1, at = seq(1, length(nilaivektoreigen_cov$values)))  
abline(h = 1, col = "red")
lines(nilaivektoreigen_cov$values)

plot: Menampilkan ukuran eigenvalue sebagai scree plot.

abline(h = 1, col = “red”): Garis horizontal di nilai 1 untuk komponen yang signifikan.

3.5.5 Kumulatif Eigen

kumeigen_cov <- for (eg in nilaivektoreigen_cov$values){
  +   print(eg/sum(nilaivektoreigen_cov$values))}
## [1] 0.603881
## [1] 0.141473
## [1] 0.1124516
## [1] 0.05198659
## [1] 0.04306857
## [1] 0.03151077
## [1] 0.009550749
## [1] 0.006077821

for loop: Menghitung proporsi kontribusi masing-masing eigenvalue terhadap total variansi.

3.5.6 Persamaan PC

PCMatrix_cov <- nilaivektoreigen_cov$vectors[,1:2]

3.5.7 Fungsi PCA dengan prcomp

pcamodel <- prcomp(projek_scalled, scale = TRUE, center=T)
summary(pcamodel)
## Importance of components:
##                           PC1    PC2    PC3     PC4     PC5     PC6     PC7
## Standard deviation     2.1980 1.0639 0.9485 0.64490 0.58698 0.50208 0.27642
## Proportion of Variance 0.6039 0.1415 0.1124 0.05199 0.04307 0.03151 0.00955
## Cumulative Proportion  0.6039 0.7453 0.8578 0.90979 0.95286 0.98437 0.99392
##                            PC8
## Standard deviation     0.22051
## Proportion of Variance 0.00608
## Cumulative Proportion  1.00000
print(round(pcamodel$rotation[,1:2],3))
##                                  PC1    PC2
## Pembunuhan                     0.370 -0.213
## Penganiayaan                   0.404 -0.169
## Pemerkosaan, Pencabulan        0.186 -0.232
## Penculikan                     0.181 -0.764
## Pencurian dengan Kekerasan     0.380  0.065
## Pencurian                      0.431  0.043
## Narkotika                      0.370  0.438
## Penipuan, Penggelapan, Korupsi 0.407  0.301

prcomp: Melakukan PCA dengan normalisasi dan sentralisasi data.

summary(pcamodel): Menampilkan variansi yang dijelaskan oleh masing-masing komponen.

round(pcamodel$rotation[,1:2],3): Menampilkan kontribusi variabel ke PC1 dan PC2.

3.5.8 Plot Efek

fviz_eig(pcamodel, addlabels = TRUE, ylim = c(0, 85))

fviz_eig: Menampilkan scree plot dengan persentase variansi setiap PC.

3.5.9 Plot Kontribusi Variabel

fviz_pca_var(pcamodel,
             col.var = "cos2",
             gradient.cols = c("navy", "magenta", "darkorange"),
             repel = TRUE)

fviz_pca_var: Plot variabel berdasarkan kontribusi pada PC, dengan gradasi warna.

3.5.10 Kontribusi Variabel pada PC1 dan PC2

PC1 <- fviz_contrib(pcamodel, choice = "var", axes = 1)
PC2 <- fviz_contrib(pcamodel, choice = "var", axes = 2)
grid.arrange(PC1,PC2, ncol=2,
             top='Contribution of the variables to PCs')

Menampilkan variabel mana yang paling berkontribusi pada PC1 dan PC2.

3.5.11 Plot Individu

fviz_pca_ind(pcamodel,
             col.ind = "cos2",
             gradient.cols = c("gold", "purple", "brown"),
             repel = TRUE)

Menampilkan plot individu untuk memvisualisasikan sebaran data individu dalam PC1 dan PC2.

3.5.12 Biplot

fviz_pca_biplot(pcamodel, axes = c(1,2), repel = TRUE, col.var = "darkorange", col.ind = "darkgreen" )

Menghasilkan biplot dari analisis komponen utama (PCA). Biplot menampilkan dua informasi utama: variabel (dalam warna oranye) dan individu (dalam warna hijau).

3.6 Cluster Hierarki

3.6.1 Data

pca_model <- prcomp(projek_scalled, center=FALSE, scale.=FALSE, rank. = 2)
results <- pca_model$x

prcomp: Melakukan analisis komponen utama (PCA) pada data yang telah dinormalisasi.

rank. = 2 (Membatasi jumlah komponen utama yang dihasilkan menjadi dua, yaitu PC1 dan PC2.

pca_model$x: Menyimpan hasil transformasi data pada ruang komponen utama yang disebut results.

3.6.2 Jarak Euclidean

jarak <- dist(projek_scalled, method = "euclidean")

Menghitung jarak antar individu dalam dataset menggunakan metode Euclidean, untuk menentukan seberapa mirip data satu dengan yang lain.

3.6.3 Koefisien Korelasi

ds <- hclust(dist(results,method = 'euclidean'),method = "single")
da <- hclust(dist(results,method = 'euclidean'),method = "average")
dc <- hclust(dist(results,method = 'euclidean'),method = "complete")
dw <- hclust(dist(results,method = 'euclidean'),method = "ward.D")
linkage <- c("single", "average", "complete", "ward")
names(linkage) <- c("single","average","complete","ward")
ac <- function(x) {
  agnes(results, method = x)$ac
} 
map_dbl(linkage,ac)
##    single   average  complete      ward 
## 0.9051577 0.9175915 0.9207571 0.9441308

hclust: Melakukan analisis hierarki cluster menggunakan jarak Euclidean yang telah dihitung sebelumnya.

Berbagai metode untuk pengelompokan hierarki, yaitu:

Single linkage: Mengelompokkan objek berdasarkan jarak antar dua titik terdekat dari kelompok yang berbeda dan disimpan dalam variabel ds.

Average linkage: Mengelompokkan objek berdasarkan rata-rata jarak antara setiap pasangan objek dan disimpan dalam variabel da.

Complete linkage: Mengelompokkan objek berdasarkan jarak terjauh antar anggota kelompok dan disimpan dalam variabel dc.

Ward’s Method: Mengelompokkan objek dengan meminimalkan total varian dalam cluster dan disimpan dalam variabel dw.

3.6.4 Indeks Validitas

validity <- clValid(results, 2:9, clMethods = "hierarchical", 
                         validation = "internal", metric = "euclidean", method = "ward")
## The "ward" method has been renamed to "ward.D"; note new "ward.D2"
## Warning in clValid(results, 2:9, clMethods = "hierarchical", validation =
## "internal", : rownames for data not specified, using 1:nrow(data)
summary(validity)
## 
## Clustering Methods:
##  hierarchical 
## 
## Cluster sizes:
##  2 3 4 5 6 7 8 9 
## 
## Validation Measures:
##                                  2       3       4       5       6       7       8       9
##                                                                                           
## hierarchical Connectivity   8.8377 18.1433 20.2266 25.5726 25.9393 28.3933 30.1433 35.2651
##              Dunn           0.2559  0.0624  0.0766  0.0766  0.1689  0.1689  0.2475  0.2496
##              Silhouette     0.6169  0.3158  0.3375  0.4008  0.4256  0.4110  0.4336  0.4188
## 
## Optimal Scores:
## 
##              Score  Method       Clusters
## Connectivity 8.8377 hierarchical 2       
## Dunn         0.2559 hierarchical 2       
## Silhouette   0.6169 hierarchical 2

Menghitung dan memvalidasi kualitas cluster hierarki menggunakan dengan metode ward dan ukuran validitas internal.

3.6.5 Dendogram

clus_hier <- eclust(results, FUNcluster = "hclust", k = 2, hc_method = "ward.D", graph = TRUE, sub = " ", xlab = "Provinsi", ylab = "Jarak")
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

Menampilkan dendrogram berdasarkan hasil analisis cluster hierarki dengan metode Ward.

klaster <- cutree(dw, 2) 
tabel <- data.frame(projekAnmul$Provinsi,results,klaster)

Menampilkan tabel yang menggabungkan nama provinsi dan cluster yang dihasilkan.

3.6.6 Karakteristik Cluster

hist.kluster1 <- subset(tabel,klaster==1)
hist.kluster2 <- subset(tabel,klaster==2)
hist.kluster_1 <- sapply(hist.kluster1,mean)
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
hist.kluster_2 <- sapply(hist.kluster2,mean)
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
mean_total=rbind(hist.kluster_1,hist.kluster_2)

subset: Memisahkan data berdasarkan cluster 1 dan cluster 2

sapply: Menghitung nilai rata-rata untuk setiap variabel dalam cluster 1 dan cluster 2

rbind: Menggabungkan hasil rata-rata cluster 1 dan cluster 2

3.7 Cluster Non-Hierarki

3.7.1 Jumlah Cluster Optimal (Silhouette Method)

fviz_nbclust(results, kmeans, method = "silhouette") + labs(title = "Silhouette Method")

Menampilkan grafik untuk menentukan jumlah cluster optimal menggunakan metode Silhouette.

3.7.2 K-Means Clustering

km2 <- kmeans(results, centers = 2)

kmeans(): Melakukan analisis cluster non-hierarki menggunakan metode k-means clustering yang kemudian hasilnya disimpan dalam variabel km2.

fviz_cluster(km2, data = results)

Menampilkan visualisasi dalam dua cluster.

4 HASIL DAN PEMBAHASAN

4.1 Input Data

projekAnmul <- read_excel("C:/Users/ASUS/Downloads/Data rpubs Anmul.xlsx")
head(projekAnmul)
## # A tibble: 6 × 9
##   Provinsi         Pembunuhan Penganiayaan `Pemerkosaan, Pencabulan` Penculikan
##   <chr>                 <dbl>        <dbl>                     <dbl>      <dbl>
## 1 Aceh                     15         1206                       232         29
## 2 Sumatera Utara           99         6207                       774         55
## 3 Sumatera Barat           20         1724                       294         97
## 4 Riau                     13         1013                       143         11
## 5 Jambi                    11          531                        69          9
## 6 Sumatera Selatan         77         1551                       172        141
## # ℹ 4 more variables: `Pencurian dengan Kekerasan` <dbl>, Pencurian <dbl>,
## #   Narkotika <dbl>, `Penipuan, Penggelapan, Korupsi` <dbl>

4.2 Tipe Data

str(projekAnmul)
## tibble [34 × 9] (S3: tbl_df/tbl/data.frame)
##  $ Provinsi                      : chr [1:34] "Aceh" "Sumatera Utara" "Sumatera Barat" "Riau" ...
##  $ Pembunuhan                    : num [1:34] 15 99 20 13 11 77 33 21 10 13 ...
##  $ Penganiayaan                  : num [1:34] 1206 6207 1724 1013 531 ...
##  $ Pemerkosaan, Pencabulan       : num [1:34] 232 774 294 143 69 172 108 247 52 109 ...
##  $ Penculikan                    : num [1:34] 29 55 97 11 9 141 1 41 47 1 ...
##  $ Pencurian dengan Kekerasan    : num [1:34] 145 780 185 413 87 563 106 399 42 103 ...
##  $ Pencurian                     : num [1:34] 2408 10916 3732 3152 1770 ...
##  $ Narkotika                     : num [1:34] 1596 5932 913 1646 619 ...
##  $ Penipuan, Penggelapan, Korupsi: num [1:34] 1130 5562 989 1095 767 ...

4.3 Statistika Deskriptif

statdes <- summary(projekAnmul)
statdes
##    Provinsi           Pembunuhan     Penganiayaan    Pemerkosaan, Pencabulan
##  Length:34          Min.   : 1.00   Min.   :  91.0   Min.   :  32.00        
##  Class :character   1st Qu.:10.25   1st Qu.: 466.2   1st Qu.:  95.75        
##  Mode  :character   Median :17.50   Median : 651.0   Median : 122.00        
##                     Mean   :26.18   Mean   :1078.6   Mean   : 201.06        
##                     3rd Qu.:32.75   3rd Qu.:1400.8   3rd Qu.: 217.75        
##                     Max.   :99.00   Max.   :6207.0   Max.   :1398.00        
##    Penculikan     Pencurian dengan Kekerasan   Pencurian       Narkotika     
##  Min.   :  0.00   Min.   :  4.0              Min.   :  112   Min.   :  41.0  
##  1st Qu.:  9.25   1st Qu.: 54.0              1st Qu.:  870   1st Qu.: 242.0  
##  Median : 28.00   Median :133.0              Median : 1576   Median : 604.5  
##  Mean   : 57.94   Mean   :192.3              Mean   : 2155   Mean   :1076.8  
##  3rd Qu.: 94.75   3rd Qu.:277.8              3rd Qu.: 2940   3rd Qu.:1479.2  
##  Max.   :311.00   Max.   :780.0              Max.   :10916   Max.   :5981.0  
##  Penipuan, Penggelapan, Korupsi
##  Min.   :  49                  
##  1st Qu.: 369                  
##  Median : 689                  
##  Mean   :1091                  
##  3rd Qu.:1201                  
##  Max.   :5562
  • Variabel Provinsi adalah data kategorik yang menunjukkan daftar 34 provinsi yang dianalisis dalam dataset ini. Data ini tidak memiliki nilai numerik tetapi digunakan sebagai pengelompok untuk variabel lainnya.

  • Jumlah kasus pembunuhan terendah adalah 1 kasus, sedangkan jumlah tertinggi mencapai 99 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pembunuhan kurang dari atau sama dengan 10,25 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 32,75 kasus. Rata-rata kasus pembunuhan di seluruh provinsi adalah 26,18 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 17,5 kasus.

  • Jumlah kasus penganiayaan terendah adalah 91 kasus, sedangkan jumlah tertinggi mencapai 6.207 kasus. Sebanyak 25% provinsi memiliki jumlah kasus penganiayaan kurang dari atau sama dengan 466,2 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 1.400,8 kasus. Rata-rata kasus penganiayaan di seluruh provinsi adalah 1.078,6 kasus, yang lebih tinggi dari nilai mediannya sebanyak 651 kasus.

  • Jumlah kasus pemerkosaan dan pencabulan terendah adalah 32 kasus, sedangkan jumlah tertinggi mencapai 1.398 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pemerkosaan dan pencabulan kurang dari atau sama dengan 95,75 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 217,75 kasus. Rata-rata kasus pemerkosaan dan pencabulan di seluruh provinsi adalah 201,06 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 122 kasus.

  • Jumlah kasus penculikan terendah adalah 0 kasus, sedangkan jumlah tertinggi mencapai 311 kasus. Sebanyak 25% provinsi memiliki jumlah kasus penculikan kurang dari atau sama dengan 9,25 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 94,75 kasus. Rata-rata kasus penculikan di seluruh provinsi adalah 57,94 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 28 kasus.

  • Jumlah kasus pencurian dengan kekerasan terendah adalah 4 kasus, sedangkan jumlah tertinggi mencapai 780 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pencurian dengan kekerasan kurang dari atau sama dengan 54 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 277,8 kasus. Rata-rata kasus pencurian dengan kekerasan di seluruh provinsi adalah 192,3 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 133 kasus.

  • Jumlah kasus pencurian terendah adalah 112 kasus, sedangkan jumlah tertinggi mencapai 10.916 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pencurian kurang dari atau sama dengan 870 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 2.940 kasus. Rata-rata kasus pencurian di seluruh provinsi adalah 2.155 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 1.576 kasus.

  • Jumlah kasus narkotika terendah adalah 41 kasus, sedangkan jumlah tertinggi mencapai 5.981 kasus. Sebanyak 25% provinsi memiliki jumlah kasus narkotika kurang dari atau sama dengan 242 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 1.479,2 kasus. Rata-rata kasus narkotika di seluruh provinsi adalah 1.076,8 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 604,5 kasus.

  • Jumlah kasus penipuan, penggelapan, dan korupsi terendah adalah 49 kasus, sedangkan jumlah tertinggi mencapai 5.562 kasus. Sebanyak 25% provinsi memiliki jumlah kasus penipuan, penggelapan, dan korupsi kurang dari atau sama dengan 369 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 1.201 kasus. Rata-rata kasus penipuan, penggelapan, dan korupsi di seluruh provinsi adalah 1.091 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 689 kasus.

4.4 Principal Component Analysis (PCA)

4.4.1 Korelasi

kor_visual <- cor(projekAnmul[,2:9])
corrplot(kor_visual, method = "number",type = "lower", tl.col = "red", tl.srt = 35)

Variabel Pencurian, Penipuan, Penggelapan, Korupsi, dan Pencurian dengan Kekerasan menunjukkan hubungan yang sangat erat di berbagai kombinasi, hal ini ditunjukkan dengan warna yang gelap (biru tua) atau nilai korelasi mendekati satu.Sedangkan korelasi rendah terlihat antara Pembunuhan dengan variabel-variabel seperti Pemerkosaan, Pencabulan dan Penculikan.

4.4.2 Normalisasi Data

projek_scalled <- scale(projekAnmul[,2:9])
projek_scalled
##         Pembunuhan Penganiayaan Pemerkosaan, Pencabulan  Penculikan
##  [1,] -0.475455052   0.10949810               0.1228258 -0.40900275
##  [2,]  3.097965021   4.40737416               2.2743794 -0.04156532
##  [3,] -0.262751476   0.55466902               0.3689445  0.55198745
##  [4,] -0.560536482  -0.05636675              -0.2304736 -0.66338251
##  [5,] -0.645617912  -0.47059915              -0.5242281 -0.69164692
##  [6,]  2.162069288   0.40599224              -0.1153535  1.17380463
##  [7,]  0.290277821  -0.51528813              -0.3694115 -0.80470459
##  [8,] -0.220210761  -0.37090837               0.1823707 -0.23941624
##  [9,] -0.688158628  -0.79803182              -0.5917123 -0.15462299
## [10,] -0.560536482  -0.48520901              -0.3654419 -0.80470459
## [11,]  0.247737106   0.31833310              -0.3495632 -0.38073833
## [12,] -0.262751476   0.31489549               0.6746080 -0.66338251
## [13,]  0.162655676  -0.59865025               0.5872756 -0.66338251
## [14,] -0.858321488  -0.43450421              -0.4091081 -0.43726717
## [15,]  1.226173555   0.27965995               0.2180976  1.68256415
## [16,] -0.773240058  -0.47919319              -0.4765922  1.31512672
## [17,] -0.858321488  -0.57114934              -0.5401067 -0.76230797
## [18,] -0.645617912  -0.37176777              -0.4210171 -0.16875520
## [19,]  0.588062827   0.55638783              -0.1629894 -0.62098588
## [20,]  0.375359251  -0.76881211              -0.2542915  0.76397058
## [21,] -0.390373621  -0.66482431              -0.3416239 -0.80470459
## [22,]  0.502981397  -0.52989798              -0.5956819 -0.81883680
## [23,] -0.603077197  -0.62443235              -0.3495632 -0.80470459
## [24,] -0.688158628  -0.84873662              -0.6711054 -0.67751471
## [25,]  2.034447142   0.77123866               0.1625224  0.42479757
## [26,] -0.347832906   0.26848771              -0.1034446 -0.50792821
## [27,]  1.906824997   2.38004170              -0.1153535  3.57628013
## [28,] -0.007507185  -0.29614028              -0.1113839 -0.69164692
## [29,] -0.560536482  -0.03058465              -0.2860487  0.21281444
## [30,] -0.773240058  -0.49294364              -0.5440764 -0.71991134
## [31,] -0.688158628  -0.07355481               4.7514448  0.86289604
## [32,] -1.071025064  -0.70779447              -0.4011688 -0.63511809
## [33,] -0.688158628  -0.36403314              -0.6115605  0.93355709
## [34,]  0.035033530   0.18684440              -0.4011688  1.66843194
##       Pencurian dengan Kekerasan   Pencurian   Narkotika
##  [1,]                -0.25633613  0.12704195  0.36707872
##  [2,]                 3.18539092  4.39628889  3.43263203
##  [3,]                -0.03953443  0.79141465 -0.11580249
##  [4,]                 1.19623528  0.50037525  0.40242873
##  [5,]                -0.57069860 -0.19310140 -0.32366058
##  [6,]                 2.00924167  0.37944336  1.04438501
##  [7,]                -0.46771779 -0.59804760 -0.52091366
##  [8,]                 1.12035469  0.18926416  0.31405369
##  [9,]                -0.81460052 -0.73503683 -0.52656967
## [10,]                -0.48397792 -0.57797592 -0.50535966
## [11,]                 0.36154872  0.50087704  3.46727504
## [12,]                 0.35070864  0.39901325  0.04539358
## [13,]                 0.23688774  0.86718525  0.37061372
## [14,]                -0.35931694 -0.19360319 -0.43607363
## [15,]                 0.80599222  1.41564399  1.09741003
## [16,]                -0.53275830 -0.24980390 -0.31305558
## [17,]                -0.74956001 -0.66930207 -0.28901756
## [18,]                 0.49704979 -0.01747417 -0.35759659
## [19,]                -0.81460052 -0.33159601 -0.73230675
## [20,]                -0.74956001 -0.45202611 -0.22750854
## [21,]                -0.57611865 -0.66127340 -0.34416359
## [22,]                 0.94691332 -0.47510854  0.35718071
## [23,]                -0.22381588 -0.64872860  0.19598464
## [24,]                -0.93926150 -0.91066406 -0.58807869
## [25,]                -0.65199924 -0.38177522 -0.69059374
## [26,]                -0.28343635 -0.01697238 -0.52091366
## [27,]                 0.84393252  1.14066193 -0.04510246
## [28,]                -0.81460052 -0.76414077 -0.62554971
## [29,]                -1.02056214 -0.73202608 -0.68988674
## [30,]                -0.96094167 -0.77668558 -0.63756871
## [31,]                -0.91758133 -0.63267125 -0.66089972
## [32,]                -0.96636171 -1.02507265 -0.67645373
## [33,]                -0.20213571 -0.42844188 -0.67645373
## [34,]                 1.84122035  0.76431788 -0.59090669
##       Penipuan, Penggelapan, Korupsi
##  [1,]                    0.031676257
##  [2,]                    3.639561262
##  [3,]                   -0.083105283
##  [4,]                    0.003184386
##  [5,]                   -0.263825154
##  [6,]                    0.549414268
##  [7,]                   -0.435590438
##  [8,]                    0.229491252
##  [9,]                   -0.782377218
## [10,]                   -0.446173133
## [11,]                    2.852371551
## [12,]                    1.384633134
## [13,]                    0.588488835
## [14,]                    0.109011338
## [15,]                    1.404984471
## [16,]                   -0.303713775
## [17,]                   -0.556070352
## [18,]                   -0.175093326
## [19,]                   -0.420937475
## [20,]                   -0.537347122
## [21,]                   -0.631777325
## [22,]                   -0.449429347
## [23,]                   -0.598401133
## [24,]                   -0.829592320
## [25,]                   -0.118923636
## [26,]                   -0.337089967
## [27,]                    0.565695337
## [28,]                   -0.788889646
## [29,]                   -0.508041197
## [30,]                   -0.689575122
## [31,]                   -0.638289753
## [32,]                   -0.848315550
## [33,]                   -0.598401133
## [34,]                   -0.317552684
## attr(,"scaled:center")
##                     Pembunuhan                   Penganiayaan 
##                       26.17647                     1078.58824 
##        Pemerkosaan, Pencabulan                     Penculikan 
##                      201.05882                       57.94118 
##     Pencurian dengan Kekerasan                      Pencurian 
##                      192.29412                     2154.82353 
##                      Narkotika Penipuan, Penggelapan, Korupsi 
##                     1076.79412                     1091.08824 
## attr(,"scaled:scale")
##                     Pembunuhan                   Penganiayaan 
##                       23.50689                     1163.59800 
##        Pemerkosaan, Pencabulan                     Penculikan 
##                      251.91099                       70.76035 
##     Pencurian dengan Kekerasan                      Pencurian 
##                      184.50039                     1992.85731 
##                      Narkotika Penipuan, Penggelapan, Korupsi 
##                     1414.42655                     1228.42053
rownames(projek_scalled) <- make.unique(as.character(projekAnmul$Provinsi))

4.4.3 Nilai Eigen

matrix_cov <- cov(projek_scalled)
matrix_cov
##                                Pembunuhan Penganiayaan Pemerkosaan, Pencabulan
## Pembunuhan                      1.0000000    0.7760740               0.2344847
## Penganiayaan                    0.7760740    1.0000000               0.4108933
## Pemerkosaan, Pencabulan         0.2344847    0.4108933               1.0000000
## Penculikan                      0.4360909    0.4017596               0.1640298
## Pencurian dengan Kekerasan      0.6319310    0.6353462               0.1774853
## Pencurian                       0.6793838    0.8501748               0.3645740
## Narkotika                       0.5390358    0.5728562               0.2173497
## Penipuan, Penggelapan, Korupsi  0.6112830    0.7171206               0.3039822
##                                Penculikan Pencurian dengan Kekerasan Pencurian
## Pembunuhan                      0.4360909                  0.6319310 0.6793838
## Penganiayaan                    0.4017596                  0.6353462 0.8501748
## Pemerkosaan, Pencabulan         0.1640298                  0.1774853 0.3645740
## Penculikan                      1.0000000                  0.3143260 0.3285805
## Pencurian dengan Kekerasan      0.3143260                  1.0000000 0.8206786
## Pencurian                       0.3285805                  0.8206786 1.0000000
## Narkotika                       0.0385149                  0.6663509 0.7336081
## Penipuan, Penggelapan, Korupsi  0.1549786                  0.6792509 0.8454067
##                                Narkotika Penipuan, Penggelapan, Korupsi
## Pembunuhan                     0.5390358                      0.6112830
## Penganiayaan                   0.5728562                      0.7171206
## Pemerkosaan, Pencabulan        0.2173497                      0.3039822
## Penculikan                     0.0385149                      0.1549786
## Pencurian dengan Kekerasan     0.6663509                      0.6792509
## Pencurian                      0.7336081                      0.8454067
## Narkotika                      1.0000000                      0.9108189
## Penipuan, Penggelapan, Korupsi 0.9108189                      1.0000000
nilaivektoreigen_cov = eigen(matrix_cov)
nilaivektoreigen_cov
## eigen() decomposition
## $values
## [1] 4.83104778 1.13178371 0.89961256 0.41589270 0.34454853 0.25208616 0.07640600
## [8] 0.04862257
## 
## $vectors
##            [,1]        [,2]         [,3]       [,4]        [,5]         [,6]
## [1,] -0.3699116  0.21271550 -0.187507748  0.6493880  0.04255967  0.548114389
## [2,] -0.4039877  0.16922687  0.068710671  0.4172618 -0.05259621 -0.555750622
## [3,] -0.1856122  0.23235804  0.913134252 -0.1155246 -0.07972575  0.240654411
## [4,] -0.1807445  0.76370749 -0.256184170 -0.4396715  0.35120036  0.001671903
## [5,] -0.3802651 -0.06539445 -0.242979286 -0.3596426 -0.68914411  0.279671100
## [6,] -0.4306101 -0.04301862  0.004247018 -0.1092868 -0.23170583 -0.413979955
## [7,] -0.3701987 -0.43834784 -0.016215370 -0.2061446  0.42082790  0.262661779
## [8,] -0.4071427 -0.30099690  0.036814236 -0.1172558  0.40002638 -0.119197249
##              [,7]        [,8]
## [1,] -0.232604098 -0.06861638
## [2,]  0.543763967  0.14840236
## [3,] -0.001739878  0.01113396
## [4,]  0.038383028 -0.01797848
## [5,]  0.189626773  0.27137889
## [6,] -0.517217161 -0.55514150
## [7,]  0.447196486 -0.42658357
## [8,] -0.381160328  0.63954611

Berdasarkan output, akan terdapat tiga macam komponen utama yaitu PC1 dari eigenvalue yang bernilai 4,83104778 dan PC2 dari eigenvalue yang bernilai 1,13178371.

4.4.4 Scree Plot Eigen

plot(nilaivektoreigen_cov$values, xlab="Eigenvalue Number", ylab = "Eigenvalue Size", main = "Scree Plot",lwd = 1)+lines(nilaivektoreigen_cov$values)
## integer(0)
axis(1, at = seq(1, length(nilaivektoreigen_cov$values)))  
abline(h = 1, col = "red")
lines(nilaivektoreigen_cov$values)

Pada hasil scree plot diatas, dapat diketahui bahwa terdapat 2 jumlah komponen utama, yaitu PC1 dan PC2. Hal ini dapat dilihat pada eigenvalue size lebih dari 1 sehingga mendapatkan hasil bahwa eigenvalue number yang terbentuk sebanyak 2. Serta dapat dilihat titik ekstrim dimana garis kurva mulai melandai ditunjukkan pada komponen ke 2.

4.4.5 Kumulatif Eigen

kumeigen_cov <- for (eg in nilaivektoreigen_cov$values){
  +   print(eg/sum(nilaivektoreigen_cov$values))}
## [1] 0.603881
## [1] 0.141473
## [1] 0.1124516
## [1] 0.05198659
## [1] 0.04306857
## [1] 0.03151077
## [1] 0.009550749
## [1] 0.006077821

Berdasarkan hasil kumulatif nilai eigen, dapat diketahui bahwa keragaman sudah dapat dijelaskan melalui 2 komponen utama yaitu 0,603881 + 0,141473 = 0,745354 Nilai kumulatif keragaman sekitar 75% sehingga dapat disusun dua komponen utama dari PC1 dan PC2.

4.4.6 Persamaan PC

PCMatrix_cov <- nilaivektoreigen_cov$vectors[,1:2]
PCMatrix_cov
##            [,1]        [,2]
## [1,] -0.3699116  0.21271550
## [2,] -0.4039877  0.16922687
## [3,] -0.1856122  0.23235804
## [4,] -0.1807445  0.76370749
## [5,] -0.3802651 -0.06539445
## [6,] -0.4306101 -0.04301862
## [7,] -0.3701987 -0.43834784
## [8,] -0.4071427 -0.30099690

Berdasarkan output dari Persamaan Komponen Utama diatas, dapat dituliskan ke dalam bentuk persamaan:

\[ \text{PC1} = -0.3699 x_1 - 0.4039 x_2 - 0.1856 x_3 - 0.1807 x_4 - 0.3802 x_5 - 0.4306 x_6 - 0.3701 x_7 - 0.4071 x_8 \]

\[ \text{PC2} = 0.2127 x_1 + 0.1692 x_2 + 0.2324 x_3 + 0.7637 x_4 - 0.0654 x_5 - 0.0430 x_6 - 0.4383 x_7 - 0.3009 x_8 \]

4.4.7 Fungsi PCA dengan prcomp

pcamodel <- prcomp(projek_scalled, scale = TRUE, center=T)
summary(pcamodel)
## Importance of components:
##                           PC1    PC2    PC3     PC4     PC5     PC6     PC7
## Standard deviation     2.1980 1.0639 0.9485 0.64490 0.58698 0.50208 0.27642
## Proportion of Variance 0.6039 0.1415 0.1124 0.05199 0.04307 0.03151 0.00955
## Cumulative Proportion  0.6039 0.7453 0.8578 0.90979 0.95286 0.98437 0.99392
##                            PC8
## Standard deviation     0.22051
## Proportion of Variance 0.00608
## Cumulative Proportion  1.00000
print(round(pcamodel$rotation[,1:2],3))
##                                  PC1    PC2
## Pembunuhan                     0.370 -0.213
## Penganiayaan                   0.404 -0.169
## Pemerkosaan, Pencabulan        0.186 -0.232
## Penculikan                     0.181 -0.764
## Pencurian dengan Kekerasan     0.380  0.065
## Pencurian                      0.431  0.043
## Narkotika                      0.370  0.438
## Penipuan, Penggelapan, Korupsi 0.407  0.301

Berdasarkan output fungsi prcomp didapatkan hasil yang sama seperti langkah sebelumnya. Didapatkan 2 komponen utama yaitu PC1 dan PC2.Hal ini karena 2 komponen utama telah menangkap minimal 70% varians data. Kedua komponen utama telah mampu menangkap 74,53% dari total keragaman data.

4.4.8 Plot Efek

fviz_eig(pcamodel, addlabels = TRUE, ylim = c(0, 85))

Berdasrkan plot efek dari setiap PCA, dapat diketahui seberapa besar persentase penjelasan keragaman mulai dari PCA 1 sampai PCA 8. Persentase penjelasan keragaman pada PCA 1 sebesar 60.4%, PCA 2 sebesar 14.1%, PCA 3 sebesar 11.2%, PCA 4 sebesar 5.2%, PCA 5 sebesar 4.3%, PCA 6 sebesar 3.2%, PCA 7 sebesar 1%, dan PCA 8 sebesar 0.6%.

4.4.9 Plot Kontribusi Variabel

fviz_pca_var(pcamodel,
             col.var = "cos2",
             gradient.cols = c("navy", "magenta", "darkorange"),
             repel = TRUE)

Berdasarkan output dari plot kontribusi variabel, representasi variabel yang baik pada komponen utama ditunjukkan oleh variabel Pencurian dan Narkotika karena memiliki nilai cos2 yang tinggi. Variabel Pemerkosaan, Pencabulan memiliki nilai cos2 yang sangat rendah sehingga variabel tersebut dianggap kurang penting untuk komponen utama. Berdasarkan jarak antar sudut juga dapat diketahui bahwa variabel Penganiayaan dan Pembunuhan memiliki hubungan yang sangat erat karena jarak antar sudutnya kecil. Begitu pula pada variabel yang lain.

4.4.10 Kontribusi Variabel pada PC1 dan PC2

PC1 <- fviz_contrib(pcamodel, choice = "var", axes = 1)
PC2 <- fviz_contrib(pcamodel, choice = "var", axes = 2)
grid.arrange(PC1,PC2, ncol=2,
             top='Contribution of the variables to PCs')

Berdasarkan grafik di atas dapat diketahui bahwa: Pada komponen utama pertama, variabel yang memberikan kontribusi terbanyak yaitu Pencurian, Penipuan, Penggelapan, Korupsi, Penganiayaan, Pencurian dengan Kekerasan, Narkotika, dan Pembunuhan. Komponen utama ini dapat disebut sebagai faktor kejahatan umum dan kekerasan. Pada komponen utama kedua, variabel yang memberikan kontribusi terbanyak yaitu Penculikan dan Narkotika. Komponen utama ini dapat disebut sebagai faktor kejahatan khusus dan terencana.

4.4.11 Plot Individu

fviz_pca_ind(pcamodel,
             col.ind = "cos2",
             gradient.cols = c("gold", "purple", "brown"),
             repel = TRUE)

Provinsi dengan warna coklat memiliki nilai cos2 yang sangat tinggi seperti Kalimantan Tengah, Kepulauan Riau, Jambi, dan lainnya. Sedangkan provinsi Maluku dan Nusa Tenggara Timur memiliki nilai cos2 yang sangat rendah. Hal ini menunjukkan bahwa data dengan cos2 rendah tidak direpresentasikan dengan baik oleh komponen utama. Selain itu jarak yang jauh antara provinsi DKI Jakarta dan Maluku menunjukkan tidak adanya kemiripan antar data. Sebaliknya, jarak plot yang dekat menunjukkan adanya kemiripan seperti pada provinsi Kalimantan Tengah dan Kepulauan Riau.

4.4.12 Biplot

fviz_pca_biplot(pcamodel, axes = c(1,2), repel = TRUE, col.var = "darkorange", col.ind = "darkgreen" )

Berdasarkan output biplot, dapat diketahui bahwa data DKI Jakarta dan Sumatera Utara memiliki jarak Euclidean yang cukup panjang dibandingkan data yang lainnya. Variabel Penculikan dan Pembunuhan serta Pencurian dan Penipuan, Penggelapan, Korupsi memiliki hubungan yang sangat kuat atau korelasi yang sangat tinggi. Begitu pula dengan variabel lain yang memiliki jarak sudut yang sempit. Sebaliknya, variabel Narkotika dan Pemerkosaan, Pencabulan memiliki jarak sudut yang lebar sehingga kedua variabel memiliki hubungan yang lemah.

4.5 Cluster Hierarki

4.5.1 Data untuk Clustering

pca_model <- prcomp(projek_scalled, center=FALSE, scale.=FALSE, rank. = 2)
results <- pca_model$x
results
##                                   PC1          PC2
## Aceh                       -0.0767488  0.525570356
## Sumatera Utara              9.1980943  1.096054751
## Sumatera Barat              0.5441859 -0.589573734
## Riau                        0.4278263  0.966070998
## Jambi                      -1.1786538  0.600081558
## Sumatera Selatan            2.6922947 -0.627358213
## Bengkulu                   -1.1203773  0.310082584
## Lampung                     0.4765048  0.538226372
## Kepualauan Bangka Belitung -1.8544822 -0.014198147
## Kepulauan Riau             -1.4183057  0.488484237
## DKI Jakarta                 2.8846138  2.689046349
## Jawa Barat                  0.9210611  0.829249977
## Jawa Tengah                 0.6477222  0.829267603
## DI Yogyakarta              -0.9850605  0.494946096
## Jawa Timur                  2.8055211 -0.626265906
## Banten                     -0.8800831 -0.922289374
## Bali                       -1.6929075  0.615035348
## Nusa Tenggara Barat        -0.5198423  0.249250680
## Nusa Tenggara Timur        -0.5952208 -0.222363506
## Kalimantan Barat           -0.8635358 -0.804034739
## Kalimantan Tengah          -1.5103014  0.482334233
## Kalimantan Selatan         -0.1818423  0.809221241
## Kalimantan Timur           -1.2212173  0.792986189
## Kalimantan Utara           -2.1492374  0.355285096
## Sulawesi Utara              0.4546780 -1.323033710
## Sulawesi Tengah            -0.5763822  0.091429157
## Sulawesi Selatan            3.3175668 -3.258046649
## Sulawesi Tenggara          -1.4596788  0.008004322
## Gorontalo                  -1.3998763 -0.525210754
## Sulawesi Barat             -1.9329247  0.340832619
## Maluku                     -0.3722810 -2.173255674
## Maluku Utara               -2.2760689  0.266706415
## Papua Barat                -1.1018141 -0.871165782
## Papua                       0.9967729 -1.421369992

4.5.2 Jarak Euclidean

jarak <- dist(projek_scalled, method = "euclidean")
jarak
##                                  Aceh Sumatera Utara Sumatera Barat       Riau
## Sumatera Utara              9.4070010                                         
## Sumatera Barat              1.4007996      8.9423506                          
## Riau                        1.5734301      9.0283339      2.0460467           
## Jambi                       1.2766331     10.5157367      2.2066756  2.1136184
## Sumatera Selatan            3.9407864      7.5396295      3.5547689  3.5214977
## Bengkulu                    1.7183969     10.4982717      2.4977469  2.4482905
## Lampung                     1.5064318      9.0319134      1.8735137  0.8523607
## Kepualauan Bangka Belitung  1.9900393     11.2790736      2.6497968  2.8294050
## Kepulauan Riau              1.5146816     10.7369280      2.4302865  2.2878054
## DKI Jakarta                 4.3450711      7.4574362      4.8377094  4.3698545
## Jawa Barat                  1.6831663      8.4593406      2.0284364  1.9510891
## Jawa Tengah                 1.5133462      8.7602820      1.9508201  1.6983176
## DI Yogyakarta               1.2209548     10.3690599      2.0320338  1.9825077
## Jawa Timur                  3.5378835      7.2618815      2.8955759  3.5281691
## Banten                      2.1355676     10.6425388      2.0104145  2.8909151
## Bali                        1.6815213     11.0216493      2.6584669  2.5307043
## Nusa Tenggara Barat         1.3305786      9.9880857      1.7769443  1.3244355
## Nusa Tenggara Timur         1.8419890      9.9796489      2.1768777  2.8114482
## Kalimantan Barat            2.0662306     10.5395323      2.2048226  2.9670804
## Kalimantan Tengah           1.6275275     10.8424152      2.5691219  2.4254370
## Kalimantan Selatan          2.0229527      9.7402022      2.7399566  1.6533245
## Kalimantan Timur            1.4013639     10.5827856      2.5166807  2.0248881
## Kalimantan Utara            2.2052692     11.5046817      3.0382176  3.0107298
## Sulawesi Utara              2.9985170      9.3655029      2.7323921  3.7631398
## Sulawesi Tengah             1.0239840      9.8908727      1.5418535  1.9017098
## Sulawesi Selatan            5.4279758      7.8710447      4.3299384  5.5733955
## Sulawesi Tenggara           1.8118402     10.7977526      2.5188930  2.7757695
## Gorontalo                   1.8196723     10.8576257      2.1837313  2.9426150
## Sulawesi Barat              1.9585063     11.2544606      2.7852109  2.8606278
## Maluku                      5.0636543     10.8880298      4.8252417  5.8702463
## Maluku Utara                2.2457113     11.6064692      3.0508893  3.0996369
## Papua Barat                 2.0996958     10.7693476      2.0558014  2.6740278
## Papua                       3.2714595      9.1718424      2.4253157  2.7304962
##                                 Jambi Sumatera Selatan   Bengkulu    Lampung
## Sumatera Utara                                                              
## Sumatera Barat                                                              
## Riau                                                                        
## Jambi                                                                       
## Sumatera Selatan            4.6706974                                       
## Bengkulu                    1.0759399        4.3408082                      
## Lampung                     2.1332157        3.1347549  2.2774540           
## Kepualauan Bangka Belitung  1.0320955        5.0022823  1.3299219  2.7086368
## Kepulauan Riau              0.5170702        4.7654552  0.8519546  2.2447799
## DKI Jakarta                 5.1942502        4.4774386  5.4303349  4.3002500
## Jawa Barat                  2.5009603        3.7860322  2.7208206  1.7137860
## Jawa Tengah                 2.2115158        3.5651831  2.3335369  1.3835887
## DI Yogyakarta               0.5664217        4.5645595  1.3933799  1.9270298
## Jawa Timur                  4.4206475        2.1256104  4.4411141  3.1319027
## Banten                      2.0129901        4.3564031  2.4132232  2.6022183
## Bali                        0.6371532        5.0712351  1.2272484  2.5411002
## Nusa Tenggara Barat         1.2139985        3.9139043  1.6327789  1.2633662
## Nusa Tenggara Timur         1.7269921        4.2780294  1.2448911  2.7039468
## Kalimantan Barat            1.8724600        3.9825692  1.6561117  2.5494421
## Kalimantan Tengah           0.7099457        4.7663162  0.7562392  2.3422068
## Kalimantan Selatan          2.0554190        3.3404397  1.6983494  1.5568059
## Kalimantan Timur            0.8824173        4.5561069  1.1886534  2.0054272
## Kalimantan Utara            1.0987786        5.3253199  1.2866831  2.9588864
## Sulawesi Utara              3.2620283        3.4505656  2.5887660  3.3804718
## Sulawesi Tengah             1.0017755        4.2185840  1.2496459  1.9000661
## Sulawesi Selatan            6.1293803        3.5858830  6.0188237  5.2880790
## Sulawesi Tenggara           1.1663899        4.7477980  0.7069269  2.6295673
## Gorontalo                   1.3274831        4.8059137  1.5357425  2.7640047
## Sulawesi Barat              0.8891800        5.2646725  1.2339227  2.8450758
## Maluku                      5.5656344        6.7856806  5.5155042  5.3787791
## Maluku Utara                1.2531518        5.5487951  1.5954633  3.0506142
## Papua Barat                 1.7577568        4.3407733  2.0519273  2.4540310
## Papua                       3.6454007        2.9156172  3.7258046  2.5149921
##                            Kepualauan Bangka Belitung Kepulauan Riau
## Sumatera Utara                                                      
## Sumatera Barat                                                      
## Riau                                                                
## Jambi                                                               
## Sumatera Selatan                                                    
## Bengkulu                                                            
## Lampung                                                             
## Kepualauan Bangka Belitung                                          
## Kepulauan Riau                              0.9140090               
## DKI Jakarta                                 5.8570419      5.4790554
## Jawa Barat                                  3.3089383      2.6714994
## Jawa Tengah                                 2.9613243      2.4309486
## DI Yogyakarta                               1.2560001      0.8393313
## Jawa Timur                                  4.8508500      4.6838638
## Banten                                      1.6946701      2.1722500
## Bali                                        0.7540374      0.5158707
## Nusa Tenggara Barat                         1.6868656      1.3414633
## Nusa Tenggara Timur                         2.0494444      1.6435024
## Kalimantan Barat                            1.5242682      1.8977194
## Kalimantan Tengah                           0.8425185      0.3710065
## Kalimantan Selatan                          2.4483196      1.9970717
## Kalimantan Timur                            1.1962547      0.7805078
## Kalimantan Utara                            0.5785222      0.8543210
## Sulawesi Utara                              3.3761069      3.2110983
## Sulawesi Tengah                             1.6163478      1.0663505
## Sulawesi Selatan                            6.2688703      6.2853705
## Sulawesi Tenggara                           1.1157859      0.8335375
## Gorontalo                                   0.9889717      1.2640663
## Sulawesi Barat                              0.6828039      0.6542985
## Maluku                                      5.4926705      5.4222940
## Maluku Utara                                0.7455717      0.9817129
## Papua Barat                                 1.3777920      1.8075788
## Papua                                       3.7913684      3.7624728
##                            DKI Jakarta Jawa Barat Jawa Tengah DI Yogyakarta
## Sumatera Utara                                                             
## Sumatera Barat                                                             
## Riau                                                                       
## Jambi                                                                      
## Sumatera Selatan                                                           
## Bengkulu                                                                   
## Lampung                                                                    
## Kepualauan Bangka Belitung                                                 
## Kepulauan Riau                                                             
## DKI Jakarta                                                                
## Jawa Barat                   3.9068462                                     
## Jawa Tengah                  4.0828728  1.4124157                          
## DI Yogyakarta                5.0557865  2.2036843   2.1153303              
## Jawa Timur                   3.7793925  3.2059290   3.0597127     4.2096273
## Banten                       5.4941440  3.2111392   3.0066482     1.8175231
## Bali                         5.5251732  2.9757599   2.7208325     0.9919790
## Nusa Tenggara Barat          5.0404960  2.2029909   1.9823589     0.9862447
## Nusa Tenggara Timur          5.5400720  2.6911352   2.6187513     1.9398831
## Kalimantan Barat             5.4591037  3.1914168   2.6755232     1.9444848
## Kalimantan Tengah            5.5181306  2.8687489   2.4880048     1.1110898
## Kalimantan Selatan           4.7861180  2.7419648   2.2197852     2.1838594
## Kalimantan Timur             5.1054732  2.7294690   2.3311148     1.1684211
## Kalimantan Utara             6.0097193  3.4683590   3.1375581     1.4427403
## Sulawesi Utara               5.6772703  3.3688503   3.2743497     3.3361130
## Sulawesi Tengah              5.2150194  2.1211183   2.0537225     1.0470816
## Sulawesi Selatan             6.3971687  5.3891401   5.5677456     5.9457589
## Sulawesi Tenggara            5.7956635  2.9903738   2.6955068     1.5070839
## Gorontalo                    5.7563910  3.0300333   2.9735195     1.3645131
## Sulawesi Barat               5.8847017  3.2051617   2.9928604     1.2202607
## Maluku                       7.7938460  5.1522800   5.1788817     5.4400750
## Maluku Utara                 6.1495435  3.4824006   3.2712242     1.4809593
## Papua Barat                  5.7790340  3.2078292   3.0237069     1.6100118
## Papua                        5.7480764  3.5152688   3.3730650     3.4035417
##                            Jawa Timur     Banten       Bali Nusa Tenggara Barat
## Sumatera Utara                                                                 
## Sumatera Barat                                                                 
## Riau                                                                           
## Jambi                                                                          
## Sumatera Selatan                                                               
## Bengkulu                                                                       
## Lampung                                                                        
## Kepualauan Bangka Belitung                                                     
## Kepulauan Riau                                                                 
## DKI Jakarta                                                                    
## Jawa Barat                                                                     
## Jawa Tengah                                                                    
## DI Yogyakarta                                                                  
## Jawa Timur                                                                     
## Banten                      3.8296409                                          
## Bali                        4.9148682  2.1500482                               
## Nusa Tenggara Barat         3.8114007  1.8346200  1.6063142                    
## Nusa Tenggara Timur         4.2774241  2.6548240  1.9643317           2.1620541
## Kalimantan Barat            3.7849887  1.3806339  2.0058908           1.9972069
## Kalimantan Tengah           4.7387149  2.2299613  0.5548532           1.5286188
## Kalimantan Selatan          3.9597006  2.9849514  2.2816241           1.6719368
## Kalimantan Timur            4.5629537  2.2716558  0.7873641           1.3707507
## Kalimantan Utara            5.2526589  2.2597397  0.6235822           1.9730582
## Sulawesi Utara              3.6545491  3.2948684  3.5380183           3.2785830
## Sulawesi Tengah             4.0338947  2.0888890  1.4019648           1.1732723
## Sulawesi Selatan            3.2648178  5.0256965  6.5186169           5.5058303
## Sulawesi Tenggara           4.7705772  2.3361075  1.0812005           1.8731459
## Gorontalo                   4.5283327  1.4670153  1.2793258           1.8227611
## Sulawesi Barat              5.1257257  2.2048279  0.4590131           1.8425810
## Maluku                      6.2805609  5.3137819  5.5761089           5.5313289
## Maluku Utara                5.4156827  2.2732754  0.7130817           2.0551154
## Papua Barat                 4.1116267  0.7378578  1.8607800           1.4805009
## Papua                       3.0206937  2.8229481  4.0268939           2.5775388
##                            Nusa Tenggara Timur Kalimantan Barat
## Sumatera Utara                                                 
## Sumatera Barat                                                 
## Riau                                                           
## Jambi                                                          
## Sumatera Selatan                                               
## Bengkulu                                                       
## Lampung                                                        
## Kepualauan Bangka Belitung                                     
## Kepulauan Riau                                                 
## DKI Jakarta                                                    
## Jawa Barat                                                     
## Jawa Tengah                                                    
## DI Yogyakarta                                                  
## Jawa Timur                                                     
## Banten                                                         
## Bali                                                           
## Nusa Tenggara Barat                                            
## Nusa Tenggara Timur                                            
## Kalimantan Barat                     2.0037326                 
## Kalimantan Tengah                    1.6955911        1.7781791
## Kalimantan Selatan                   2.3926858        2.4337912
## Kalimantan Timur                     2.0553664        1.9864981
## Kalimantan Utara                     2.0983694        1.9623520
## Sulawesi Utara                       1.8600320        2.4118625
## Sulawesi Tengah                      1.1865731        1.9422182
## Sulawesi Selatan                     5.3896315        5.1492625
## Sulawesi Tenggara                    1.1929144        1.6830349
## Gorontalo                            1.6082085        1.4464290
## Sulawesi Barat                       1.8465962        2.0056603
## Maluku                               5.3416037        5.1904255
## Maluku Utara                         2.2577359        2.1790850
## Papua Barat                          2.3479440        1.3988660
## Papua                                3.7450849        3.2001137
##                            Kalimantan Tengah Kalimantan Selatan
## Sumatera Utara                                                 
## Sumatera Barat                                                 
## Riau                                                           
## Jambi                                                          
## Sumatera Selatan                                               
## Bengkulu                                                       
## Lampung                                                        
## Kepualauan Bangka Belitung                                     
## Kepulauan Riau                                                 
## DKI Jakarta                                                    
## Jawa Barat                                                     
## Jawa Tengah                                                    
## DI Yogyakarta                                                  
## Jawa Timur                                                     
## Banten                                                         
## Bali                                                           
## Nusa Tenggara Barat                                            
## Nusa Tenggara Timur                                            
## Kalimantan Barat                                               
## Kalimantan Tengah                                              
## Kalimantan Selatan                 1.9391884                   
## Kalimantan Timur                   0.6812386          1.6558998
## Kalimantan Utara                   0.7347984          2.5162545
## Sulawesi Utara                     3.1897933          3.1515301
## Sulawesi Tengah                    1.2792789          2.0512400
## Sulawesi Selatan                   6.3702002          5.8137701
## Sulawesi Tenggara                  0.7208501          2.1985054
## Gorontalo                          1.3442544          2.7526920
## Sulawesi Barat                     0.6893058          2.5338927
## Maluku                             5.4199904          6.1335451
## Maluku Utara                       0.9692178          2.7877094
## Papua Barat                        1.8918708          2.6325931
## Papua                              3.8809430          3.1951933
##                            Kalimantan Timur Kalimantan Utara Sulawesi Utara
## Sumatera Utara                                                             
## Sumatera Barat                                                             
## Riau                                                                       
## Jambi                                                                      
## Sumatera Selatan                                                           
## Bengkulu                                                                   
## Lampung                                                                    
## Kepualauan Bangka Belitung                                                 
## Kepulauan Riau                                                             
## DKI Jakarta                                                                
## Jawa Barat                                                                 
## Jawa Tengah                                                                
## DI Yogyakarta                                                              
## Jawa Timur                                                                 
## Banten                                                                     
## Bali                                                                       
## Nusa Tenggara Barat                                                        
## Nusa Tenggara Timur                                                        
## Kalimantan Barat                                                           
## Kalimantan Tengah                                                          
## Kalimantan Selatan                                                         
## Kalimantan Timur                                                           
## Kalimantan Utara                  1.1940667                                
## Sulawesi Utara                    3.4567130        3.5811635               
## Sulawesi Tengah                   1.4128000        1.7863010      2.6858965
## Sulawesi Selatan                  6.3505593        6.7224958      4.2490682
## Sulawesi Tenggara                 1.2670998        1.0593428      2.6937105
## Gorontalo                         1.6818204        1.3337526      2.8342443
## Sulawesi Barat                    1.1636672        0.4384469      3.4453968
## Maluku                            5.5072035        5.7006554      5.4571515
## Maluku Utara                      1.3319017        0.5129319      3.7838517
## Papua Barat                       1.9938375        1.9160343      3.1613476
## Papua                             3.7607940        4.2391748      3.7124938
##                            Sulawesi Tengah Sulawesi Selatan Sulawesi Tenggara
## Sumatera Utara                                                               
## Sumatera Barat                                                               
## Riau                                                                         
## Jambi                                                                        
## Sumatera Selatan                                                             
## Bengkulu                                                                     
## Lampung                                                                      
## Kepualauan Bangka Belitung                                                   
## Kepulauan Riau                                                               
## DKI Jakarta                                                                  
## Jawa Barat                                                                   
## Jawa Tengah                                                                  
## DI Yogyakarta                                                                
## Jawa Timur                                                                   
## Banten                                                                       
## Bali                                                                         
## Nusa Tenggara Barat                                                          
## Nusa Tenggara Timur                                                          
## Kalimantan Barat                                                             
## Kalimantan Tengah                                                            
## Kalimantan Selatan                                                           
## Kalimantan Timur                                                             
## Kalimantan Utara                                                             
## Sulawesi Utara                                                               
## Sulawesi Tengah                                                              
## Sulawesi Selatan                 5.4658519                                   
## Sulawesi Tenggara                1.2344673        6.1312853                  
## Gorontalo                        1.3416161        5.6385271         1.1624913
## Sulawesi Barat                   1.4744063        6.5527376         0.9190653
## Maluku                           5.1549459        7.2026858         5.1602671
## Maluku Utara                     1.8300678        6.8253565         1.2185811
## Papua Barat                      1.7664538        5.1772738         1.9713053
## Papua                            3.1793548        3.7748563         3.9372529
##                             Gorontalo Sulawesi Barat     Maluku Maluku Utara
## Sumatera Utara                                                              
## Sumatera Barat                                                              
## Riau                                                                        
## Jambi                                                                       
## Sumatera Selatan                                                            
## Bengkulu                                                                    
## Lampung                                                                     
## Kepualauan Bangka Belitung                                                  
## Kepulauan Riau                                                              
## DKI Jakarta                                                                 
## Jawa Barat                                                                  
## Jawa Tengah                                                                 
## DI Yogyakarta                                                               
## Jawa Timur                                                                  
## Banten                                                                      
## Bali                                                                        
## Nusa Tenggara Barat                                                         
## Nusa Tenggara Timur                                                         
## Kalimantan Barat                                                            
## Kalimantan Tengah                                                           
## Kalimantan Selatan                                                          
## Kalimantan Timur                                                            
## Kalimantan Utara                                                            
## Sulawesi Utara                                                              
## Sulawesi Tengah                                                             
## Sulawesi Selatan                                                            
## Sulawesi Tenggara                                                           
## Gorontalo                                                                   
## Sulawesi Barat              1.1121219                                       
## Maluku                      5.0848169      5.5458764                        
## Maluku Utara                1.2869479      0.5008846  5.4353501             
## Papua Barat                 1.2341936      1.8625933  5.4227855    1.9422235
## Papua                       3.6067965      4.1481810  6.1204139    4.3247601
##                            Papua Barat
## Sumatera Utara                        
## Sumatera Barat                        
## Riau                                  
## Jambi                                 
## Sumatera Selatan                      
## Bengkulu                              
## Lampung                               
## Kepualauan Bangka Belitung            
## Kepulauan Riau                        
## DKI Jakarta                           
## Jawa Barat                            
## Jawa Tengah                           
## DI Yogyakarta                         
## Jawa Timur                            
## Banten                                
## Bali                                  
## Nusa Tenggara Barat                   
## Nusa Tenggara Timur                   
## Kalimantan Barat                      
## Kalimantan Tengah                     
## Kalimantan Selatan                    
## Kalimantan Timur                      
## Kalimantan Utara                      
## Sulawesi Utara                        
## Sulawesi Tengah                       
## Sulawesi Selatan                      
## Sulawesi Tenggara                     
## Gorontalo                             
## Sulawesi Barat                        
## Maluku                                
## Maluku Utara                          
## Papua Barat                           
## Papua                        2.6636352

4.5.3 Koefisien Korelasi

ds <- hclust(dist(results,method = 'euclidean'),method = "single")
da <- hclust(dist(results,method = 'euclidean'),method = "average")
dc <- hclust(dist(results,method = 'euclidean'),method = "complete")
dw <- hclust(dist(results,method = 'euclidean'),method = "ward.D")
linkage <- c("single", "average", "complete", "ward")
names(linkage) <- c("single","average","complete","ward")
ac <- function(x) {
  agnes(results, method = x)$ac
} 
map_dbl(linkage,ac)
##    single   average  complete      ward 
## 0.9051577 0.9175915 0.9207571 0.9441308

Nilai-nilai korelasi yang dihasilkan menunjukkan tingkat kemiripan atau hubungan antara hasil clustering yang diperoleh dari masing-masing metode. Metode ward menghasilkan koefisien yang paling optimum (0.9441308) mendekati 1, maka dipilih hasil clustering dengan metode ward linkage.

4.5.4 Indeks Validitas

validity <- clValid(results, 2:9, clMethods = "hierarchical", 
                         validation = "internal", metric = "euclidean", method = "ward")
## The "ward" method has been renamed to "ward.D"; note new "ward.D2"
summary(validity)
## 
## Clustering Methods:
##  hierarchical 
## 
## Cluster sizes:
##  2 3 4 5 6 7 8 9 
## 
## Validation Measures:
##                                  2       3       4       5       6       7       8       9
##                                                                                           
## hierarchical Connectivity   8.8377 18.1433 20.2266 25.5726 25.9393 28.3933 30.1433 35.2651
##              Dunn           0.2559  0.0624  0.0766  0.0766  0.1689  0.1689  0.2475  0.2496
##              Silhouette     0.6169  0.3158  0.3375  0.4008  0.4256  0.4110  0.4336  0.4188
## 
## Optimal Scores:
## 
##              Score  Method       Clusters
## Connectivity 8.8377 hierarchical 2       
## Dunn         0.2559 hierarchical 2       
## Silhouette   0.6169 hierarchical 2

Berdasarkan output di atas, dapat disimpulkan bahwa clustering hierarki akan dilakukan dengan 2 cluster, karena seluruh indeks validitas memberikan jumlah cluster optimal sebanyak 2.

4.5.5 Dendogram

clus_hier <- eclust(results, FUNcluster = "hclust", k = 2, hc_method = "ward.D", graph = TRUE, sub = " ", xlab = "Provinsi", ylab = "Jarak")
fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

klaster <- cutree(dw, 2) 
tabel <- data.frame(projekAnmul$Provinsi,results,klaster)
tabel
##                                  projekAnmul.Provinsi        PC1          PC2
## Aceh                                             Aceh -0.0767488  0.525570356
## Sumatera Utara                         Sumatera Utara  9.1980943  1.096054751
## Sumatera Barat                         Sumatera Barat  0.5441859 -0.589573734
## Riau                                             Riau  0.4278263  0.966070998
## Jambi                                           Jambi -1.1786538  0.600081558
## Sumatera Selatan                     Sumatera Selatan  2.6922947 -0.627358213
## Bengkulu                                     Bengkulu -1.1203773  0.310082584
## Lampung                                       Lampung  0.4765048  0.538226372
## Kepualauan Bangka Belitung Kepualauan Bangka Belitung -1.8544822 -0.014198147
## Kepulauan Riau                         Kepulauan Riau -1.4183057  0.488484237
## DKI Jakarta                               DKI Jakarta  2.8846138  2.689046349
## Jawa Barat                                 Jawa Barat  0.9210611  0.829249977
## Jawa Tengah                               Jawa Tengah  0.6477222  0.829267603
## DI Yogyakarta                           DI Yogyakarta -0.9850605  0.494946096
## Jawa Timur                                 Jawa Timur  2.8055211 -0.626265906
## Banten                                         Banten -0.8800831 -0.922289374
## Bali                                             Bali -1.6929075  0.615035348
## Nusa Tenggara Barat               Nusa Tenggara Barat -0.5198423  0.249250680
## Nusa Tenggara Timur               Nusa Tenggara Timur -0.5952208 -0.222363506
## Kalimantan Barat                     Kalimantan Barat -0.8635358 -0.804034739
## Kalimantan Tengah                   Kalimantan Tengah -1.5103014  0.482334233
## Kalimantan Selatan                 Kalimantan Selatan -0.1818423  0.809221241
## Kalimantan Timur                     Kalimantan Timur -1.2212173  0.792986189
## Kalimantan Utara                     Kalimantan Utara -2.1492374  0.355285096
## Sulawesi Utara                         Sulawesi Utara  0.4546780 -1.323033710
## Sulawesi Tengah                       Sulawesi Tengah -0.5763822  0.091429157
## Sulawesi Selatan                     Sulawesi Selatan  3.3175668 -3.258046649
## Sulawesi Tenggara                   Sulawesi Tenggara -1.4596788  0.008004322
## Gorontalo                                   Gorontalo -1.3998763 -0.525210754
## Sulawesi Barat                         Sulawesi Barat -1.9329247  0.340832619
## Maluku                                         Maluku -0.3722810 -2.173255674
## Maluku Utara                             Maluku Utara -2.2760689  0.266706415
## Papua Barat                               Papua Barat -1.1018141 -0.871165782
## Papua                                           Papua  0.9967729 -1.421369992
##                            klaster
## Aceh                             1
## Sumatera Utara                   2
## Sumatera Barat                   1
## Riau                             1
## Jambi                            1
## Sumatera Selatan                 2
## Bengkulu                         1
## Lampung                          1
## Kepualauan Bangka Belitung       1
## Kepulauan Riau                   1
## DKI Jakarta                      2
## Jawa Barat                       1
## Jawa Tengah                      1
## DI Yogyakarta                    1
## Jawa Timur                       2
## Banten                           1
## Bali                             1
## Nusa Tenggara Barat              1
## Nusa Tenggara Timur              1
## Kalimantan Barat                 1
## Kalimantan Tengah                1
## Kalimantan Selatan               1
## Kalimantan Timur                 1
## Kalimantan Utara                 1
## Sulawesi Utara                   1
## Sulawesi Tengah                  1
## Sulawesi Selatan                 2
## Sulawesi Tenggara                1
## Gorontalo                        1
## Sulawesi Barat                   1
## Maluku                           1
## Maluku Utara                     1
## Papua Barat                      1
## Papua                            1

Berdasarkan output diatas didapatkan 2 cluster:

  • Cluster 1 (29 provinsi): Aceh, Sumatera Barat, Jambi, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, Riau, Jawa Barat, Jawa Tengah, DI Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Kalimantan Selatan, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua, Papua Barat

  • Cluster 2 (5 provinsi): Sumatera Utara, DKI Jakarta, Sumatera Selatan, Sulawesi Selatan, Jawa Timur

4.5.6 Karakteristik Cluster

hist.kluster1 <- subset(tabel,klaster==1)
hist.kluster2 <- subset(tabel,klaster==2)
hist.kluster_1 <- sapply(hist.kluster1,mean)
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
hist.kluster_2 <- sapply(hist.kluster2,mean)
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
mean_total=rbind(hist.kluster_1,hist.kluster_2)
mean_total
##                projekAnmul.Provinsi        PC1         PC2 klaster
## hist.kluster_1                   NA -0.7206238  0.02505413       1
## hist.kluster_2                   NA  4.1796181 -0.14531393       2

Berdasarkan hasil di atas dapat diketahui bahwa cluster 1 memiliki nilai yang lebih rendah dibandingkan cluster 2. Artinya, provinsi yang tergolong cluster 1 termasuk provinsi dengan tingkat kriminalitas yang rendah sedangkan provinsi yang tergolong cluster 2 termasuk provinsi dengan tingkat kriminalitas yang tinggi.

4.6 Cluster Non-Hierarki (K-Means)

4.6.1 Jumlah Cluster Optimal (Silhouette Method)

fviz_nbclust(results, kmeans, method = "silhouette") + labs(title = "Silhouette Method")

Berdasarkan grafik Silhouette di atas, nilai tertinggi dicapai ketika jumlah cluster adalah 2. Hal ini menunjukkan bahwa pembagian data menjadi 2 cluster memberikan hasil pengelompokan terbaik.

4.6.2 K-Means Clustering

fviz_cluster(km2, data = results)

km2 <- kmeans(results, centers = 2)
km2
## K-means clustering with 2 clusters of sizes 29, 5
## 
## Cluster means:
##          PC1         PC2
## 1 -0.7206238  0.02505413
## 2  4.1796181 -0.14531393
## 
## Clustering vector:
##                       Aceh             Sumatera Utara 
##                          1                          2 
##             Sumatera Barat                       Riau 
##                          1                          1 
##                      Jambi           Sumatera Selatan 
##                          1                          2 
##                   Bengkulu                    Lampung 
##                          1                          1 
## Kepualauan Bangka Belitung             Kepulauan Riau 
##                          1                          1 
##                DKI Jakarta                 Jawa Barat 
##                          2                          1 
##                Jawa Tengah              DI Yogyakarta 
##                          1                          1 
##                 Jawa Timur                     Banten 
##                          2                          1 
##                       Bali        Nusa Tenggara Barat 
##                          1                          1 
##        Nusa Tenggara Timur           Kalimantan Barat 
##                          1                          1 
##          Kalimantan Tengah         Kalimantan Selatan 
##                          1                          1 
##           Kalimantan Timur           Kalimantan Utara 
##                          1                          1 
##             Sulawesi Utara            Sulawesi Tengah 
##                          1                          1 
##           Sulawesi Selatan          Sulawesi Tenggara 
##                          2                          1 
##                  Gorontalo             Sulawesi Barat 
##                          1                          1 
##                     Maluku               Maluku Utara 
##                          1                          1 
##                Papua Barat                      Papua 
##                          1                          1 
## 
## Within cluster sum of squares by cluster:
## [1] 42.81103 51.43293
##  (between_SS / total_SS =  52.1 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

Berdasarkan hasil K-means clustering dengan 2 cluster, dapat diketahui bahwa: - Cluster 1 terdiri dari 29 provinsi dengan nilai PC1 yang lebih rendah (-0.7206238) dan nilai PC2 yang lebih tinggi (0.02505413). - Cluster 2 terdiri dari 5 provinsi dengan nilai PC1 yang lebih tinggi (4.1796181) dan nilai PC2 yang lebih rendah (-0.14531393).

Dengan nilai 52.1% menunjukkan bahwa model clustering ini berhasil memisahkan data dengan cukup baik berdasarkan dua komponen utama.

Secara keseluruhan, cluster 1 memiliki nilai yang lebih rendah dibandingkan cluster 2. Artinya, provinsi yang tergolong cluster 1 termasuk provinsi dengan tingkat kriminalitas yang rendah sedangkan provinsi yang tergolong cluster 2 termasuk provinsi dengan tingkat kriminalitas yang tinggi.

5 PENUTUP

5.1 Kesimpulan

Berdasarkan Analisis Cluster Hierarki dan Non-Hierarki, didapatkan hasil yang sama yaitu terdapat 2 cluster. Cluster pertama, yaitu cluster dengan tingkat kriminalitas yang rendah dimana faktor yang dominan dari kriminalitas tersebut adalah faktor kejahatan umum dan kekerasan. Cluster pertama mencakup 29 provinsi, yaitu Aceh, Sumatera Barat, Jambi, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, Riau, Jawa Barat, Jawa Tengah, DI Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Kalimantan Selatan, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua, dan Papua Barat. Sedangkan cluster kedua, yaitu cluster dengan tingkat kriminalitas yang tinggi dimana faktor yang dominan dari penyebab perceraian tersebut adalah faktor kejahatan khusus dan terencana.Cluster kedua mencakup 5 provinsi, yaitu Sumatera Utara, DKI Jakarta, Sumatera Selatan, Sulawesi Selatan, dan Jawa Timur.

5.2 Saran

  1. Cluster dengan tingkat kriminalitas rendah (Cluster 1) sebaiknya terus meningkatkan program pencegahan kejahatan melalui edukasi masyarakat, penguatan norma sosial, serta memperkuat pengawasan dan kerja sama antara masyarakat dan aparat keamanan guna mencegah potensi meningkatnya kejahatan.

  2. Cluster dengan tingkat kriminalitas tinggi (Cluster 2) sebaiknya memprioritaskan pemberantasan jaringan narkotika dan pengawasan lingkungan dengan meningkatkan kapasitas aparat penegak hukum, serta mengadakan program rehabilitasi sosial untuk pencegahan dan penanganan tindak kejahatan.

6 DAFTAR PUSTAKA

Nasution, M. Z. (2019). Penerapan principal component analysis (pca) dalam penentuan faktor dominan yang mempengaruhi pengidap kanker serviks (Studi Kasus: Cervical Cancer Dataset). Jurnal Mantik, 3(1), 204-210.

Dewi, S. M., Windarto, A. P., Damanik, I. S., & H. S. (2019). Analisa Metode KMeans pada Pengelompokan Kriminalitas Menurut Wilayah. Seminar Nasional Sains & Teknologi Informasi (SENSASI).

Statistik, B. P. (2020). Statistik Kriminal 2020. Jakarta: Badan Pusat Statistik.

Johnson, & Wichen. (2007). Applied Multivariate Statistical Analysis Edisi Keenam. Pearson Pretice Hall.

Triaynto, W. A. (2015). Algoritma K-Medoids untuk Penentuan Strategi Pemasaran Produk. Jakarta: PT. Raja Grafindo Persada.

Muhtadi. (2017). PENERAPAN PRINCIPAL COMPONENT ANALYSISI (PCA) DALAM ALGORITMA K-MEANS UNTUK MENENTUKAN CENTROID PADA CLUSTERING. Journal of Mathematic Teaching.

Prasetyo, Eko. 2012. Data Mining: Konsep dan Aplikasi menggunakan MATLAB. Yogyakarta: ANDI Yogyakarta.

Simamora. (2005). Analisis Multivariat Pemasaran. Jakarta: PT. Gramedika Pustaka Utama.