1 PENDAHULUAN
1.1 Latar Belakang
Tindakan kriminalitas dapat dipicu oleh berbagai faktor, termasuk masalah ekonomi dan tingkat kesadaran masyarakat dalam melaporkan tindak kejahatan. Pertambahan jumlah penduduk seringkali memunculkan berbagai persoalan sosial, seperti kemiskinan dan pengangguran, yang pada akhirnya dapat mendorong sebagian orang melakukan tindak kriminal. Kriminalitas, yang merupakan tindakan atau perilaku melanggar hukum, dapat menimbulkan kerugian dan dampak negatif bagi masyarakat. Pelaku kriminal disebut sebagai kriminal, dan tindak kejahatan ini tidak hanya terjadi di negara lain tetapi juga di Indonesia. Jenis-jenis kriminalitas yang umum terjadi di Indonesia mencakup pembunuhan, penganiayaan, pemerkosaan, pencurian, penyalahgunaan narkoba, penipuan, hingga korupsi (Supratman, 2020). Berdasarkan survei tingkat kriminalitas, Indonesia berada di peringkat keempat di ASEAN pada tahun 2020 (Asia, 2020).
Rasa aman adalah hak asasi yang dijamin dalam Pasal 28G Ayat 1 UUD 1945, yang menyatakan bahwa setiap orang berhak atas perlindungan terhadap diri, keluarga, kehormatan, harta benda, serta rasa aman dari ancaman untuk berbuat atau tidak berbuat sesuatu yang merupakan haknya. Selama periode 2018–2020, jumlah kasus kejahatan di Indonesia mengalami fluktuasi. Data Badan Pusat Statistik menunjukkan adanya 294.281 kasus pada tahun 2018, yang kemudian menurun menjadi 269.324 kasus pada tahun 2019, dan kembali menurun menjadi 247.218 kasus pada tahun 2020.
Dengan banyaknya kejadian kriminalitas tersebut, diperlukan langkah untuk mengelompokkan daerah-daerah rawan kejahatan di Indonesia berdasarkan data dari Polda atau Provinsi. Pendekatan yang dapat digunakan adalah analisis klaster, yang bertujuan untuk mengelompokkan objek-objek dengan karakteristik yang serupa ke dalam satu klaster (Ediyanto, Muhlahsal, & Neva, 2013). Metode ini diharapkan membantu masyarakat lebih waspada dan pemerintah meningkatkan keamanan di wilayah-wilayah dengan tingkat kriminalitas tinggi.
1.2 Rumusan Masalah
- Bagaimana tingkat kriminalitas berbeda di antara provinsi-provinsi di Indonesia berdasarkan analisis cluster?
- Faktor-faktor apa saja yang mendominasi tingkat kriminalitas di setiap cluster?
- Bagaimana karakteristik masing-masing cluster berdasarkan tingkat kriminalitasnya?
1.3 Tujuan
- Menganalisis perbedaan tingkat kriminalitas antar provinsi di Indonesia dengan menggunakan metode cluster.
- Mengidentifikasi faktor dominan yang memengaruhi tingkat kriminalitas di setiap cluster.
- Mendeskripsikan karakteristik masing-masing cluster berdasarkan tingkat kriminalitas yang dimiliki.
1.4 Batasan Masalah
- Penelitian hanya berfokus pada kasus tindakan kriminalitas di Indonesia pada tahun 2020, dengan variabel Kejahatan Terhadap Nyawa, Kejahatan Terhadap Fisik, Kejahatan Terhadap Kesusilaan, Kejahatan Terhadap Kemerdekaan Orang, Kejahatan Terhadap Hak Milik dengan Penggunaan Kekerasan, Kejahatan Terhadap Hak Milik dengan Tanpa Penggunaan Kekerasan, Kejahatan Terkait Narkotika, Kejahatan Terkait Penipuan, Penggelapan, Korupsi.
- Data yang digunakan adalah data sekunder yang diperoleh dari Badan Pusat Statistik.
- Metode analisis yang digunakan adalah Principal Component Analysis (PCA), Cluster Hierarki, dan Cluster Nonhierarki (K-Means).
1.5 Data
Data yang digunakan adalah data sekunder yang berasal dari website Badan Pusat Statistik (BPS). Data yang digunakan yaitu Data Kriminalitas di Indonesia pada Tahun 2020. Adapun variabel yang digunakan, yaitu:
X1: Kejahatan Terhadap Nyawa (Pembunuhan)
X2: Kejahatan Terhadap Fisik (Penganiayaan, KDRT)
X3: Kejahatan Terhadap Kesusilaan (Pemerkosaan, Pencabulan)
X4: Kejahatan Terhadap Kemerdekaan Orang (Penculikan, Mempekerjakan anak dibawah umur)
X5: Kejahatan Terhadap Hak Milik dengan Penggunaan Kekerasan (Pencurian dengan Kekerasan, Pencurian dengan Kekerasan Menggunakan Senjata Api, Pencurian dengan Kekerasan Menggunakan Senjata Tajam, dll)
X6: Kejahatan Terhadap Hak Milik dengan Tanpa Penggunaan Kekerasan (Pencurian, dll)
X7: Kejahatan Terkait Narkotika
X8: Kejahatan Terkait Penipuan, Penggelapan, Korupsi
1.6 Latar Belakang Metode
PCA merupakan suatu teknik seleksi data multivariat (multivariable) yang mengubah atau mengtransformasi suatu matriks data asli menjadi sekumpulan kombinasi homogen yang lebih sedikit namun menyerap sejumlah besar carian pada data awal (M. Zulfahmi, 2019). Pada analisis faktor ini, PCA mengidentifikasi pola dan kumpulan data serta menemukan persamaan dan perbedaan yang terdapat pada masing-masing faktor. Pendeketan pada analisis PCA yaitu dilakukan untuk menyederhanakan dan menghilangkan faktor-faktor yang kurang dominan atau relevan yang mempengaruhi terhadap variabe yang akan di teliti. Sehingga dengan analisis PCA diharapkan memberikan hasil yang terbaik ketika diterapkan pada setiap atribut yang berkorelasi.
Analisis cluster mengklasifikasi objek sehingga objek-objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. (Ediyanto, Muhlahsal, & Neva, 2013). Analisis cluster dengan metode hierarchical adalah analisis yang pengclusteran datanya dilakukan dengan cara mengukur jarak kedekatan pada setiap objek yang kemudian membentuk sebuah dendrogram. Berbeda dengan metode hierarchical, metode non-hierarchical dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan. Setelah jumlah cluster diketahui baru proses cluster dilakukan. Dalam metode non-hierarchical terdapat dua cara analisis yaitu K-means Clustering dan K-Medoids Clustering. Dalam penelitian ini menggunakan K-Means Clustering.
PCA menjadi langkah awal untuk mengidentifikasi faktor utama dari kriminalitas di Indonesia, sehingga memungkinkan pengembangan solusi yang sesuai untuk menjaga stabilitas keamnanan di Indonesia. Oleh karena itu, akan dilakukan analisis untuk mengelompokkan provinsi di Indonesia dengan data jumlah kriminalitas berdasarkan bentuknya pada tahun 2020. Dengan adanya pengelompokkan ini, diharapkan masyarakat bisa lebih waspada dan pemerintah serta apparat setempat dapat lebih siaga dan menerapkan kebijakan yang tepat untuk terciptanya keamanan dan kesejahteraan rakyat.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Menurut Sholikhah (2016), statistika deskriptif adalah metode statistika yang berfokus pada pengumpulan, pengorganisasian, dan pengolahan data untuk menyajikan informasi yang jelas mengenai suatu kondisi atau peristiwa tertentu berdasarkan data yang diperoleh. Dengan demikian, statistika deskriptif berfungsi untuk menyajikan data secara terstruktur, sehingga dapat memberikan pemahaman atau interpretasi tertentu melalui representasi visual yang disajikan.
2.2 Standarisasi Data
Standarisasi adalah proses menyesuaikan skala data sehingga setiap variabel memiliki nilai rata-rata sebesar 0 dan simpangan baku sebesar 1. Proses ini sering dilakukan menggunakan metode Z-Score. Standarisasi menjadi langkah penting, terutama dalam penerapan metode yang melibatkan pengukuran jarak antar data. Jika skala variabel berbeda-beda, variabel dengan skala lebih besar cenderung mendominasi perhitungan, yang dapat mengurangi keakuratan hasil analisis.
2.3 Principal Component Analysis (PCA)
PCA merupakan kombinasi linear dari variabel awal yang secara geometris, kombinasi linear ini merupakan sistem koordinat baru yang diperoleh dari rotasi sisetem semula. Metode PCA sangat berguna digunakan jika data yang dimiliki jumlah variabelnya besar dan memiliki korelasi antar variabelnya. Perhitungan dari principal component analysis didasarkan pada perhitungan nilai eigen dan eigenvector yang penyebaran data dari suatu dataset (Johnson & Wichen, 2007). Tujuan dari analisis PCA adalah untuk mereduksi variabel yang ada menjadi lebih sedikit tanpa harus kehilangan informasi yang termuat dari data asli. Langkah-langkah untuk melakukan analisis PCA yaitu pertama dengan melakukan standarisasi data. Langkah ini bertujuan agar interval data menjadi lebih proporsional dengan menyamakan rentang nilai pada data.
Kemudian menghitung matriks varian kovarian sebagai langkah awal dalam melakukan analisis PCA untuk mendapatkan kedekatan hubungan antar variabel penelitian. Selanjutnya, menghitung eigenvalue dan eigenvector yang didapatkan dari matriks kovarian yang diperoleh. Perhitungan nilai eigen dengan menggunakan persamaan:
[𝜆𝐼 − 𝐴] = 0
dengan 𝜆 adalah eigenvalue, 𝐼 adalah matriks identitas, dan 𝐴 adalah matriks data. Kemudian menghitung eigen vector dengan menggunakan persamaan:
[𝜆𝐼 − 𝐴][𝑋] = 0
dengan 𝜆 adalah eigenvalue, 𝐼 adalah matriks identitas, dan 𝐴 adalah matriks data, dan 𝑋 adalah eigenvector. Setelah itu, mengurutkan eigenvalue secara descending dan Principal Component (PC) didapatkan dari deretan eigenvector. Jumlah principal component yang terpilih adalah nilai 𝜆 > 1. Selanjutnya, didapatkanlah dataset baru.
2.4 Analisis Cluster
Analisis cluster adalah suatu teknik multivariat yang digunakan untuk mengelompokkan objek ke dalam dua atau lebih kelompok berdasarkan kesamaan karakteristik objek tersebut. Tujuan dari analisis ini adalah untuk mengidentifikasi kelompok-kelompok yang memiliki kesamaan tinggi di dalamnya (homogenitas), sementara kelompok yang berbeda menunjukkan perbedaan yang signifikan antar kelompok (heterogenitas) (Simamora, 2005). Dengan demikian, analisis cluster membantu dalam mengelompokkan objek penelitian berdasarkan kemiripan yang dimilikinya.
2.4.1 Analisis Cluster Hierarki
Metode hierarki dimulai dengan mengelompokkan objek-objek yang memiliki kesamaan atau kedekatan terbesar terlebih dahulu. Setelah itu, objek-objek yang memiliki kedekatan berikutnya akan dikelompokkan, dan seterusnya. Proses ini berlanjut hingga terbentuk beberapa kelompok atau cluster, yang dapat digambarkan dalam bentuk struktur hierarkis, mirip dengan pohon yang menunjukkan hubungan atau tingkatan antar cluster.
Metode agglomerative adalah pendekatan yang memulai dengan menganggap setiap objek sebagai sebuah cluster terpisah, kemudian menggabungkan objek-objek tersebut berdasarkan jarak tertentu hingga semua objek terkumpul dalam satu cluster. Proses penggabungan ini melibatkan pembaruan matriks jarak pada setiap langkah dan sering kali digambarkan dalam bentuk dendrogram (Simamora, 2005). Terdapat empat metode dalam Agglomerative:
Single Linkage (Nearest Neighbor): Objek-objek yang memiliki jarak terdekat akan digabungkan terlebih dahulu.
\[d(ij)_k = \min(dik, djk)\]Complete Linkage (Farthest Neighbor): Jarak antar cluster dihitung berdasarkan objek dengan jarak terjauh antara kedua cluster.
\[d(ij)_k = \max(dik, djk)\]Average Linkage: Jarak antar cluster dihitung dengan rata-rata jarak semua pasangan objek yang berasal dari kedua cluster.
\[ d(ij)_k = \frac{\sum_a \sum_b d_{ab}}{n_(ij_)n_k} \]Ward’s Method: Metode ini berfokus pada optimisasi varians internal cluster dengan meminimalkan peningkatan jumlah kuadrat kesalahan (sum of squares) pada setiap tahap penggabungan.
Keempat metode ini memberikan fleksibilitas dalam memilih pendekatan yang paling sesuai dengan karakteristik data dan tujuan analisis.
2.4.2 Analisis Cluster Non-Hierarki (K-Means)
Metode non hierarchical merupakan pengelompokkan objek dimana banyaknya cluster yang akan dibentuk dapat ditentukan terlebih dahulu sebagai bagian dari prosedur pengerombolan. Pengelompokan berbasis partitioning menghasilkan sebuah partisi dari data mengakibatkan objek dalam kelompok lebih mirip satu sama lain daripada objek yang ada dalam kelompok lain (Triaynto,2015). Terdapat beberapa metode yang termasuk dalam Clustering Non-Hierarchical salah satunya yaitu Clustering K- Means.
Pengelompokan K-Means merupakan metode analisis kelompok yang mengarah pada pemartisian N objek pengamatan ke dalam kelompok cluster, dimana setiap objek pengamatan dimiliki oleh sebuah kelompok dengan mean (rata-rata) terdekat. Keduanya mencoba untuk menemukan pusat dari kelompok dalam data sebanyak iterasi perbaikan yang dilakukan oleh kedua algoritma (Prasetyo, 2012). Prinsip utama dari teknik ini adalah menyusun k buah partisi/pusat massa (centroid)/rata-rata (mean) dari sekumpulan data. Tujuan dari pengelompokan data ini adalah untuk meminimalkan fungsi objektif yang diset dalam proses pengelompokan, yang pada intinya adalah untuk berusaha meminimalkan variasi dalam suatu kelompok dan memaksimalkan variasi antar kelompok.
Langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut: 1.Tentukan keluaran k sebagai jumlah cluster yang akan dibentuk.
2.Inisialisasi pusat cluster (centroid) setiap keluaran k dengan cara random yang diambil dari data yang ada.
3.Menghitung jarak setiap data input terhadap masing – masing centroid menggunakan rumus jarak Euclidean atau Manhattan hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. jarak Euclidean: \[ D_e = \sqrt{(x_i - s_i)^2 + (y_i - t_i)^2} \]
4.Mengklasifikasikan setiap data berdasarkan kedekatannya dengan centroid (jarak terkecil).
5.Memperbaharui nilai centroid. Nilai centroid baru di peroleh dari rata-rata tiap cluster yang bersangkutan
6.Melakukan perulangan dari langkah 2 hingga 5, sampai centroid tiap cluster tidak ada yang berubah.
3 SOURCE CODE
3.1 Library
## corrplot 0.94 loaded
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ggplot2)
library(gridExtra)
library(NbClust)
library(purrr)
library(cluster)
library(clValid)readxl: Untuk membaca file Excel.
corrplot: Untuk membuat visualisasi matriks korelasi.
factoextra: Untuk visualisasi analisis faktor dan PCA.
ggplot2: Untuk membuat grafik menggunakan pendekatan grammar of graphics.
gridExtra: Untuk menggabungkan beberapa plot dalam satu grid.
NbClust: Untuk menentukan jumlah optimal cluster.
purrr: Untuk manipulasi data berbasis fungsional.
cluster: Untuk analisis cluster hierarki.
clValid: untuk mengevaluasi validitas hasil klasterisasi.
3.2 Input Data
## # A tibble: 6 × 9
## Provinsi Pembunuhan Penganiayaan `Pemerkosaan, Pencabulan` Penculikan
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Aceh 15 1206 232 29
## 2 Sumatera Utara 99 6207 774 55
## 3 Sumatera Barat 20 1724 294 97
## 4 Riau 13 1013 143 11
## 5 Jambi 11 531 69 9
## 6 Sumatera Selatan 77 1551 172 141
## # ℹ 4 more variables: `Pencurian dengan Kekerasan` <dbl>, Pencurian <dbl>,
## # Narkotika <dbl>, `Penipuan, Penggelapan, Korupsi` <dbl>
read_excel: Membaca data Excel.
head(projekAnmul): Menampilkan enam baris pertama data.
3.3 Tipe Data
## tibble [34 × 9] (S3: tbl_df/tbl/data.frame)
## $ Provinsi : chr [1:34] "Aceh" "Sumatera Utara" "Sumatera Barat" "Riau" ...
## $ Pembunuhan : num [1:34] 15 99 20 13 11 77 33 21 10 13 ...
## $ Penganiayaan : num [1:34] 1206 6207 1724 1013 531 ...
## $ Pemerkosaan, Pencabulan : num [1:34] 232 774 294 143 69 172 108 247 52 109 ...
## $ Penculikan : num [1:34] 29 55 97 11 9 141 1 41 47 1 ...
## $ Pencurian dengan Kekerasan : num [1:34] 145 780 185 413 87 563 106 399 42 103 ...
## $ Pencurian : num [1:34] 2408 10916 3732 3152 1770 ...
## $ Narkotika : num [1:34] 1596 5932 913 1646 619 ...
## $ Penipuan, Penggelapan, Korupsi: num [1:34] 1130 5562 989 1095 767 ...
str(projekAnmul): Menampilkan struktur data, termasuk tipe data tiap kolom.
3.4 Statistika Deskriptif
summary: Menampilkan statistik deskriptif (mean, median, min, max, dll.) untuk setiap kolom data.
3.5 Principal Component Analysis (PCA)
3.5.1 Korelasi
kor_visual <- cor(projekAnmul[,2:9])
corrplot(kor_visual, method = "number",type = "lower", tl.col = "red", tl.srt = 35)cor: Menghitung matriks korelasi antara kolom 2 sampai 9.
corrplot: Membuat plot korelasi dengan angka dan format visual “lower triangle.”
3.5.2 Normalisasi Data
scale: Menormalkan data sehingga memiliki mean = 0 dan standar deviasi = 1.
3.5.3 Nilai Eigen
cov: Membuat matriks kovarians dari data yang sudah dinormalisasi.
eigen: Menghitung nilai eigen dan vektor eigen dari matriks kovarians.
3.5.4 Scree Plot Eigen
plot(nilaivektoreigen_cov$values, xlab="Eigenvalue Number", ylab = "Eigenvalue Size", main = "Scree Plot",lwd = 1)+lines(nilaivektoreigen_cov$values)## integer(0)
axis(1, at = seq(1, length(nilaivektoreigen_cov$values)))
abline(h = 1, col = "red")
lines(nilaivektoreigen_cov$values)plot: Menampilkan ukuran eigenvalue sebagai scree plot.
abline(h = 1, col = “red”): Garis horizontal di nilai 1 untuk komponen yang signifikan.
3.5.5 Kumulatif Eigen
kumeigen_cov <- for (eg in nilaivektoreigen_cov$values){
+ print(eg/sum(nilaivektoreigen_cov$values))}## [1] 0.603881
## [1] 0.141473
## [1] 0.1124516
## [1] 0.05198659
## [1] 0.04306857
## [1] 0.03151077
## [1] 0.009550749
## [1] 0.006077821
for loop: Menghitung proporsi kontribusi masing-masing eigenvalue terhadap total variansi.
3.5.7 Fungsi PCA dengan prcomp
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 2.1980 1.0639 0.9485 0.64490 0.58698 0.50208 0.27642
## Proportion of Variance 0.6039 0.1415 0.1124 0.05199 0.04307 0.03151 0.00955
## Cumulative Proportion 0.6039 0.7453 0.8578 0.90979 0.95286 0.98437 0.99392
## PC8
## Standard deviation 0.22051
## Proportion of Variance 0.00608
## Cumulative Proportion 1.00000
## PC1 PC2
## Pembunuhan 0.370 -0.213
## Penganiayaan 0.404 -0.169
## Pemerkosaan, Pencabulan 0.186 -0.232
## Penculikan 0.181 -0.764
## Pencurian dengan Kekerasan 0.380 0.065
## Pencurian 0.431 0.043
## Narkotika 0.370 0.438
## Penipuan, Penggelapan, Korupsi 0.407 0.301
prcomp: Melakukan PCA dengan normalisasi dan sentralisasi data.
summary(pcamodel): Menampilkan variansi yang dijelaskan oleh masing-masing komponen.
round(pcamodel$rotation[,1:2],3): Menampilkan kontribusi variabel ke PC1 dan PC2.
3.5.8 Plot Efek
fviz_eig: Menampilkan scree plot dengan persentase variansi setiap PC.
3.5.9 Plot Kontribusi Variabel
fviz_pca_var(pcamodel,
col.var = "cos2",
gradient.cols = c("navy", "magenta", "darkorange"),
repel = TRUE)fviz_pca_var: Plot variabel berdasarkan kontribusi pada PC, dengan gradasi warna.
3.5.10 Kontribusi Variabel pada PC1 dan PC2
PC1 <- fviz_contrib(pcamodel, choice = "var", axes = 1)
PC2 <- fviz_contrib(pcamodel, choice = "var", axes = 2)
grid.arrange(PC1,PC2, ncol=2,
top='Contribution of the variables to PCs')Menampilkan variabel mana yang paling berkontribusi pada PC1 dan PC2.
3.6 Cluster Hierarki
3.6.1 Data
prcomp: Melakukan analisis komponen utama (PCA) pada data yang telah dinormalisasi.
rank. = 2 (Membatasi jumlah komponen utama yang dihasilkan menjadi dua, yaitu PC1 dan PC2.
pca_model$x: Menyimpan hasil transformasi data pada ruang komponen utama yang disebut results.
3.6.2 Jarak Euclidean
Menghitung jarak antar individu dalam dataset menggunakan metode Euclidean, untuk menentukan seberapa mirip data satu dengan yang lain.
3.6.3 Koefisien Korelasi
ds <- hclust(dist(results,method = 'euclidean'),method = "single")
da <- hclust(dist(results,method = 'euclidean'),method = "average")
dc <- hclust(dist(results,method = 'euclidean'),method = "complete")
dw <- hclust(dist(results,method = 'euclidean'),method = "ward.D")
linkage <- c("single", "average", "complete", "ward")
names(linkage) <- c("single","average","complete","ward")
ac <- function(x) {
agnes(results, method = x)$ac
}
map_dbl(linkage,ac)## single average complete ward
## 0.9051577 0.9175915 0.9207571 0.9441308
hclust: Melakukan analisis hierarki cluster menggunakan jarak Euclidean yang telah dihitung sebelumnya.
Berbagai metode untuk pengelompokan hierarki, yaitu:
Single linkage: Mengelompokkan objek berdasarkan jarak antar dua titik terdekat dari kelompok yang berbeda dan disimpan dalam variabel ds.
Average linkage: Mengelompokkan objek berdasarkan rata-rata jarak antara setiap pasangan objek dan disimpan dalam variabel da.
Complete linkage: Mengelompokkan objek berdasarkan jarak terjauh antar anggota kelompok dan disimpan dalam variabel dc.
Ward’s Method: Mengelompokkan objek dengan meminimalkan total varian dalam cluster dan disimpan dalam variabel dw.
3.6.4 Indeks Validitas
validity <- clValid(results, 2:9, clMethods = "hierarchical",
validation = "internal", metric = "euclidean", method = "ward")## The "ward" method has been renamed to "ward.D"; note new "ward.D2"
## Warning in clValid(results, 2:9, clMethods = "hierarchical", validation =
## "internal", : rownames for data not specified, using 1:nrow(data)
##
## Clustering Methods:
## hierarchical
##
## Cluster sizes:
## 2 3 4 5 6 7 8 9
##
## Validation Measures:
## 2 3 4 5 6 7 8 9
##
## hierarchical Connectivity 8.8377 18.1433 20.2266 25.5726 25.9393 28.3933 30.1433 35.2651
## Dunn 0.2559 0.0624 0.0766 0.0766 0.1689 0.1689 0.2475 0.2496
## Silhouette 0.6169 0.3158 0.3375 0.4008 0.4256 0.4110 0.4336 0.4188
##
## Optimal Scores:
##
## Score Method Clusters
## Connectivity 8.8377 hierarchical 2
## Dunn 0.2559 hierarchical 2
## Silhouette 0.6169 hierarchical 2
Menghitung dan memvalidasi kualitas cluster hierarki menggunakan dengan metode ward dan ukuran validitas internal.
3.6.5 Dendogram
clus_hier <- eclust(results, FUNcluster = "hclust", k = 2, hc_method = "ward.D", graph = TRUE, sub = " ", xlab = "Provinsi", ylab = "Jarak")## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
## Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Menampilkan dendrogram berdasarkan hasil analisis cluster hierarki dengan metode Ward.
Menampilkan tabel yang menggabungkan nama provinsi dan cluster yang dihasilkan.
3.6.6 Karakteristik Cluster
hist.kluster1 <- subset(tabel,klaster==1)
hist.kluster2 <- subset(tabel,klaster==2)
hist.kluster_1 <- sapply(hist.kluster1,mean)## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
subset: Memisahkan data berdasarkan cluster 1 dan cluster 2
sapply: Menghitung nilai rata-rata untuk setiap variabel dalam cluster 1 dan cluster 2
rbind: Menggabungkan hasil rata-rata cluster 1 dan cluster 2
3.7 Cluster Non-Hierarki
3.7.1 Jumlah Cluster Optimal (Silhouette Method)
Menampilkan grafik untuk menentukan jumlah cluster optimal menggunakan metode Silhouette.
4 HASIL DAN PEMBAHASAN
4.1 Input Data
## # A tibble: 6 × 9
## Provinsi Pembunuhan Penganiayaan `Pemerkosaan, Pencabulan` Penculikan
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Aceh 15 1206 232 29
## 2 Sumatera Utara 99 6207 774 55
## 3 Sumatera Barat 20 1724 294 97
## 4 Riau 13 1013 143 11
## 5 Jambi 11 531 69 9
## 6 Sumatera Selatan 77 1551 172 141
## # ℹ 4 more variables: `Pencurian dengan Kekerasan` <dbl>, Pencurian <dbl>,
## # Narkotika <dbl>, `Penipuan, Penggelapan, Korupsi` <dbl>
4.2 Tipe Data
## tibble [34 × 9] (S3: tbl_df/tbl/data.frame)
## $ Provinsi : chr [1:34] "Aceh" "Sumatera Utara" "Sumatera Barat" "Riau" ...
## $ Pembunuhan : num [1:34] 15 99 20 13 11 77 33 21 10 13 ...
## $ Penganiayaan : num [1:34] 1206 6207 1724 1013 531 ...
## $ Pemerkosaan, Pencabulan : num [1:34] 232 774 294 143 69 172 108 247 52 109 ...
## $ Penculikan : num [1:34] 29 55 97 11 9 141 1 41 47 1 ...
## $ Pencurian dengan Kekerasan : num [1:34] 145 780 185 413 87 563 106 399 42 103 ...
## $ Pencurian : num [1:34] 2408 10916 3732 3152 1770 ...
## $ Narkotika : num [1:34] 1596 5932 913 1646 619 ...
## $ Penipuan, Penggelapan, Korupsi: num [1:34] 1130 5562 989 1095 767 ...
4.3 Statistika Deskriptif
## Provinsi Pembunuhan Penganiayaan Pemerkosaan, Pencabulan
## Length:34 Min. : 1.00 Min. : 91.0 Min. : 32.00
## Class :character 1st Qu.:10.25 1st Qu.: 466.2 1st Qu.: 95.75
## Mode :character Median :17.50 Median : 651.0 Median : 122.00
## Mean :26.18 Mean :1078.6 Mean : 201.06
## 3rd Qu.:32.75 3rd Qu.:1400.8 3rd Qu.: 217.75
## Max. :99.00 Max. :6207.0 Max. :1398.00
## Penculikan Pencurian dengan Kekerasan Pencurian Narkotika
## Min. : 0.00 Min. : 4.0 Min. : 112 Min. : 41.0
## 1st Qu.: 9.25 1st Qu.: 54.0 1st Qu.: 870 1st Qu.: 242.0
## Median : 28.00 Median :133.0 Median : 1576 Median : 604.5
## Mean : 57.94 Mean :192.3 Mean : 2155 Mean :1076.8
## 3rd Qu.: 94.75 3rd Qu.:277.8 3rd Qu.: 2940 3rd Qu.:1479.2
## Max. :311.00 Max. :780.0 Max. :10916 Max. :5981.0
## Penipuan, Penggelapan, Korupsi
## Min. : 49
## 1st Qu.: 369
## Median : 689
## Mean :1091
## 3rd Qu.:1201
## Max. :5562
Variabel Provinsi adalah data kategorik yang menunjukkan daftar 34 provinsi yang dianalisis dalam dataset ini. Data ini tidak memiliki nilai numerik tetapi digunakan sebagai pengelompok untuk variabel lainnya.
Jumlah kasus pembunuhan terendah adalah 1 kasus, sedangkan jumlah tertinggi mencapai 99 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pembunuhan kurang dari atau sama dengan 10,25 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 32,75 kasus. Rata-rata kasus pembunuhan di seluruh provinsi adalah 26,18 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 17,5 kasus.
Jumlah kasus penganiayaan terendah adalah 91 kasus, sedangkan jumlah tertinggi mencapai 6.207 kasus. Sebanyak 25% provinsi memiliki jumlah kasus penganiayaan kurang dari atau sama dengan 466,2 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 1.400,8 kasus. Rata-rata kasus penganiayaan di seluruh provinsi adalah 1.078,6 kasus, yang lebih tinggi dari nilai mediannya sebanyak 651 kasus.
Jumlah kasus pemerkosaan dan pencabulan terendah adalah 32 kasus, sedangkan jumlah tertinggi mencapai 1.398 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pemerkosaan dan pencabulan kurang dari atau sama dengan 95,75 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 217,75 kasus. Rata-rata kasus pemerkosaan dan pencabulan di seluruh provinsi adalah 201,06 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 122 kasus.
Jumlah kasus penculikan terendah adalah 0 kasus, sedangkan jumlah tertinggi mencapai 311 kasus. Sebanyak 25% provinsi memiliki jumlah kasus penculikan kurang dari atau sama dengan 9,25 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 94,75 kasus. Rata-rata kasus penculikan di seluruh provinsi adalah 57,94 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 28 kasus.
Jumlah kasus pencurian dengan kekerasan terendah adalah 4 kasus, sedangkan jumlah tertinggi mencapai 780 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pencurian dengan kekerasan kurang dari atau sama dengan 54 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 277,8 kasus. Rata-rata kasus pencurian dengan kekerasan di seluruh provinsi adalah 192,3 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 133 kasus.
Jumlah kasus pencurian terendah adalah 112 kasus, sedangkan jumlah tertinggi mencapai 10.916 kasus. Sebanyak 25% provinsi memiliki jumlah kasus pencurian kurang dari atau sama dengan 870 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 2.940 kasus. Rata-rata kasus pencurian di seluruh provinsi adalah 2.155 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 1.576 kasus.
Jumlah kasus narkotika terendah adalah 41 kasus, sedangkan jumlah tertinggi mencapai 5.981 kasus. Sebanyak 25% provinsi memiliki jumlah kasus narkotika kurang dari atau sama dengan 242 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 1.479,2 kasus. Rata-rata kasus narkotika di seluruh provinsi adalah 1.076,8 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 604,5 kasus.
Jumlah kasus penipuan, penggelapan, dan korupsi terendah adalah 49 kasus, sedangkan jumlah tertinggi mencapai 5.562 kasus. Sebanyak 25% provinsi memiliki jumlah kasus penipuan, penggelapan, dan korupsi kurang dari atau sama dengan 369 kasus, sedangkan 75% provinsi memiliki kasus kurang dari atau sama dengan 1.201 kasus. Rata-rata kasus penipuan, penggelapan, dan korupsi di seluruh provinsi adalah 1.091 kasus, yang lebih tinggi dari nilai mediannya, yaitu sebanyak 689 kasus.
4.4 Principal Component Analysis (PCA)
4.4.1 Korelasi
kor_visual <- cor(projekAnmul[,2:9])
corrplot(kor_visual, method = "number",type = "lower", tl.col = "red", tl.srt = 35)Variabel Pencurian, Penipuan, Penggelapan, Korupsi, dan Pencurian dengan Kekerasan menunjukkan hubungan yang sangat erat di berbagai kombinasi, hal ini ditunjukkan dengan warna yang gelap (biru tua) atau nilai korelasi mendekati satu.Sedangkan korelasi rendah terlihat antara Pembunuhan dengan variabel-variabel seperti Pemerkosaan, Pencabulan dan Penculikan.
4.4.2 Normalisasi Data
## Pembunuhan Penganiayaan Pemerkosaan, Pencabulan Penculikan
## [1,] -0.475455052 0.10949810 0.1228258 -0.40900275
## [2,] 3.097965021 4.40737416 2.2743794 -0.04156532
## [3,] -0.262751476 0.55466902 0.3689445 0.55198745
## [4,] -0.560536482 -0.05636675 -0.2304736 -0.66338251
## [5,] -0.645617912 -0.47059915 -0.5242281 -0.69164692
## [6,] 2.162069288 0.40599224 -0.1153535 1.17380463
## [7,] 0.290277821 -0.51528813 -0.3694115 -0.80470459
## [8,] -0.220210761 -0.37090837 0.1823707 -0.23941624
## [9,] -0.688158628 -0.79803182 -0.5917123 -0.15462299
## [10,] -0.560536482 -0.48520901 -0.3654419 -0.80470459
## [11,] 0.247737106 0.31833310 -0.3495632 -0.38073833
## [12,] -0.262751476 0.31489549 0.6746080 -0.66338251
## [13,] 0.162655676 -0.59865025 0.5872756 -0.66338251
## [14,] -0.858321488 -0.43450421 -0.4091081 -0.43726717
## [15,] 1.226173555 0.27965995 0.2180976 1.68256415
## [16,] -0.773240058 -0.47919319 -0.4765922 1.31512672
## [17,] -0.858321488 -0.57114934 -0.5401067 -0.76230797
## [18,] -0.645617912 -0.37176777 -0.4210171 -0.16875520
## [19,] 0.588062827 0.55638783 -0.1629894 -0.62098588
## [20,] 0.375359251 -0.76881211 -0.2542915 0.76397058
## [21,] -0.390373621 -0.66482431 -0.3416239 -0.80470459
## [22,] 0.502981397 -0.52989798 -0.5956819 -0.81883680
## [23,] -0.603077197 -0.62443235 -0.3495632 -0.80470459
## [24,] -0.688158628 -0.84873662 -0.6711054 -0.67751471
## [25,] 2.034447142 0.77123866 0.1625224 0.42479757
## [26,] -0.347832906 0.26848771 -0.1034446 -0.50792821
## [27,] 1.906824997 2.38004170 -0.1153535 3.57628013
## [28,] -0.007507185 -0.29614028 -0.1113839 -0.69164692
## [29,] -0.560536482 -0.03058465 -0.2860487 0.21281444
## [30,] -0.773240058 -0.49294364 -0.5440764 -0.71991134
## [31,] -0.688158628 -0.07355481 4.7514448 0.86289604
## [32,] -1.071025064 -0.70779447 -0.4011688 -0.63511809
## [33,] -0.688158628 -0.36403314 -0.6115605 0.93355709
## [34,] 0.035033530 0.18684440 -0.4011688 1.66843194
## Pencurian dengan Kekerasan Pencurian Narkotika
## [1,] -0.25633613 0.12704195 0.36707872
## [2,] 3.18539092 4.39628889 3.43263203
## [3,] -0.03953443 0.79141465 -0.11580249
## [4,] 1.19623528 0.50037525 0.40242873
## [5,] -0.57069860 -0.19310140 -0.32366058
## [6,] 2.00924167 0.37944336 1.04438501
## [7,] -0.46771779 -0.59804760 -0.52091366
## [8,] 1.12035469 0.18926416 0.31405369
## [9,] -0.81460052 -0.73503683 -0.52656967
## [10,] -0.48397792 -0.57797592 -0.50535966
## [11,] 0.36154872 0.50087704 3.46727504
## [12,] 0.35070864 0.39901325 0.04539358
## [13,] 0.23688774 0.86718525 0.37061372
## [14,] -0.35931694 -0.19360319 -0.43607363
## [15,] 0.80599222 1.41564399 1.09741003
## [16,] -0.53275830 -0.24980390 -0.31305558
## [17,] -0.74956001 -0.66930207 -0.28901756
## [18,] 0.49704979 -0.01747417 -0.35759659
## [19,] -0.81460052 -0.33159601 -0.73230675
## [20,] -0.74956001 -0.45202611 -0.22750854
## [21,] -0.57611865 -0.66127340 -0.34416359
## [22,] 0.94691332 -0.47510854 0.35718071
## [23,] -0.22381588 -0.64872860 0.19598464
## [24,] -0.93926150 -0.91066406 -0.58807869
## [25,] -0.65199924 -0.38177522 -0.69059374
## [26,] -0.28343635 -0.01697238 -0.52091366
## [27,] 0.84393252 1.14066193 -0.04510246
## [28,] -0.81460052 -0.76414077 -0.62554971
## [29,] -1.02056214 -0.73202608 -0.68988674
## [30,] -0.96094167 -0.77668558 -0.63756871
## [31,] -0.91758133 -0.63267125 -0.66089972
## [32,] -0.96636171 -1.02507265 -0.67645373
## [33,] -0.20213571 -0.42844188 -0.67645373
## [34,] 1.84122035 0.76431788 -0.59090669
## Penipuan, Penggelapan, Korupsi
## [1,] 0.031676257
## [2,] 3.639561262
## [3,] -0.083105283
## [4,] 0.003184386
## [5,] -0.263825154
## [6,] 0.549414268
## [7,] -0.435590438
## [8,] 0.229491252
## [9,] -0.782377218
## [10,] -0.446173133
## [11,] 2.852371551
## [12,] 1.384633134
## [13,] 0.588488835
## [14,] 0.109011338
## [15,] 1.404984471
## [16,] -0.303713775
## [17,] -0.556070352
## [18,] -0.175093326
## [19,] -0.420937475
## [20,] -0.537347122
## [21,] -0.631777325
## [22,] -0.449429347
## [23,] -0.598401133
## [24,] -0.829592320
## [25,] -0.118923636
## [26,] -0.337089967
## [27,] 0.565695337
## [28,] -0.788889646
## [29,] -0.508041197
## [30,] -0.689575122
## [31,] -0.638289753
## [32,] -0.848315550
## [33,] -0.598401133
## [34,] -0.317552684
## attr(,"scaled:center")
## Pembunuhan Penganiayaan
## 26.17647 1078.58824
## Pemerkosaan, Pencabulan Penculikan
## 201.05882 57.94118
## Pencurian dengan Kekerasan Pencurian
## 192.29412 2154.82353
## Narkotika Penipuan, Penggelapan, Korupsi
## 1076.79412 1091.08824
## attr(,"scaled:scale")
## Pembunuhan Penganiayaan
## 23.50689 1163.59800
## Pemerkosaan, Pencabulan Penculikan
## 251.91099 70.76035
## Pencurian dengan Kekerasan Pencurian
## 184.50039 1992.85731
## Narkotika Penipuan, Penggelapan, Korupsi
## 1414.42655 1228.42053
4.4.3 Nilai Eigen
## Pembunuhan Penganiayaan Pemerkosaan, Pencabulan
## Pembunuhan 1.0000000 0.7760740 0.2344847
## Penganiayaan 0.7760740 1.0000000 0.4108933
## Pemerkosaan, Pencabulan 0.2344847 0.4108933 1.0000000
## Penculikan 0.4360909 0.4017596 0.1640298
## Pencurian dengan Kekerasan 0.6319310 0.6353462 0.1774853
## Pencurian 0.6793838 0.8501748 0.3645740
## Narkotika 0.5390358 0.5728562 0.2173497
## Penipuan, Penggelapan, Korupsi 0.6112830 0.7171206 0.3039822
## Penculikan Pencurian dengan Kekerasan Pencurian
## Pembunuhan 0.4360909 0.6319310 0.6793838
## Penganiayaan 0.4017596 0.6353462 0.8501748
## Pemerkosaan, Pencabulan 0.1640298 0.1774853 0.3645740
## Penculikan 1.0000000 0.3143260 0.3285805
## Pencurian dengan Kekerasan 0.3143260 1.0000000 0.8206786
## Pencurian 0.3285805 0.8206786 1.0000000
## Narkotika 0.0385149 0.6663509 0.7336081
## Penipuan, Penggelapan, Korupsi 0.1549786 0.6792509 0.8454067
## Narkotika Penipuan, Penggelapan, Korupsi
## Pembunuhan 0.5390358 0.6112830
## Penganiayaan 0.5728562 0.7171206
## Pemerkosaan, Pencabulan 0.2173497 0.3039822
## Penculikan 0.0385149 0.1549786
## Pencurian dengan Kekerasan 0.6663509 0.6792509
## Pencurian 0.7336081 0.8454067
## Narkotika 1.0000000 0.9108189
## Penipuan, Penggelapan, Korupsi 0.9108189 1.0000000
## eigen() decomposition
## $values
## [1] 4.83104778 1.13178371 0.89961256 0.41589270 0.34454853 0.25208616 0.07640600
## [8] 0.04862257
##
## $vectors
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] -0.3699116 0.21271550 -0.187507748 0.6493880 0.04255967 0.548114389
## [2,] -0.4039877 0.16922687 0.068710671 0.4172618 -0.05259621 -0.555750622
## [3,] -0.1856122 0.23235804 0.913134252 -0.1155246 -0.07972575 0.240654411
## [4,] -0.1807445 0.76370749 -0.256184170 -0.4396715 0.35120036 0.001671903
## [5,] -0.3802651 -0.06539445 -0.242979286 -0.3596426 -0.68914411 0.279671100
## [6,] -0.4306101 -0.04301862 0.004247018 -0.1092868 -0.23170583 -0.413979955
## [7,] -0.3701987 -0.43834784 -0.016215370 -0.2061446 0.42082790 0.262661779
## [8,] -0.4071427 -0.30099690 0.036814236 -0.1172558 0.40002638 -0.119197249
## [,7] [,8]
## [1,] -0.232604098 -0.06861638
## [2,] 0.543763967 0.14840236
## [3,] -0.001739878 0.01113396
## [4,] 0.038383028 -0.01797848
## [5,] 0.189626773 0.27137889
## [6,] -0.517217161 -0.55514150
## [7,] 0.447196486 -0.42658357
## [8,] -0.381160328 0.63954611
Berdasarkan output, akan terdapat tiga macam komponen utama yaitu PC1 dari eigenvalue yang bernilai 4,83104778 dan PC2 dari eigenvalue yang bernilai 1,13178371.
4.4.4 Scree Plot Eigen
plot(nilaivektoreigen_cov$values, xlab="Eigenvalue Number", ylab = "Eigenvalue Size", main = "Scree Plot",lwd = 1)+lines(nilaivektoreigen_cov$values)## integer(0)
axis(1, at = seq(1, length(nilaivektoreigen_cov$values)))
abline(h = 1, col = "red")
lines(nilaivektoreigen_cov$values)Pada hasil scree plot diatas, dapat diketahui bahwa terdapat 2 jumlah komponen utama, yaitu PC1 dan PC2. Hal ini dapat dilihat pada eigenvalue size lebih dari 1 sehingga mendapatkan hasil bahwa eigenvalue number yang terbentuk sebanyak 2. Serta dapat dilihat titik ekstrim dimana garis kurva mulai melandai ditunjukkan pada komponen ke 2.
4.4.5 Kumulatif Eigen
kumeigen_cov <- for (eg in nilaivektoreigen_cov$values){
+ print(eg/sum(nilaivektoreigen_cov$values))}## [1] 0.603881
## [1] 0.141473
## [1] 0.1124516
## [1] 0.05198659
## [1] 0.04306857
## [1] 0.03151077
## [1] 0.009550749
## [1] 0.006077821
Berdasarkan hasil kumulatif nilai eigen, dapat diketahui bahwa keragaman sudah dapat dijelaskan melalui 2 komponen utama yaitu 0,603881 + 0,141473 = 0,745354 Nilai kumulatif keragaman sekitar 75% sehingga dapat disusun dua komponen utama dari PC1 dan PC2.
4.4.6 Persamaan PC
## [,1] [,2]
## [1,] -0.3699116 0.21271550
## [2,] -0.4039877 0.16922687
## [3,] -0.1856122 0.23235804
## [4,] -0.1807445 0.76370749
## [5,] -0.3802651 -0.06539445
## [6,] -0.4306101 -0.04301862
## [7,] -0.3701987 -0.43834784
## [8,] -0.4071427 -0.30099690
Berdasarkan output dari Persamaan Komponen Utama diatas, dapat dituliskan ke dalam bentuk persamaan:
\[ \text{PC1} = -0.3699 x_1 - 0.4039 x_2 - 0.1856 x_3 - 0.1807 x_4 - 0.3802 x_5 - 0.4306 x_6 - 0.3701 x_7 - 0.4071 x_8 \]
\[ \text{PC2} = 0.2127 x_1 + 0.1692 x_2 + 0.2324 x_3 + 0.7637 x_4 - 0.0654 x_5 - 0.0430 x_6 - 0.4383 x_7 - 0.3009 x_8 \]
4.4.7 Fungsi PCA dengan prcomp
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 2.1980 1.0639 0.9485 0.64490 0.58698 0.50208 0.27642
## Proportion of Variance 0.6039 0.1415 0.1124 0.05199 0.04307 0.03151 0.00955
## Cumulative Proportion 0.6039 0.7453 0.8578 0.90979 0.95286 0.98437 0.99392
## PC8
## Standard deviation 0.22051
## Proportion of Variance 0.00608
## Cumulative Proportion 1.00000
## PC1 PC2
## Pembunuhan 0.370 -0.213
## Penganiayaan 0.404 -0.169
## Pemerkosaan, Pencabulan 0.186 -0.232
## Penculikan 0.181 -0.764
## Pencurian dengan Kekerasan 0.380 0.065
## Pencurian 0.431 0.043
## Narkotika 0.370 0.438
## Penipuan, Penggelapan, Korupsi 0.407 0.301
Berdasarkan output fungsi prcomp didapatkan hasil yang sama seperti langkah sebelumnya. Didapatkan 2 komponen utama yaitu PC1 dan PC2.Hal ini karena 2 komponen utama telah menangkap minimal 70% varians data. Kedua komponen utama telah mampu menangkap 74,53% dari total keragaman data.
4.4.8 Plot Efek
Berdasrkan plot efek dari setiap PCA, dapat diketahui seberapa besar persentase penjelasan keragaman mulai dari PCA 1 sampai PCA 8. Persentase penjelasan keragaman pada PCA 1 sebesar 60.4%, PCA 2 sebesar 14.1%, PCA 3 sebesar 11.2%, PCA 4 sebesar 5.2%, PCA 5 sebesar 4.3%, PCA 6 sebesar 3.2%, PCA 7 sebesar 1%, dan PCA 8 sebesar 0.6%.
4.4.9 Plot Kontribusi Variabel
fviz_pca_var(pcamodel,
col.var = "cos2",
gradient.cols = c("navy", "magenta", "darkorange"),
repel = TRUE)Berdasarkan output dari plot kontribusi variabel, representasi variabel yang baik pada komponen utama ditunjukkan oleh variabel Pencurian dan Narkotika karena memiliki nilai cos2 yang tinggi. Variabel Pemerkosaan, Pencabulan memiliki nilai cos2 yang sangat rendah sehingga variabel tersebut dianggap kurang penting untuk komponen utama. Berdasarkan jarak antar sudut juga dapat diketahui bahwa variabel Penganiayaan dan Pembunuhan memiliki hubungan yang sangat erat karena jarak antar sudutnya kecil. Begitu pula pada variabel yang lain.
4.4.10 Kontribusi Variabel pada PC1 dan PC2
PC1 <- fviz_contrib(pcamodel, choice = "var", axes = 1)
PC2 <- fviz_contrib(pcamodel, choice = "var", axes = 2)
grid.arrange(PC1,PC2, ncol=2,
top='Contribution of the variables to PCs')Berdasarkan grafik di atas dapat diketahui bahwa: Pada komponen utama pertama, variabel yang memberikan kontribusi terbanyak yaitu Pencurian, Penipuan, Penggelapan, Korupsi, Penganiayaan, Pencurian dengan Kekerasan, Narkotika, dan Pembunuhan. Komponen utama ini dapat disebut sebagai faktor kejahatan umum dan kekerasan. Pada komponen utama kedua, variabel yang memberikan kontribusi terbanyak yaitu Penculikan dan Narkotika. Komponen utama ini dapat disebut sebagai faktor kejahatan khusus dan terencana.
4.4.11 Plot Individu
fviz_pca_ind(pcamodel,
col.ind = "cos2",
gradient.cols = c("gold", "purple", "brown"),
repel = TRUE)Provinsi dengan warna coklat memiliki nilai cos2 yang sangat tinggi seperti Kalimantan Tengah, Kepulauan Riau, Jambi, dan lainnya. Sedangkan provinsi Maluku dan Nusa Tenggara Timur memiliki nilai cos2 yang sangat rendah. Hal ini menunjukkan bahwa data dengan cos2 rendah tidak direpresentasikan dengan baik oleh komponen utama. Selain itu jarak yang jauh antara provinsi DKI Jakarta dan Maluku menunjukkan tidak adanya kemiripan antar data. Sebaliknya, jarak plot yang dekat menunjukkan adanya kemiripan seperti pada provinsi Kalimantan Tengah dan Kepulauan Riau.
4.4.12 Biplot
fviz_pca_biplot(pcamodel, axes = c(1,2), repel = TRUE, col.var = "darkorange", col.ind = "darkgreen" )Berdasarkan output biplot, dapat diketahui bahwa data DKI Jakarta dan Sumatera Utara memiliki jarak Euclidean yang cukup panjang dibandingkan data yang lainnya. Variabel Penculikan dan Pembunuhan serta Pencurian dan Penipuan, Penggelapan, Korupsi memiliki hubungan yang sangat kuat atau korelasi yang sangat tinggi. Begitu pula dengan variabel lain yang memiliki jarak sudut yang sempit. Sebaliknya, variabel Narkotika dan Pemerkosaan, Pencabulan memiliki jarak sudut yang lebar sehingga kedua variabel memiliki hubungan yang lemah.
4.5 Cluster Hierarki
4.5.1 Data untuk Clustering
pca_model <- prcomp(projek_scalled, center=FALSE, scale.=FALSE, rank. = 2)
results <- pca_model$x
results## PC1 PC2
## Aceh -0.0767488 0.525570356
## Sumatera Utara 9.1980943 1.096054751
## Sumatera Barat 0.5441859 -0.589573734
## Riau 0.4278263 0.966070998
## Jambi -1.1786538 0.600081558
## Sumatera Selatan 2.6922947 -0.627358213
## Bengkulu -1.1203773 0.310082584
## Lampung 0.4765048 0.538226372
## Kepualauan Bangka Belitung -1.8544822 -0.014198147
## Kepulauan Riau -1.4183057 0.488484237
## DKI Jakarta 2.8846138 2.689046349
## Jawa Barat 0.9210611 0.829249977
## Jawa Tengah 0.6477222 0.829267603
## DI Yogyakarta -0.9850605 0.494946096
## Jawa Timur 2.8055211 -0.626265906
## Banten -0.8800831 -0.922289374
## Bali -1.6929075 0.615035348
## Nusa Tenggara Barat -0.5198423 0.249250680
## Nusa Tenggara Timur -0.5952208 -0.222363506
## Kalimantan Barat -0.8635358 -0.804034739
## Kalimantan Tengah -1.5103014 0.482334233
## Kalimantan Selatan -0.1818423 0.809221241
## Kalimantan Timur -1.2212173 0.792986189
## Kalimantan Utara -2.1492374 0.355285096
## Sulawesi Utara 0.4546780 -1.323033710
## Sulawesi Tengah -0.5763822 0.091429157
## Sulawesi Selatan 3.3175668 -3.258046649
## Sulawesi Tenggara -1.4596788 0.008004322
## Gorontalo -1.3998763 -0.525210754
## Sulawesi Barat -1.9329247 0.340832619
## Maluku -0.3722810 -2.173255674
## Maluku Utara -2.2760689 0.266706415
## Papua Barat -1.1018141 -0.871165782
## Papua 0.9967729 -1.421369992
4.5.2 Jarak Euclidean
## Aceh Sumatera Utara Sumatera Barat Riau
## Sumatera Utara 9.4070010
## Sumatera Barat 1.4007996 8.9423506
## Riau 1.5734301 9.0283339 2.0460467
## Jambi 1.2766331 10.5157367 2.2066756 2.1136184
## Sumatera Selatan 3.9407864 7.5396295 3.5547689 3.5214977
## Bengkulu 1.7183969 10.4982717 2.4977469 2.4482905
## Lampung 1.5064318 9.0319134 1.8735137 0.8523607
## Kepualauan Bangka Belitung 1.9900393 11.2790736 2.6497968 2.8294050
## Kepulauan Riau 1.5146816 10.7369280 2.4302865 2.2878054
## DKI Jakarta 4.3450711 7.4574362 4.8377094 4.3698545
## Jawa Barat 1.6831663 8.4593406 2.0284364 1.9510891
## Jawa Tengah 1.5133462 8.7602820 1.9508201 1.6983176
## DI Yogyakarta 1.2209548 10.3690599 2.0320338 1.9825077
## Jawa Timur 3.5378835 7.2618815 2.8955759 3.5281691
## Banten 2.1355676 10.6425388 2.0104145 2.8909151
## Bali 1.6815213 11.0216493 2.6584669 2.5307043
## Nusa Tenggara Barat 1.3305786 9.9880857 1.7769443 1.3244355
## Nusa Tenggara Timur 1.8419890 9.9796489 2.1768777 2.8114482
## Kalimantan Barat 2.0662306 10.5395323 2.2048226 2.9670804
## Kalimantan Tengah 1.6275275 10.8424152 2.5691219 2.4254370
## Kalimantan Selatan 2.0229527 9.7402022 2.7399566 1.6533245
## Kalimantan Timur 1.4013639 10.5827856 2.5166807 2.0248881
## Kalimantan Utara 2.2052692 11.5046817 3.0382176 3.0107298
## Sulawesi Utara 2.9985170 9.3655029 2.7323921 3.7631398
## Sulawesi Tengah 1.0239840 9.8908727 1.5418535 1.9017098
## Sulawesi Selatan 5.4279758 7.8710447 4.3299384 5.5733955
## Sulawesi Tenggara 1.8118402 10.7977526 2.5188930 2.7757695
## Gorontalo 1.8196723 10.8576257 2.1837313 2.9426150
## Sulawesi Barat 1.9585063 11.2544606 2.7852109 2.8606278
## Maluku 5.0636543 10.8880298 4.8252417 5.8702463
## Maluku Utara 2.2457113 11.6064692 3.0508893 3.0996369
## Papua Barat 2.0996958 10.7693476 2.0558014 2.6740278
## Papua 3.2714595 9.1718424 2.4253157 2.7304962
## Jambi Sumatera Selatan Bengkulu Lampung
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan 4.6706974
## Bengkulu 1.0759399 4.3408082
## Lampung 2.1332157 3.1347549 2.2774540
## Kepualauan Bangka Belitung 1.0320955 5.0022823 1.3299219 2.7086368
## Kepulauan Riau 0.5170702 4.7654552 0.8519546 2.2447799
## DKI Jakarta 5.1942502 4.4774386 5.4303349 4.3002500
## Jawa Barat 2.5009603 3.7860322 2.7208206 1.7137860
## Jawa Tengah 2.2115158 3.5651831 2.3335369 1.3835887
## DI Yogyakarta 0.5664217 4.5645595 1.3933799 1.9270298
## Jawa Timur 4.4206475 2.1256104 4.4411141 3.1319027
## Banten 2.0129901 4.3564031 2.4132232 2.6022183
## Bali 0.6371532 5.0712351 1.2272484 2.5411002
## Nusa Tenggara Barat 1.2139985 3.9139043 1.6327789 1.2633662
## Nusa Tenggara Timur 1.7269921 4.2780294 1.2448911 2.7039468
## Kalimantan Barat 1.8724600 3.9825692 1.6561117 2.5494421
## Kalimantan Tengah 0.7099457 4.7663162 0.7562392 2.3422068
## Kalimantan Selatan 2.0554190 3.3404397 1.6983494 1.5568059
## Kalimantan Timur 0.8824173 4.5561069 1.1886534 2.0054272
## Kalimantan Utara 1.0987786 5.3253199 1.2866831 2.9588864
## Sulawesi Utara 3.2620283 3.4505656 2.5887660 3.3804718
## Sulawesi Tengah 1.0017755 4.2185840 1.2496459 1.9000661
## Sulawesi Selatan 6.1293803 3.5858830 6.0188237 5.2880790
## Sulawesi Tenggara 1.1663899 4.7477980 0.7069269 2.6295673
## Gorontalo 1.3274831 4.8059137 1.5357425 2.7640047
## Sulawesi Barat 0.8891800 5.2646725 1.2339227 2.8450758
## Maluku 5.5656344 6.7856806 5.5155042 5.3787791
## Maluku Utara 1.2531518 5.5487951 1.5954633 3.0506142
## Papua Barat 1.7577568 4.3407733 2.0519273 2.4540310
## Papua 3.6454007 2.9156172 3.7258046 2.5149921
## Kepualauan Bangka Belitung Kepulauan Riau
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau 0.9140090
## DKI Jakarta 5.8570419 5.4790554
## Jawa Barat 3.3089383 2.6714994
## Jawa Tengah 2.9613243 2.4309486
## DI Yogyakarta 1.2560001 0.8393313
## Jawa Timur 4.8508500 4.6838638
## Banten 1.6946701 2.1722500
## Bali 0.7540374 0.5158707
## Nusa Tenggara Barat 1.6868656 1.3414633
## Nusa Tenggara Timur 2.0494444 1.6435024
## Kalimantan Barat 1.5242682 1.8977194
## Kalimantan Tengah 0.8425185 0.3710065
## Kalimantan Selatan 2.4483196 1.9970717
## Kalimantan Timur 1.1962547 0.7805078
## Kalimantan Utara 0.5785222 0.8543210
## Sulawesi Utara 3.3761069 3.2110983
## Sulawesi Tengah 1.6163478 1.0663505
## Sulawesi Selatan 6.2688703 6.2853705
## Sulawesi Tenggara 1.1157859 0.8335375
## Gorontalo 0.9889717 1.2640663
## Sulawesi Barat 0.6828039 0.6542985
## Maluku 5.4926705 5.4222940
## Maluku Utara 0.7455717 0.9817129
## Papua Barat 1.3777920 1.8075788
## Papua 3.7913684 3.7624728
## DKI Jakarta Jawa Barat Jawa Tengah DI Yogyakarta
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat 3.9068462
## Jawa Tengah 4.0828728 1.4124157
## DI Yogyakarta 5.0557865 2.2036843 2.1153303
## Jawa Timur 3.7793925 3.2059290 3.0597127 4.2096273
## Banten 5.4941440 3.2111392 3.0066482 1.8175231
## Bali 5.5251732 2.9757599 2.7208325 0.9919790
## Nusa Tenggara Barat 5.0404960 2.2029909 1.9823589 0.9862447
## Nusa Tenggara Timur 5.5400720 2.6911352 2.6187513 1.9398831
## Kalimantan Barat 5.4591037 3.1914168 2.6755232 1.9444848
## Kalimantan Tengah 5.5181306 2.8687489 2.4880048 1.1110898
## Kalimantan Selatan 4.7861180 2.7419648 2.2197852 2.1838594
## Kalimantan Timur 5.1054732 2.7294690 2.3311148 1.1684211
## Kalimantan Utara 6.0097193 3.4683590 3.1375581 1.4427403
## Sulawesi Utara 5.6772703 3.3688503 3.2743497 3.3361130
## Sulawesi Tengah 5.2150194 2.1211183 2.0537225 1.0470816
## Sulawesi Selatan 6.3971687 5.3891401 5.5677456 5.9457589
## Sulawesi Tenggara 5.7956635 2.9903738 2.6955068 1.5070839
## Gorontalo 5.7563910 3.0300333 2.9735195 1.3645131
## Sulawesi Barat 5.8847017 3.2051617 2.9928604 1.2202607
## Maluku 7.7938460 5.1522800 5.1788817 5.4400750
## Maluku Utara 6.1495435 3.4824006 3.2712242 1.4809593
## Papua Barat 5.7790340 3.2078292 3.0237069 1.6100118
## Papua 5.7480764 3.5152688 3.3730650 3.4035417
## Jawa Timur Banten Bali Nusa Tenggara Barat
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat
## Jawa Tengah
## DI Yogyakarta
## Jawa Timur
## Banten 3.8296409
## Bali 4.9148682 2.1500482
## Nusa Tenggara Barat 3.8114007 1.8346200 1.6063142
## Nusa Tenggara Timur 4.2774241 2.6548240 1.9643317 2.1620541
## Kalimantan Barat 3.7849887 1.3806339 2.0058908 1.9972069
## Kalimantan Tengah 4.7387149 2.2299613 0.5548532 1.5286188
## Kalimantan Selatan 3.9597006 2.9849514 2.2816241 1.6719368
## Kalimantan Timur 4.5629537 2.2716558 0.7873641 1.3707507
## Kalimantan Utara 5.2526589 2.2597397 0.6235822 1.9730582
## Sulawesi Utara 3.6545491 3.2948684 3.5380183 3.2785830
## Sulawesi Tengah 4.0338947 2.0888890 1.4019648 1.1732723
## Sulawesi Selatan 3.2648178 5.0256965 6.5186169 5.5058303
## Sulawesi Tenggara 4.7705772 2.3361075 1.0812005 1.8731459
## Gorontalo 4.5283327 1.4670153 1.2793258 1.8227611
## Sulawesi Barat 5.1257257 2.2048279 0.4590131 1.8425810
## Maluku 6.2805609 5.3137819 5.5761089 5.5313289
## Maluku Utara 5.4156827 2.2732754 0.7130817 2.0551154
## Papua Barat 4.1116267 0.7378578 1.8607800 1.4805009
## Papua 3.0206937 2.8229481 4.0268939 2.5775388
## Nusa Tenggara Timur Kalimantan Barat
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat
## Jawa Tengah
## DI Yogyakarta
## Jawa Timur
## Banten
## Bali
## Nusa Tenggara Barat
## Nusa Tenggara Timur
## Kalimantan Barat 2.0037326
## Kalimantan Tengah 1.6955911 1.7781791
## Kalimantan Selatan 2.3926858 2.4337912
## Kalimantan Timur 2.0553664 1.9864981
## Kalimantan Utara 2.0983694 1.9623520
## Sulawesi Utara 1.8600320 2.4118625
## Sulawesi Tengah 1.1865731 1.9422182
## Sulawesi Selatan 5.3896315 5.1492625
## Sulawesi Tenggara 1.1929144 1.6830349
## Gorontalo 1.6082085 1.4464290
## Sulawesi Barat 1.8465962 2.0056603
## Maluku 5.3416037 5.1904255
## Maluku Utara 2.2577359 2.1790850
## Papua Barat 2.3479440 1.3988660
## Papua 3.7450849 3.2001137
## Kalimantan Tengah Kalimantan Selatan
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat
## Jawa Tengah
## DI Yogyakarta
## Jawa Timur
## Banten
## Bali
## Nusa Tenggara Barat
## Nusa Tenggara Timur
## Kalimantan Barat
## Kalimantan Tengah
## Kalimantan Selatan 1.9391884
## Kalimantan Timur 0.6812386 1.6558998
## Kalimantan Utara 0.7347984 2.5162545
## Sulawesi Utara 3.1897933 3.1515301
## Sulawesi Tengah 1.2792789 2.0512400
## Sulawesi Selatan 6.3702002 5.8137701
## Sulawesi Tenggara 0.7208501 2.1985054
## Gorontalo 1.3442544 2.7526920
## Sulawesi Barat 0.6893058 2.5338927
## Maluku 5.4199904 6.1335451
## Maluku Utara 0.9692178 2.7877094
## Papua Barat 1.8918708 2.6325931
## Papua 3.8809430 3.1951933
## Kalimantan Timur Kalimantan Utara Sulawesi Utara
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat
## Jawa Tengah
## DI Yogyakarta
## Jawa Timur
## Banten
## Bali
## Nusa Tenggara Barat
## Nusa Tenggara Timur
## Kalimantan Barat
## Kalimantan Tengah
## Kalimantan Selatan
## Kalimantan Timur
## Kalimantan Utara 1.1940667
## Sulawesi Utara 3.4567130 3.5811635
## Sulawesi Tengah 1.4128000 1.7863010 2.6858965
## Sulawesi Selatan 6.3505593 6.7224958 4.2490682
## Sulawesi Tenggara 1.2670998 1.0593428 2.6937105
## Gorontalo 1.6818204 1.3337526 2.8342443
## Sulawesi Barat 1.1636672 0.4384469 3.4453968
## Maluku 5.5072035 5.7006554 5.4571515
## Maluku Utara 1.3319017 0.5129319 3.7838517
## Papua Barat 1.9938375 1.9160343 3.1613476
## Papua 3.7607940 4.2391748 3.7124938
## Sulawesi Tengah Sulawesi Selatan Sulawesi Tenggara
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat
## Jawa Tengah
## DI Yogyakarta
## Jawa Timur
## Banten
## Bali
## Nusa Tenggara Barat
## Nusa Tenggara Timur
## Kalimantan Barat
## Kalimantan Tengah
## Kalimantan Selatan
## Kalimantan Timur
## Kalimantan Utara
## Sulawesi Utara
## Sulawesi Tengah
## Sulawesi Selatan 5.4658519
## Sulawesi Tenggara 1.2344673 6.1312853
## Gorontalo 1.3416161 5.6385271 1.1624913
## Sulawesi Barat 1.4744063 6.5527376 0.9190653
## Maluku 5.1549459 7.2026858 5.1602671
## Maluku Utara 1.8300678 6.8253565 1.2185811
## Papua Barat 1.7664538 5.1772738 1.9713053
## Papua 3.1793548 3.7748563 3.9372529
## Gorontalo Sulawesi Barat Maluku Maluku Utara
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat
## Jawa Tengah
## DI Yogyakarta
## Jawa Timur
## Banten
## Bali
## Nusa Tenggara Barat
## Nusa Tenggara Timur
## Kalimantan Barat
## Kalimantan Tengah
## Kalimantan Selatan
## Kalimantan Timur
## Kalimantan Utara
## Sulawesi Utara
## Sulawesi Tengah
## Sulawesi Selatan
## Sulawesi Tenggara
## Gorontalo
## Sulawesi Barat 1.1121219
## Maluku 5.0848169 5.5458764
## Maluku Utara 1.2869479 0.5008846 5.4353501
## Papua Barat 1.2341936 1.8625933 5.4227855 1.9422235
## Papua 3.6067965 4.1481810 6.1204139 4.3247601
## Papua Barat
## Sumatera Utara
## Sumatera Barat
## Riau
## Jambi
## Sumatera Selatan
## Bengkulu
## Lampung
## Kepualauan Bangka Belitung
## Kepulauan Riau
## DKI Jakarta
## Jawa Barat
## Jawa Tengah
## DI Yogyakarta
## Jawa Timur
## Banten
## Bali
## Nusa Tenggara Barat
## Nusa Tenggara Timur
## Kalimantan Barat
## Kalimantan Tengah
## Kalimantan Selatan
## Kalimantan Timur
## Kalimantan Utara
## Sulawesi Utara
## Sulawesi Tengah
## Sulawesi Selatan
## Sulawesi Tenggara
## Gorontalo
## Sulawesi Barat
## Maluku
## Maluku Utara
## Papua Barat
## Papua 2.6636352
4.5.3 Koefisien Korelasi
ds <- hclust(dist(results,method = 'euclidean'),method = "single")
da <- hclust(dist(results,method = 'euclidean'),method = "average")
dc <- hclust(dist(results,method = 'euclidean'),method = "complete")
dw <- hclust(dist(results,method = 'euclidean'),method = "ward.D")
linkage <- c("single", "average", "complete", "ward")
names(linkage) <- c("single","average","complete","ward")
ac <- function(x) {
agnes(results, method = x)$ac
}
map_dbl(linkage,ac)## single average complete ward
## 0.9051577 0.9175915 0.9207571 0.9441308
Nilai-nilai korelasi yang dihasilkan menunjukkan tingkat kemiripan atau hubungan antara hasil clustering yang diperoleh dari masing-masing metode. Metode ward menghasilkan koefisien yang paling optimum (0.9441308) mendekati 1, maka dipilih hasil clustering dengan metode ward linkage.
4.5.4 Indeks Validitas
validity <- clValid(results, 2:9, clMethods = "hierarchical",
validation = "internal", metric = "euclidean", method = "ward")## The "ward" method has been renamed to "ward.D"; note new "ward.D2"
##
## Clustering Methods:
## hierarchical
##
## Cluster sizes:
## 2 3 4 5 6 7 8 9
##
## Validation Measures:
## 2 3 4 5 6 7 8 9
##
## hierarchical Connectivity 8.8377 18.1433 20.2266 25.5726 25.9393 28.3933 30.1433 35.2651
## Dunn 0.2559 0.0624 0.0766 0.0766 0.1689 0.1689 0.2475 0.2496
## Silhouette 0.6169 0.3158 0.3375 0.4008 0.4256 0.4110 0.4336 0.4188
##
## Optimal Scores:
##
## Score Method Clusters
## Connectivity 8.8377 hierarchical 2
## Dunn 0.2559 hierarchical 2
## Silhouette 0.6169 hierarchical 2
Berdasarkan output di atas, dapat disimpulkan bahwa clustering hierarki akan dilakukan dengan 2 cluster, karena seluruh indeks validitas memberikan jumlah cluster optimal sebanyak 2.
4.5.5 Dendogram
clus_hier <- eclust(results, FUNcluster = "hclust", k = 2, hc_method = "ward.D", graph = TRUE, sub = " ", xlab = "Provinsi", ylab = "Jarak")
fviz_dend(clus_hier, rect = TRUE, cex = 0.5)## projekAnmul.Provinsi PC1 PC2
## Aceh Aceh -0.0767488 0.525570356
## Sumatera Utara Sumatera Utara 9.1980943 1.096054751
## Sumatera Barat Sumatera Barat 0.5441859 -0.589573734
## Riau Riau 0.4278263 0.966070998
## Jambi Jambi -1.1786538 0.600081558
## Sumatera Selatan Sumatera Selatan 2.6922947 -0.627358213
## Bengkulu Bengkulu -1.1203773 0.310082584
## Lampung Lampung 0.4765048 0.538226372
## Kepualauan Bangka Belitung Kepualauan Bangka Belitung -1.8544822 -0.014198147
## Kepulauan Riau Kepulauan Riau -1.4183057 0.488484237
## DKI Jakarta DKI Jakarta 2.8846138 2.689046349
## Jawa Barat Jawa Barat 0.9210611 0.829249977
## Jawa Tengah Jawa Tengah 0.6477222 0.829267603
## DI Yogyakarta DI Yogyakarta -0.9850605 0.494946096
## Jawa Timur Jawa Timur 2.8055211 -0.626265906
## Banten Banten -0.8800831 -0.922289374
## Bali Bali -1.6929075 0.615035348
## Nusa Tenggara Barat Nusa Tenggara Barat -0.5198423 0.249250680
## Nusa Tenggara Timur Nusa Tenggara Timur -0.5952208 -0.222363506
## Kalimantan Barat Kalimantan Barat -0.8635358 -0.804034739
## Kalimantan Tengah Kalimantan Tengah -1.5103014 0.482334233
## Kalimantan Selatan Kalimantan Selatan -0.1818423 0.809221241
## Kalimantan Timur Kalimantan Timur -1.2212173 0.792986189
## Kalimantan Utara Kalimantan Utara -2.1492374 0.355285096
## Sulawesi Utara Sulawesi Utara 0.4546780 -1.323033710
## Sulawesi Tengah Sulawesi Tengah -0.5763822 0.091429157
## Sulawesi Selatan Sulawesi Selatan 3.3175668 -3.258046649
## Sulawesi Tenggara Sulawesi Tenggara -1.4596788 0.008004322
## Gorontalo Gorontalo -1.3998763 -0.525210754
## Sulawesi Barat Sulawesi Barat -1.9329247 0.340832619
## Maluku Maluku -0.3722810 -2.173255674
## Maluku Utara Maluku Utara -2.2760689 0.266706415
## Papua Barat Papua Barat -1.1018141 -0.871165782
## Papua Papua 0.9967729 -1.421369992
## klaster
## Aceh 1
## Sumatera Utara 2
## Sumatera Barat 1
## Riau 1
## Jambi 1
## Sumatera Selatan 2
## Bengkulu 1
## Lampung 1
## Kepualauan Bangka Belitung 1
## Kepulauan Riau 1
## DKI Jakarta 2
## Jawa Barat 1
## Jawa Tengah 1
## DI Yogyakarta 1
## Jawa Timur 2
## Banten 1
## Bali 1
## Nusa Tenggara Barat 1
## Nusa Tenggara Timur 1
## Kalimantan Barat 1
## Kalimantan Tengah 1
## Kalimantan Selatan 1
## Kalimantan Timur 1
## Kalimantan Utara 1
## Sulawesi Utara 1
## Sulawesi Tengah 1
## Sulawesi Selatan 2
## Sulawesi Tenggara 1
## Gorontalo 1
## Sulawesi Barat 1
## Maluku 1
## Maluku Utara 1
## Papua Barat 1
## Papua 1
Berdasarkan output diatas didapatkan 2 cluster:
Cluster 1 (29 provinsi): Aceh, Sumatera Barat, Jambi, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, Riau, Jawa Barat, Jawa Tengah, DI Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Kalimantan Selatan, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua, Papua Barat
Cluster 2 (5 provinsi): Sumatera Utara, DKI Jakarta, Sumatera Selatan, Sulawesi Selatan, Jawa Timur
4.5.6 Karakteristik Cluster
hist.kluster1 <- subset(tabel,klaster==1)
hist.kluster2 <- subset(tabel,klaster==2)
hist.kluster_1 <- sapply(hist.kluster1,mean)## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## projekAnmul.Provinsi PC1 PC2 klaster
## hist.kluster_1 NA -0.7206238 0.02505413 1
## hist.kluster_2 NA 4.1796181 -0.14531393 2
Berdasarkan hasil di atas dapat diketahui bahwa cluster 1 memiliki nilai yang lebih rendah dibandingkan cluster 2. Artinya, provinsi yang tergolong cluster 1 termasuk provinsi dengan tingkat kriminalitas yang rendah sedangkan provinsi yang tergolong cluster 2 termasuk provinsi dengan tingkat kriminalitas yang tinggi.
4.6 Cluster Non-Hierarki (K-Means)
4.6.1 Jumlah Cluster Optimal (Silhouette Method)
Berdasarkan grafik Silhouette di atas, nilai tertinggi dicapai ketika jumlah cluster adalah 2. Hal ini menunjukkan bahwa pembagian data menjadi 2 cluster memberikan hasil pengelompokan terbaik.
4.6.2 K-Means Clustering
## K-means clustering with 2 clusters of sizes 29, 5
##
## Cluster means:
## PC1 PC2
## 1 -0.7206238 0.02505413
## 2 4.1796181 -0.14531393
##
## Clustering vector:
## Aceh Sumatera Utara
## 1 2
## Sumatera Barat Riau
## 1 1
## Jambi Sumatera Selatan
## 1 2
## Bengkulu Lampung
## 1 1
## Kepualauan Bangka Belitung Kepulauan Riau
## 1 1
## DKI Jakarta Jawa Barat
## 2 1
## Jawa Tengah DI Yogyakarta
## 1 1
## Jawa Timur Banten
## 2 1
## Bali Nusa Tenggara Barat
## 1 1
## Nusa Tenggara Timur Kalimantan Barat
## 1 1
## Kalimantan Tengah Kalimantan Selatan
## 1 1
## Kalimantan Timur Kalimantan Utara
## 1 1
## Sulawesi Utara Sulawesi Tengah
## 1 1
## Sulawesi Selatan Sulawesi Tenggara
## 2 1
## Gorontalo Sulawesi Barat
## 1 1
## Maluku Maluku Utara
## 1 1
## Papua Barat Papua
## 1 1
##
## Within cluster sum of squares by cluster:
## [1] 42.81103 51.43293
## (between_SS / total_SS = 52.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
Berdasarkan hasil K-means clustering dengan 2 cluster, dapat diketahui bahwa: - Cluster 1 terdiri dari 29 provinsi dengan nilai PC1 yang lebih rendah (-0.7206238) dan nilai PC2 yang lebih tinggi (0.02505413). - Cluster 2 terdiri dari 5 provinsi dengan nilai PC1 yang lebih tinggi (4.1796181) dan nilai PC2 yang lebih rendah (-0.14531393).
Dengan nilai 52.1% menunjukkan bahwa model clustering ini berhasil memisahkan data dengan cukup baik berdasarkan dua komponen utama.
Secara keseluruhan, cluster 1 memiliki nilai yang lebih rendah dibandingkan cluster 2. Artinya, provinsi yang tergolong cluster 1 termasuk provinsi dengan tingkat kriminalitas yang rendah sedangkan provinsi yang tergolong cluster 2 termasuk provinsi dengan tingkat kriminalitas yang tinggi.
5 PENUTUP
5.1 Kesimpulan
Berdasarkan Analisis Cluster Hierarki dan Non-Hierarki, didapatkan hasil yang sama yaitu terdapat 2 cluster. Cluster pertama, yaitu cluster dengan tingkat kriminalitas yang rendah dimana faktor yang dominan dari kriminalitas tersebut adalah faktor kejahatan umum dan kekerasan. Cluster pertama mencakup 29 provinsi, yaitu Aceh, Sumatera Barat, Jambi, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, Riau, Jawa Barat, Jawa Tengah, DI Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Kalimantan Selatan, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua, dan Papua Barat. Sedangkan cluster kedua, yaitu cluster dengan tingkat kriminalitas yang tinggi dimana faktor yang dominan dari penyebab perceraian tersebut adalah faktor kejahatan khusus dan terencana.Cluster kedua mencakup 5 provinsi, yaitu Sumatera Utara, DKI Jakarta, Sumatera Selatan, Sulawesi Selatan, dan Jawa Timur.
5.2 Saran
Cluster dengan tingkat kriminalitas rendah (Cluster 1) sebaiknya terus meningkatkan program pencegahan kejahatan melalui edukasi masyarakat, penguatan norma sosial, serta memperkuat pengawasan dan kerja sama antara masyarakat dan aparat keamanan guna mencegah potensi meningkatnya kejahatan.
Cluster dengan tingkat kriminalitas tinggi (Cluster 2) sebaiknya memprioritaskan pemberantasan jaringan narkotika dan pengawasan lingkungan dengan meningkatkan kapasitas aparat penegak hukum, serta mengadakan program rehabilitasi sosial untuk pencegahan dan penanganan tindak kejahatan.
6 DAFTAR PUSTAKA
Nasution, M. Z. (2019). Penerapan principal component analysis (pca) dalam penentuan faktor dominan yang mempengaruhi pengidap kanker serviks (Studi Kasus: Cervical Cancer Dataset). Jurnal Mantik, 3(1), 204-210.
Dewi, S. M., Windarto, A. P., Damanik, I. S., & H. S. (2019). Analisa Metode KMeans pada Pengelompokan Kriminalitas Menurut Wilayah. Seminar Nasional Sains & Teknologi Informasi (SENSASI).
Statistik, B. P. (2020). Statistik Kriminal 2020. Jakarta: Badan Pusat Statistik.
Johnson, & Wichen. (2007). Applied Multivariate Statistical Analysis Edisi Keenam. Pearson Pretice Hall.
Triaynto, W. A. (2015). Algoritma K-Medoids untuk Penentuan Strategi Pemasaran Produk. Jakarta: PT. Raja Grafindo Persada.
Muhtadi. (2017). PENERAPAN PRINCIPAL COMPONENT ANALYSISI (PCA) DALAM ALGORITMA K-MEANS UNTUK MENENTUKAN CENTROID PADA CLUSTERING. Journal of Mathematic Teaching.
Prasetyo, Eko. 2012. Data Mining: Konsep dan Aplikasi menggunakan MATLAB. Yogyakarta: ANDI Yogyakarta.
Simamora. (2005). Analisis Multivariat Pemasaran. Jakarta: PT. Gramedika Pustaka Utama.