Keamanan negara merupakan salah satu hal penting dalam menjamin stabilitas suatu negara. Keamanan negara mencerminkan ketertiban dan perlindungan terhadap ancaman, baik dari dalam maupun luar. Selain itu, keamanan negara tidak hanya berfokus pada aspek pertahanan fisik, tetapi juga terhadap dimensi sosial, ekonomi, politik, dan lingkungan. Dalam Mahayuda, dan Ardana (2020) Undang-Undang Nomor 2 Tahun 2002 menegaskan bahwa yang dimaksud dengan keamanan dan ketertiban masyarakat adalah suatu kondisi dinamis masyarakat sebagai salah satu prasyarat terselenggaranya proses pembangunan nasional dalam rangka tercapainya tujuan nasional yang ditandai oleh terjaminnya keamanan, ketertiban, dan tegaknya hukum, serta terbinanya ketenteraman, yang mengandung kemampuan membina serta mengembangkan potensi dan kekuatan masyarakat dalam menangkal, mencegah, dan menanggulangi segala bentuk pelanggaran hukum dan bentuk-bentuk gangguan lainnya yang dapat meresahkan masyarakat.
Provinsi Nusa Tenggara Timur (NTT) sebagai salah satu wilayah di Indonesia turut menghadapi berbagai tantangan terkait keamanan, seperti tindak pidana, tingkat kemiskinan, tingkat pengangguran, dan kepadatan penduduk. Pada tahun 2023, dilansir dari web BPS Provinsi Nusa Tenggara Timur (2024) terdapat jumlah tindak pidana yang dilaporkan sebesar 8740 kasus, tingkat kemiskinan sebesar 19.96%, tingkat pengangguran terbuka sebesar 3.14%, dan kepadatan penduduk 120 jiwa/km2. Menurut Munawar (2013) akibat dari faktor-faktor tersebut, yaitu muncul berbagai implikasi negatif, seperti adanya kesenjangan antarpenduduk, dalam bidang ekonomi, sosial, dan budaya yang nantinya dapat menyebabkan konflik. Keadaan ini menunjukkan bahwa faktor-faktor tersebut berpotensi menjadi ancaman bagi stabilitas wilayah di NTT jika tidak ditangani secara serius.
Untuk menangani hal ini, diperlukan analisis cluster sebagai pendekatan komprehensif untuk mengidentifikasi pola distribusi dan karakteristik wilayah berdasarkan keempat faktor yang telah ditetapkan. Metode ini bertujuan menemukan struktur klaster dalam set data berdasarkan kesamaan terbesar pada klaster yang sama dan perbedaan maksimal di antara klaster yang berbeda (SINAGA & YANG, 2020). Terdapat dua jenis analisis cluster, yaitu analisis cluster hierarki dan analisis cluster non-hierarki. Pada kasus ini akan digunakan analisis cluster hierarki, karena mampu memberikan visualisasi yang jelas melalui dendrogram. Dengan menggunakan analisis ini, pemerintah diharapkan dapat memahami struktur kerentanan keamanan wilayah secara lebih mendalam, sehingga memungkinkan pengambilan keputusan yang lebih tepat sasaran dalam mengatasi ancaman keamanan di Provinsi Nusa Tenggara Timur.
Bagaimana pola pengelompokan wilayah di Provinsi Nusa Tenggara Timur berdasarkan tindak pidana, tingkat kemiskinan, tingkat pengangguran, dan kepadatan penduduk dengan menggunakan analisis cluster hierarki, serta bagaimana pengelompokan tersebut dapat membantu mengidentifikasi karakteristik wilayah yang berpotensi memengaruhi keamanan?
Penelitian ini bertujuan untuk menganalisis pola pengelompokan wilayah di Provinsi Nusa Tenggara Timur menggunakan analisis cluster hierarki berdasarkan tindak pidana, kemiskinan, pengangguran, dan kepadatan penduduk, untuk mengidentifikasi karakteristik masing-masing kelompok wilayah yang berpotensi memengaruhi keamanan.
Analisis clustering adalah salah satu metode statistik multivariat terapan untuk mengelompokkan setiap objek yang paling mirip dengan objek lain dalam cluster yang sama (Apriliana & Widodo, 2023). Tujuan utama dari analisis ini adalah untuk memaksimalkan homogeneitas dalam kelompok dan meminimalkan heterogenitas antar kelompok. Terdapat dua jenis analisis cluster, yaitu analisis cluster hierarki dan analisis cluster non-hierarki.
Analisis cluster hierarki merupakan salah satu pendekatan dalam analisis cluster yang menghasilkan struktur hierarki dalam bentuk dendrogram. Menurut Az-Zahra & Wijayanto (2024) dalam metode hierarki, pengelompokan bisa dilakukan melalui proses penggabungan (agglomerative) maupun pemisahan (divisive), yang ditinjau berdasarkan kemiripan sifat, di mana banyak kelompok belum diketahui sebelum cluster terbentuk. Kemiripan sifat tersebut dapat ditentukan dari kedekatan jarak Euclidean atau jarak Mahalanobis (Silvi, 2018). Namun, meskipun sama-sama jarak, jarak Euclidean atau jarak Mahalanobis digunakan disaat yang berbeda. Menurut Silvi (2018) Jarak Euclidean digunakan jika tidak terjadi korelasi, sedangkan jarak Mahalanobis digunakan jika data terjadi korelasi. Jarak Euclidean memiliki rumus sebagai berikut:
\[ d(x, y) = \sqrt{\sum_{i=1}^n (y_k - x_k)} \]
Sedangkan Jarak Mahalanobis memiliki rumus sebagai berikut:
\[ d_{\text{Mahalanobis}}(x, y) = \sqrt{(y - x)^T \Sigma^{-1} (y - x)} \]
Dalam metode cluster hierarki terdapat beberapa metode penghitungan jarak yang dapat digunakan, antara lain single linkage, complete linkage, average linkage, Centroid Linkage, dan Ward.
Metode single linkage merupakan pengelompokkan data berdasarkan jarak minimum antar anggota cluster. Metode ini cenderung menghasilkan cluster yang panjang dan ramping, dan dapat sensitif terhadap outlier. Rumus untuk metode ini, yaitu :
\[ d_{ij} = \min(d_{pj}; d_{qj}) \]
Metode complete linkage merupakan pengelompokkan data berdasarkan jarak maksimum antar anggota cluster. Metode ini cenderung menghasilkan cluster yang lebih kompak dan bulat dan lebih tahan terhadap outlier. Rumus untuk metode ini, yaitu :
\[ d_{ij} = \max(d_{pj}; d_{qj}) \]
Metode average linkage merupakan pengelompokkan data berdasarkan jarak rata-rata antar anggota cluster. Metode ini memberikan keseimbangan antara single dan complete linkage, dan sering digunakan dalam praktik karena kemampuannya untuk menghasilkan hasil yang stabil. Rumus untuk metode ini, yaitu :
\[ d_{ij} = \frac{1}{n_i \times n_j} \sum_{i=1}^{n_i} \sum_{j=1}^{n_j} \sqrt{\sum_{k=1}^p (x_{ik} - y_{jk})^2} \]
Metode centroid linkage merupakan pengelompokan data berdasarkan pusat (centroid) dari setiap klaster untuk menentukan jarak antar klaster. Metode ini menganggap setiap cluster sebagai titik di ruang multidimensi yang mewakili rata-rata semua anggotanya, sehingga pendekatan ini dapat memberikan hasil yang berbeda tergantung pada distribusi data.
Metode Ward merupakan pengelompokan data yang meminimalkan total varians dalam setiap cluster. Metode ini cenderung menghasilkan cluster yang lebih homogen dan kompak dengan meminimalkan jumlah kuadrat deviasi dari rata-rata dalam setiap kelompok. Rumus untuk metode ini, yaitu :
\[ ESS = \sum_{k=1}^K \left[ \sum_{i=1}^{n_k} \sum_{j=1}^p X_{ijk}^2 - \frac{1}{n_k} \sum_{j=1}^p \left( \sum_{i=1}^{n_k} X_{ijk} \right)^2 \right] \]
Uji asumsi merupakan langkah penting dalam analisis statistik untuk memastikan bahwa data memenuhi syarat-syarat tertentu sebelum melakukan analisis lebih lanjut. Dalam analisis cluster terdapat dua uji asumsi yang harus dipenuhi, yaitu uji representatif dengan menggunakan KMO dan uji non-multikolinearitas.
Uji KMO merupakan indeks yang digunakan untuk mengukur ketepatan sampel yang sudah mencukupi secara keseluruhan tiap indicator (Apriliana & Widodo, 2023). Nilai KMO berkisar antara 0 hingga 1, dengan nilai lebih dari 0.5 dianggap cukup untuk melanjutkan analisis. Rumus untuk KMO, yaitu :
\[ KMO = \frac{\sum_{i=1}^p \sum_{j=1}^p r_{ij}^2}{\sum_{i=1}^p \sum_{j=1}^p r_{ij}^2 + \sum_{i=1}^p \sum_{j=1}^p q_{ij}^2} \]
Uji non-multikolinearitas digunakan untuk memeriksa apakah terdapat hubungan linear yang kuat antara dua atau lebih variabel independent. Multikolinieritas dapat diketahui dengan melihat nilai Variance Inflation Factor (VIF). Apriliana & Widodo (2023) menyatakan jika nilai VIF melebihi 10 maka menunjukkan adanya gejala multikolinieritas sehingga perlu melakukan analisis komponen utama untuk menanganinya. Rumus untuk VIF, yaitu :
\[ VIF_j = \frac{1}{1 - R_j^2} \]
Indeks validitas digunakan untuk mengukur sejauh mana instrumen pengukuran dapat mencerminkan variabel yang ingin diukur. Indeks validitas penting karena untuk memastikan bahwa kesimpulan yang diambil dari data adalah akurat dan dapat dipercaya. Terdapat beberapa indeks validitas, yaitu indeks connectivity, indeks dunn, dan indeks silhouette.
Indeks connectivity digunakan untuk mengukur seberapa baik variabel dalam dataset dikelompokkan bersama berdasarkan kedekatannya. Indeks ini berada pada rentang nilai nol hingga takhingga, dengan klaster yang baik memiliki indeks connectivity seminimum mungkin (Az-Zahra & Wijayanto, 2024).
\[ Conn = \sum_{i=1}^N \sum_{j=1}^L x_{i, nn_{i(j)}} \]
Indeks Dunn digunakan untuk mengevaluasi kualitas hasil clustering dengan membandingkan jarak antar cluster dengan diameter dari masing-masing cluster. Semakin besar indeks Dunn yang dihasilkan, semakin baik pula klaster yang terbentuk (Az-Zahra & Wijayanto, 2024). Rumus untuk indeks dunn, yaitu :
\[ Dunn = \frac{\min d_{C}(C_k, C_h)}{\max \mathrm{\Delta}(C_k)} \]
Indeks silhouette digunakan untuk mengukur seberapa mirip suatu objek dengan objek lain dalam kelompoknya dibandingkan dengan objek di kelompok lain. Indeks ini menghasilkan jumlah klaster optimal melalui perbedaan jarak rata-rata dalam klaster dan jarak minimun antarklaster (Az-Zahra & Wijayanto, 2024).
\[ \bar{S} = \frac{1}{n} \sum_{i=1}^n \left( \frac{b(i) - a(i)}{\max\{a(i), b(i)\}} \right) \]
Pada penelitian ini, data yang digunakan adalah data sekunder yang bersumber dari Badan Pusat Statistika (BPS) Nusa Tenggara Timur (NTT). Terdapat empat variabel yang akan digunakan dalam penelitian ini, diantaranya yaitu :
Tindak Pidana (X1)
Tindak pidana merupakan jumlah kasus kejahatan yang terjadi di suatu wilayah. Tingginya tindak pidana mencerminkan ketidakstabilan sosial yang dapat mengancam keamanan wilayah. Dengan demikian, tindak pidana dijadikan sebagai variabel dalam penelitian ini.
Sumber : https://ntt.bps.go.id/id/statistics-table/2/MTk5IzI=/jumlah-tindak-pidana-yang-dilaporkan.html
Tingkat Kemiskinan (X2)
Tingkat kemiskinan merupakan persentase penduduk yang hidup di bawah garis kemiskinan, yang telah ditetapkan oleh pemerintah. Tingginya tingkat kemiskinan membawa dampak negatif pada stabilitas keamanan wilayah, karena dapat menyebabkan beberapa konflik. Dengan demikian, kemiskinan dijadikan sebagai salah satu variabel dalam penelitian ini.
Tingkat Pengangguran (X3)
Tingkat pengangguran adalah persentase angkatan kerja yang belum mendapatkan pekerjaan meskipun aktif mencari kerja. Tingginya tingkat pengangguran dapat memicu terjadinya kejahatan, sehingga akan berdampak pada keamanan wilayah. Dengan demikian, tingkat pengangguran dijadikan sebagai salah satu variabel dalam penelitian ini.
Kepadatan Penduduk (X4)
Kepadatan penduduk merupakan jumlah penduduk per kilometer persegi di suatu wilayah. Kepadatan penduduk yang tinggi dapat menyebabkan konflik sosial dan kriminalitas yang akan berakibat pada keamanan wilayah. Dengan demikian, kepadatan penduduk dijadikan sebagai salah satu variabel dalam penelitian ini.
> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(eclust)
> # Mengimport Data
> setwd("C:/Users/zahra/OneDrive/Documents")
> Laprak2 <- read.csv("Data Laprak 2 Anmul.csv",header = TRUE, sep = ";")
> Laprak2
Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
1 Sumba Barat 452 27.17 3.52
2 Sumba Timur 443 28.08 2.21
3 Kupang 442 21.78 3.22
4 Timor Tengah Selatan 874 25.18 2.64
5 Timor Tengah Utara 563 21.85 1.96
6 Belu 500 14.30 5.45
7 Alor 734 19.97 2.52
8 Lembata 276 24.78 2.55
9 Flores Timur 461 11.77 3.79
10 Sikka 310 12.56 2.62
11 Ende 338 22.86 2.59
12 Ngada 223 12.06 4.00
13 Manggarai 274 19.69 2.44
14 Rote Ndao 390 27.05 3.65
15 Manggarai Barat 223 16.82 4.42
16 Sumba Tengah 0 31.78 1.89
17 Sumba Barat Daya 280 27.48 2.08
18 Nagekeo 104 12.33 3.54
19 Manggarai Timur 180 25.06 1.63
20 Sabu Raijua 167 28.37 4.06
21 Malaka 335 14.42 3.06
22 Kota Kupang 1171 8.61 5.69
Kepadatan.Penduduk..X4.
1 201
2 37
3 73
4 121
5 103
6 205
7 76
8 111
9 165
10 201
11 134
12 99
13 245
14 117
15 87
16 51
17 233
18 119
19 122
20 202
21 172
22 2929
> Keamanan <- data.frame(Laprak2)
> View(Keamanan)
> # Statistik Deskriptif
> Statistika_Deskriptif <- summary(Keamanan)
> Statistika_Deskriptif
Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
Length:22 Min. : 0.0 Min. : 8.61 Min. :1.630
Class :character 1st Qu.: 235.8 1st Qu.:14.33 1st Qu.:2.460
Mode :character Median : 336.5 Median :21.82 Median :2.850
Mean : 397.3 Mean :20.64 Mean :3.160
3rd Qu.: 458.8 3rd Qu.:26.58 3rd Qu.:3.755
Max. :1171.0 Max. :31.78 Max. :5.690
Kepadatan.Penduduk..X4.
Min. : 37.0
1st Qu.: 100.0
Median : 121.5
Mean : 263.8
3rd Qu.: 201.0
Max. :2929.0
> # Uji Sampel Representatif
> KMO <- KMO(Keamanan[,2:5])
> KMO
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = Keamanan[, 2:5])
Overall MSA = 0.68
MSA for each item =
Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
0.65 0.72 0.69
Kepadatan.Penduduk..X4.
0.66
>
> # Uji Non-Multikolinearitas
> Uji_NonMultikolinieritas <- cor(Keamanan[,2:5], method = 'pearson')
> Uji_NonMultikolinieritas
Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
Tindak.Pidana..X1. 1.0000000 -0.2805001 0.3421776
Kemiskinan..X2. -0.2805001 1.0000000 -0.5774505
Pengangguran..X3. 0.3421776 -0.5774505 1.0000000
Kepadatan.Penduduk..X4. 0.6495506 -0.4119542 0.5303392
Kepadatan.Penduduk..X4.
Tindak.Pidana..X1. 0.6495506
Kemiskinan..X2. -0.4119542
Pengangguran..X3. 0.5303392
Kepadatan.Penduduk..X4. 1.0000000
> # Standarisasi
> Standarisasi <- scale(Keamanan[,2:5])
> Standarisasi
Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
[1,] 0.20812780 0.96609465 0.32742377
[2,] 0.17390080 1.10062352 -0.86554121
[3,] 0.17009780 0.16926984 0.05422568
[4,] 1.81299365 0.67190516 -0.47395728
[5,] 0.63026076 0.17961821 -1.09320628
[6,] 0.39067178 -0.93652787 2.08499811
[7,] 1.28057370 -0.09830956 -0.58323652
[8,] -0.46120014 0.61277159 -0.55591671
[9,] 0.24235480 -1.31054768 0.57330204
[10,] -0.33189815 -1.19375889 -0.49217049
[11,] -0.22541416 0.32893047 -0.51949030
[12,] -0.66275912 -1.26767585 0.76454070
[13,] -0.46880614 -0.13970305 -0.65608934
[14,] -0.02765818 0.94835458 0.44580960
[15,] -0.66275912 -0.56398640 1.14701802
[16,] -1.51082804 1.64760902 -1.15695250
[17,] -0.44598814 1.01192317 -0.98392704
[18,] -1.11531608 -1.22776069 0.34563697
[19,] -0.82628810 0.65416509 -1.39372417
[20,] -0.87572710 1.14349536 0.81918032
[21,] -0.23682316 -0.91878780 -0.09147996
[22,] 2.94248454 -1.77770287 2.30355658
Kepadatan.Penduduk..X4.
[1,] -0.10494217
[2,] -0.37911402
[3,] -0.31892996
[4,] -0.23868454
[5,] -0.26877657
[6,] -0.09825505
[7,] -0.31391462
[8,] -0.25540233
[9,] -0.16512623
[10,] -0.10494217
[11,] -0.21695140
[12,] -0.27546369
[13,] -0.03138386
[14,] -0.24537165
[15,] -0.29552504
[16,] -0.35570911
[17,] -0.05144522
[18,] -0.24202809
[19,] -0.23701276
[20,] -0.10327039
[21,] -0.15342378
[22,] 4.45567264
attr(,"scaled:center")
Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
397.272727 20.635000 3.160455
Kepadatan.Penduduk..X4.
263.772727
attr(,"scaled:scale")
Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
262.950327 6.764348 1.098104
Kepadatan.Penduduk..X4.
598.164966
>
> rownames(Standarisasi) <- 1:nrow(Standarisasi)
> # Menghitung Jarak Euclidien
> Jarak <- dist(Standarisasi, method = "euclidean")
> Jarak
1 2 3 4 5 6 7
2 1.2319112
3 0.8699448 1.3103539
4 1.8227014 1.7445582 1.7992125
5 1.6857559 1.0585466 1.2373247 1.4232282
6 2.5966145 3.6029904 2.3332757 3.3433560 3.3813083
7 1.7765326 1.6571398 1.3081050 0.9456761 0.8730735 2.9428762
8 1.1729304 0.8674818 0.9856675 2.2764997 1.2914208 3.1820027 1.8824406
9 2.2909278 2.8168232 1.5773956 2.7384646 2.2713562 1.5657540 1.9766485
10 2.3724102 2.3947023 1.5665844 2.8459589 1.7888544 2.6888878 1.9626607
11 1.1505418 0.9492158 0.7221294 2.0676759 1.0422618 2.9628357 1.5697130
12 2.4430152 2.9961229 1.8069035 3.3803190 2.6866018 1.7304295 2.6385492
13 1.6290295 1.4547400 1.0444581 2.4375118 1.2479345 2.9818894 1.7740277
14 0.2994084 1.3421400 0.8971228 2.0761597 1.8419909 2.5369990 1.9673867
15 1.9513197 2.7437762 1.5575809 3.2074244 2.6914993 1.4721501 2.6433911
16 2.3844345 1.7952640 2.5454476 3.5326995 2.5982454 4.5683686 3.3423124
17 1.4671301 0.7165976 1.4963074 2.3481352 1.3821064 3.7305434 2.1078604
18 2.5658584 2.9273193 1.9221908 3.5854531 2.6643459 2.3235455 2.8078321
19 2.0364452 1.2242847 1.8251514 2.7950128 1.5614254 4.0164733 2.3807328
20 1.2033452 2.0044783 1.6353990 3.0236002 2.6232944 2.7445551 2.8640629
21 1.9820681 2.2128767 1.1824029 2.6240448 1.7248455 2.2658696 1.8009052
22 6.3015427 7.0262480 6.2716147 6.0850556 6.5601755 5.2920080 6.0551504
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 2.3403913
10 1.8185085 1.2174810
11 0.3727817 2.0257288 1.5307561
12 2.3066683 0.9326391 1.3127579 2.0958487
13 0.7915142 1.8455127 1.0779878 0.5761524 1.8405719
14 1.1419855 2.2799649 2.3623588 1.1642187 2.3273674 1.6243316
15 2.0801399 1.3125315 1.7970373 1.9421624 0.8011680 1.8811169 1.7845832
16 1.5949648 3.8541463 3.1572245 1.9536667 3.5939786 2.1532173 2.2955980
17 0.6199554 2.8819390 2.2633463 0.8707616 2.8897898 1.1977661 1.5035941
18 2.1513727 1.3812564 1.1556875 1.9910517 0.6188694 1.6277810 2.4348559
19 0.9150203 2.9793378 2.1188408 1.1097362 2.8947884 1.1594863 2.0268970
20 1.5386800 2.7086374 2.7346208 1.7004074 2.4272902 1.9984422 0.9575486
21 1.6192962 0.9083828 0.4975457 1.3206664 1.0250900 0.9972295 1.9562988
22 6.9043647 5.6439789 6.2990372 6.6540586 6.1652356 6.5736693 6.4656151
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 3.3048869
17 2.6703899 1.2886019
18 1.1359919 3.2703026 2.6959685
19 2.8230178 1.2351823 0.6891937 2.5788726
20 1.7621829 2.1508859 1.8589967 2.4338766 2.2708416
21 1.3643224 3.0635979 2.1396860 1.0325386 2.1270818 2.3437209
22 6.1953491 8.1663500 7.0982688 6.5322296 7.4705294 6.7896593 6.1502603
> # Koefisien Korelasi Cophenetic
> Koef_KorCop <- dist(Keamanan[,2:5])
>
> ## Single Linkage
> SingLink <- hclust(dist(Keamanan[,2:5]), method = "single")
> ### Korelasi Cophenetic
> HierarkiCluster1 <- hclust(Koef_KorCop, "single")
> KorCop_Single <- cophenetic(HierarkiCluster1)
> Kor_Single <- cor(Koef_KorCop,KorCop_Single)
> Kor_Single
[1] 0.9860323
>
> ## Average Linkage
> AveLink <- hclust(dist(Keamanan[,2:5]), method = "ave")
> ### Korelasi Cophenetic
> HierarkiCluster2 <- hclust(Koef_KorCop, "ave")
> KorCop_Average <- cophenetic(HierarkiCluster2)
> Kor_Average <- cor(Koef_KorCop,KorCop_Average)
> Kor_Average
[1] 0.9931291
>
> ## Complete Linkage
> CompLink <- hclust(dist(Keamanan[,2:5]), method = "complete")
> ### Korelasi Cophenetic
> HierarkiCluster3 <- hclust(Koef_KorCop, "complete")
> KorCop_Complete <- cophenetic(HierarkiCluster3)
> Kor_Complete <- cor(Koef_KorCop,KorCop_Complete)
> Kor_Complete
[1] 0.943608
>
> ## Centroid Linkage
> CentLink <- hclust(dist(Keamanan[,2:5]), method = "centroid")
> ### Korelasi Cophenetic
> HierarkiCluster4 <- hclust(Koef_KorCop, "centroid")
> KorCop_Centroid <- cophenetic(HierarkiCluster4)
> Kor_Centroid <- cor(Koef_KorCop,KorCop_Centroid)
> Kor_Centroid
[1] 0.9919499
>
> ## Ward
> Ward <- hclust(dist(Keamanan[,2:5]), method = "ward.D")
> ### Korelasi Cophenetic
> HierarkiCluster5 <- hclust(Koef_KorCop,"ward.D")
> KorCop_Ward <- cophenetic(HierarkiCluster5)
> Kor_Ward <- cor(Koef_KorCop,KorCop_Ward)
> Kor_Ward
[1] 0.9491605
>
> # Hasil Dalam Bentuk Tabel
> KorCop<-data.frame(Kor_Single,Kor_Average,Kor_Complete,Kor_Centroid,Kor_Ward)
> KorCop
Kor_Single Kor_Average Kor_Complete Kor_Centroid Kor_Ward
1 0.9860323 0.9931291 0.943608 0.9919499 0.9491605
> # Indeks Validitas
> Indeks_Validitas <- clValid(Standarisasi, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(Indeks_Validitas)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 2.9290 8.6929 12.0552 15.0829
Dunn 1.1584 0.2823 0.3298 0.3298
Silhouette 0.6617 0.3630 0.2729 0.2277
Optimal Scores:
Score Method Clusters
Connectivity 2.9290 hierarchical 2
Dunn 1.1584 hierarchical 2
Silhouette 0.6617 hierarchical 2
> optimalScores(Indeks_Validitas)
Score Method Clusters
Connectivity 2.9289683 hierarchical 2
Dunn 1.1584022 hierarchical 2
Silhouette 0.6617359 hierarchical 2
> plot(Indeks_Validitas)
> # Metode Average Linkage
> Average_Linkage <- hclust(dist(scale(Keamanan[,2:5])), method = "average")
> Average_Linkage
Call:
hclust(d = dist(scale(Keamanan[, 2:5])), method = "average")
Cluster method : average
Distance : euclidean
Number of objects: 22
> plot(Average_Linkage, labels(Keamanan$Wilayah), hang = 1, col = "cornsilk4", main = "Cluster Dendogram", sub = " ", xlab = "Provinsi", ylab = "Jarak")
>
> Kelompok_Average <- data.frame(id = Keamanan$Wilayah, cutree(Average_Linkage, k = 2))
> Kelompok_Average
id cutree.Average_Linkage..k...2.
1 Sumba Barat 1
2 Sumba Timur 1
3 Kupang 1
4 Timor Tengah Selatan 1
5 Timor Tengah Utara 1
6 Belu 1
7 Alor 1
8 Lembata 1
9 Flores Timur 1
10 Sikka 1
11 Ende 1
12 Ngada 1
13 Manggarai 1
14 Rote Ndao 1
15 Manggarai Barat 1
16 Sumba Tengah 1
17 Sumba Barat Daya 1
18 Nagekeo 1
19 Manggarai Timur 1
20 Sabu Raijua 1
21 Malaka 1
22 Kota Kupang 2
> HierarkiCluster <- eclust(Standarisasi, FUNcluster = "hclust", k = 2, hc_method = "average",
+ graph = TRUE)
> fviz_dend(HierarkiCluster, rect = TRUE, cex = 0.5)
>
> idclus = HierarkiCluster$cluster
> idclus
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
> aggregate(Keamanan,list(idclus),mean)
Group.1 Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
1 1 NA 360.4286 21.20762 3.04
2 2 NA 1171.0000 8.61000 5.69
Kepadatan.Penduduk..X4.
1 136.8571
2 2929.0000
Hasil :
> Statistika_Deskriptif
Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
Length:22 Min. : 0.0 Min. : 8.61 Min. :1.630
Class :character 1st Qu.: 235.8 1st Qu.:14.33 1st Qu.:2.460
Mode :character Median : 336.5 Median :21.82 Median :2.850
Mean : 397.3 Mean :20.64 Mean :3.160
3rd Qu.: 458.8 3rd Qu.:26.58 3rd Qu.:3.755
Max. :1171.0 Max. :31.78 Max. :5.690
Kepadatan.Penduduk..X4.
Min. : 37.0
1st Qu.: 100.0
Median : 121.5
Mean : 263.8
3rd Qu.: 201.0
Max. :2929.0
Interpretasi :
Hipotesis :
\(H_0:\) Matriks korelasi antarvariabel tidak cukup memadai untuk melakukan analisis cluster
\(H_1:\) Matriks korelasi antarvariabel cukup memadai untuk melakukan analisis cluster
Hasil :
> KMO
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = Keamanan[, 2:5])
Overall MSA = 0.68
MSA for each item =
Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
0.65 0.72 0.69
Kepadatan.Penduduk..X4.
0.66
Keputusan :
Overall MSA (0.68) \(≥0.5\), maka tolak \(H_0\)
MSA for each item \(≥0.5\), maka tolak \(H_0\)
Interpretasi :
Berdasarkan keputusan yang telah dibuat, maka dapat disimpulkan bahwa variabel tindak pidana, tingkat kemiskinan, tingkat pengangguran, dan kepadatan penduduk cukup memadai untuk dilakukan analisis cluster.
Hipotesis :
\(H_0:\) Tidak terdapat multikolinearitas pada antarvariabel
\(H_1:\) Terdapat multikolinearitas pada antarvariabel
Hasil :
> Uji_NonMultikolinieritas
Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
Tindak.Pidana..X1. 1.0000000 -0.2805001 0.3421776
Kemiskinan..X2. -0.2805001 1.0000000 -0.5774505
Pengangguran..X3. 0.3421776 -0.5774505 1.0000000
Kepadatan.Penduduk..X4. 0.6495506 -0.4119542 0.5303392
Kepadatan.Penduduk..X4.
Tindak.Pidana..X1. 0.6495506
Kemiskinan..X2. -0.4119542
Pengangguran..X3. 0.5303392
Kepadatan.Penduduk..X4. 1.0000000
Keputusan :
\(|\) nilai korelasi antarvariabel \(|<0.8\), maka terima \(H_0\)
Interpretasi :
Berdasarkan keputusan yang telah dibuat, maka dapat disimpulkan bahwa tidak terdapat multikolinearitas pada antarvariabel.
Hasil :
> KorCop
Kor_Single Kor_Average Kor_Complete Kor_Centroid Kor_Ward
1 0.9860323 0.9931291 0.943608 0.9919499 0.9491605
Interpretasi :
Berdasarkan hasil output di atas, dapat dilihat bahwa nilai korelasi yang mendekati 1 yaitu Kor_Average, sehingga dapat disimpulkan bahwa metode terbaik untuk menjalankan analisis cluster hierarki ini adalah metode average linkage.
Hasil :
> summary(Indeks_Validitas)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 2.9290 8.6929 12.0552 15.0829
Dunn 1.1584 0.2823 0.3298 0.3298
Silhouette 0.6617 0.3630 0.2729 0.2277
Optimal Scores:
Score Method Clusters
Connectivity 2.9290 hierarchical 2
Dunn 1.1584 hierarchical 2
Silhouette 0.6617 hierarchical 2
Interpretasi :
Berdasarkan hasil output di atas, dapat dilihat bahwa indeks connectivity, indeks dunn, dan indeks silhouette sama-sama memiliki jumlah cluster sebanyak dua, sehingga akan terdapat dua cluster yang merupakan cluster optimal pada metode average linkage.
Hasil :
> Average_Linkage
Call:
hclust(d = dist(scale(Keamanan[, 2:5])), method = "average")
Cluster method : average
Distance : euclidean
Number of objects: 22
Interpretasi :
Berdasarkan hasil output di atas, dapat dilihat bahwa pada analisis cluster penelitian ini akan digunakan metode average linkage dengan perhitungan jarak euclidean untuk 22 Kabupaten/Kota yang berada di Povinsi Nusa Tenggara Timur.
Hasil :
> plot(Average_Linkage, labels(Keamanan$Wilayah), hang = 1, col = "cornsilk4", main = "Cluster Dendogram", sub = " ", xlab = "Provinsi", ylab = "Jarak")
> fviz_dend(HierarkiCluster, rect = TRUE, cex = 0.5)
Interpretasi :
Berdasarkan hasil output di atas, dapat dilihat bahwa terdapat dua cluster yang terbentuk, untuk cluster pertama terdiri dari Sumba Barat, Sumba Timur, Kupang, Timor Tengah Selatan, Timor Tengah Utara, Belu, Alor, Lembata, Flores Timur, Sikka, Ende, Ngada, Manggarai, Rote Ndao, Sumba Tengah, Sumba Barat Daya, Nagekeo, Manggarai Timur, Sabu Raijua, dan Malaka. Sedangkan untuk cluster kedua, yaitu Kota Kupang.
Hasil :
> aggregate(Keamanan,list(idclus),mean)
Group.1 Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
1 1 NA 360.4286 21.20762 3.04
2 2 NA 1171.0000 8.61000 5.69
Kepadatan.Penduduk..X4.
1 136.8571
2 2929.0000
Interpretasi :
Berdasarkan hasil output di atas, dapat dilihat karakteristik dari kedua cluster, yaitu
Cluster 1 : Variabel tingkat kemiskinan memiliki karakteristik yang tinggi, sedangkan variabel kepadatan penduduk, tingkat pengangguran dan tindak pidana memiliki karakteristik yang rendah.
Cluster 2 : Variabel tingkat kemiskinan memiliki karakteristik yang rendah, sedangkan variabel kepadatan penduduk, tingkat pengangguran dan tindak pidana memiliki karakteristik yang tinggi.
sehingga dapat disimpulkan bahwa, cluster 1 merupakan kelompok dengan faktor penyebab terancamnya keamanan wilayah yang rendah dan cluster 2 merupakan kelompok dengan faktor penyebab terancamnya keamanan wilayah yang tinggi.
Berdasarkan hasil penelitian secara keseluruhan, dapat disimpulkan bahwa Kota Kupang menjadi satu–satunya kota dengan faktor penyebab terancamnya keamanan wilayah yang tinggi. Hal ini disebabkan Kota Kupang memiliki tiga dari empat variabel faktor penyebab terancamnya keamanan wilayah berkarakteristik tinggi, variabel tersebut yaitu kepadatan penduduk, tingkat pengangguran, dan tindak pidana. Sedangkan untuk Kabupaten/Kota selain Kota Kupang menjadi wilayah dengan aktor penyebab terancamnya keamanan wilayah yang rendah.
Dari hasil penelitian ini juga, dapat dilihat bahwa Kota Kupang membutuhkan perhatian pemerintah lebih lanjut, khususnya terhadap variabel tindak pidana dan variabel kepadatan penduduk. Dengan ini, analisis hierarki dapat mengelompokan berbagai hal sesuai dengan karakteristikanya, sehingga dalam kasus ini dapat dengan mudah mengetahui hal penting yang butuh penanganan terlebih dahulu.
Mahayuda, I. P., & Ardana, P. S. (2020). PENYELESAIAN MASALAH DI DESA DENGAN PENDEKATAN RESTORATIVE JUSTICE OLEH BHAYANGKARA PEMBINA KEAMANAN DAN KETERTIBAN MASYARAKAT DI WILAYAH HUKUM KEPOLISIAN RESOR BULELENG. Jurnal Fakultas Hukum UNIPAS, 1-30.
Munawar. (2013). HUBUNGAN KONFLIK ANTARWARGA DENGAN KEAMANAN KEMANUSIAAN DAN IMPLIKASINYA TERHADAP KETAHANAN WILAYAH (STUDI TAWURAN WARGA DI KECAMATAN JOHAR BARUJAKARTA PUSAT 2010-201). JURNAL KETAHANAN NASIONAL, 26-31.
K. P. Sinaga and M. -S. Yang, “Unsupervised K-Means Clustering Algorithm,” in IEEE Access, vol. 8, pp. 80716-80727, 2020, doi: 10.1109/ACCESS.2020.2988796.
Apriliana, T., & Widodo, E. (2023). Analisis Cluster Hierarki untuk Pengelompokan Provinsi di Indonesia berdasarkan Jumlah Base Transceiver Station dan Kekuatan Sinyal. Konvergensi Teknologi dan Sistem Informasi, 286-296.
Az-Zahra, A., & Wijayanto, A. W. (2024). Tinjauan Kesejahteraan di Daerah Perbatasan Republik Indonesia Tahun 2021: Penerapan Analisis Klaster K-Means dan Hierarki. Jurnal Sistem dan Teknologi Informasi, 55-64.
Silvi, R. ( 2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K-Means Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. JURNAL MATEMATIKA “MANTIK”, 22-31.