1 PENDAHULUAN

1.1 Latar Belakang

Keamanan negara merupakan salah satu hal penting dalam menjamin stabilitas suatu negara. Keamanan negara mencerminkan ketertiban dan perlindungan terhadap ancaman, baik dari dalam maupun luar. Selain itu, keamanan negara tidak hanya berfokus pada aspek pertahanan fisik, tetapi juga terhadap dimensi sosial, ekonomi, politik, dan lingkungan. Dalam Mahayuda, dan Ardana (2020) Undang-Undang Nomor 2 Tahun 2002 menegaskan bahwa yang dimaksud dengan keamanan dan ketertiban masyarakat adalah suatu kondisi dinamis masyarakat sebagai salah satu prasyarat terselenggaranya proses pembangunan nasional dalam rangka tercapainya tujuan nasional yang ditandai oleh terjaminnya keamanan, ketertiban, dan tegaknya hukum, serta terbinanya ketenteraman, yang mengandung kemampuan membina serta mengembangkan potensi dan kekuatan masyarakat dalam menangkal, mencegah, dan menanggulangi segala bentuk pelanggaran hukum dan bentuk-bentuk gangguan lainnya yang dapat meresahkan masyarakat.

Provinsi Nusa Tenggara Timur (NTT) sebagai salah satu wilayah di Indonesia turut menghadapi berbagai tantangan terkait keamanan, seperti tindak pidana, tingkat kemiskinan, tingkat pengangguran, dan kepadatan penduduk. Pada tahun 2023, dilansir dari web BPS Provinsi Nusa Tenggara Timur (2024) terdapat jumlah tindak pidana yang dilaporkan sebesar 8740 kasus, tingkat kemiskinan sebesar 19.96%, tingkat pengangguran terbuka sebesar 3.14%, dan kepadatan penduduk 120 jiwa/km2. Menurut Munawar (2013) akibat dari faktor-faktor tersebut, yaitu muncul berbagai implikasi negatif, seperti adanya kesenjangan antarpenduduk, dalam bidang ekonomi, sosial, dan budaya yang nantinya dapat menyebabkan konflik. Keadaan ini menunjukkan bahwa faktor-faktor tersebut berpotensi menjadi ancaman bagi stabilitas wilayah di NTT jika tidak ditangani secara serius.

Untuk menangani hal ini, diperlukan analisis cluster sebagai pendekatan komprehensif untuk mengidentifikasi pola distribusi dan karakteristik wilayah berdasarkan keempat faktor yang telah ditetapkan. Metode ini bertujuan menemukan struktur klaster dalam set data berdasarkan kesamaan terbesar pada klaster yang sama dan perbedaan maksimal di antara klaster yang berbeda (SINAGA & YANG, 2020). Terdapat dua jenis analisis cluster, yaitu analisis cluster hierarki dan analisis cluster non-hierarki. Pada kasus ini akan digunakan analisis cluster hierarki, karena mampu memberikan visualisasi yang jelas melalui dendrogram. Dengan menggunakan analisis ini, pemerintah diharapkan dapat memahami struktur kerentanan keamanan wilayah secara lebih mendalam, sehingga memungkinkan pengambilan keputusan yang lebih tepat sasaran dalam mengatasi ancaman keamanan di Provinsi Nusa Tenggara Timur.

1.2 Rumusan Masalah

Bagaimana pola pengelompokan wilayah di Provinsi Nusa Tenggara Timur berdasarkan tindak pidana, tingkat kemiskinan, tingkat pengangguran, dan kepadatan penduduk dengan menggunakan analisis cluster hierarki, serta bagaimana pengelompokan tersebut dapat membantu mengidentifikasi karakteristik wilayah yang berpotensi memengaruhi keamanan?

1.3 Tujuan

Penelitian ini bertujuan untuk menganalisis pola pengelompokan wilayah di Provinsi Nusa Tenggara Timur menggunakan analisis cluster hierarki berdasarkan tindak pidana, kemiskinan, pengangguran, dan kepadatan penduduk, untuk mengidentifikasi karakteristik masing-masing kelompok wilayah yang berpotensi memengaruhi keamanan.

2 TINJAUAN PUSTAKA

2.1 Analisis Cluster

Analisis clustering adalah salah satu metode statistik multivariat terapan untuk mengelompokkan setiap objek yang paling mirip dengan objek lain dalam cluster yang sama (Apriliana & Widodo, 2023). Tujuan utama dari analisis ini adalah untuk memaksimalkan homogeneitas dalam kelompok dan meminimalkan heterogenitas antar kelompok. Terdapat dua jenis analisis cluster, yaitu analisis cluster hierarki dan analisis cluster non-hierarki.

2.2 Analisis Cluster Hierarki

Analisis cluster hierarki merupakan salah satu pendekatan dalam analisis cluster yang menghasilkan struktur hierarki dalam bentuk dendrogram. Menurut Az-Zahra & Wijayanto (2024) dalam metode hierarki, pengelompokan bisa dilakukan melalui proses penggabungan (agglomerative) maupun pemisahan (divisive), yang ditinjau berdasarkan kemiripan sifat, di mana banyak kelompok belum diketahui sebelum cluster terbentuk. Kemiripan sifat tersebut dapat ditentukan dari kedekatan jarak Euclidean atau jarak Mahalanobis (Silvi, 2018). Namun, meskipun sama-sama jarak, jarak Euclidean atau jarak Mahalanobis digunakan disaat yang berbeda. Menurut Silvi (2018) Jarak Euclidean digunakan jika tidak terjadi korelasi, sedangkan jarak Mahalanobis digunakan jika data terjadi korelasi. Jarak Euclidean memiliki rumus sebagai berikut:

\[ d(x, y) = \sqrt{\sum_{i=1}^n (y_k - x_k)} \]

Sedangkan Jarak Mahalanobis memiliki rumus sebagai berikut:

\[ d_{\text{Mahalanobis}}(x, y) = \sqrt{(y - x)^T \Sigma^{-1} (y - x)} \]

Dalam metode cluster hierarki terdapat beberapa metode penghitungan jarak yang dapat digunakan, antara lain single linkage, complete linkage, average linkage, Centroid Linkage, dan Ward.

2.2.1 Single Linkage

Metode single linkage merupakan pengelompokkan data berdasarkan jarak minimum antar anggota cluster. Metode ini cenderung menghasilkan cluster yang panjang dan ramping, dan dapat sensitif terhadap outlier. Rumus untuk metode ini, yaitu :

\[ d_{ij} = \min(d_{pj}; d_{qj}) \]

2.2.2 Complete Linkage

Metode complete linkage merupakan pengelompokkan data berdasarkan jarak maksimum antar anggota cluster. Metode ini cenderung menghasilkan cluster yang lebih kompak dan bulat dan lebih tahan terhadap outlier. Rumus untuk metode ini, yaitu :

\[ d_{ij} = \max(d_{pj}; d_{qj}) \]

2.2.3 Average Linkage

Metode average linkage merupakan pengelompokkan data berdasarkan jarak rata-rata antar anggota cluster. Metode ini memberikan keseimbangan antara single dan complete linkage, dan sering digunakan dalam praktik karena kemampuannya untuk menghasilkan hasil yang stabil. Rumus untuk metode ini, yaitu :

\[ d_{ij} = \frac{1}{n_i \times n_j} \sum_{i=1}^{n_i} \sum_{j=1}^{n_j} \sqrt{\sum_{k=1}^p (x_{ik} - y_{jk})^2} \]

2.2.4 Centroid Linkage

Metode centroid linkage merupakan pengelompokan data berdasarkan pusat (centroid) dari setiap klaster untuk menentukan jarak antar klaster. Metode ini menganggap setiap cluster sebagai titik di ruang multidimensi yang mewakili rata-rata semua anggotanya, sehingga pendekatan ini dapat memberikan hasil yang berbeda tergantung pada distribusi data.

2.2.5 Ward

Metode Ward merupakan pengelompokan data yang meminimalkan total varians dalam setiap cluster. Metode ini cenderung menghasilkan cluster yang lebih homogen dan kompak dengan meminimalkan jumlah kuadrat deviasi dari rata-rata dalam setiap kelompok. Rumus untuk metode ini, yaitu :

\[ ESS = \sum_{k=1}^K \left[ \sum_{i=1}^{n_k} \sum_{j=1}^p X_{ijk}^2 - \frac{1}{n_k} \sum_{j=1}^p \left( \sum_{i=1}^{n_k} X_{ijk} \right)^2 \right] \]

2.3 Uji Asumsi

Uji asumsi merupakan langkah penting dalam analisis statistik untuk memastikan bahwa data memenuhi syarat-syarat tertentu sebelum melakukan analisis lebih lanjut. Dalam analisis cluster terdapat dua uji asumsi yang harus dipenuhi, yaitu uji representatif dengan menggunakan KMO dan uji non-multikolinearitas.

2.3.1 Uji Kaiser-Meyer-Olkin (KMO)

Uji KMO merupakan indeks yang digunakan untuk mengukur ketepatan sampel yang sudah mencukupi secara keseluruhan tiap indicator (Apriliana & Widodo, 2023). Nilai KMO berkisar antara 0 hingga 1, dengan nilai lebih dari 0.5 dianggap cukup untuk melanjutkan analisis. Rumus untuk KMO, yaitu :

\[ KMO = \frac{\sum_{i=1}^p \sum_{j=1}^p r_{ij}^2}{\sum_{i=1}^p \sum_{j=1}^p r_{ij}^2 + \sum_{i=1}^p \sum_{j=1}^p q_{ij}^2} \]

2.3.2 Uji Non-Multikolinearitas

Uji non-multikolinearitas digunakan untuk memeriksa apakah terdapat hubungan linear yang kuat antara dua atau lebih variabel independent. Multikolinieritas dapat diketahui dengan melihat nilai Variance Inflation Factor (VIF). Apriliana & Widodo (2023) menyatakan jika nilai VIF melebihi 10 maka menunjukkan adanya gejala multikolinieritas sehingga perlu melakukan analisis komponen utama untuk menanganinya. Rumus untuk VIF, yaitu :

\[ VIF_j = \frac{1}{1 - R_j^2} \]

2.4 Indeks Validitas

Indeks validitas digunakan untuk mengukur sejauh mana instrumen pengukuran dapat mencerminkan variabel yang ingin diukur. Indeks validitas penting karena untuk memastikan bahwa kesimpulan yang diambil dari data adalah akurat dan dapat dipercaya. Terdapat beberapa indeks validitas, yaitu indeks connectivity, indeks dunn, dan indeks silhouette.

2.4.1 Indeks Connectivity

Indeks connectivity digunakan untuk mengukur seberapa baik variabel dalam dataset dikelompokkan bersama berdasarkan kedekatannya. Indeks ini berada pada rentang nilai nol hingga takhingga, dengan klaster yang baik memiliki indeks connectivity seminimum mungkin (Az-Zahra & Wijayanto, 2024).

\[ Conn = \sum_{i=1}^N \sum_{j=1}^L x_{i, nn_{i(j)}} \]

2.4.2 Indeks Dunn

Indeks Dunn digunakan untuk mengevaluasi kualitas hasil clustering dengan membandingkan jarak antar cluster dengan diameter dari masing-masing cluster. Semakin besar indeks Dunn yang dihasilkan, semakin baik pula klaster yang terbentuk (Az-Zahra & Wijayanto, 2024). Rumus untuk indeks dunn, yaitu :

\[ Dunn = \frac{\min d_{C}(C_k, C_h)}{\max \mathrm{\Delta}(C_k)} \]

2.4.3 Indeks Silhouette

Indeks silhouette digunakan untuk mengukur seberapa mirip suatu objek dengan objek lain dalam kelompoknya dibandingkan dengan objek di kelompok lain. Indeks ini menghasilkan jumlah klaster optimal melalui perbedaan jarak rata-rata dalam klaster dan jarak minimun antarklaster (Az-Zahra & Wijayanto, 2024).

\[ \bar{S} = \frac{1}{n} \sum_{i=1}^n \left( \frac{b(i) - a(i)}{\max\{a(i), b(i)\}} \right) \]

3 DATA

Pada penelitian ini, data yang digunakan adalah data sekunder yang bersumber dari Badan Pusat Statistika (BPS) Nusa Tenggara Timur (NTT). Terdapat empat variabel yang akan digunakan dalam penelitian ini, diantaranya yaitu :

Tindak Pidana (X1)

Tindak pidana merupakan jumlah kasus kejahatan yang terjadi di suatu wilayah. Tingginya tindak pidana mencerminkan ketidakstabilan sosial yang dapat mengancam keamanan wilayah. Dengan demikian, tindak pidana dijadikan sebagai variabel dalam penelitian ini.

Sumber : https://ntt.bps.go.id/id/statistics-table/2/MTk5IzI=/jumlah-tindak-pidana-yang-dilaporkan.html

Tingkat Kemiskinan (X2)

Tingkat kemiskinan merupakan persentase penduduk yang hidup di bawah garis kemiskinan, yang telah ditetapkan oleh pemerintah. Tingginya tingkat kemiskinan membawa dampak negatif pada stabilitas keamanan wilayah, karena dapat menyebabkan beberapa konflik. Dengan demikian, kemiskinan dijadikan sebagai salah satu variabel dalam penelitian ini.

Sumber : https://ntt.bps.go.id/id/statistics-table/2/NTg0IzI=/persentase-penduduk-miskin-menurut-kabupaten-kota.html

Tingkat Pengangguran (X3)

Tingkat pengangguran adalah persentase angkatan kerja yang belum mendapatkan pekerjaan meskipun aktif mencari kerja. Tingginya tingkat pengangguran dapat memicu terjadinya kejahatan, sehingga akan berdampak pada keamanan wilayah. Dengan demikian, tingkat pengangguran dijadikan sebagai salah satu variabel dalam penelitian ini.

Sumber : https://ntt.bps.go.id/id/statistics-table/2/NTIyIzI=/tingkat-pengangguran-terbuka-tpt-menurut-kabupaten-kota.html

Kepadatan Penduduk (X4)

Kepadatan penduduk merupakan jumlah penduduk per kilometer persegi di suatu wilayah. Kepadatan penduduk yang tinggi dapat menyebabkan konflik sosial dan kriminalitas yang akan berakibat pada keamanan wilayah. Dengan demikian, kepadatan penduduk dijadikan sebagai salah satu variabel dalam penelitian ini.

Sumber : https://ntt.bps.go.id/id/statistics-table/2/NTM2IzI=/kepadatan-penduduk-di-nusa-tenggara-timur--2024.html

4 SOURCE CODE

4.1 Library

> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(eclust)

4.2 Impor Data

> # Mengimport Data
> setwd("C:/Users/zahra/OneDrive/Documents")
> Laprak2 <- read.csv("Data Laprak 2 Anmul.csv",header = TRUE, sep = ";")
> Laprak2
                Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
1           Sumba Barat                452           27.17              3.52
2           Sumba Timur                443           28.08              2.21
3                Kupang                442           21.78              3.22
4  Timor Tengah Selatan                874           25.18              2.64
5    Timor Tengah Utara                563           21.85              1.96
6                  Belu                500           14.30              5.45
7                  Alor                734           19.97              2.52
8               Lembata                276           24.78              2.55
9          Flores Timur                461           11.77              3.79
10                Sikka                310           12.56              2.62
11                 Ende                338           22.86              2.59
12                Ngada                223           12.06              4.00
13            Manggarai                274           19.69              2.44
14            Rote Ndao                390           27.05              3.65
15      Manggarai Barat                223           16.82              4.42
16         Sumba Tengah                  0           31.78              1.89
17     Sumba Barat Daya                280           27.48              2.08
18              Nagekeo                104           12.33              3.54
19      Manggarai Timur                180           25.06              1.63
20          Sabu Raijua                167           28.37              4.06
21               Malaka                335           14.42              3.06
22          Kota Kupang               1171            8.61              5.69
   Kepadatan.Penduduk..X4.
1                      201
2                       37
3                       73
4                      121
5                      103
6                      205
7                       76
8                      111
9                      165
10                     201
11                     134
12                      99
13                     245
14                     117
15                      87
16                      51
17                     233
18                     119
19                     122
20                     202
21                     172
22                    2929
> Keamanan <- data.frame(Laprak2)
> View(Keamanan)

4.3 Statistika Deskriptif

> # Statistik Deskriptif
> Statistika_Deskriptif <- summary(Keamanan)
> Statistika_Deskriptif
   Wilayah          Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
 Length:22          Min.   :   0.0     Min.   : 8.61   Min.   :1.630    
 Class :character   1st Qu.: 235.8     1st Qu.:14.33   1st Qu.:2.460    
 Mode  :character   Median : 336.5     Median :21.82   Median :2.850    
                    Mean   : 397.3     Mean   :20.64   Mean   :3.160    
                    3rd Qu.: 458.8     3rd Qu.:26.58   3rd Qu.:3.755    
                    Max.   :1171.0     Max.   :31.78   Max.   :5.690    
 Kepadatan.Penduduk..X4.
 Min.   :  37.0         
 1st Qu.: 100.0         
 Median : 121.5         
 Mean   : 263.8         
 3rd Qu.: 201.0         
 Max.   :2929.0

4.4 Uji Asumsi

> # Uji Sampel Representatif
> KMO <- KMO(Keamanan[,2:5])
> KMO
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = Keamanan[, 2:5])
Overall MSA =  0.68
MSA for each item = 
     Tindak.Pidana..X1.         Kemiskinan..X2.       Pengangguran..X3. 
                   0.65                    0.72                    0.69 
Kepadatan.Penduduk..X4. 
                   0.66 
> 
> # Uji Non-Multikolinearitas
> Uji_NonMultikolinieritas <- cor(Keamanan[,2:5], method = 'pearson')
> Uji_NonMultikolinieritas
                        Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
Tindak.Pidana..X1.               1.0000000      -0.2805001         0.3421776
Kemiskinan..X2.                 -0.2805001       1.0000000        -0.5774505
Pengangguran..X3.                0.3421776      -0.5774505         1.0000000
Kepadatan.Penduduk..X4.          0.6495506      -0.4119542         0.5303392
                        Kepadatan.Penduduk..X4.
Tindak.Pidana..X1.                    0.6495506
Kemiskinan..X2.                      -0.4119542
Pengangguran..X3.                     0.5303392
Kepadatan.Penduduk..X4.               1.0000000

4.5 Standarisasi

> # Standarisasi
> Standarisasi <- scale(Keamanan[,2:5])
> Standarisasi
      Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
 [1,]         0.20812780      0.96609465        0.32742377
 [2,]         0.17390080      1.10062352       -0.86554121
 [3,]         0.17009780      0.16926984        0.05422568
 [4,]         1.81299365      0.67190516       -0.47395728
 [5,]         0.63026076      0.17961821       -1.09320628
 [6,]         0.39067178     -0.93652787        2.08499811
 [7,]         1.28057370     -0.09830956       -0.58323652
 [8,]        -0.46120014      0.61277159       -0.55591671
 [9,]         0.24235480     -1.31054768        0.57330204
[10,]        -0.33189815     -1.19375889       -0.49217049
[11,]        -0.22541416      0.32893047       -0.51949030
[12,]        -0.66275912     -1.26767585        0.76454070
[13,]        -0.46880614     -0.13970305       -0.65608934
[14,]        -0.02765818      0.94835458        0.44580960
[15,]        -0.66275912     -0.56398640        1.14701802
[16,]        -1.51082804      1.64760902       -1.15695250
[17,]        -0.44598814      1.01192317       -0.98392704
[18,]        -1.11531608     -1.22776069        0.34563697
[19,]        -0.82628810      0.65416509       -1.39372417
[20,]        -0.87572710      1.14349536        0.81918032
[21,]        -0.23682316     -0.91878780       -0.09147996
[22,]         2.94248454     -1.77770287        2.30355658
      Kepadatan.Penduduk..X4.
 [1,]             -0.10494217
 [2,]             -0.37911402
 [3,]             -0.31892996
 [4,]             -0.23868454
 [5,]             -0.26877657
 [6,]             -0.09825505
 [7,]             -0.31391462
 [8,]             -0.25540233
 [9,]             -0.16512623
[10,]             -0.10494217
[11,]             -0.21695140
[12,]             -0.27546369
[13,]             -0.03138386
[14,]             -0.24537165
[15,]             -0.29552504
[16,]             -0.35570911
[17,]             -0.05144522
[18,]             -0.24202809
[19,]             -0.23701276
[20,]             -0.10327039
[21,]             -0.15342378
[22,]              4.45567264
attr(,"scaled:center")
     Tindak.Pidana..X1.         Kemiskinan..X2.       Pengangguran..X3. 
             397.272727               20.635000                3.160455 
Kepadatan.Penduduk..X4. 
             263.772727 
attr(,"scaled:scale")
     Tindak.Pidana..X1.         Kemiskinan..X2.       Pengangguran..X3. 
             262.950327                6.764348                1.098104 
Kepadatan.Penduduk..X4. 
             598.164966 
> 
> rownames(Standarisasi) <- 1:nrow(Standarisasi)

4.6 Jarak Euclidien

> # Menghitung Jarak Euclidien
> Jarak <- dist(Standarisasi, method = "euclidean")
> Jarak
           1         2         3         4         5         6         7
2  1.2319112                                                            
3  0.8699448 1.3103539                                                  
4  1.8227014 1.7445582 1.7992125                                        
5  1.6857559 1.0585466 1.2373247 1.4232282                              
6  2.5966145 3.6029904 2.3332757 3.3433560 3.3813083                    
7  1.7765326 1.6571398 1.3081050 0.9456761 0.8730735 2.9428762          
8  1.1729304 0.8674818 0.9856675 2.2764997 1.2914208 3.1820027 1.8824406
9  2.2909278 2.8168232 1.5773956 2.7384646 2.2713562 1.5657540 1.9766485
10 2.3724102 2.3947023 1.5665844 2.8459589 1.7888544 2.6888878 1.9626607
11 1.1505418 0.9492158 0.7221294 2.0676759 1.0422618 2.9628357 1.5697130
12 2.4430152 2.9961229 1.8069035 3.3803190 2.6866018 1.7304295 2.6385492
13 1.6290295 1.4547400 1.0444581 2.4375118 1.2479345 2.9818894 1.7740277
14 0.2994084 1.3421400 0.8971228 2.0761597 1.8419909 2.5369990 1.9673867
15 1.9513197 2.7437762 1.5575809 3.2074244 2.6914993 1.4721501 2.6433911
16 2.3844345 1.7952640 2.5454476 3.5326995 2.5982454 4.5683686 3.3423124
17 1.4671301 0.7165976 1.4963074 2.3481352 1.3821064 3.7305434 2.1078604
18 2.5658584 2.9273193 1.9221908 3.5854531 2.6643459 2.3235455 2.8078321
19 2.0364452 1.2242847 1.8251514 2.7950128 1.5614254 4.0164733 2.3807328
20 1.2033452 2.0044783 1.6353990 3.0236002 2.6232944 2.7445551 2.8640629
21 1.9820681 2.2128767 1.1824029 2.6240448 1.7248455 2.2658696 1.8009052
22 6.3015427 7.0262480 6.2716147 6.0850556 6.5601755 5.2920080 6.0551504
           8         9        10        11        12        13        14
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9  2.3403913                                                            
10 1.8185085 1.2174810                                                  
11 0.3727817 2.0257288 1.5307561                                        
12 2.3066683 0.9326391 1.3127579 2.0958487                              
13 0.7915142 1.8455127 1.0779878 0.5761524 1.8405719                    
14 1.1419855 2.2799649 2.3623588 1.1642187 2.3273674 1.6243316          
15 2.0801399 1.3125315 1.7970373 1.9421624 0.8011680 1.8811169 1.7845832
16 1.5949648 3.8541463 3.1572245 1.9536667 3.5939786 2.1532173 2.2955980
17 0.6199554 2.8819390 2.2633463 0.8707616 2.8897898 1.1977661 1.5035941
18 2.1513727 1.3812564 1.1556875 1.9910517 0.6188694 1.6277810 2.4348559
19 0.9150203 2.9793378 2.1188408 1.1097362 2.8947884 1.1594863 2.0268970
20 1.5386800 2.7086374 2.7346208 1.7004074 2.4272902 1.9984422 0.9575486
21 1.6192962 0.9083828 0.4975457 1.3206664 1.0250900 0.9972295 1.9562988
22 6.9043647 5.6439789 6.2990372 6.6540586 6.1652356 6.5736693 6.4656151
          15        16        17        18        19        20        21
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16 3.3048869                                                            
17 2.6703899 1.2886019                                                  
18 1.1359919 3.2703026 2.6959685                                        
19 2.8230178 1.2351823 0.6891937 2.5788726                              
20 1.7621829 2.1508859 1.8589967 2.4338766 2.2708416                    
21 1.3643224 3.0635979 2.1396860 1.0325386 2.1270818 2.3437209          
22 6.1953491 8.1663500 7.0982688 6.5322296 7.4705294 6.7896593 6.1502603

4.7 Koefisien Korelasi Cophenetic

> # Koefisien Korelasi Cophenetic
> Koef_KorCop <- dist(Keamanan[,2:5])
> 
> ## Single Linkage
> SingLink <- hclust(dist(Keamanan[,2:5]), method = "single")
> ### Korelasi Cophenetic
> HierarkiCluster1 <- hclust(Koef_KorCop, "single")
> KorCop_Single <- cophenetic(HierarkiCluster1)
> Kor_Single <- cor(Koef_KorCop,KorCop_Single)
> Kor_Single
[1] 0.9860323
> 
> ## Average Linkage
> AveLink <- hclust(dist(Keamanan[,2:5]), method = "ave")
> ### Korelasi Cophenetic
> HierarkiCluster2 <- hclust(Koef_KorCop, "ave")
> KorCop_Average <- cophenetic(HierarkiCluster2)
> Kor_Average <- cor(Koef_KorCop,KorCop_Average)
> Kor_Average
[1] 0.9931291
> 
> ## Complete Linkage
> CompLink <- hclust(dist(Keamanan[,2:5]), method = "complete")
> ### Korelasi Cophenetic
> HierarkiCluster3 <- hclust(Koef_KorCop, "complete")
> KorCop_Complete <- cophenetic(HierarkiCluster3)
> Kor_Complete <- cor(Koef_KorCop,KorCop_Complete)
> Kor_Complete
[1] 0.943608
> 
> ## Centroid Linkage
> CentLink <- hclust(dist(Keamanan[,2:5]), method = "centroid")
> ### Korelasi Cophenetic
> HierarkiCluster4 <- hclust(Koef_KorCop, "centroid")
> KorCop_Centroid <- cophenetic(HierarkiCluster4)
> Kor_Centroid <- cor(Koef_KorCop,KorCop_Centroid)
> Kor_Centroid
[1] 0.9919499
> 
> ## Ward
> Ward <- hclust(dist(Keamanan[,2:5]), method = "ward.D")
> ### Korelasi Cophenetic
> HierarkiCluster5 <- hclust(Koef_KorCop,"ward.D")
> KorCop_Ward <- cophenetic(HierarkiCluster5)
> Kor_Ward <- cor(Koef_KorCop,KorCop_Ward)
> Kor_Ward
[1] 0.9491605
> 
> # Hasil Dalam Bentuk Tabel
> KorCop<-data.frame(Kor_Single,Kor_Average,Kor_Complete,Kor_Centroid,Kor_Ward)
> KorCop
  Kor_Single Kor_Average Kor_Complete Kor_Centroid  Kor_Ward
1  0.9860323   0.9931291     0.943608    0.9919499 0.9491605

4.8 Indeks Validitas

> # Indeks Validitas
> Indeks_Validitas <- clValid(Standarisasi, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(Indeks_Validitas)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 5 

Validation Measures:
                                 2       3       4       5
                                                          
hierarchical Connectivity   2.9290  8.6929 12.0552 15.0829
             Dunn           1.1584  0.2823  0.3298  0.3298
             Silhouette     0.6617  0.3630  0.2729  0.2277

Optimal Scores:

             Score  Method       Clusters
Connectivity 2.9290 hierarchical 2       
Dunn         1.1584 hierarchical 2       
Silhouette   0.6617 hierarchical 2       
> optimalScores(Indeks_Validitas)
                 Score       Method Clusters
Connectivity 2.9289683 hierarchical        2
Dunn         1.1584022 hierarchical        2
Silhouette   0.6617359 hierarchical        2
> plot(Indeks_Validitas)

4.9 Metode Average Linkage

> # Metode Average Linkage
> Average_Linkage <- hclust(dist(scale(Keamanan[,2:5])), method = "average")
> Average_Linkage

Call:
hclust(d = dist(scale(Keamanan[, 2:5])), method = "average")

Cluster method   : average 
Distance         : euclidean 
Number of objects: 22 
> plot(Average_Linkage, labels(Keamanan$Wilayah), hang = 1, col = "cornsilk4", main = "Cluster Dendogram", sub = " ", xlab = "Provinsi", ylab = "Jarak")

> 
> Kelompok_Average <- data.frame(id = Keamanan$Wilayah, cutree(Average_Linkage, k = 2))
> Kelompok_Average
                     id cutree.Average_Linkage..k...2.
1           Sumba Barat                              1
2           Sumba Timur                              1
3                Kupang                              1
4  Timor Tengah Selatan                              1
5    Timor Tengah Utara                              1
6                  Belu                              1
7                  Alor                              1
8               Lembata                              1
9          Flores Timur                              1
10                Sikka                              1
11                 Ende                              1
12                Ngada                              1
13            Manggarai                              1
14            Rote Ndao                              1
15      Manggarai Barat                              1
16         Sumba Tengah                              1
17     Sumba Barat Daya                              1
18              Nagekeo                              1
19      Manggarai Timur                              1
20          Sabu Raijua                              1
21               Malaka                              1
22          Kota Kupang                              2
> HierarkiCluster <- eclust(Standarisasi, FUNcluster = "hclust", k = 2, hc_method = "average", 
+                     graph = TRUE)
> fviz_dend(HierarkiCluster, rect = TRUE, cex = 0.5)

> 
> idclus = HierarkiCluster$cluster
> idclus
 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 
 1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  2 
> aggregate(Keamanan,list(idclus),mean)
  Group.1 Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
1       1      NA           360.4286        21.20762              3.04
2       2      NA          1171.0000         8.61000              5.69
  Kepadatan.Penduduk..X4.
1                136.8571
2               2929.0000

5 HASIL DAN PEMBAHASAN

5.1 Statistika Deskriptif

Hasil :

> Statistika_Deskriptif
   Wilayah          Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
 Length:22          Min.   :   0.0     Min.   : 8.61   Min.   :1.630    
 Class :character   1st Qu.: 235.8     1st Qu.:14.33   1st Qu.:2.460    
 Mode  :character   Median : 336.5     Median :21.82   Median :2.850    
                    Mean   : 397.3     Mean   :20.64   Mean   :3.160    
                    3rd Qu.: 458.8     3rd Qu.:26.58   3rd Qu.:3.755    
                    Max.   :1171.0     Max.   :31.78   Max.   :5.690    
 Kepadatan.Penduduk..X4.
 Min.   :  37.0         
 1st Qu.: 100.0         
 Median : 121.5         
 Mean   : 263.8         
 3rd Qu.: 201.0         
 Max.   :2929.0

Interpretasi :

Untuk variabel tindak pidana, sebagian besar wilayah memiliki angka tindak pidana relatif rendah, namun ada satu wilayah yang memiliki angka tindak pidana yang tinggi mencapai 1171.
Untuk variabel tingkat kemiskinan, sebagian besar wilayah memiliki tingkat kemiskinan mendekati 20.64%, dan terdapat beberapa wilayah dengan tingkat kemiskinan yang tinggi mencapai 31.78%.
Untuk variabel tingkat pengangguran, sebagian besar wilayah relatif rendah dengan tingkat pengangguran di bawah 3.16%, namun ada satu wilayah yang memiliki tingkat pengangguran yang tinggi mencapai 5.69%.
Untuk variabel kepadatan penduduk, sebagian besar wilayah memiliki kepadatan penduduk lebih rendah dibandingkan rata-rata, namun ada satu wilayah yang memiliki kepadatan penduduk yang tinggi mencapai 2929.

5.2 Uji Asumsi

5.2.1 Uji Kaiser-Meyer-Olkin (KMO)

Hipotesis :

\(H_0:\) Matriks korelasi antarvariabel tidak cukup memadai untuk melakukan analisis cluster

\(H_1:\) Matriks korelasi antarvariabel cukup memadai untuk melakukan analisis cluster

Hasil :

> KMO
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = Keamanan[, 2:5])
Overall MSA =  0.68
MSA for each item = 
     Tindak.Pidana..X1.         Kemiskinan..X2.       Pengangguran..X3. 
                   0.65                    0.72                    0.69 
Kepadatan.Penduduk..X4. 
                   0.66

Keputusan :

Overall MSA (0.68) \(≥0.5\), maka tolak \(H_0\)

MSA for each item \(≥0.5\), maka tolak \(H_0\)

Interpretasi :

Berdasarkan keputusan yang telah dibuat, maka dapat disimpulkan bahwa variabel tindak pidana, tingkat kemiskinan, tingkat pengangguran, dan kepadatan penduduk cukup memadai untuk dilakukan analisis cluster.

5.2.2 Uji Non Multikolinearitas

Hipotesis :

\(H_0:\) Tidak terdapat multikolinearitas pada antarvariabel

\(H_1:\) Terdapat multikolinearitas pada antarvariabel

Hasil :

> Uji_NonMultikolinieritas
                        Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
Tindak.Pidana..X1.               1.0000000      -0.2805001         0.3421776
Kemiskinan..X2.                 -0.2805001       1.0000000        -0.5774505
Pengangguran..X3.                0.3421776      -0.5774505         1.0000000
Kepadatan.Penduduk..X4.          0.6495506      -0.4119542         0.5303392
                        Kepadatan.Penduduk..X4.
Tindak.Pidana..X1.                    0.6495506
Kemiskinan..X2.                      -0.4119542
Pengangguran..X3.                     0.5303392
Kepadatan.Penduduk..X4.               1.0000000

Keputusan :

\(|\) nilai korelasi antarvariabel \(|<0.8\), maka terima \(H_0\)

Interpretasi :

Berdasarkan keputusan yang telah dibuat, maka dapat disimpulkan bahwa tidak terdapat multikolinearitas pada antarvariabel.

5.3 Koefisien Korelasi Cophenetic

Hasil :

> KorCop
  Kor_Single Kor_Average Kor_Complete Kor_Centroid  Kor_Ward
1  0.9860323   0.9931291     0.943608    0.9919499 0.9491605

Interpretasi :

Berdasarkan hasil output di atas, dapat dilihat bahwa nilai korelasi yang mendekati 1 yaitu Kor_Average, sehingga dapat disimpulkan bahwa metode terbaik untuk menjalankan analisis cluster hierarki ini adalah metode average linkage.

5.4 Indeks Validitas

Hasil :

> summary(Indeks_Validitas)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 5 

Validation Measures:
                                 2       3       4       5
                                                          
hierarchical Connectivity   2.9290  8.6929 12.0552 15.0829
             Dunn           1.1584  0.2823  0.3298  0.3298
             Silhouette     0.6617  0.3630  0.2729  0.2277

Optimal Scores:

             Score  Method       Clusters
Connectivity 2.9290 hierarchical 2       
Dunn         1.1584 hierarchical 2       
Silhouette   0.6617 hierarchical 2

Interpretasi :

Berdasarkan hasil output di atas, dapat dilihat bahwa indeks connectivity, indeks dunn, dan indeks silhouette sama-sama memiliki jumlah cluster sebanyak dua, sehingga akan terdapat dua cluster yang merupakan cluster optimal pada metode average linkage.

5.5 Metode Average Linkage

5.5.1 Analisis Cluster

Hasil :

> Average_Linkage

Call:
hclust(d = dist(scale(Keamanan[, 2:5])), method = "average")

Cluster method   : average 
Distance         : euclidean 
Number of objects: 22

Interpretasi :

Berdasarkan hasil output di atas, dapat dilihat bahwa pada analisis cluster penelitian ini akan digunakan metode average linkage dengan perhitungan jarak euclidean untuk 22 Kabupaten/Kota yang berada di Povinsi Nusa Tenggara Timur.

5.5.2 Cluster Dendrogram

Hasil :

> plot(Average_Linkage, labels(Keamanan$Wilayah), hang = 1, col = "cornsilk4", main = "Cluster Dendogram", sub = " ", xlab = "Provinsi", ylab = "Jarak")

> fviz_dend(HierarkiCluster, rect = TRUE, cex = 0.5)

Interpretasi :

Berdasarkan hasil output di atas, dapat dilihat bahwa terdapat dua cluster yang terbentuk, untuk cluster pertama terdiri dari Sumba Barat, Sumba Timur, Kupang, Timor Tengah Selatan, Timor Tengah Utara, Belu, Alor, Lembata, Flores Timur, Sikka, Ende, Ngada, Manggarai, Rote Ndao, Sumba Tengah, Sumba Barat Daya, Nagekeo, Manggarai Timur, Sabu Raijua, dan Malaka. Sedangkan untuk cluster kedua, yaitu Kota Kupang.

5.5.3 Hasil Cluster

Hasil :

> aggregate(Keamanan,list(idclus),mean)
  Group.1 Wilayah Tindak.Pidana..X1. Kemiskinan..X2. Pengangguran..X3.
1       1      NA           360.4286        21.20762              3.04
2       2      NA          1171.0000         8.61000              5.69
  Kepadatan.Penduduk..X4.
1                136.8571
2               2929.0000

Interpretasi :

Berdasarkan hasil output di atas, dapat dilihat karakteristik dari kedua cluster, yaitu

Cluster 1 : Variabel tingkat kemiskinan memiliki karakteristik yang tinggi, sedangkan variabel kepadatan penduduk, tingkat pengangguran dan tindak pidana memiliki karakteristik yang rendah.

Cluster 2 : Variabel tingkat kemiskinan memiliki karakteristik yang rendah, sedangkan variabel kepadatan penduduk, tingkat pengangguran dan tindak pidana memiliki karakteristik yang tinggi.

sehingga dapat disimpulkan bahwa, cluster 1 merupakan kelompok dengan faktor penyebab terancamnya keamanan wilayah yang rendah dan cluster 2 merupakan kelompok dengan faktor penyebab terancamnya keamanan wilayah yang tinggi.

6 KESIMPULAN

Berdasarkan hasil penelitian secara keseluruhan, dapat disimpulkan bahwa Kota Kupang menjadi satu–satunya kota dengan faktor penyebab terancamnya keamanan wilayah yang tinggi. Hal ini disebabkan Kota Kupang memiliki tiga dari empat variabel faktor penyebab terancamnya keamanan wilayah berkarakteristik tinggi, variabel tersebut yaitu kepadatan penduduk, tingkat pengangguran, dan tindak pidana. Sedangkan untuk Kabupaten/Kota selain Kota Kupang menjadi wilayah dengan aktor penyebab terancamnya keamanan wilayah yang rendah.

Dari hasil penelitian ini juga, dapat dilihat bahwa Kota Kupang membutuhkan perhatian pemerintah lebih lanjut, khususnya terhadap variabel tindak pidana dan variabel kepadatan penduduk. Dengan ini, analisis hierarki dapat mengelompokan berbagai hal sesuai dengan karakteristikanya, sehingga dalam kasus ini dapat dengan mudah mengetahui hal penting yang butuh penanganan terlebih dahulu.

7 DAFTAR PUSTAKA

Mahayuda, I. P., & Ardana, P. S. (2020). PENYELESAIAN MASALAH DI DESA DENGAN PENDEKATAN RESTORATIVE JUSTICE OLEH BHAYANGKARA PEMBINA KEAMANAN DAN KETERTIBAN MASYARAKAT DI WILAYAH HUKUM KEPOLISIAN RESOR BULELENG. Jurnal Fakultas Hukum UNIPAS, 1-30.

Munawar. (2013). HUBUNGAN KONFLIK ANTARWARGA DENGAN KEAMANAN KEMANUSIAAN DAN IMPLIKASINYA TERHADAP KETAHANAN WILAYAH (STUDI TAWURAN WARGA DI KECAMATAN JOHAR BARUJAKARTA PUSAT 2010-201). JURNAL KETAHANAN NASIONAL, 26-31.

K. P. Sinaga and M. -S. Yang, “Unsupervised K-Means Clustering Algorithm,” in IEEE Access, vol. 8, pp. 80716-80727, 2020, doi: 10.1109/ACCESS.2020.2988796.

Apriliana, T., & Widodo, E. (2023). Analisis Cluster Hierarki untuk Pengelompokan Provinsi di Indonesia berdasarkan Jumlah Base Transceiver Station dan Kekuatan Sinyal. Konvergensi Teknologi dan Sistem Informasi, 286-296.

Az-Zahra, A., & Wijayanto, A. W. (2024). Tinjauan Kesejahteraan di Daerah Perbatasan Republik Indonesia Tahun 2021: Penerapan Analisis Klaster K-Means dan Hierarki. Jurnal Sistem dan Teknologi Informasi, 55-64.

Silvi, R. ( 2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K-Means Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. JURNAL MATEMATIKA “MANTIK”, 22-31.

Penerapan Analisis Cluster Hierarki Dalam Pengelompokan Kota/Kabupaten di Provinsi Nusa Tenggara Timur Berdasarkan Faktor-Faktor Penyebab Terancamnya Keamanan Wilayah Pada Tahun 2023

Putri Ayu Faradilla Azzahra

2024-11-30

1 PENDAHULUAN

1.1 Latar Belakang

1.2 Rumusan Masalah

1.3 Tujuan

2 TINJAUAN PUSTAKA

2.1 Analisis Cluster

2.2 Analisis Cluster Hierarki

2.2.1 Single Linkage

2.2.2 Complete Linkage

2.2.3 Average Linkage

2.2.4 Centroid Linkage

2.2.5 Ward

2.3 Uji Asumsi

2.3.1 Uji Kaiser-Meyer-Olkin (KMO)

2.3.2 Uji Non-Multikolinearitas

2.4 Indeks Validitas

2.4.1 Indeks Connectivity

2.4.2 Indeks Dunn

2.4.3 Indeks Silhouette

3 DATA

4 SOURCE CODE

4.1 Library

4.2 Impor Data

4.3 Statistika Deskriptif

4.4 Uji Asumsi

4.5 Standarisasi

4.6 Jarak Euclidien

4.7 Koefisien Korelasi Cophenetic

4.8 Indeks Validitas

4.9 Metode Average Linkage

5 HASIL DAN PEMBAHASAN

5.1 Statistika Deskriptif

5.2 Uji Asumsi

5.2.1 Uji Kaiser-Meyer-Olkin (KMO)

5.2.2 Uji Non Multikolinearitas

5.3 Koefisien Korelasi Cophenetic

5.4 Indeks Validitas

5.5 Metode Average Linkage

5.5.1 Analisis Cluster

5.5.2 Cluster Dendrogram

5.5.3 Hasil Cluster

6 KESIMPULAN

7 DAFTAR PUSTAKA