Pengelompokkan Kabupaten/Kota di Sumatera Utara berdasarkan Indikator Pembangunan Ekonomi Menggunakan Analisis Cluster Hierarki

Rachel Cyrilla Sahla

27 November 2024


1 PENDAHULUAN

1.1 Latar Belakang

Indikator pembangunan ekonomi digunakan untuk mengukur kemajuan suatu daerah dalam meningkatkan kesejahteraan masyarakatnya. Salah satu indikator yang sering digunakan adalah Pendapatan Per Kapita atau Produk Domestik Regional Bruto (PDRB), yang menggambarkan total nilai barang dan jasa yang diproduksi di suatu wilayah dibagi dengan jumlah penduduk. PDRB memberikan gambaran tentang seberapa besar daya beli masyarakat dan potensi ekonomi daerah tersebut. Semakin tinggi PDRB per kapita, semakin baik pula perekonomian daerah tersebut dalam menciptakan kesejahteraan bagi warganya.

Selain PDRB, Indeks Pembangunan Manusia (IPM) juga merupakan indikator penting dalam mengukur keberhasilan pembangunan ekonomi. IPM menggabungkan tiga dimensi dasar, yaitu kesehatan (diukur dengan harapan hidup), pendidikan (diukur dengan rata-rata lama sekolah dan angka melek huruf), serta standar hidup (diukur dengan pendapatan per kapita). IPM yang lebih tinggi mencerminkan tingkat kesejahteraan manusia yang lebih baik dan mencakup tidak hanya aspek ekonomi, tetapi juga kualitas hidup masyarakat secara keseluruhan. Peningkatan IPM menunjukkan adanya pemerataan pembangunan yang lebih inklusif di suatu wilayah.

Tingkat Partisipasi Angkatan Kerja (TPAK) dan persentase penduduk miskin juga merupakan indikator penting yang mencerminkan kondisi sosial ekonomi di suatu daerah. TPAK menggambarkan proporsi penduduk usia kerja yang aktif dalam kegiatan ekonomi, baik bekerja maupun mencari pekerjaan. Tingginya TPAK menunjukkan partisipasi yang besar dalam kegiatan ekonomi, yang bisa menjadi indikator pertumbuhan ekonomi yang sehat. Sementara itu, persentase penduduk miskin menunjukkan tingkat kemiskinan yang ada di daerah tersebut, di mana semakin rendah persentasenya, semakin baik pencapaian pembangunan ekonomi dalam mengurangi ketimpangan dan meningkatkan kesejahteraan masyarakat. Indikator-indikator ini saling terkait dan memberikan gambaran yang lebih lengkap tentang kemajuan pembangunan ekonomi suatu wilayah.

1.2 Rumusan Masalah

Berdasarkan latar belakang masalah yang telah diuraikan, maka dapat dirumuskan permasalahan penelitian, yaitu:

  1. Bagaimana mengelompokkan kabupaten/kota di Provinsi Sumatera Utara berdasarkan indikator pembangunan ekonomi?

  2. Bagaimana mengetahui cluster mana yang memiliki indikator pembangunan ekonomi yang lebih baik?

1.3 Tujuan Penelitian

Dalam melakukan penelitian ini, tujuan penelitian yang ingin dicapai yaitu:

  1. Untuk mengetahui pengelompokan kabupaten/kota di Provinsi Sumatera Utara berdasarkan indikator pembangunan ekonomi.

  2. Untuk mengetahui cluster mana yang memiliki indikator pembangunan ekonomi yang lebih baik.

1.4 Batasan Masalah

Untuk menghindari kesalahpahaman dan meluasnya pokok bahasan, maka peneliti memberikan batasan masalah sebagai berikut.

  1. Data yang digunakan adalah dataset di setiap kabupaten/kota di Provinsi Sumatera Utara pada tahun 2023 yang didapatkan dari Badan Pusat Statistik.

  2. Analisis yang digunakan untuk mengelompokkan kabupaten/kota di Provinsi Sumatera Utara pada tahun 2023 berdasarkan indikator pembangunan ekonomi adalah analisis cluster hierarki dengan menggunakan jarak euclidean dan metode Average Linkage.

1.5 Data

Data pada kasus ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik di Sumatera Utara mengenai indikator pembangunan ekonomi Tahun 2023. Indikator pembangun ekonomi terdiri dari 3 indikator yaitu indikator moneter, indikator non-moneter dan indikator campuran dengan beberapa peubah yang digunakan adalah Produk Domestik Regional Bruto perkapita Atas Dasar Harga Konstan (\(X_1\)), Indeks Pembangunan Manusia (\(X_2\)), Tingkat Partisipasi Angkatan Kerja (\(X_3\)), dan Persentase Penduduk Misikin (\(X_4\)). Adapun data tersebut tersaji dalam tabel berikut:

Tabel 1.5. Data Indikator Pembangunan Ekonomi Provinsi Sumatera Utara Tahun 2023

1.6 Latar Belakang Metode

Salah satu metode yang dapat digunakan untuk pengelompokan ini adalah analisis cluster. Metode ini memungkinkan pengelompokan daerah berdasarkan kesamaan karakteristik ekonomi dengan cara yang lebih sistematis dan terstruktur. Melalui analisis cluster, setiap kabupaten/kota akan dikelompokkan berdasarkan kesamaan dalam indikator ekonomi, seperti Produk Domestik Regional Bruto (PDRB), Indeks Pembangunan Manusia (IPM), Tingkat Partisipasi Angkatan Kerja (TPAK), dan persentase penduduk miskin. Hasil dari pengelompokan ini dapat memberikan informasi yang berguna bagi pemerintah dalam merumuskan kebijakan pembangunan yang lebih tepat sasaran. Metode analisis cluster yang digunakan dalam kasus ini adalah analisis cluster hierarki dengan jarak euclidean dan dengan membandingkan beberapa metode, yaitu  Single LinkageComplete LinkageAverage Linkage, dan Ward’s Method. Dengan adanya metode ini, dapat mengetahui cluster mana yang memiliki indikator pembangunan ekonomi yang kurang baik dan dapat dijadikan sebagai acuan penting bagi Pemerintah. Melalui pengelompokan ini, diharapkan pembangunan ekonomi di Sumatera Utara dapat lebih merata dan terarah.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif yaitu salah satu metode statistika yang berkaitan untuk pengumpulan dan penyajian sehingga dapat memberikan informasi yang berguna (Martias, 2021). Adapun pengertian statistika deskriptif menurut (Solikhah, 2016) yaitu statistika deskriptif yang lazim dikenal pula dengan istilah statistik deduktif, statistik sederhana, dan statistik deskriptif, adalah statistik yang tingkat pekerjaannya mencakup cara-cara menghimpun, menyusun, atau mengatur, mengolah, menyajikan, dan menganalisis data angka, agar dapat memberikan gambaran yang teratur, ringkas, dan jelas mengenai suatu gejala, peristiwa, atau keadaan sehingga dapat ditarik pengertian atau makna tertentu.

2.2 Analisis Cluster

Analisis cluster adalah suatu teknik statistik yang bertujuan untuk mengelompokkan obyek ke dalam suatu kelompok sedemikian sehingga obyek yang berada dalam satu kelompok akan memiliki kesamaan yang tinggi dibandingkan dengan obyek yang berada di kelompok lain (Silvi, 2018). Dengan kata lain tujuan dari analisis cluster adalah pengklasifikasian obyek-obyek berdasarkan similaritas diantaranya dan menghimpun data menjadi beberapa kelompok.

Secara umum analisis cluster terbagi menjadi 2 metode yaitu metode hierarki dan metode non-hierarki. Metode cluster hierarki merupakan metode pengelompokan yang jumlah clusternya belum diketahui. Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative) atau pembagian berurutan (divisive). Pada metode non-hierarki, jumlah cluster ditentukan terlebih dahulu sesuai keinginan peneliti.

Tahap-tahap dalam analisis cluster yaitu sebagai berikut (Hamelia & Bagus, 2019):

  1. Melakukan Proses Standarisasi Data

    Hal pertama yang harus dilakukan dalam analisis clustering adalah melakukan standarisasi data yaitu menggunakan z-score, dimana tujuan dilakukan standarisasi data adalah untuk mempersempit perbedaan satuan lebar serta dapat digunakan untuk menyamakan peubah yang memiliki satuan yang berbeda-beda.

  2. Menentukan Ukuran Kemiripan

    Pada analisis cluster terdapat beberapa ukuran kemiripan diantaranya adalah ukuran asosiasi, ukuran korelasi dan ukuran jarak. Ukuran kemiripan dengan menghitung jarak antar dua objek. Dalam mengukur kedekatan antara dua objek dapat digunakan metode pengukuran Euclidean Distance.

  3. Memilih Prosedur Pengclusteran

    Pembentukan cluster dapat dilakukan dengan dua cara, yaitu dengan metode Hierarki dan Non Hierarki.

  4. Menentukan Banyaknya Cluster

    Masalah utama dalam analisis cluster adalah menetukan berapa banyaknya cluster. Namun demikian ada beberapa petunjuk yang bisa dipergunakan, yaitu:

    • Pertimbangan teoretis, konseptual, praktis, mungkin bisa diusulkan/disarankan untuk menetukan berapa banyaknya cluster yang sebenarnya

    • Besarnya relatif cluster seharusnya berguna/bermanfaat

  5. Menginterpretasikan Hasil Cluster

    Tahap terakhir adalah interpretasi masing-masing cluster yang terbentuk. Saat memulai interpretasi digunakan rata-rata pada peubah.

2.2.1 Uji Asumsi Analisis Cluster

a. Uji Sampel Representatif

Sampel representatif adalah keadaan ketika sampel yang diambil dapat merepresentasikan atau mewakili populasi yang ada. Asumsi sampel representatif ini dapat dilakukan menggunakan uji Kaiser Meyer Olkin (KMO). Jika nilai uji KMO menunjukkan sebesar 0.5 sampai 1, maka sampel dikatakan telah representatif atau mewakili populasi.

b. Uji Non-Multikolinearitas

Menurut Gujarati undefined95), apabila nilai mutlak koefisien korelasi antar variabel independent menunjukkan nilai lebih dari 0.8 maka dikatakan telah terjadi masalah multikolinearitas. Sebaliknya apabila koefisien korelasi menunjukkan nilai kurang dari 0.8 maka model tidak mengalami masalah multikolinearitas atau telah memenuhi asumsi non-multikolinearitas.

2.2.2 Standarisasi Variabel

Standarisasi variabel dilakukan apabila terdapat perbedaan satuan yang signifikan diantara variabel-variabel yang diteliti. Proses standarisasi dilakukan dengan mengenolkan rata-rata dan varian menjadi 1 (satu) atau dengan kata lain mengubah data Z-Score yaitu transformasi data dalam bentuk normal baku N(0,1), yang dapat dicari dengan:

\(Z = \frac{X_i - \bar{x}}{\sigma}\)

Dengan:

  • \(X_i\) : data ke-i

  • \(\bar{x}\) : rata-rata data

  • \(\sigma\) : simpangan baku

2.2.3 Jarak Analisis Cluster

Konsep dasar pengukuran analisis cluster adalah pengukuran jarak (distance) dan kesamaan (similarity). Jarak merupakan ukuran jarak pisah antar objek sedangkan kesamaan merupakan ukuran kedekatan. Konsep ini penting karena pengelompokkan pada analisis cluster didasarkan pada kedekatan. Pengukuran jarak (distance type measure) digunakan untuk data bersifat kuantitatif, sedangkan pengukuran kesesuaian (matchingtype measure) digunakan untuk data yang bersifat kualitatif. Perhitungan jarak biasanya menggunakan jarak Euclidean yang digunakan pada 2 dimensi observasi.

a. Jarak Euclidean

Jarak Euclidean yaitu besarnya jarak suatu garis lurus yang menghubungkan antar objek. Jarak Euclidean (Euclidean distance) merupakan jarak yang paling umum dan paling sering digunakan dalam analisis cluster. Jarak Euclidean merupakan perhitungan jarak dari dua buah titik dalam euclidean space untuk mempelajari hubungan antara sudut dan jarak. Adapun rumus jarak euclidean yaitu:

\(d_{e u c}(x, y)=\sqrt{\sum_{i=1}^n\left(x_i-y_i\right)^2}\)

Dengan:

  • \(d_{e u c}\) : kuadrat jarak euclidean antar obyek-\(y\) dan obyex-\(x\)

  • \(x_i\) : nilai dari obyek-\(x\) pada variabel ke-\(i\)

  • \(y_i\) : nilai dari obyek-\(y\) pada variabel ke-\(i\)

b. Jarak Mahalanobis

Jarak Mahalanobis digunakan jika data terjadi korelasi. Jarak Mahalanobis antara dua sampel X dan Y dari suatu variabel acak didefinisikan sebagai berikut:

\(d_{\text {Mahalanobis }}(x, y)=\sqrt{(x-y)^T+S^{-1}(x-y)}\)

Dengan:

  • \(S^{-1}\) : suatu matriks varians kovarians

2.2.4 Analisis Cluster Hierarki

Metode cluster hierarki merupakan metode pengelompokan yang mana jumlah kelompok yang akan dibuat belum diketahui. Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative) atau pembagian berurutan (divissive).

a. Metode Agglomerative

Metode agglomerative dimulai dengan objek individual. Awalnya ada banyak cluster sebagai objek. Objek yang paling mirip dikelompokkan kemudian kelompok-kelompok awal ini digabungkan sesuai dengan kesamaannya. Ketika kesamaan menurun, semua sub kelompok digabungkan menjadi satu kelompok. Metode ini dibagi lagi menjadi beberapa macam yakni sebagai berikut.

  1. Single Linkage

    Untuk menentukan jarak antar cluster dengan menggunakan single linkage¸ maka dipilih jarak yang paling dekat atau aturan tetangga dekat (nearest neighbour rule). Langkah-langkah menggunakan metode single linkage yaitu (Johnson & Wichern, 2007) :

    • Menentukan jarak minimum dalam \(D=d_{ij}\)

    • Menghitung jarak antara cluster yang telah dibentuk pada langkah a dengan objek lainnya

    • Dari algoritma diatas jarak-jarak antara \((ij)\) dan cluster K yang lainnya dapat dihitungan dengan rumus :

      \(d_{(ij)k=min(d_{ik},d_{jk})}\)

  2. Complete Linkage

    Metode complete linkage jarak antar cluster ditentukan oleh jarak terjauh atau maximum (farthest-neighbour) antara dua objek dalam cluster yang berbeda (Johnson & Wichern,2007). Adapun rumusnya yaitu:

    \(d_{(ij)k=max(d_{ik},d_{jk})}\)

  3. Average Linkage

    Metode average linkage akan mengelompokkan objek berdasarkan jarak antara dua cluster yang dianggap sebagai jarak rata-rata antara semua anggota dalam satu cluster dengan semua anggota cluster lain (Johnson & Wichern, 2007).Pada metode ini digunakan jarak rata-rata dari sampel pada suatu kelompok terhadap sampel pada kelompok yang lain. Perhitungan jarak antar kelompok adalah dengan menggunakan persamaan:

    \(d_{(i j) k}=\frac{1}{n_i \times n_j} \sum_{i=1}^{n_i} \sum_{j=1}^{n_j} \sqrt{\sum_{k=1}^p\left(x_{i k}-y_{j k}\right)^2}\)

  4. Ward’s Method

    Pada Ward’s Method jarak antara dua cluster yang terbentuk adalah sum of squares (Jumlah Kuadrat) di antara dua cluster tersebut. Diukur dengan menggunakan jumlah total dari deviasi kuadrat pada mean cluster untuk setiap pengamatan. Fungsi obyektif yang digunakan yaitu Error sum of squares (SSE). Dua obyek akan digabungkan jika mempunyai fungsi obyektif terkecil diantara kemungkinan yang ada (Fathia, Rahmawati, dan Tarno, 2016).

    \(E S S=\sum_{j=1}^k\left(\sum_{i=1}^{n_j} x_{i j}^2-\frac{1}{n_j}\left(\sum_{i=1}^{n_j} x_{i j}^2\right)\right)\)

    Dengan:

    • \(x_{ij}\) : nilai untuk objek ke-\(i\) dengan \(i\)=1, 2, .., n pada kelompok ke-\(j\)

    • \(K\) : jumlah kelompok setiap stage

    • \(n_j\) : jumlah kelompok ke-\(i\) pada kelompok ke-\(j\)

b. Metode Divissive

Metode devisive bekerja dari arah yang berlawanan. Satu kelompok objek awal dibagi menjadi dua kelompok sehingga objek dalam satu subkelompok jauh dari objek yang lain. Sub kelompok ini kemudian dibagi lagi menjadi subkelompok yang berbeda. Proses tersebut terus berlanjut sampai ada banyak sub kelompok sebagai objek, yakni sampai masing-masing objek membentuk suatu kelompok.

2.2.5 Koefisien Korelasi Cophenetic

Setelah mendapatkan hasil dari proses cluster maka dilakukan uji validitas cluster yang diperlukan untuk melihat kebaikan hasil analisis cluster. Ukuran yang digunakan untuk menguji validitas hasil clustering pada penelitian ini adalah koefisien korelasi cophenetic. Koefisien korelasi cophenetic merupakan koefisien korelasi antara elemen-elemen asli matriks ketidakmiripan (matriks jarak squared euclidean) dan elemen-elemen yang dihasilkan oleh dendogram (matriks cophenetic) (Widodo dkk., Sumatera Utara18).

2.2.6 Dendogram

Dendogram merupakan representasi visual dari proses terbentuknya cluster berdasarkan nilai koefisien jarak pada setiap langkah hingga terbentuk cluster akhir yaitu satu objek satu cluster (Dzikrullah, Sumatera Utara22). Dendogram adalah representasi matematis dan visual dari prosedur pengklasteran yang dilakukan dengan menggunakan analisis cluster hierarki. Bentuk dendogram identik dengan diagram pohon. Titik-titik pada dendogram mewakili cluster, sedangkan panjang batangnya mempresentasikan jarak dimana objek-objek digabung dalam cluster. Dendogram sebagai representasi proses pengelompokan analisis cluster hierarki akan membentuk struktur yang berbeda tergantung pada jarak maupun lingkage yang akan digunakan pada proses pengklusteran. Dendogram dipotong untuk mengetahui banyaknya cluster yang terbentuk dari selisih terpanjang. Pemotongan dendogram dilakukan pada selisih jarak penggabungan terbesar ataupun pada gerombol yang dihasilkan lebih bermakna. Pemotongan dendogram dapat dilakukan pada selisih jarak penggabungan terbesar.

3 SOURCE CODE

3.1 Library yang Dibutuhkan

> library(readxl)
> library(magrittr)
> library(knitr)
> library(ggplot2)
> library(factoextra)
> library(cluster)
> library(psych)

Sebelum melakukan analisis perlu mengaktifkan packages yang dibutuhkan terlebih dahulu untuk support proses analisis. Berikut adalah library yang akan digunakan untuk membantu dalam pemrograman ini agar lebih cepat dan efisien.

  • library(“readxl”) digunakan untuk membuka dan membaca file data yang bertype microsoft excel xlsx dari dalam R.

  • library(“magrittr”) digunakan untuk mengurangi waktu pengembangan dan meningkatkan keterbacaan, serta memelihara kode.

  • library(“knitr”) digunakan untuk membuat laporan dinamis menggunakan R Markdown.

  • library(“ggplot2”) digunakan untuk membuat visualisasi data yang berbasis grafik dengan tampilan yang menarik, fleksibel, informatif dan estetis dengan cara yang lebih sistematis dan deklaratif.

  • library(“factoextra”) digunakan untuk library(“factoextra”) digunakan untuk visualisasi dan analisis hasil dari berbagai teknik analisis data multivariat, terutama dalam analisis faktor, analisis komponen utama, analisis klastering, dan analisis diskriminan serta dan menentukan jumlah cluster optimum.

  • library(“cluster”) digunakan untuk melakukan berbagai jenis analisis klastering (pengelompokan) data.

  • library(“psych”) digunakan untuk analisis psikometri, statistik dan menyediakan banyak fungsi yang berguna untuk melakukan berbagai jenis analisis dan pemrosesan data terkait psikometri, seperti analisis faktor, analisis reliabilitas, uji validitas, dan berbagai jenis transformasi data.

3.2 Import Data

> data_IPE_sumut_2023 <- read_excel("C:/Users/Rachel Cyrilla Sahla/Documents/Semester 5/Anmul/Laprak/UAP/indikator_pembangunan_ekonomi_sumut.xlsx")
Tabel 1. Data Indikator Pembangunan Ekonomi Provinsi Sumatera Utara Tahun 2023
Kabupaten/Kota X1 X2 X3 X4
Nias 18569 65.15 81.68 15.10
Mandailing Natal 21117 72.65 63.07 8.86
Tapanuli Selatan 35368 74.58 75.64 7.01
Tapanuli Tengah 20064 72.77 74.52 11.50
Tapanuli Utara 20476 76.86 81.20 8.54
Toba Samosir 28894 77.83 80.87 8.04
Labuhan Batu 51728 74.70 64.84 7.99
Asahan 37307 73.59 69.53 8.21
Simalungun 30418 75.17 72.15 7.87
Dairi 22387 75.18 84.81 7.47
Karo 37944 76.88 83.86 7.98
Deli Serdang 39444 77.16 67.62 3.44
Langkat 31147 74.33 75.87 9.23
Nias Selatan 12102 64.98 79.29 16.39
Humbang Hasundutan 22419 72.49 86.67 8.69
Pakpak Bharat 17328 72.30 85.95 7.54
Samosir 24552 72.93 86.89 11.66
Serdang Bedagai 31910 73.40 67.65 7.44
Batu Bara 61604 72.56 72.94 11.38
Padang Lawas Utara 34081 73.45 73.41 8.79
Padang Lawas 33367 72.16 78.14 7.89
Labuhan Batu Selatan 65192 74.23 73.20 8.06
Labuhan Batu Utara 49005 75.45 64.68 9.08
Nias Utara 16583 65.44 81.27 21.79
Nias Barat 14409 64.68 81.08 22.81
Kota Sibolga 42759 77.07 71.18 11.42
Kota Tanjung Balai 35097 75.42 69.79 12.21
Kota Pematang Siantar 37461 80.46 70.96 7.24
Kota Tebing Tinggi 24329 78.17 65.70 9.49
Kota Medan 70103 82.61 64.67 8.00
Kota Binjai 29370 78.11 62.79 4.79
Kota Padangsidimpuan 20260 78.10 68.90 6.85
Kota Gunungsitoli 26332 71.55 67.77 14.78

Untuk mengimport file data dari excel ke R dapat menggunakan fungsi read_excel dari library(readxl) yang kemudian disimpan dalam variabel data_IPE_sumut_2023.

3.3 Statistika Deskriptif

> summary(data_IPE_sumut_2023)

Menghitung statistika deskriptif dengan fungsi summary(). Hasil dari perintah tersebut menunjukkan rangkuman ukuran pemusatan dan persebaran data pada masing-masing variabel.

3.4 Uji Asumsi Analisis Cluster

a. Uji Sampel Representatif

> kmo <- KMO(data_IPE_sumut_2023[,2:5])
> kmo

Melakukan uji sampel representatif dengan menggunakan fungsi KMO() dengan argumen didalamnya adalah data[,2:5] yang disimpan dalam variabel kmo. Argumen dalam data [,2:5] menunjukkan data yang dianalisis yaitu data pada kolom kedua sampai kelima.

b. Uji Non-Multikolinearitas

> korelasi <- cor(data_IPE_sumut_2023[,2:5], method = 'pearson')
> korelasi

Melakukan uji asumsi non-multikolinearitas menggunakan korelasi antar variabel dengan fungsi cor() dengan argumen didalamnya yaitu data dan metode yang digunakan adalah pearson yang disimpan dalam variabel korelasi.

3.5 Standarisasi Data

> datastand <- scale(data_IPE_sumut_2023[2:5])

Melakukan standarisasi menggunakan fungsi scale() dengan argument yang berisi data awal dari kolom 2 hingga kolom 5 yang disimpan dalam variabel datastand. Standarisasi ini perlu dilakukan dengan tujuan untuk mempersempit dan menyamakan peubah yang memiliki satuan yang berbeda-beda.

3.6 Menghitung Jarak

> jarak <- dist(datastand, method = "euclidean")
> jarak
           1         2         3         4         5         6         7
2  3.4164439                                                            
3  3.2809780 2.0587937                                                  
4  2.2248293 1.6640557 1.5770420                                        
5  3.1949657 2.6344953 1.4341019 1.4995628                              
6  3.5264338 2.7501522 1.1630459 1.7974054 0.6417691                    
7  4.2961528 2.2060885 1.8586730 2.7294028 3.1357766 2.7769594          
8  3.3290754 1.4471756 0.9106240 1.5939696 2.1064546 1.9181318 1.2143688
9  3.3102485 1.5232861 0.6324773 1.3017440 1.4638386 1.3358641 1.7813422
10 3.0391815 3.0015694 1.5377669 1.7858206 0.6908534 0.9484792 3.3746669
11 3.5424680 3.1974672 1.2663562 2.1859370 1.2730797 0.7800294 2.7777967
12 4.6422302 2.1947417 1.5303963 2.7311971 2.5599188 2.2217873 1.5455076
13 2.8442899 1.9001479 0.6091650 1.0282434 1.2047903 1.1169381 2.0829980
14 0.6337336 3.4187006 3.6144804 2.3456306 3.4460207 3.8331332 4.5504077
15 2.4288288 3.1723671 1.8475891 1.7734262 1.2794935 1.5629694 3.6135389
16 2.5443215 3.1022700 1.9496657 1.8163383 1.2981955 1.6888555 3.7550947
17 2.1798334 3.2784980 2.0576721 1.6917731 1.4457210 1.6869321 3.6454386
18 3.4048105 1.0431960 1.1398042 1.5782010 2.1656987 2.0799505 1.4676010
19 3.7706668 3.1693574 2.1854736 2.8966594 3.3032313 2.9171154 1.6025380
20 2.9241462 1.6669229 0.5917088 1.1900128 1.6278213 1.4996692 1.7192268
21 2.6487439 2.2116981 0.7118119 1.3618768 1.4976128 1.4305595 2.2775287
22 4.3907974 3.3794884 2.1159524 3.2666155 3.3504045 2.8570535 1.4664862
23 4.2122480 2.0620109 1.8313110 2.5564500 2.9982286 2.6584666 0.3683198
24 1.6043149 4.3041004 4.4071743 3.1524911 4.1740744 4.4896058 5.1497070
25 1.8669410 4.5530752 4.7322796 3.4501622 4.4874496 4.8152664 5.4458341
26 3.6887158 2.2196322 1.4421187 1.9326318 2.1649770 1.8184734 1.4494279
27 3.2091778 1.6827095 1.4821082 1.3861060 2.0656125 1.9285034 1.6799144
28 4.5322176 2.4507180 1.5395904 2.4619874 2.0284778 1.5981521 1.8878813
29 4.0156546 1.3844040 1.8573241 1.8350111 2.1345391 2.0929737 2.1095192
30 6.1750533 4.1577224 3.4203829 4.4740024 4.3267145 3.7730562 2.2722680
31 4.7466499 1.7191485 2.0341583 2.6595681 2.7181250 2.5508069 1.9316738
32 4.0370194 1.5883552 1.6198716 1.8449110 1.7263160 1.7410297 2.4106063
33 2.4699381 1.6102414 2.3380253 1.3071035 2.6884965 2.8177314 2.5409743
           8         9        10        11        12        13        14
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9  0.7076505                                                            
10 2.3375359 1.7926941                                                  
11 2.0789604 1.7071832 1.1679910                                        
12 1.4497808 1.4506903 2.8081018 2.4389532                              
13 0.9995235 0.6304045 1.4249847 1.3533009 1.9801411                    
14 3.5750973 3.5400324 3.3852169 3.9523019 4.8976067 3.1328583          
15 2.5407522 2.1349838 0.7452786 1.5568732 3.2787835 1.6374228 2.8379607
16 2.6297367 2.1763755 0.7845200 1.8243323 3.2738775 1.7754368 2.9005396
17 2.6320906 2.2778028 1.1770630 1.6382251 3.5537518 1.6878357 2.5751154
18 0.4902935 0.7506995 2.4355890 2.3703564 1.4080687 1.2056134 3.5918037
19 1.9223987 2.4080310 3.3519727 2.5631010 2.7688456 2.2537517 4.1526849
20 0.5850480 0.5555304 1.8096423 1.6565968 1.7747125 0.4533820 3.2084875
21 1.2386589 1.0958460 1.3822022 1.3961791 2.1710741 0.6962120 3.0381625
22 2.0066560 2.4326597 3.3707124 2.4570332 2.3379738 2.4105222 4.8033573
23 1.1508287 1.6628602 3.3001142 2.7231392 1.6041051 1.9682118 4.4342524
24 4.3366577 4.3353513 4.1727149 4.5348337 5.7273125 3.8715002 1.3561744
25 4.6424691 4.6464320 4.4912047 4.8714657 6.0365378 4.1944586 1.5601863
26 1.2093573 1.2938900 2.5394824 1.9208137 1.9764245 1.3211482 3.9222349
27 1.0603389 1.1321618 2.4768336 2.1796322 2.1735070 1.1467535 3.3659261
28 1.6594014 1.3663583 2.4772506 1.9388131 1.2870778 1.7243754 4.7588644
29 1.5348749 1.2598801 2.7103998 2.6593510 1.8197728 1.7109606 4.0721066
30 3.1967781 3.4275270 4.6324084 3.6741157 2.7496608 3.6817403 6.4548551
31 1.7154788 1.6168315 3.1433309 3.0054406 1.0326347 2.2430546 4.8724042
32 1.6324826 1.1104476 2.2568955 2.3891270 1.5875703 1.6044187 4.1427058
33 1.8246831 1.9706920 3.0166937 3.0917547 3.1504723 1.8668856 2.4407599
          15        16        17        18        19        20        21
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16 0.4603870                                                            
17 0.7319646 1.1209886                                                  
18 2.6646916 2.6723189 2.8229449                                        
19 3.3522759 3.6572289 3.1877309 2.3855933                              
20 1.9706858 2.0877390 2.0500471 0.8517440 2.0230253                    
21 1.3911474 1.5338429 1.6123977 1.4472974 2.2460856 0.7390983          
22 3.5090050 3.7729723 3.4928896 2.4437337 0.9209136 2.1782407 2.3622882
23 3.5563948 3.7029135 3.5399487 1.4007927 1.6646781 1.6379329 2.2679451
24 3.6416160 3.8221949 3.1435974 4.4472068 4.4809373 3.9790600 3.8835459
25 3.9575026 4.1249111 3.4672687 4.7402872 4.7856545 4.2963120 4.2093452
26 2.8175371 3.0339140 2.6509562 1.5669551 1.7089667 1.2597073 1.8358051
27 2.6663412 2.8337661 2.4864372 1.2871736 2.0190696 1.0611823 1.7130646
28 3.0417456 3.1268829 3.1139906 1.7780257 2.7176320 1.7529920 2.2186952
29 3.1323099 3.1303055 3.1498927 1.3672771 3.1052104 1.6785724 2.3177149
30 5.0531187 5.2581441 4.9991815 3.4664626 2.8165157 3.5244452 3.9951857
31 3.6295811 3.5661399 3.8464527 1.4521908 3.3304751 2.0685172 2.6219177
32 2.7731583 2.6858299 2.9589280 1.3966284 3.3849480 1.6507018 2.1033124
33 2.9464909 3.0613906 2.6972257 1.8465491 2.6856120 1.7635154 2.2142145
          22        23        24        25        26        27        28
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23 1.6492756                                                            
24 5.2617498 4.9896321                                                  
25 5.5781321 5.2833230 0.3395561                                        
26 1.8984520 1.1877985 4.3475881 4.6582364                              
27 2.3766623 1.4014353 3.8572642 4.1559975 0.7126141                    
28 2.4569455 1.7219208 5.3668178 5.6800978 1.3339126 1.7001961          
29 3.1749186 1.8410709 4.7348631 5.0109860 1.5698345 1.3077545 1.3845837
30 2.3221594 2.2607423 6.8027709 7.1047618 2.6032699 3.2129405 2.4817220
31 3.1012242 1.8370920 5.6972399 5.9813115 2.1678787 2.1411233 1.4745973
32 3.3199995 2.2350136 4.9570818 5.2441023 1.9466511 1.7659983 1.3527426
33 3.2875342 2.3161889 2.9413992 3.1964500 1.9688023 1.2907320 2.9149888
          29        30        31        32
2                                         
3                                         
4                                         
5                                         
6                                         
7                                         
8                                         
9                                         
10                                        
11                                        
12                                        
13                                        
14                                        
15                                        
16                                        
17                                        
18                                        
19                                        
20                                        
21                                        
22                                        
23                                        
24                                        
25                                        
26                                        
27                                        
28                                        
29                                        
30 3.3745127                              
31 1.2381415 3.1327391                    
32 0.8134917 3.6818940 1.1474041          
33 2.0400999 4.3536008 2.9325416 2.4901165

Menghitung jarak euclidean dengan fungsi dist() dengan argumen didalamnya yaitu datastand yang merupakan data hasil standarisasi dan metode euclidean yang disimpan dalam variabel jarak.

3.7 Koefisien Korelasi Cophenetic

> single = hclust(jarak, method="single")
> average = hclust(jarak, method="average")
> complete = hclust(jarak, method="complete")
> ward = hclust(jarak, method = "ward.D2")
> cor_single = cor((cophenetic(single)), jarak)
> cor_complete = cor((cophenetic(complete)), jarak)
> cor_avg = cor((cophenetic(average)), jarak)
> cor_ward = cor((cophenetic(ward)), jarak)
> jarak_cophenetic <- data.frame (Metode = c("Single", "Complete", "Average", "Ward"),Korelasi = c(cor_single, cor_complete, cor_avg, cor_ward))
> jarak_cophenetic

Syntax ini melakukan analisis hierarchical clustering menggunakan empat metode berbeda: Single Linkage, Average Linkage, Complete Linkage, dan Ward’s Method. Fungsi hclust diterapkan pada matriks jarak (jarak) untuk membangun dendrogram dengan pendekatan masing-masing metode. Selanjutnya, korelasi cophenetic dihitung menggunakan fungsi cor() untuk mengevaluasi seberapa baik dendrogram yang dihasilkan merepresentasikan struktur jarak asli. Matriks cophenetic dari hasil clustering dibandingkan dengan matriks jarak asli, menghasilkan nilai korelasi untuk setiap metode.

3.8 Cluster Optimum

> fviz_nbclust(datastand, hcut, method = "silhouette")

Fungsi fviz_nbclust digunakan untuk menentukan jumlah cluster optimum, dimana argument yang diisikan adalah data hasil standarisasi, hirarki cluster dengan menggunakan metode Silhoutte untuk memvalidasi.

3.9 Dendogram

> wilayah <- data_IPE_sumut_2023$`Kabupaten/Kota`
> clus_hier <- eclust(datastand, FUNcluster = "hclust", hc_method = "average", k=2, graph = TRUE)
> clus_hier$labels <- wilayah
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5, k_colors = "jco") +
+   labs(title = "Dendrogram Clustering Hierarki") +
+   theme_minimal()

Syntax ini melakukan analisis clustering hierarki pada data yang sudah distandarisasi (datastand) dengan menggunakan fungsi eclust dari package factoextra. Metode clustering yang digunakan adalah Average Linkage, dan jumlah cluster ditentukan sebanyak 2 (k=2). Nama wilayah dari kolom Kabupaten/Kota pada dataset data_IPE_sumut_2023 diatur sebagai label untuk dendrogram dengan menetapkan clus_hier$labels sama dengan wilayah. Dendrogram hasil clustering divisualisasikan menggunakan fungsi fviz_dend, dengan penambahan kotak di sekitar cluster (rect = TRUE) dan penyesuaian ukuran teks label (cex = 0.5). Warna cluster diatur menggunakan skema palet "jco", dan grafik diberi judul “Dendrogram Clustering Hierarki” dengan tema minimalis (theme_minimal()). Hasil ini memudahkan interpretasi struktur hierarki antar wilayah berdasarkan data yang dianalisis.

3.10 Karakteristik Setiap Cluster

> clusters <- cutree(average, k=2)
> clusters
> aggregate(data_IPE_sumut_2023[2:5], list(clusters), mean)

Kode ini membagi dendrogram hasil clustering hierarki metode Average Linkage menjadi 2 cluster menggunakan fungsi cutree, dan hasilnya disimpan dalam variabel clusters. Kemudian, fungsi aggregate digunakan untuk menghitung rata-rata nilai variabel pada kolom ke-2 hingga ke-5 dari dataset data_IPE_sumut_2023, dikelompokkan berdasarkan hasil pembagian cluster. Outputnya adalah tabel yang menunjukkan rata-rata dari setiap variabel dalam masing-masing cluster, mempermudah interpretasi perbedaan karakteristik antar cluster.

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

Statistik deskriptif pada penelitian ini digunakan untuk memberikan gambaran umum dan menyajikan data Indikator Pembangunan Ekonomi pada peubah PDRB perkapita Atas Dasar Harga Konstan (\(X_1\)), IPM (\(X_2\)), Tingkat Partisipasi Angkatan Kerja (\(X_3\)), dan Persentase Penduduk Miskin (\(X_4\)).

Tabel 4.1. Statistika Deskriptif

X1 X2 X3 X4
Min. :12102 Min. :64.68 Min. :62.79 Min. : 3.440
1st Qu.:21117 1st Qu.:72.56 1st Qu.:67.77 1st Qu.: 7.870
Median :30418 Median :74.33 Median :73.20 Median : 8.540
Mean :32216 Mean :74.01 Mean :74.20 Mean : 9.925
3rd Qu.:37461 3rd Qu.:76.88 3rd Qu.:81.08 3rd Qu.:11.420
Max. :70103 Max. :82.61 Max. :86.89 Max. :22.810
  • Rata-rata PDRB perkapita Atas Dasar Harga Konstan 33 Kabupaten/Kota di Provinsi Sumatera Utara adalah Rp 32.216.000. Provinsi Sumatera Utara memiliki rata-rata Indeks Pembangunan Manusia (IPM) sebesar 74,01%, rata-rata Tingkat Partisipasi Angkatan Kerja (TPAK) sebesar 74,20% dan rata-rata penduduk miskin sebesar 9,925%.

  • Setiap Kabupaten/Kota mempunyai Produk Domestik Regional Bruto (PDRB) perkapita, wilayah yang memiliki PDRB perkapita Atas Dasar Harga Konstan terendah adalah Nias Selatan yaitu sebesar Rp 12.102.000, sedangkan wilayah yang memiliki PDRB perkapita Atas Dasar Harga Konstan terbesar adalah Kota Medan sebesar Rp 70.103.000.

  • Wilayah yang memiliki Indeks Pembangunan Manusia (IPM) terendah adalah Nias Barat yaitu sebesar 64,68%, sedangkan wilayah yang memiliki IPM tertinggi adalah Kota Medan sebesar 82,61%.

  • Kota Binjai mempunyai Tingkat Partisipasi Angkatan Kerja (TPAK) terendah yaitu sebesar 62,79% , sedangkan Samosir termasuk Kota yang memiliki TPAK tertinggi yaitu sebsar 86,89%

  • Kabupaten/Kota yang memiliki penduduk miskin terrendah adalah Deli Serdang yaitu sebesar 3,44%, sedangkan kabupaten/kota yang memiliki penduduk miskin tertinggi adalah Nias Barat sebesar 22,81% .

4.2 Uji Asumsi Analisis Cluster

a. Uji Sampel Representatif

Tabel 4.2.1. Nilai Uji KMO

Variabel Nilai.Uji.KMO
X1 0.78
X2 0.62
X3 0.78
X4 0.62

Berdasarkan output, dapat diketahui bahwa nilai uji KMO pada PDRB perkapita Atas Dasar Harga Konstan (\(X_1\)) sebesar 0,78, nilai uji KMO pada IPM (\(X_2\)) sebesar 0,62, nilai uji KMO pada TPAK (\(X_3\)) sebesar 0,78, dan nilai uji KMO pada Persentase Penduduk Miskin (\(X_4\)) sebesar 0,78. Uji KMO pada masing masing variabel tersebut bernilai lebih dari 0.5 sehingga dapat disimpulkan bahwa sampel telah representatif atau mewakili populasi.

b. Uji Non-Multikolinearitas

Tabel 4.2.2. NilaiKorelasi Antar Variabel

X1 X2 X3 X4
X1 1.0000000 0.5040557 -0.4552940 -0.3764427
X2 0.5040557 1.0000000 -0.4357804 -0.7769302
X3 -0.4552940 -0.4357804 1.0000000 0.3131738
X4 -0.3764427 -0.7769302 0.3131738 1.0000000

Berdasarkan output, dapat diketahui bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel.

4.3 Standarisasi Data

Statndarisasi data perlu dilakukan agar mempersempit dan menyamakan satuan peubah yang berbeda beda. Karena dalam kasus ini satuan peubah ada yang berbeda, maka harus dilakukan standarisasi. Berikut adalah hasil data Indikator Pembangunan Ekonomi di Sumatera Utara Tahun 2023 yang sudah di standarisasi.

Tabel 4.3. Hasil Standarisasi Data

X1 X2 X3 X4
-0.9488791 -2.1051598 1.0049559 1.2344080
-0.7717153 -0.3236271 -1.4952408 -0.2541683
0.2191645 0.1348206 0.1935003 -0.6954931
-0.8449310 -0.2951226 0.0430317 0.3756140
-0.8162844 0.6764066 0.9404694 -0.3305056
-0.2309763 0.9068181 0.8961349 -0.4497826
1.3566842 0.1633252 -1.2574467 -0.4617102
0.3539842 -0.1003417 -0.6273595 -0.4092284
-0.1250117 0.2749679 -0.2753705 -0.4903367
-0.6834115 0.2773432 1.4254618 -0.5857583
0.3982752 0.6811573 1.2978322 -0.4640958
0.5025710 0.7476679 -0.8839622 -1.5471305
-0.0743239 0.0754362 0.2244001 -0.1659034
-1.3985331 -2.1455412 0.6838667 1.5421426
-0.6811865 -0.3616331 1.6753472 -0.2947225
-1.0351665 -0.4067653 1.5786174 -0.5690595
-0.5328779 -0.2571166 1.7049035 0.4137826
-0.0212721 -0.1454738 -0.8799318 -0.5929149
2.0433678 -0.3450055 -0.1692364 0.3469875
0.1296787 -0.1335970 -0.1060934 -0.2708671
0.0800339 -0.4400206 0.5293677 -0.4855656
2.2928434 0.0516824 -0.1343062 -0.4450115
1.1673525 0.3414784 -1.2789423 -0.2016865
-1.0869668 -2.0362738 0.9498736 2.8303337
-1.2381262 -2.2168025 0.9243477 3.0736587
0.7330647 0.7262895 -0.4056871 0.3565297
0.2003217 0.3343523 -0.5924293 0.5449872
0.3646919 1.5315422 -0.4352434 -0.6406257
-0.5483832 0.9875809 -1.1419084 -0.1038794
2.6343079 2.0422483 -1.2802857 -0.4593247
-0.1978797 0.9733287 -1.5328580 -1.2250828
-0.8313030 0.9709533 -0.7119981 -0.7336617
-0.4091135 -0.5849186 -0.8638102 1.1580708

Hasil standarisasi digunakan dalam pengelompokan kabupaten/kota di Sumatera Utara berdasarkan indikator pembangunan ekonomi.

4.4 Menghitung Jarak

Setelah dilakukan standarisasi data, langkah selanjutnya yaitu menghitung jarak nilai tengah objek setiap peubah dalam satu kelompok dengan menggunakan jarak Euclidean. Adapun hasil dari perhitungan jarak Euclidean dapat dilihat pada subab 3.6.

4.5 Koefisien Korelasi Cophenetic

Tabel 4.5. Hasil Koefisien Korelasi Cophenetic

Metode Korelasi
Single 0.8022394
Complete 0.7793019
Average 0.8298003
Ward 0.7627174

Dari hasil koefisein korelasi cophenetic terlihat bahwa Average Lingkage memiliki nilai koefisien korelasi tertinggi dibandingkan metode lain, yaitu sebesar 0,8298003. Oleh karena itu metode cluster yang terbaik yang akan digunakan adalah metode Average Lingkage.

4.6 Cluster Optimum

Berdasarkan plot diatas, dengan menggunakan metode silhoutte untuk memvalidasi jumlah cluster, jumlah cluster optimum yang tepat digunakan untuk menyeleasikan kasus ini adalah sebanyakan 2 cluster.

4.7 Dendogram

Dalam penentuan jumlah cluster dengan menggunakan analisis cluster metode Average Linkage yaitu dengan melihat pada dendogram yang telah terbentuk. Dapat dilihat struktur dan pola pada dendogram menunjukkan bahwa objek-objek dalam dataset berkelompok menjadi dua bagian. Selain itu, dengan melihat selisih terpanjang dari gambar dendogram diatas terlihat bahwa pemotongan yang tepat akan menghasilkan 2 cluster, dimana pada cluster 1 sebanyak 4 anggota dan cluster 2 sebanyak 29 anggota. Oleh karena itu jumlah cluster untuk mengelompokkan kabupaten/kota di Provinsi Sumatera Utara sebanyak dua.

Berdasarkan hasil clustering menggunakan Average Linkakge, diperoleh anggota tiap cluster sebagai berikut:

Tabel 4.7. Anggota Cluster

Cluster Anggota
1 Nias, Nias Selatan, Nias Utara, Nias Barat
2 Mandailing Natal, Tapanuli Selatan, Tapanuli Tengah, Tapanuli Utara, Toba Samosir, Labuhan Batu, Asahan, Simalungun, Dairi, Karo, Deli Serdang, Langkat, Humbang Hasundutan, Pakpak Bharat, Samosir, Serdang Bedagai, Batu Bara, Padang Lawas Utara, Padang Lawas, Labuhan Batu Selatan, Labuhan Batu Utara, Kota Sibolga, Kota Tanjung Balai, Kota Pematang Siantar, Kota Tebing Tinggi, Kota Medan, Kota Binjai, Kota Padangsidimpuan, Kota Gunungsitoli

4.8 Karakteristik Setiap Cluster

Tabel 4.8. Karakteristik Setiap Cluster

Peubah Cluster 1 Cluster 2
X1 15415.7500 34533.20690
X2 65.0625 75.24690
X3 80.8300 73.28517
X4 19.0225 8.67069

Berdasarkan tabel dapat dilihat bahwa 4 kabupaten/kota di Provinsi Sumatera Utara yang berada pada cluster 1, dapat diketahui bahwa Persentase Penduduk miskin yang Tinggi serta variabel Produk Domestik Regional Bruto (PDRB) perkapita Atas Dasar Harga Konstan dan Indeks Pembangunan Manusia memiliki karakteristik yang lebih rendah dibandingkan dengan cluster 2. Berdasarkan karakteristik tersebut, dapat diketahui bahwa cluster 1 merupakan kelompok kabupaten/kota dengan Indikator Pembangunan Ekonomi yang buruk.

Pada 29 kabupaten/kota di Provinsi Sumatera Utara yang berada pada cluster 2, dapat diketahui bahwa Persentase Penduduk miskin yang rendah serta variabel Produk Domestik Regional Bruto (PDRB) perkapita Atas Dasar Harga Konstan dan Indeks Pembangunan Manusia memiliki karakteristik yang lebih tinggi dibandingkan dengan cluster 1. Berdasarkan karakteristik tersebut, dapat diketahui bahwa cluster 1 merupakan kelompok kabupaten/kota dengan Indikator Pembangunan Ekonomi yang baik.

5 PENUTUP

5.1 Kesimpulan

Berdasarkan kasus pembangunan ekonomi yang diambil dari 33 kabupaten/kota di Provinsi Sumatera Utara, digunakan metode analisis cluster hierarki untuk mengelompokkan setiap kabupaten/kota di Provinsi Sumatera Utara menjadi beberapa kelompok yang ditinjau berdasarkan Indikator Pembangunan Ekonomi pada tahun 2023, yaitu Produk Domestik Regional Bruto perkapita Atas Dasar Harga Konstan (Ribu Rp), Indeks Pembangunan Manusia (persen), Tingkat Partisipasi Angkatan Kerja (persen), dan Persentase Penduduk Misikin (persen). Metode analisis cluster yang digunakan pada kasus ini yaitu Average Linkage, karena memiliki nilai koefisien cophenetic yang paling mendekati 1 dan tertinggi daripada metode lainnya. Hasil yang didapatkan dengan menggunakan analisis cluster metode Average Linkage yaitu terbentuk 2 cluster, dimana cluster 1 terdiri dari 4 kabupaten/kota dan cluster 2 terdiri dari 29 kabupaten/kota. Berdasarkan karakteristik setiap cluster, dapat ditentukan bahwa cluster 1 merupakan kelompok kabupaten/kota dengan Indikator Pembangunan Ekonomi yang buruk, sedangkan cluster 2 merupakan kelompok Indikator Pembangunan Ekonomi yang baik. Sehingga dapat disimpulkan bahwa cluster yang memiliki Indikator Pembangunan Ekonomi yang lebih baik yaitu cluster 2 yang terdiri dari 29 kabupaten/kota di Provinsi Sumatera Utara.

5.2 Saran

Peneliti selanjutnya dapat mengembangkan penelitian ini dengan meneliti variabel lain terkait indikator pembangunan ekonomi di Provinsi Sumatera Utara pada tahun 2023. Pada penelitian ini, peneliti hanya mengkaji metode cluster hierarki, yaitu metode Average Linkage dan diaplikasikan untuk data indikator pembangunan ekonomi di Sumatera Utara pada tahun 2023. Oleh karena itu, bagi peneliti selanjutnya yang juga ingin melakukan analisis cluster dapat menggunakan metode yang lainnya pada metode hierarki maupun non-hierarki mengingat metode untuk analisis cluster sangatlah beragam.

6 DAFTAR PUSTAKA

Abidin, Z. 2017. Pengelompokan Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Kemiskinan Dengan Menggunakan Analisis Cluster Hierarki (Skripsi, Institut Teknologi Sepuluh Nopember).

Akhyar, S. 2017. Pengelompokan Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Pembangunan Ekonomi Menggunakan Model-Based Clustering (Skripsi, Institut Teknologi Sepuluh Nopember).

Dzikrullah, A. A. (2022). Pengelompokan Provinsi Berdasarkan Kualitas Jaringan Internet Dengan Metode Centroid Linkage. Journal of Mathematics, Computations, and Statistics, 5(1), 48-57.

Badan Pusat Statistik Sumatera Utara. (2024). Produk - Tabel Statistik. Diakses pada 26 November 2024 di https://sumut.bps.go.id/.

Fathia, A. N., Rahmawati, R., & Tarno. (2016). Analisis Klaster Kecamatan di Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage. Jurnal Gaussian, 5(4), 801-810.

Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.

Hemelia, & Sumargo, B. (2019). Pengklasifikasian Pengguna Internet Lingkungan Pedesaan Menurut Jenjang Pendidikan di Indonesia Menggunakan Metode Cluster Average Linkage. Jurnal Statistika dan Aplikasinya (JSA), 3(1), 22-29.

Johnson, R. A., & Wichern, D. W. 2007. Applied Multivariate Statistical Analysis. Englewood, New Jersey: Prentice Hall.

Martias, L. D.(2021).Statistika Deskriptif Sebagai Kumpulan Informasi. FIHRIS: Jurnal Ilmu Perpustakaan dan Informasi, 16(1), 40-59.

Sholikhah, A., (2016). Statistik deskriptif dalam penelitian kualitatif. KOMUNIKA: Jurnal Dakwah Dan Komunikasi, 10(2), 342-362.

Silvi, R. (2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K-Means Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. Jurnal Matematika “MANTIK”, 4(1), 22-31.

Widodo, E., Sari, N. N., Hidayati, I., Yubinas, F., Yuniarti, M., & Novyantika, R. D. (2018). Analisis Cluster Penderita Disabilitas Mental di Provinsi Daerah Istimewa Yogyakarta Tahun 2016. Program Studi Pendidikan Matematika FKIP UMS, 577-586.