Indikator pembangunan ekonomi digunakan untuk mengukur kemajuan suatu daerah dalam meningkatkan kesejahteraan masyarakatnya. Salah satu indikator yang sering digunakan adalah Pendapatan Per Kapita atau Produk Domestik Regional Bruto (PDRB), yang menggambarkan total nilai barang dan jasa yang diproduksi di suatu wilayah dibagi dengan jumlah penduduk. PDRB memberikan gambaran tentang seberapa besar daya beli masyarakat dan potensi ekonomi daerah tersebut. Semakin tinggi PDRB per kapita, semakin baik pula perekonomian daerah tersebut dalam menciptakan kesejahteraan bagi warganya.
Selain PDRB, Indeks Pembangunan Manusia (IPM) juga merupakan indikator penting dalam mengukur keberhasilan pembangunan ekonomi. IPM menggabungkan tiga dimensi dasar, yaitu kesehatan (diukur dengan harapan hidup), pendidikan (diukur dengan rata-rata lama sekolah dan angka melek huruf), serta standar hidup (diukur dengan pendapatan per kapita). IPM yang lebih tinggi mencerminkan tingkat kesejahteraan manusia yang lebih baik dan mencakup tidak hanya aspek ekonomi, tetapi juga kualitas hidup masyarakat secara keseluruhan. Peningkatan IPM menunjukkan adanya pemerataan pembangunan yang lebih inklusif di suatu wilayah.
Tingkat Partisipasi Angkatan Kerja (TPAK) dan persentase penduduk miskin juga merupakan indikator penting yang mencerminkan kondisi sosial ekonomi di suatu daerah. TPAK menggambarkan proporsi penduduk usia kerja yang aktif dalam kegiatan ekonomi, baik bekerja maupun mencari pekerjaan. Tingginya TPAK menunjukkan partisipasi yang besar dalam kegiatan ekonomi, yang bisa menjadi indikator pertumbuhan ekonomi yang sehat. Sementara itu, persentase penduduk miskin menunjukkan tingkat kemiskinan yang ada di daerah tersebut, di mana semakin rendah persentasenya, semakin baik pencapaian pembangunan ekonomi dalam mengurangi ketimpangan dan meningkatkan kesejahteraan masyarakat. Indikator-indikator ini saling terkait dan memberikan gambaran yang lebih lengkap tentang kemajuan pembangunan ekonomi suatu wilayah.
Berdasarkan latar belakang masalah yang telah diuraikan, maka dapat dirumuskan permasalahan penelitian, yaitu:
Bagaimana mengelompokkan kabupaten/kota di Provinsi Sumatera Utara berdasarkan indikator pembangunan ekonomi?
Bagaimana mengetahui cluster mana yang memiliki indikator pembangunan ekonomi yang lebih baik?
Dalam melakukan penelitian ini, tujuan penelitian yang ingin dicapai yaitu:
Untuk mengetahui pengelompokan kabupaten/kota di Provinsi Sumatera Utara berdasarkan indikator pembangunan ekonomi.
Untuk mengetahui cluster mana yang memiliki indikator pembangunan ekonomi yang lebih baik.
Untuk menghindari kesalahpahaman dan meluasnya pokok bahasan, maka peneliti memberikan batasan masalah sebagai berikut.
Data yang digunakan adalah dataset di setiap kabupaten/kota di Provinsi Sumatera Utara pada tahun 2023 yang didapatkan dari Badan Pusat Statistik.
Analisis yang digunakan untuk mengelompokkan kabupaten/kota di Provinsi Sumatera Utara pada tahun 2023 berdasarkan indikator pembangunan ekonomi adalah analisis cluster hierarki dengan menggunakan jarak euclidean dan metode Average Linkage.
Data pada kasus ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik di Sumatera Utara mengenai indikator pembangunan ekonomi Tahun 2023. Indikator pembangun ekonomi terdiri dari 3 indikator yaitu indikator moneter, indikator non-moneter dan indikator campuran dengan beberapa peubah yang digunakan adalah Produk Domestik Regional Bruto perkapita Atas Dasar Harga Konstan (\(X_1\)), Indeks Pembangunan Manusia (\(X_2\)), Tingkat Partisipasi Angkatan Kerja (\(X_3\)), dan Persentase Penduduk Misikin (\(X_4\)). Adapun data tersebut tersaji dalam tabel berikut:
Tabel 1.5. Data Indikator Pembangunan Ekonomi Provinsi Sumatera Utara Tahun 2023
Salah satu metode yang dapat digunakan untuk pengelompokan ini adalah analisis cluster. Metode ini memungkinkan pengelompokan daerah berdasarkan kesamaan karakteristik ekonomi dengan cara yang lebih sistematis dan terstruktur. Melalui analisis cluster, setiap kabupaten/kota akan dikelompokkan berdasarkan kesamaan dalam indikator ekonomi, seperti Produk Domestik Regional Bruto (PDRB), Indeks Pembangunan Manusia (IPM), Tingkat Partisipasi Angkatan Kerja (TPAK), dan persentase penduduk miskin. Hasil dari pengelompokan ini dapat memberikan informasi yang berguna bagi pemerintah dalam merumuskan kebijakan pembangunan yang lebih tepat sasaran. Metode analisis cluster yang digunakan dalam kasus ini adalah analisis cluster hierarki dengan jarak euclidean dan dengan membandingkan beberapa metode, yaitu Single Linkage, Complete Linkage, Average Linkage, dan Ward’s Method. Dengan adanya metode ini, dapat mengetahui cluster mana yang memiliki indikator pembangunan ekonomi yang kurang baik dan dapat dijadikan sebagai acuan penting bagi Pemerintah. Melalui pengelompokan ini, diharapkan pembangunan ekonomi di Sumatera Utara dapat lebih merata dan terarah.
Statistika deskriptif yaitu salah satu metode statistika yang berkaitan untuk pengumpulan dan penyajian sehingga dapat memberikan informasi yang berguna (Martias, 2021). Adapun pengertian statistika deskriptif menurut (Solikhah, 2016) yaitu statistika deskriptif yang lazim dikenal pula dengan istilah statistik deduktif, statistik sederhana, dan statistik deskriptif, adalah statistik yang tingkat pekerjaannya mencakup cara-cara menghimpun, menyusun, atau mengatur, mengolah, menyajikan, dan menganalisis data angka, agar dapat memberikan gambaran yang teratur, ringkas, dan jelas mengenai suatu gejala, peristiwa, atau keadaan sehingga dapat ditarik pengertian atau makna tertentu.
Analisis cluster adalah suatu teknik statistik yang bertujuan untuk mengelompokkan obyek ke dalam suatu kelompok sedemikian sehingga obyek yang berada dalam satu kelompok akan memiliki kesamaan yang tinggi dibandingkan dengan obyek yang berada di kelompok lain (Silvi, 2018). Dengan kata lain tujuan dari analisis cluster adalah pengklasifikasian obyek-obyek berdasarkan similaritas diantaranya dan menghimpun data menjadi beberapa kelompok.
Secara umum analisis cluster terbagi menjadi 2 metode yaitu metode hierarki dan metode non-hierarki. Metode cluster hierarki merupakan metode pengelompokan yang jumlah clusternya belum diketahui. Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative) atau pembagian berurutan (divisive). Pada metode non-hierarki, jumlah cluster ditentukan terlebih dahulu sesuai keinginan peneliti.
Tahap-tahap dalam analisis cluster yaitu sebagai berikut (Hamelia & Bagus, 2019):
Melakukan Proses Standarisasi Data
Hal pertama yang harus dilakukan dalam analisis clustering adalah melakukan standarisasi data yaitu menggunakan z-score, dimana tujuan dilakukan standarisasi data adalah untuk mempersempit perbedaan satuan lebar serta dapat digunakan untuk menyamakan peubah yang memiliki satuan yang berbeda-beda.
Menentukan Ukuran Kemiripan
Pada analisis cluster terdapat beberapa ukuran kemiripan diantaranya adalah ukuran asosiasi, ukuran korelasi dan ukuran jarak. Ukuran kemiripan dengan menghitung jarak antar dua objek. Dalam mengukur kedekatan antara dua objek dapat digunakan metode pengukuran Euclidean Distance.
Memilih Prosedur Pengclusteran
Pembentukan cluster dapat dilakukan dengan dua cara, yaitu dengan metode Hierarki dan Non Hierarki.
Menentukan Banyaknya Cluster
Masalah utama dalam analisis cluster adalah menetukan berapa banyaknya cluster. Namun demikian ada beberapa petunjuk yang bisa dipergunakan, yaitu:
Pertimbangan teoretis, konseptual, praktis, mungkin bisa diusulkan/disarankan untuk menetukan berapa banyaknya cluster yang sebenarnya
Besarnya relatif cluster seharusnya berguna/bermanfaat
Menginterpretasikan Hasil Cluster
Tahap terakhir adalah interpretasi masing-masing cluster yang terbentuk. Saat memulai interpretasi digunakan rata-rata pada peubah.
a. Uji Sampel Representatif
Sampel representatif adalah keadaan ketika sampel yang diambil dapat merepresentasikan atau mewakili populasi yang ada. Asumsi sampel representatif ini dapat dilakukan menggunakan uji Kaiser Meyer Olkin (KMO). Jika nilai uji KMO menunjukkan sebesar 0.5 sampai 1, maka sampel dikatakan telah representatif atau mewakili populasi.
b. Uji Non-Multikolinearitas
Menurut Gujarati undefined95), apabila nilai mutlak koefisien korelasi antar variabel independent menunjukkan nilai lebih dari 0.8 maka dikatakan telah terjadi masalah multikolinearitas. Sebaliknya apabila koefisien korelasi menunjukkan nilai kurang dari 0.8 maka model tidak mengalami masalah multikolinearitas atau telah memenuhi asumsi non-multikolinearitas.
Standarisasi variabel dilakukan apabila terdapat perbedaan satuan yang signifikan diantara variabel-variabel yang diteliti. Proses standarisasi dilakukan dengan mengenolkan rata-rata dan varian menjadi 1 (satu) atau dengan kata lain mengubah data Z-Score yaitu transformasi data dalam bentuk normal baku N(0,1), yang dapat dicari dengan:
\(Z = \frac{X_i - \bar{x}}{\sigma}\)
Dengan:
\(X_i\) : data ke-i
\(\bar{x}\) : rata-rata data
\(\sigma\) : simpangan baku
Konsep dasar pengukuran analisis cluster adalah pengukuran jarak (distance) dan kesamaan (similarity). Jarak merupakan ukuran jarak pisah antar objek sedangkan kesamaan merupakan ukuran kedekatan. Konsep ini penting karena pengelompokkan pada analisis cluster didasarkan pada kedekatan. Pengukuran jarak (distance type measure) digunakan untuk data bersifat kuantitatif, sedangkan pengukuran kesesuaian (matchingtype measure) digunakan untuk data yang bersifat kualitatif. Perhitungan jarak biasanya menggunakan jarak Euclidean yang digunakan pada 2 dimensi observasi.
a. Jarak Euclidean
Jarak Euclidean yaitu besarnya jarak suatu garis lurus yang menghubungkan antar objek. Jarak Euclidean (Euclidean distance) merupakan jarak yang paling umum dan paling sering digunakan dalam analisis cluster. Jarak Euclidean merupakan perhitungan jarak dari dua buah titik dalam euclidean space untuk mempelajari hubungan antara sudut dan jarak. Adapun rumus jarak euclidean yaitu:
\(d_{e u c}(x, y)=\sqrt{\sum_{i=1}^n\left(x_i-y_i\right)^2}\)
Dengan:
\(d_{e u c}\) : kuadrat jarak euclidean antar obyek-\(y\) dan obyex-\(x\)
\(x_i\) : nilai dari obyek-\(x\) pada variabel ke-\(i\)
\(y_i\) : nilai dari obyek-\(y\) pada variabel ke-\(i\)
b. Jarak Mahalanobis
Jarak Mahalanobis digunakan jika data terjadi korelasi. Jarak Mahalanobis antara dua sampel X dan Y dari suatu variabel acak didefinisikan sebagai berikut:
\(d_{\text {Mahalanobis }}(x, y)=\sqrt{(x-y)^T+S^{-1}(x-y)}\)
Dengan:
Metode cluster hierarki merupakan metode pengelompokan yang mana jumlah kelompok yang akan dibuat belum diketahui. Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative) atau pembagian berurutan (divissive).
a. Metode Agglomerative
Metode agglomerative dimulai dengan objek individual. Awalnya ada banyak cluster sebagai objek. Objek yang paling mirip dikelompokkan kemudian kelompok-kelompok awal ini digabungkan sesuai dengan kesamaannya. Ketika kesamaan menurun, semua sub kelompok digabungkan menjadi satu kelompok. Metode ini dibagi lagi menjadi beberapa macam yakni sebagai berikut.
Single Linkage
Untuk menentukan jarak antar cluster dengan menggunakan single linkage¸ maka dipilih jarak yang paling dekat atau aturan tetangga dekat (nearest neighbour rule). Langkah-langkah menggunakan metode single linkage yaitu (Johnson & Wichern, 2007) :
Menentukan jarak minimum dalam \(D=d_{ij}\)
Menghitung jarak antara cluster yang telah dibentuk pada langkah a dengan objek lainnya
Dari algoritma diatas jarak-jarak antara \((ij)\) dan cluster K yang lainnya dapat dihitungan dengan rumus :
\(d_{(ij)k=min(d_{ik},d_{jk})}\)
Complete Linkage
Metode complete linkage jarak antar cluster ditentukan oleh jarak terjauh atau maximum (farthest-neighbour) antara dua objek dalam cluster yang berbeda (Johnson & Wichern,2007). Adapun rumusnya yaitu:
\(d_{(ij)k=max(d_{ik},d_{jk})}\)
Average Linkage
Metode average linkage akan mengelompokkan objek berdasarkan jarak antara dua cluster yang dianggap sebagai jarak rata-rata antara semua anggota dalam satu cluster dengan semua anggota cluster lain (Johnson & Wichern, 2007).Pada metode ini digunakan jarak rata-rata dari sampel pada suatu kelompok terhadap sampel pada kelompok yang lain. Perhitungan jarak antar kelompok adalah dengan menggunakan persamaan:
\(d_{(i j) k}=\frac{1}{n_i \times n_j} \sum_{i=1}^{n_i} \sum_{j=1}^{n_j} \sqrt{\sum_{k=1}^p\left(x_{i k}-y_{j k}\right)^2}\)
Ward’s Method
Pada Ward’s Method jarak antara dua cluster yang terbentuk adalah sum of squares (Jumlah Kuadrat) di antara dua cluster tersebut. Diukur dengan menggunakan jumlah total dari deviasi kuadrat pada mean cluster untuk setiap pengamatan. Fungsi obyektif yang digunakan yaitu Error sum of squares (SSE). Dua obyek akan digabungkan jika mempunyai fungsi obyektif terkecil diantara kemungkinan yang ada (Fathia, Rahmawati, dan Tarno, 2016).
\(E S S=\sum_{j=1}^k\left(\sum_{i=1}^{n_j} x_{i j}^2-\frac{1}{n_j}\left(\sum_{i=1}^{n_j} x_{i j}^2\right)\right)\)
Dengan:
\(x_{ij}\) : nilai untuk objek ke-\(i\) dengan \(i\)=1, 2, .., n pada kelompok ke-\(j\)
\(K\) : jumlah kelompok setiap stage
\(n_j\) : jumlah kelompok ke-\(i\) pada kelompok ke-\(j\)
b. Metode Divissive
Metode devisive bekerja dari arah yang berlawanan. Satu kelompok objek awal dibagi menjadi dua kelompok sehingga objek dalam satu subkelompok jauh dari objek yang lain. Sub kelompok ini kemudian dibagi lagi menjadi subkelompok yang berbeda. Proses tersebut terus berlanjut sampai ada banyak sub kelompok sebagai objek, yakni sampai masing-masing objek membentuk suatu kelompok.
Setelah mendapatkan hasil dari proses cluster maka dilakukan uji validitas cluster yang diperlukan untuk melihat kebaikan hasil analisis cluster. Ukuran yang digunakan untuk menguji validitas hasil clustering pada penelitian ini adalah koefisien korelasi cophenetic. Koefisien korelasi cophenetic merupakan koefisien korelasi antara elemen-elemen asli matriks ketidakmiripan (matriks jarak squared euclidean) dan elemen-elemen yang dihasilkan oleh dendogram (matriks cophenetic) (Widodo dkk., Sumatera Utara18).
Dendogram merupakan representasi visual dari proses terbentuknya cluster berdasarkan nilai koefisien jarak pada setiap langkah hingga terbentuk cluster akhir yaitu satu objek satu cluster (Dzikrullah, Sumatera Utara22). Dendogram adalah representasi matematis dan visual dari prosedur pengklasteran yang dilakukan dengan menggunakan analisis cluster hierarki. Bentuk dendogram identik dengan diagram pohon. Titik-titik pada dendogram mewakili cluster, sedangkan panjang batangnya mempresentasikan jarak dimana objek-objek digabung dalam cluster. Dendogram sebagai representasi proses pengelompokan analisis cluster hierarki akan membentuk struktur yang berbeda tergantung pada jarak maupun lingkage yang akan digunakan pada proses pengklusteran. Dendogram dipotong untuk mengetahui banyaknya cluster yang terbentuk dari selisih terpanjang. Pemotongan dendogram dilakukan pada selisih jarak penggabungan terbesar ataupun pada gerombol yang dihasilkan lebih bermakna. Pemotongan dendogram dapat dilakukan pada selisih jarak penggabungan terbesar.
> library(readxl)
> library(magrittr)
> library(knitr)
> library(ggplot2)
> library(factoextra)
> library(cluster)
> library(psych)Sebelum melakukan analisis perlu mengaktifkan packages yang dibutuhkan terlebih dahulu untuk support proses analisis. Berikut adalah library yang akan digunakan untuk membantu dalam pemrograman ini agar lebih cepat dan efisien.
library(“readxl”) digunakan untuk membuka dan membaca file data yang bertype microsoft excel xlsx dari dalam R.
library(“magrittr”) digunakan untuk mengurangi waktu pengembangan dan meningkatkan keterbacaan, serta memelihara kode.
library(“knitr”) digunakan untuk membuat laporan dinamis menggunakan R Markdown.
library(“ggplot2”) digunakan untuk membuat visualisasi data yang berbasis grafik dengan tampilan yang menarik, fleksibel, informatif dan estetis dengan cara yang lebih sistematis dan deklaratif.
library(“factoextra”) digunakan untuk library(“factoextra”) digunakan untuk visualisasi dan analisis hasil dari berbagai teknik analisis data multivariat, terutama dalam analisis faktor, analisis komponen utama, analisis klastering, dan analisis diskriminan serta dan menentukan jumlah cluster optimum.
library(“cluster”) digunakan untuk melakukan berbagai jenis analisis klastering (pengelompokan) data.
library(“psych”) digunakan untuk analisis psikometri, statistik dan menyediakan banyak fungsi yang berguna untuk melakukan berbagai jenis analisis dan pemrosesan data terkait psikometri, seperti analisis faktor, analisis reliabilitas, uji validitas, dan berbagai jenis transformasi data.
> data_IPE_sumut_2023 <- read_excel("C:/Users/Rachel Cyrilla Sahla/Documents/Semester 5/Anmul/Laprak/UAP/indikator_pembangunan_ekonomi_sumut.xlsx")| Kabupaten/Kota | X1 | X2 | X3 | X4 |
|---|---|---|---|---|
| Nias | 18569 | 65.15 | 81.68 | 15.10 |
| Mandailing Natal | 21117 | 72.65 | 63.07 | 8.86 |
| Tapanuli Selatan | 35368 | 74.58 | 75.64 | 7.01 |
| Tapanuli Tengah | 20064 | 72.77 | 74.52 | 11.50 |
| Tapanuli Utara | 20476 | 76.86 | 81.20 | 8.54 |
| Toba Samosir | 28894 | 77.83 | 80.87 | 8.04 |
| Labuhan Batu | 51728 | 74.70 | 64.84 | 7.99 |
| Asahan | 37307 | 73.59 | 69.53 | 8.21 |
| Simalungun | 30418 | 75.17 | 72.15 | 7.87 |
| Dairi | 22387 | 75.18 | 84.81 | 7.47 |
| Karo | 37944 | 76.88 | 83.86 | 7.98 |
| Deli Serdang | 39444 | 77.16 | 67.62 | 3.44 |
| Langkat | 31147 | 74.33 | 75.87 | 9.23 |
| Nias Selatan | 12102 | 64.98 | 79.29 | 16.39 |
| Humbang Hasundutan | 22419 | 72.49 | 86.67 | 8.69 |
| Pakpak Bharat | 17328 | 72.30 | 85.95 | 7.54 |
| Samosir | 24552 | 72.93 | 86.89 | 11.66 |
| Serdang Bedagai | 31910 | 73.40 | 67.65 | 7.44 |
| Batu Bara | 61604 | 72.56 | 72.94 | 11.38 |
| Padang Lawas Utara | 34081 | 73.45 | 73.41 | 8.79 |
| Padang Lawas | 33367 | 72.16 | 78.14 | 7.89 |
| Labuhan Batu Selatan | 65192 | 74.23 | 73.20 | 8.06 |
| Labuhan Batu Utara | 49005 | 75.45 | 64.68 | 9.08 |
| Nias Utara | 16583 | 65.44 | 81.27 | 21.79 |
| Nias Barat | 14409 | 64.68 | 81.08 | 22.81 |
| Kota Sibolga | 42759 | 77.07 | 71.18 | 11.42 |
| Kota Tanjung Balai | 35097 | 75.42 | 69.79 | 12.21 |
| Kota Pematang Siantar | 37461 | 80.46 | 70.96 | 7.24 |
| Kota Tebing Tinggi | 24329 | 78.17 | 65.70 | 9.49 |
| Kota Medan | 70103 | 82.61 | 64.67 | 8.00 |
| Kota Binjai | 29370 | 78.11 | 62.79 | 4.79 |
| Kota Padangsidimpuan | 20260 | 78.10 | 68.90 | 6.85 |
| Kota Gunungsitoli | 26332 | 71.55 | 67.77 | 14.78 |
Untuk mengimport file data dari excel ke R dapat menggunakan fungsi read_excel dari library(readxl) yang kemudian disimpan dalam variabel data_IPE_sumut_2023.
Menghitung statistika deskriptif dengan fungsi summary(). Hasil dari perintah tersebut menunjukkan rangkuman ukuran pemusatan dan persebaran data pada masing-masing variabel.
a. Uji Sampel Representatif
Melakukan uji sampel representatif dengan menggunakan fungsi KMO() dengan argumen didalamnya adalah data[,2:5] yang disimpan dalam variabel kmo. Argumen dalam data [,2:5] menunjukkan data yang dianalisis yaitu data pada kolom kedua sampai kelima.
b. Uji Non-Multikolinearitas
Melakukan uji asumsi non-multikolinearitas menggunakan korelasi antar variabel dengan fungsi cor() dengan argumen didalamnya yaitu data dan metode yang digunakan adalah pearson yang disimpan dalam variabel korelasi.
Melakukan standarisasi menggunakan fungsi scale() dengan argument yang berisi data awal dari kolom 2 hingga kolom 5 yang disimpan dalam variabel datastand. Standarisasi ini perlu dilakukan dengan tujuan untuk mempersempit dan menyamakan peubah yang memiliki satuan yang berbeda-beda.
> jarak <- dist(datastand, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 3.4164439
3 3.2809780 2.0587937
4 2.2248293 1.6640557 1.5770420
5 3.1949657 2.6344953 1.4341019 1.4995628
6 3.5264338 2.7501522 1.1630459 1.7974054 0.6417691
7 4.2961528 2.2060885 1.8586730 2.7294028 3.1357766 2.7769594
8 3.3290754 1.4471756 0.9106240 1.5939696 2.1064546 1.9181318 1.2143688
9 3.3102485 1.5232861 0.6324773 1.3017440 1.4638386 1.3358641 1.7813422
10 3.0391815 3.0015694 1.5377669 1.7858206 0.6908534 0.9484792 3.3746669
11 3.5424680 3.1974672 1.2663562 2.1859370 1.2730797 0.7800294 2.7777967
12 4.6422302 2.1947417 1.5303963 2.7311971 2.5599188 2.2217873 1.5455076
13 2.8442899 1.9001479 0.6091650 1.0282434 1.2047903 1.1169381 2.0829980
14 0.6337336 3.4187006 3.6144804 2.3456306 3.4460207 3.8331332 4.5504077
15 2.4288288 3.1723671 1.8475891 1.7734262 1.2794935 1.5629694 3.6135389
16 2.5443215 3.1022700 1.9496657 1.8163383 1.2981955 1.6888555 3.7550947
17 2.1798334 3.2784980 2.0576721 1.6917731 1.4457210 1.6869321 3.6454386
18 3.4048105 1.0431960 1.1398042 1.5782010 2.1656987 2.0799505 1.4676010
19 3.7706668 3.1693574 2.1854736 2.8966594 3.3032313 2.9171154 1.6025380
20 2.9241462 1.6669229 0.5917088 1.1900128 1.6278213 1.4996692 1.7192268
21 2.6487439 2.2116981 0.7118119 1.3618768 1.4976128 1.4305595 2.2775287
22 4.3907974 3.3794884 2.1159524 3.2666155 3.3504045 2.8570535 1.4664862
23 4.2122480 2.0620109 1.8313110 2.5564500 2.9982286 2.6584666 0.3683198
24 1.6043149 4.3041004 4.4071743 3.1524911 4.1740744 4.4896058 5.1497070
25 1.8669410 4.5530752 4.7322796 3.4501622 4.4874496 4.8152664 5.4458341
26 3.6887158 2.2196322 1.4421187 1.9326318 2.1649770 1.8184734 1.4494279
27 3.2091778 1.6827095 1.4821082 1.3861060 2.0656125 1.9285034 1.6799144
28 4.5322176 2.4507180 1.5395904 2.4619874 2.0284778 1.5981521 1.8878813
29 4.0156546 1.3844040 1.8573241 1.8350111 2.1345391 2.0929737 2.1095192
30 6.1750533 4.1577224 3.4203829 4.4740024 4.3267145 3.7730562 2.2722680
31 4.7466499 1.7191485 2.0341583 2.6595681 2.7181250 2.5508069 1.9316738
32 4.0370194 1.5883552 1.6198716 1.8449110 1.7263160 1.7410297 2.4106063
33 2.4699381 1.6102414 2.3380253 1.3071035 2.6884965 2.8177314 2.5409743
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 0.7076505
10 2.3375359 1.7926941
11 2.0789604 1.7071832 1.1679910
12 1.4497808 1.4506903 2.8081018 2.4389532
13 0.9995235 0.6304045 1.4249847 1.3533009 1.9801411
14 3.5750973 3.5400324 3.3852169 3.9523019 4.8976067 3.1328583
15 2.5407522 2.1349838 0.7452786 1.5568732 3.2787835 1.6374228 2.8379607
16 2.6297367 2.1763755 0.7845200 1.8243323 3.2738775 1.7754368 2.9005396
17 2.6320906 2.2778028 1.1770630 1.6382251 3.5537518 1.6878357 2.5751154
18 0.4902935 0.7506995 2.4355890 2.3703564 1.4080687 1.2056134 3.5918037
19 1.9223987 2.4080310 3.3519727 2.5631010 2.7688456 2.2537517 4.1526849
20 0.5850480 0.5555304 1.8096423 1.6565968 1.7747125 0.4533820 3.2084875
21 1.2386589 1.0958460 1.3822022 1.3961791 2.1710741 0.6962120 3.0381625
22 2.0066560 2.4326597 3.3707124 2.4570332 2.3379738 2.4105222 4.8033573
23 1.1508287 1.6628602 3.3001142 2.7231392 1.6041051 1.9682118 4.4342524
24 4.3366577 4.3353513 4.1727149 4.5348337 5.7273125 3.8715002 1.3561744
25 4.6424691 4.6464320 4.4912047 4.8714657 6.0365378 4.1944586 1.5601863
26 1.2093573 1.2938900 2.5394824 1.9208137 1.9764245 1.3211482 3.9222349
27 1.0603389 1.1321618 2.4768336 2.1796322 2.1735070 1.1467535 3.3659261
28 1.6594014 1.3663583 2.4772506 1.9388131 1.2870778 1.7243754 4.7588644
29 1.5348749 1.2598801 2.7103998 2.6593510 1.8197728 1.7109606 4.0721066
30 3.1967781 3.4275270 4.6324084 3.6741157 2.7496608 3.6817403 6.4548551
31 1.7154788 1.6168315 3.1433309 3.0054406 1.0326347 2.2430546 4.8724042
32 1.6324826 1.1104476 2.2568955 2.3891270 1.5875703 1.6044187 4.1427058
33 1.8246831 1.9706920 3.0166937 3.0917547 3.1504723 1.8668856 2.4407599
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 0.4603870
17 0.7319646 1.1209886
18 2.6646916 2.6723189 2.8229449
19 3.3522759 3.6572289 3.1877309 2.3855933
20 1.9706858 2.0877390 2.0500471 0.8517440 2.0230253
21 1.3911474 1.5338429 1.6123977 1.4472974 2.2460856 0.7390983
22 3.5090050 3.7729723 3.4928896 2.4437337 0.9209136 2.1782407 2.3622882
23 3.5563948 3.7029135 3.5399487 1.4007927 1.6646781 1.6379329 2.2679451
24 3.6416160 3.8221949 3.1435974 4.4472068 4.4809373 3.9790600 3.8835459
25 3.9575026 4.1249111 3.4672687 4.7402872 4.7856545 4.2963120 4.2093452
26 2.8175371 3.0339140 2.6509562 1.5669551 1.7089667 1.2597073 1.8358051
27 2.6663412 2.8337661 2.4864372 1.2871736 2.0190696 1.0611823 1.7130646
28 3.0417456 3.1268829 3.1139906 1.7780257 2.7176320 1.7529920 2.2186952
29 3.1323099 3.1303055 3.1498927 1.3672771 3.1052104 1.6785724 2.3177149
30 5.0531187 5.2581441 4.9991815 3.4664626 2.8165157 3.5244452 3.9951857
31 3.6295811 3.5661399 3.8464527 1.4521908 3.3304751 2.0685172 2.6219177
32 2.7731583 2.6858299 2.9589280 1.3966284 3.3849480 1.6507018 2.1033124
33 2.9464909 3.0613906 2.6972257 1.8465491 2.6856120 1.7635154 2.2142145
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 1.6492756
24 5.2617498 4.9896321
25 5.5781321 5.2833230 0.3395561
26 1.8984520 1.1877985 4.3475881 4.6582364
27 2.3766623 1.4014353 3.8572642 4.1559975 0.7126141
28 2.4569455 1.7219208 5.3668178 5.6800978 1.3339126 1.7001961
29 3.1749186 1.8410709 4.7348631 5.0109860 1.5698345 1.3077545 1.3845837
30 2.3221594 2.2607423 6.8027709 7.1047618 2.6032699 3.2129405 2.4817220
31 3.1012242 1.8370920 5.6972399 5.9813115 2.1678787 2.1411233 1.4745973
32 3.3199995 2.2350136 4.9570818 5.2441023 1.9466511 1.7659983 1.3527426
33 3.2875342 2.3161889 2.9413992 3.1964500 1.9688023 1.2907320 2.9149888
29 30 31 32
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 3.3745127
31 1.2381415 3.1327391
32 0.8134917 3.6818940 1.1474041
33 2.0400999 4.3536008 2.9325416 2.4901165Menghitung jarak euclidean dengan fungsi dist() dengan argumen didalamnya yaitu datastand yang merupakan data hasil standarisasi dan metode euclidean yang disimpan dalam variabel jarak.
> single = hclust(jarak, method="single")
> average = hclust(jarak, method="average")
> complete = hclust(jarak, method="complete")
> ward = hclust(jarak, method = "ward.D2")
> cor_single = cor((cophenetic(single)), jarak)
> cor_complete = cor((cophenetic(complete)), jarak)
> cor_avg = cor((cophenetic(average)), jarak)
> cor_ward = cor((cophenetic(ward)), jarak)
> jarak_cophenetic <- data.frame (Metode = c("Single", "Complete", "Average", "Ward"),Korelasi = c(cor_single, cor_complete, cor_avg, cor_ward))
> jarak_copheneticSyntax ini melakukan analisis hierarchical clustering
menggunakan empat metode berbeda: Single Linkage, Average
Linkage, Complete Linkage, dan Ward’s Method.
Fungsi hclust diterapkan pada matriks jarak
(jarak) untuk membangun dendrogram dengan pendekatan
masing-masing metode. Selanjutnya, korelasi cophenetic dihitung
menggunakan fungsi cor() untuk mengevaluasi seberapa baik
dendrogram yang dihasilkan merepresentasikan struktur jarak asli.
Matriks cophenetic dari hasil clustering dibandingkan dengan matriks
jarak asli, menghasilkan nilai korelasi untuk setiap metode.
Fungsi fviz_nbclust digunakan untuk menentukan jumlah cluster optimum, dimana argument yang diisikan adalah data hasil standarisasi, hirarki cluster dengan menggunakan metode Silhoutte untuk memvalidasi.
> wilayah <- data_IPE_sumut_2023$`Kabupaten/Kota`
> clus_hier <- eclust(datastand, FUNcluster = "hclust", hc_method = "average", k=2, graph = TRUE)
> clus_hier$labels <- wilayah
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5, k_colors = "jco") +
+ labs(title = "Dendrogram Clustering Hierarki") +
+ theme_minimal()Syntax ini melakukan analisis clustering hierarki pada data yang
sudah distandarisasi (datastand) dengan menggunakan fungsi
eclust dari package factoextra. Metode
clustering yang digunakan adalah Average Linkage, dan jumlah
cluster ditentukan sebanyak 2 (k=2). Nama wilayah dari
kolom Kabupaten/Kota pada dataset
data_IPE_sumut_2023 diatur sebagai label untuk dendrogram
dengan menetapkan clus_hier$labels sama dengan
wilayah. Dendrogram hasil clustering divisualisasikan
menggunakan fungsi fviz_dend, dengan penambahan kotak di
sekitar cluster (rect = TRUE) dan penyesuaian ukuran teks
label (cex = 0.5). Warna cluster diatur menggunakan skema
palet "jco", dan grafik diberi judul “Dendrogram Clustering
Hierarki” dengan tema minimalis (theme_minimal()). Hasil
ini memudahkan interpretasi struktur hierarki antar wilayah berdasarkan
data yang dianalisis.
> clusters <- cutree(average, k=2)
> clusters
> aggregate(data_IPE_sumut_2023[2:5], list(clusters), mean)Kode ini membagi dendrogram hasil clustering hierarki metode
Average Linkage menjadi 2 cluster menggunakan fungsi
cutree, dan hasilnya disimpan dalam variabel
clusters. Kemudian, fungsi aggregate digunakan
untuk menghitung rata-rata nilai variabel pada kolom ke-2 hingga ke-5
dari dataset data_IPE_sumut_2023, dikelompokkan berdasarkan
hasil pembagian cluster. Outputnya adalah tabel yang menunjukkan
rata-rata dari setiap variabel dalam masing-masing cluster, mempermudah
interpretasi perbedaan karakteristik antar cluster.
Statistik deskriptif pada penelitian ini digunakan untuk memberikan gambaran umum dan menyajikan data Indikator Pembangunan Ekonomi pada peubah PDRB perkapita Atas Dasar Harga Konstan (\(X_1\)), IPM (\(X_2\)), Tingkat Partisipasi Angkatan Kerja (\(X_3\)), dan Persentase Penduduk Miskin (\(X_4\)).
Tabel 4.1. Statistika Deskriptif
| X1 | X2 | X3 | X4 | |
|---|---|---|---|---|
| Min. :12102 | Min. :64.68 | Min. :62.79 | Min. : 3.440 | |
| 1st Qu.:21117 | 1st Qu.:72.56 | 1st Qu.:67.77 | 1st Qu.: 7.870 | |
| Median :30418 | Median :74.33 | Median :73.20 | Median : 8.540 | |
| Mean :32216 | Mean :74.01 | Mean :74.20 | Mean : 9.925 | |
| 3rd Qu.:37461 | 3rd Qu.:76.88 | 3rd Qu.:81.08 | 3rd Qu.:11.420 | |
| Max. :70103 | Max. :82.61 | Max. :86.89 | Max. :22.810 |
Rata-rata PDRB perkapita Atas Dasar Harga Konstan 33 Kabupaten/Kota di Provinsi Sumatera Utara adalah Rp 32.216.000. Provinsi Sumatera Utara memiliki rata-rata Indeks Pembangunan Manusia (IPM) sebesar 74,01%, rata-rata Tingkat Partisipasi Angkatan Kerja (TPAK) sebesar 74,20% dan rata-rata penduduk miskin sebesar 9,925%.
Setiap Kabupaten/Kota mempunyai Produk Domestik Regional Bruto (PDRB) perkapita, wilayah yang memiliki PDRB perkapita Atas Dasar Harga Konstan terendah adalah Nias Selatan yaitu sebesar Rp 12.102.000, sedangkan wilayah yang memiliki PDRB perkapita Atas Dasar Harga Konstan terbesar adalah Kota Medan sebesar Rp 70.103.000.
Wilayah yang memiliki Indeks Pembangunan Manusia (IPM) terendah adalah Nias Barat yaitu sebesar 64,68%, sedangkan wilayah yang memiliki IPM tertinggi adalah Kota Medan sebesar 82,61%.
Kota Binjai mempunyai Tingkat Partisipasi Angkatan Kerja (TPAK) terendah yaitu sebesar 62,79% , sedangkan Samosir termasuk Kota yang memiliki TPAK tertinggi yaitu sebsar 86,89%
Kabupaten/Kota yang memiliki penduduk miskin terrendah adalah Deli Serdang yaitu sebesar 3,44%, sedangkan kabupaten/kota yang memiliki penduduk miskin tertinggi adalah Nias Barat sebesar 22,81% .
a. Uji Sampel Representatif
Tabel 4.2.1. Nilai Uji KMO
| Variabel | Nilai.Uji.KMO |
|---|---|
| X1 | 0.78 |
| X2 | 0.62 |
| X3 | 0.78 |
| X4 | 0.62 |
Berdasarkan output, dapat diketahui bahwa nilai uji KMO pada PDRB perkapita Atas Dasar Harga Konstan (\(X_1\)) sebesar 0,78, nilai uji KMO pada IPM (\(X_2\)) sebesar 0,62, nilai uji KMO pada TPAK (\(X_3\)) sebesar 0,78, dan nilai uji KMO pada Persentase Penduduk Miskin (\(X_4\)) sebesar 0,78. Uji KMO pada masing masing variabel tersebut bernilai lebih dari 0.5 sehingga dapat disimpulkan bahwa sampel telah representatif atau mewakili populasi.
b. Uji Non-Multikolinearitas
Tabel 4.2.2. NilaiKorelasi Antar Variabel
| X1 | X2 | X3 | X4 | |
|---|---|---|---|---|
| X1 | 1.0000000 | 0.5040557 | -0.4552940 | -0.3764427 |
| X2 | 0.5040557 | 1.0000000 | -0.4357804 | -0.7769302 |
| X3 | -0.4552940 | -0.4357804 | 1.0000000 | 0.3131738 |
| X4 | -0.3764427 | -0.7769302 | 0.3131738 | 1.0000000 |
Berdasarkan output, dapat diketahui bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel.
Statndarisasi data perlu dilakukan agar mempersempit dan menyamakan satuan peubah yang berbeda beda. Karena dalam kasus ini satuan peubah ada yang berbeda, maka harus dilakukan standarisasi. Berikut adalah hasil data Indikator Pembangunan Ekonomi di Sumatera Utara Tahun 2023 yang sudah di standarisasi.
Tabel 4.3. Hasil Standarisasi Data
| X1 | X2 | X3 | X4 |
|---|---|---|---|
| -0.9488791 | -2.1051598 | 1.0049559 | 1.2344080 |
| -0.7717153 | -0.3236271 | -1.4952408 | -0.2541683 |
| 0.2191645 | 0.1348206 | 0.1935003 | -0.6954931 |
| -0.8449310 | -0.2951226 | 0.0430317 | 0.3756140 |
| -0.8162844 | 0.6764066 | 0.9404694 | -0.3305056 |
| -0.2309763 | 0.9068181 | 0.8961349 | -0.4497826 |
| 1.3566842 | 0.1633252 | -1.2574467 | -0.4617102 |
| 0.3539842 | -0.1003417 | -0.6273595 | -0.4092284 |
| -0.1250117 | 0.2749679 | -0.2753705 | -0.4903367 |
| -0.6834115 | 0.2773432 | 1.4254618 | -0.5857583 |
| 0.3982752 | 0.6811573 | 1.2978322 | -0.4640958 |
| 0.5025710 | 0.7476679 | -0.8839622 | -1.5471305 |
| -0.0743239 | 0.0754362 | 0.2244001 | -0.1659034 |
| -1.3985331 | -2.1455412 | 0.6838667 | 1.5421426 |
| -0.6811865 | -0.3616331 | 1.6753472 | -0.2947225 |
| -1.0351665 | -0.4067653 | 1.5786174 | -0.5690595 |
| -0.5328779 | -0.2571166 | 1.7049035 | 0.4137826 |
| -0.0212721 | -0.1454738 | -0.8799318 | -0.5929149 |
| 2.0433678 | -0.3450055 | -0.1692364 | 0.3469875 |
| 0.1296787 | -0.1335970 | -0.1060934 | -0.2708671 |
| 0.0800339 | -0.4400206 | 0.5293677 | -0.4855656 |
| 2.2928434 | 0.0516824 | -0.1343062 | -0.4450115 |
| 1.1673525 | 0.3414784 | -1.2789423 | -0.2016865 |
| -1.0869668 | -2.0362738 | 0.9498736 | 2.8303337 |
| -1.2381262 | -2.2168025 | 0.9243477 | 3.0736587 |
| 0.7330647 | 0.7262895 | -0.4056871 | 0.3565297 |
| 0.2003217 | 0.3343523 | -0.5924293 | 0.5449872 |
| 0.3646919 | 1.5315422 | -0.4352434 | -0.6406257 |
| -0.5483832 | 0.9875809 | -1.1419084 | -0.1038794 |
| 2.6343079 | 2.0422483 | -1.2802857 | -0.4593247 |
| -0.1978797 | 0.9733287 | -1.5328580 | -1.2250828 |
| -0.8313030 | 0.9709533 | -0.7119981 | -0.7336617 |
| -0.4091135 | -0.5849186 | -0.8638102 | 1.1580708 |
Hasil standarisasi digunakan dalam pengelompokan kabupaten/kota di Sumatera Utara berdasarkan indikator pembangunan ekonomi.
Setelah dilakukan standarisasi data, langkah selanjutnya yaitu menghitung jarak nilai tengah objek setiap peubah dalam satu kelompok dengan menggunakan jarak Euclidean. Adapun hasil dari perhitungan jarak Euclidean dapat dilihat pada subab 3.6.
Tabel 4.5. Hasil Koefisien Korelasi Cophenetic
| Metode | Korelasi |
|---|---|
| Single | 0.8022394 |
| Complete | 0.7793019 |
| Average | 0.8298003 |
| Ward | 0.7627174 |
Dari hasil koefisein korelasi cophenetic terlihat bahwa Average Lingkage memiliki nilai koefisien korelasi tertinggi dibandingkan metode lain, yaitu sebesar 0,8298003. Oleh karena itu metode cluster yang terbaik yang akan digunakan adalah metode Average Lingkage.
Berdasarkan plot diatas, dengan menggunakan metode silhoutte untuk memvalidasi jumlah cluster, jumlah cluster optimum yang tepat digunakan untuk menyeleasikan kasus ini adalah sebanyakan 2 cluster.
Dalam penentuan jumlah cluster dengan menggunakan analisis cluster metode Average Linkage yaitu dengan melihat pada dendogram yang telah terbentuk. Dapat dilihat struktur dan pola pada dendogram menunjukkan bahwa objek-objek dalam dataset berkelompok menjadi dua bagian. Selain itu, dengan melihat selisih terpanjang dari gambar dendogram diatas terlihat bahwa pemotongan yang tepat akan menghasilkan 2 cluster, dimana pada cluster 1 sebanyak 4 anggota dan cluster 2 sebanyak 29 anggota. Oleh karena itu jumlah cluster untuk mengelompokkan kabupaten/kota di Provinsi Sumatera Utara sebanyak dua.
Berdasarkan hasil clustering menggunakan Average Linkakge, diperoleh anggota tiap cluster sebagai berikut:
Tabel 4.7. Anggota Cluster
| Cluster | Anggota |
|---|---|
| 1 | Nias, Nias Selatan, Nias Utara, Nias Barat |
| 2 | Mandailing Natal, Tapanuli Selatan, Tapanuli Tengah, Tapanuli Utara, Toba Samosir, Labuhan Batu, Asahan, Simalungun, Dairi, Karo, Deli Serdang, Langkat, Humbang Hasundutan, Pakpak Bharat, Samosir, Serdang Bedagai, Batu Bara, Padang Lawas Utara, Padang Lawas, Labuhan Batu Selatan, Labuhan Batu Utara, Kota Sibolga, Kota Tanjung Balai, Kota Pematang Siantar, Kota Tebing Tinggi, Kota Medan, Kota Binjai, Kota Padangsidimpuan, Kota Gunungsitoli |
Tabel 4.8. Karakteristik Setiap Cluster
| Peubah | Cluster 1 | Cluster 2 |
|---|---|---|
| X1 | 15415.7500 | 34533.20690 |
| X2 | 65.0625 | 75.24690 |
| X3 | 80.8300 | 73.28517 |
| X4 | 19.0225 | 8.67069 |
Berdasarkan tabel dapat dilihat bahwa 4 kabupaten/kota di Provinsi Sumatera Utara yang berada pada cluster 1, dapat diketahui bahwa Persentase Penduduk miskin yang Tinggi serta variabel Produk Domestik Regional Bruto (PDRB) perkapita Atas Dasar Harga Konstan dan Indeks Pembangunan Manusia memiliki karakteristik yang lebih rendah dibandingkan dengan cluster 2. Berdasarkan karakteristik tersebut, dapat diketahui bahwa cluster 1 merupakan kelompok kabupaten/kota dengan Indikator Pembangunan Ekonomi yang buruk.
Pada 29 kabupaten/kota di Provinsi Sumatera Utara yang berada pada cluster 2, dapat diketahui bahwa Persentase Penduduk miskin yang rendah serta variabel Produk Domestik Regional Bruto (PDRB) perkapita Atas Dasar Harga Konstan dan Indeks Pembangunan Manusia memiliki karakteristik yang lebih tinggi dibandingkan dengan cluster 1. Berdasarkan karakteristik tersebut, dapat diketahui bahwa cluster 1 merupakan kelompok kabupaten/kota dengan Indikator Pembangunan Ekonomi yang baik.
Berdasarkan kasus pembangunan ekonomi yang diambil dari 33 kabupaten/kota di Provinsi Sumatera Utara, digunakan metode analisis cluster hierarki untuk mengelompokkan setiap kabupaten/kota di Provinsi Sumatera Utara menjadi beberapa kelompok yang ditinjau berdasarkan Indikator Pembangunan Ekonomi pada tahun 2023, yaitu Produk Domestik Regional Bruto perkapita Atas Dasar Harga Konstan (Ribu Rp), Indeks Pembangunan Manusia (persen), Tingkat Partisipasi Angkatan Kerja (persen), dan Persentase Penduduk Misikin (persen). Metode analisis cluster yang digunakan pada kasus ini yaitu Average Linkage, karena memiliki nilai koefisien cophenetic yang paling mendekati 1 dan tertinggi daripada metode lainnya. Hasil yang didapatkan dengan menggunakan analisis cluster metode Average Linkage yaitu terbentuk 2 cluster, dimana cluster 1 terdiri dari 4 kabupaten/kota dan cluster 2 terdiri dari 29 kabupaten/kota. Berdasarkan karakteristik setiap cluster, dapat ditentukan bahwa cluster 1 merupakan kelompok kabupaten/kota dengan Indikator Pembangunan Ekonomi yang buruk, sedangkan cluster 2 merupakan kelompok Indikator Pembangunan Ekonomi yang baik. Sehingga dapat disimpulkan bahwa cluster yang memiliki Indikator Pembangunan Ekonomi yang lebih baik yaitu cluster 2 yang terdiri dari 29 kabupaten/kota di Provinsi Sumatera Utara.
Peneliti selanjutnya dapat mengembangkan penelitian ini dengan meneliti variabel lain terkait indikator pembangunan ekonomi di Provinsi Sumatera Utara pada tahun 2023. Pada penelitian ini, peneliti hanya mengkaji metode cluster hierarki, yaitu metode Average Linkage dan diaplikasikan untuk data indikator pembangunan ekonomi di Sumatera Utara pada tahun 2023. Oleh karena itu, bagi peneliti selanjutnya yang juga ingin melakukan analisis cluster dapat menggunakan metode yang lainnya pada metode hierarki maupun non-hierarki mengingat metode untuk analisis cluster sangatlah beragam.
Abidin, Z. 2017. Pengelompokan Kabupaten/Kota di Jawa Timur
Berdasarkan Indikator Kemiskinan Dengan Menggunakan Analisis Cluster
Hierarki (Skripsi, Institut Teknologi Sepuluh Nopember).
Akhyar, S. 2017. Pengelompokan Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Pembangunan Ekonomi Menggunakan Model-Based Clustering (Skripsi, Institut Teknologi Sepuluh Nopember).
Dzikrullah, A. A. (2022). Pengelompokan Provinsi Berdasarkan Kualitas Jaringan Internet Dengan Metode Centroid Linkage. Journal of Mathematics, Computations, and Statistics, 5(1), 48-57.
Badan Pusat Statistik Sumatera Utara. (2024). Produk - Tabel Statistik. Diakses pada 26 November 2024 di https://sumut.bps.go.id/.
Fathia, A. N., Rahmawati, R., & Tarno. (2016). Analisis Klaster Kecamatan di Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage. Jurnal Gaussian, 5(4), 801-810.
Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.
Hemelia, & Sumargo, B. (2019). Pengklasifikasian Pengguna Internet Lingkungan Pedesaan Menurut Jenjang Pendidikan di Indonesia Menggunakan Metode Cluster Average Linkage. Jurnal Statistika dan Aplikasinya (JSA), 3(1), 22-29.
Johnson, R. A., & Wichern, D. W. 2007. Applied Multivariate Statistical Analysis. Englewood, New Jersey: Prentice Hall.
Martias, L. D.(2021).Statistika Deskriptif Sebagai Kumpulan Informasi. FIHRIS: Jurnal Ilmu Perpustakaan dan Informasi, 16(1), 40-59.
Sholikhah, A., (2016). Statistik deskriptif dalam penelitian kualitatif. KOMUNIKA: Jurnal Dakwah Dan Komunikasi, 10(2), 342-362.
Silvi, R. (2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K-Means Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. Jurnal Matematika “MANTIK”, 4(1), 22-31.
Widodo, E., Sari, N. N., Hidayati, I., Yubinas, F., Yuniarti, M., & Novyantika, R. D. (2018). Analisis Cluster Penderita Disabilitas Mental di Provinsi Daerah Istimewa Yogyakarta Tahun 2016. Program Studi Pendidikan Matematika FKIP UMS, 577-586.