1. PENDAHULUAN

1.1 Latar Belakang

Statistika adalah disiplin ilmu yang mempelajari proses pengumpulan, analisis, interpretasi, presentasi, dan penggunaan data dalam pengambilan keputusan. Dalam berbagai aspek kehidupan, statistika memiliki peranan penting dalam memahami fenomena yang terjadi, menggunakan data sebagai dasar pengambilan keputusan, serta mengungkap pola dan tren yang tersembunyi di dalam data. Disiplin ilmu seperti sains, ekonomi, kedokteran, sosial, lingkungan, dan lainnya menerapkan prinsip statistika dalam penelitian dan salah satunya adalah analisis cluster.

Analisis cluster adalah teknik analisis data yang bertujuan untuk mengelompokkan individu atau objek ke dalam kelompok yang mempunyai ciri yang berbeda antar kelompok, sehingga individu atau objek dalam kelompok tersebut mempunyai ciri yang  relatif seragam. Clustering membuat pengelompokan seluruh anggota  setiap partisi mempunyai kesamaan berdasarkan matriks tertentu dan salah satu metode yang sering digunakan adalah algoritma K-Means. Algoritma K-Means adalah metode yang memperhitungkan jarak kedekatan antar data dengan centroid atau pusat cluster pada kelompok yang telah ditetapkan(Wahyudi, dkk.,2020). Pengukuran jarak pada permasalahan ini menggunakan square euclidean distance. Tujuan dari analisis cluster adalah untuk mengelompokkan objek ini menjadi satu. Salah satu cara mendapatkan data untuk melakukan analisis cluster adalah mengaskses website Badan Pust Statistik.

BPS Provinsi Maluku (2024) melaporkan bahwa Indeks Pembangunan manusia di Maluku terus mengalami kemajuan. Status pembangunan manusia Maluku pun sudah berada di level “tinggi”. Namun, Provinsi Maluku masih menempati peringkat ke-25 dari 38 provinsi di Indonesia, dengan nilai IPM sebesar 73,40. Indeks Pembangunan Manusia dapat digunakan untuk mengidentifikasi kesenjangan pembangunan dalam sektor sekolah, sektor kesehatan, sektor ekonomi. Perbedaaan IPM yang berbeda antar Provinsi di Indonesia tentu harus diatasi agar sumber daya manusia yang ada memiliki kualitas yang sama di seluruh Indonesia. Walau sudah tergolong tinggi  Indeks Pembangunan Manusia (IPM) di Provinsi Maluku harus selalu ditingkatkan dengan cara melakukan peningkatan indikator indikator pendukung. Agar peningkatan tepat sasaran dapat dilakukan pengelompokan daerah di Provinsi Maluku berdasarkan Kabupaten/Kota berdasarkan indikator IPM.

Pengelompokkan daerah berdasarkan indikator Indeks Pembangunan Manusia dapat menambah pandangan pemerintah dalam meningkat fasilitas penunjang dalam meningkatkan Umur Harapan Hidup saat Lahir (UHH), Harapan Lama Sekolah (HLS), Rata-rata Lama Sekolah (RLS), dan Pengeluaran riil per kapita dengan menggunakan analisis cluster. Oleh karena itu, melalui kegiatan PKL mahasiswa diharapkan dapat berkontribusi dan mempelajari bagaimana data-data tersebut dihasilkan sehingga dapat digunakan untuk mengelompokkan daerah tertentu berdasarkan indikator penunjang Indeks Pembangunan Manusia.

1.2 Rumusan Masalah

  1. Berapa jumlah cluter yang terbentuk dengan metode sillhouette index ?
  2. Dimensi apa saja yang membedakan antara kelompok daerah di Provinsi Maluku?

1.3 Tujuan

  1. Analisis cluster diimplementasikan dalam pengelompokkan Kabupaten/Kota yang memiliki indiktator Indeks Pembangunan Manusia yang serupa di Provinsi Maluku
  2. Mampu berkontribusi dalam menyelesaikan permasalahan dan menghasilkan informasi yang bermanfaat bagi BPS Kota Tual

2. TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif merupakan cabang ilmu statistika yang fokus pada pengumpulan, pengolahan, penyajian, dan peringkasan data untuk menggambarkan karakteristik dasar suatu kumpulan data. Menurut Sugiyono (2017), statistika deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku untuk umum atau generalisasi.

2.2 Analisis Cluster

Analisis cluster adalah metode statistik yang digunakan untuk mengelompokkan objek ke dalam beberapa kelompok (cluster) berdasarkan karakteristik yang serupa di antara objek tersebut. Tujuan utama analisis cluster adalah untuk menciptakan kelompok yang memiliki kesamaan yang maksimal di dalam kelompok dan meminimalkan kesamaan antar kelompok yang berbeda. Menurut Tendean, T., & Purba, W. (2020) clustering adalah proses untuk mengorganisasikan  sekelompok data ke dalam berbagai kelompok-kelompok sedemikian rupa sehingga objek-objek yang serupa akan menjadi satu cluster sedangkan objek-objek yang tidak serupa menjadi anggota clusteryang lain. Menurut Hair, Black, Babin & Anderson (2009), terdapat dua klasifikasi terkait cara pembentukan kelompok atau cluster yaitu metode hierarki dan non hierarki

2.2.1 Analisis Cluster Non-Hirarki

Analisis cluster non-hirarki melakukan proses clustering dengan langsung mengelompokkan semua observasi dalam dataset tanpa adanya tingkatan, sehingga proses pengelompokan terjadi dalam satu level atau tidak hirarki. Metode yang termasuk dalam jenis ini antara lain: a. K-Means
Mengelompokkan data berdasarkan centroid yang diperbarui iteratif. b. K-Medoids Mirip dengan K-Means tetapi menggunakan medoid (poin aktual dalam dataset) sebagai pusat cluster. c. DBSCAN (Density-based Spatial Clustering of Applications with Noise) Mengelompokkan data berdasarkan kepadatan, mampu menemukan cluster dengan bentuk arbitrer dan menangani noise.

2.2.2 Analisis Cluster Hirarki

Analisis cluster hirarki adalah metode analisis kelompok yang menggunakan proses clustering bertingkat. Metode ini dibagi menjadi dua pendekatan utama: a. Agglomeratif Clustering (Bottom-Up): Dimulai dengan setiap observasi sebagai cluster terpisah dan menggabungkannya secara bertahap berdasarkan kemiripan hingga semua observasi berada dalam satu cluster. b. Divisif Clustering (Top-Down): Dimulai dengan satu cluster yang mencakup semua observasi dan membagi cluster ini secara bertahap hingga setiap observasi berada dalam cluster terpisah atau sesuai dengan jumlah cluster yang diinginkan.

2.3 Algoritma K-Means

K-Means adalah teknik pengelompokan non-hirarki yang digunakan dalam analisis data atau sebagai metode data mining yang berbasis unsupervised learning. Metode ini mengelompokkan data dengan menggunakan sistem partisi. Menurut Prasetyo, E. (2012), langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut:

  1. Menentukan k sebagai jumlah cluster yang ingin dibentuk

  2. Memasukan data ke dalam cluster secara acak

  3. Menentukan pusat cluster (centroid) dari data yang ada pada masing-masing cluster dengan persamaan :\(C_{kj}=\frac{X_{1j} +X_{2j}+...+X_{nj}}{{n}}\)

    \(C_{kj}\):Pusat cluster ke-k pada variabel ke j(J=1,2,..,p)

    \(n\):Banyak data cluster ke-k

  4. Menentukan jarak setiap objek dengan sertiap centorid menggunakan jarak Euclidean

    \[ d(X_i,X_g)=\sqrt{\sum_{j=1}^p(X_{ij}-X_{gj})^{2}} \]

  5. Menghitung fungsi objektif dengan formula :

    \[ J=\sum_{i=1}^n\sum_{j=1}^ka_{ij}d(X_i,C_{kj})^2 \]

  6. Mengalokasikan masing-masing data ke centoroid terdekat yang dirumuskan sebagai berikut :

    \[ a_{ij} = \begin{cases} 1, & \text{if } s = \min\{d(X_i, C_k)\} \\ 0, & \text{otherwise.} \end{cases} \]

  7. Mengulangi Kembali langkah 3-6 sampai tidak ada lagi perpindahan objek atau tidak ada perubahan pada fungsi

2.4 Silhouuette Index

Menurut penjelasan Paembonan & Abduh (2021), Metode validasi silhouette index adalah teknik yang digunakan untuk mengevaluasi kualitas pengelompokan(clustering) berdasarkan kriteria internal. Indeks ini mengukur seberapa baik setiap objek ditempatkan dalam clusternya dengan membandingkan jarak rata-rata objek tersebut dengan objek lain dalam cluster yang sama, serta jarak objek tersebut dengan objek dari cluster yang berbeda. Semakin besar nilai silhouette untuk sebuah objek, semakin tepat penempatan objek tersebut dalam clusternya. Koefisien silhouette dihitung sebagai ratarata dari nilai-nilai silhouette untuk setiap objek dalam data, yang dilambangkan dengan s(𝑖).

\[ SC=\frac{1}{n}\sum_{i=1}^{n} s(i) \] \[ SC=\frac{b(i)-a(i)}{max(a(i),b(i))} \]

2.5 Indeks Pembangunan Manusia

Indeks Pembangunan Manusia (IPM) menjadi salah satu indikator yang penting dalam melihat sisi lain dari pembangunan. Setiap indikator komponen penghitungan IPM dapat dimanfaatkan untuk mengukur keberhasilan pembangunan kualitas hidup manusia(masyarakat/penduduk). Pada tahun 1990 UNDP menetapkan tiga dimensi pembentuk IPM (Badan Pusat Statistik, 2024). Ketiga dimensi ini merupakan pendekatan yang dipilih dalam penggambaran kualitas hidup manusia dan tidak mengalami perubahan hingga saat ini. dimensi tersebut mencakup:

  1. Umur panjang dan hidup sehat (a long and healthy life)
  2. Pengetahuan (knowledge)
  3. Standar hidup layak (decent standard of living)

Dimensi pertama diukur melalui indikator umur harapan hidup saat lahir, yang mencerminkan pentingnya kesehatan dan kecukupan gizi. Dimensi kedua mencakup Harapan Lama Sekolah (HLS) dan Rata-rata Lama Sekolah (RLS), sebagai cerminan kemampuan masyarakat dalam mengakses pendidikan yang berkualitas. Sementara itu, dimensi ketiga menggunakan pengeluaran riil per kapita yang disesuaikan sebagai alternatif indikator dari Pendapatan Nasional Bruto (PNB) per kapita, agar dapat diterapkan pada level kabupaten/kota (Badan Pusat Statistik, 2021).

2.5.1 Umur Harapan Hidup

Umur Harapan Hidup (UHH) mencerminkan tingkat kesehatan dan kualitas hidup masyarakat di suatu wilayah. Indikator ini mengacu pada rata-rata jumlah tahun yang diharapkan dapat dijalani oleh seseorang sejak lahir, dengan asumsi bahwa pola kematian saat ini tetap berlaku (Badan Pusat Statistik, 2021). Peningkatan UHH menunjukkan adanya perbaikan dalam layanan kesehatan, gizi, sanitasi, dan faktor lain yang mendukung kesejahteraan masyarakat. Studi sebelumnya menunjukkan bahwa UHH memiliki korelasi positif dengan tingkat kesejahteraan ekonomi suatu daerah, yang tercermin dalam peningkatan pendapatan dan akses terhadap fasilitas kesehatan.

2.5.2 Harapan Lama Sekolah

Harapan Lama Sekolah (HLS) mengukur jumlah tahun pendidikan formal yang diharapkan akan dijalani oleh anak-anak di suatu wilayah. Indikator ini mencerminkan komitmen pemerintah dalam meningkatkan akses pendidikan dan menciptakan sumber daya manusia yang berkualitas. Peningkatan HLS biasanya diikuti dengan perbaikan dalam sistem pendidikan, seperti penyediaan fasilitas yang lebih baik dan peningkatan kualitas tenaga pengajar (Hanushek & Woessmann, 2015). Hasil penelitian menunjukkan bahwa daerah dengan HLS yang lebih tinggi cenderung memiliki tingkat literasi danproduktivitas yang lebih baik, yang pada akhirnya berkontribusi terhadap pertumbuhan ekonomi.

2.5.3 Rata – Rata Lama Sekolah

Rata-Rata Lama Sekolah (RLS) adalah indikator yang menggambarkan jumlah tahun rata-rata pendidikan yang telah diselesaikan oleh penduduk usia 25 tahun ke atas. Indikator ini mencerminkan tingkat pencapaian pendidikan masyarakat suatu daerah dan menjadi salah satu faktor yang memengaruhi kualitas tenaga kerja. Penelitian menunjukkan bahwa peningkatan RLS berhubungan erat dengan produktivitas tenaga kerja dan tingkat upah, yang pada gilirannya berkontribusi pada pertumbuhan ekonomi daerah tersebut. Schultz (1981) menekankan bahwa kualitas populasi yang tercermin dalam RLS merupakan investasi jangka panjang yang strategis bagi pembangunan ekonomi.

2.5.4 Pengeluaran Riil per Kapita

Pengeluaran riil per kapita adalah indikator yang digunakan untuk mewakili dimensi standar hidup layak. Indikator ini menggambarkan kemampuan daya beli masyarakat selama periode tertentu (Badan Pusat Statistik, 2024). Menurut Jannah, M dan Indah Fitriana Sari (2023), pendapatan perkapita adalah total pendapatan suatu daerah dibagi jumlah penduduk di daerah tersebut untuk tahun yang sama. Angka yang digunakan semestinya adalah total pendapatan regional dibagi jumlah penduduk. Indikator ini terpilih karena mampu mencerminkan tingkat pendapatan dan kesejahteraan masyarakat.

3. DATA DAN METODE

3.1 Data

Data yang digunakan dalam penelitian ini berupa data sekunder tentang indikator IPM Kabupaten/Kota di Maluku. Data diperoleh melalui web BPS seperti yang terlampir pada Lampiran Adapun 4 variabel yang akan digunakan

Variabel Penelitian
Variabel Penjelasan
Umur Harapan Hidup (X1) Usia Harapan Hidup adalah rata-rata usia yang diharapkan bahwa seorang individu akan hidup sampai pada suatu titik waktu
tertentu di masa depan. Variabel ini memiliki satuan Tahun
Harapan Lama Sekolah (X2)
Harapan Lama Sekolah adalah indikator yang mengukur rata-rata tahun sekolah yang diharapkan akan diselesaikan oleh seorang individu dalam suatu negara atau wilayah. Variabel ini memiliki satuan Tahun
Rata – Rata Lama Sekolah (X3) Rata-Rata Lama Sekolah adalah indikator yang menggambarkan jumlah tahun rata-rata pendidikan yang telah diselesaikan oleh penduduk usia 25 tahun ke atas. Variabel ini memiliki satuan Tahun
Pengeluaran riil per kapita (X4) Pengeluaran riil per kapita adalah Indikator yang menggambarkan kemampuan daya beli masyarakat selama periode tertentu. Variabel ini memiliki satuan Rupiah
Kabupaten.Kota UHH HLS RLS Pengeluaran.riil.per.kapita
Maluku Tenggara Barat 70.20 12.34 9.92 7091
Maluku Tenggara 70.93 12.91 9.84 8553
Maluku Tengah 71.01 14.67 9.79 11183
Buru 70.34 13.24 9.02 11261
Kepulauan Aru 70.40 12.37 9.21 8488
Seram Bagian Barat 71.18 13.70 9.59 9706
Seram Bagian Timur 68.73 12.92 9.00 10049
Maluku Barat Daya 69.65 12.71 9.13 7600
Buru Selatan 70.28 12.85 8.48 8474
Ambon 73.14 16.08 12.24 15196
Tual 71.72 14.02 10.67 8238

3.2 Metode Penelitian

Penelitian ini menggunakan analisi cluster  non hierarki dengan metode K-Means. Proses analisis dilakukan dengan menggunakan bantuan software Rstudio. Berikut merupakan prosedur yang dilakukan penulis dalam melakukan analisis statistika ini:

  1. Mendeskripsikan kondisi variabel yang digunakan menggunakan analisis statistika deskriptif.
  2. Melakukan standarisasi data tiap variabel.
  3. Menentukan jumlah cluster menggunakan silhouette index.
  4. Melakukan clistering dengan algoritma cluster K-Means.
  5. Profiling karakteristik tiap cluster.

3.3 Hasil Analisis

> install.packages(c("sf", "dbscan", "ggplot2", "factoextra", "tidyverse","tmap","dplyr","tidyr","cluster"))
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> library(sf)      
> library(dbscan) 
> library(ggplot2)  
> library(factoextra) 
> library(tidyverse)
> library(tmap)
> library(dplyr)
> library(tidyr)
> library(cluster)

3.3.1 Statistika Deskriptif

          Kabupaten.Kota   UHH   HLS   RLS Pengeluaran.riil.per.kapita
1  Maluku Tenggara Barat 70.20 12.34  9.92                        7091
2        Maluku Tenggara 70.93 12.91  9.84                        8553
3          Maluku Tengah 71.01 14.67  9.79                       11183
4                   Buru 70.34 13.24  9.02                       11261
5          Kepulauan Aru 70.40 12.37  9.21                        8488
6     Seram Bagian Barat 71.18 13.70  9.59                        9706
7     Seram Bagian Timur 68.73 12.92  9.00                       10049
8      Maluku Barat Daya 69.65 12.71  9.13                        7600
9           Buru Selatan 70.28 12.85  8.48                        8474
10                 Ambon 73.14 16.08 12.24                       15196
11                  Tual 71.72 14.02 10.67                        8238
Statistika Deskriptif
UHH HLS RLS Pengeluaran.riil.per.kapita
Min. :68.73 Min. :12.34 Min. : 8.480 Min. : 7091
1st Qu.:70.24 1st Qu.:12.78 1st Qu.: 9.075 1st Qu.: 8356
Median :70.40 Median :12.92 Median : 9.590 Median : 8553
Mean :70.69 Mean :13.44 Mean : 9.717 Mean : 9622
3rd Qu.:71.09 3rd Qu.:13.86 3rd Qu.: 9.880 3rd Qu.:10616
Max. :73.14 Max. :16.08 Max. :12.240 Max. :15196
  1. Umur Harapan Hidup

    Umur harapan hidup terendah di Provinsi Maluku adalah 68,73 tahun tepatnya di Seram Bagian Timur sedangkan umur harapan hidup tertinggi 73,14 di Ambon. Hal ini mengindikasikan secara rata-rata umur harapan hidup di Provinsi Maluku 70,69 tahun. Ragam menunjukkan 1,30 tahun yang berarti umur harapan hidup memiliki keragaman yang tidak jauh berbeda antar Kabupaten/Kota.

  2. Harapan Lama Sekolah

    Harapan lama sekolah terendah di Provinsi Maluku adalah 12,34 tahun tepatnya di Maluku Tenggara Barat sedangkan harapan lama sekolah tertinggi 16,08 di Ambon. Hal ini mengindikasikan secara rata-rata harapan lama sekolah di Provinsi Maluku 13,44 tahun. Ragam menunjukkan 1,27 tahun yang berarti harapan lama sekolah memiliki keragaman yang tidak jauh berbeda antar Kabupaten/Kota.

  3. Rata-Rata Lama Sekolah

    Rata-rata lama sekolah terendah di Provinsi Maluku adalah 8,48 tahun tepatnya di Buru sedangkan rata-rata lama sekolah tertinggi 12,24 di Ambon. Hal ini mengindikasikan secara rata-rata lama sekolah di Provinsi Maluku 9,72 tahun. Ragam menunjukkan 1,04 tahun yang berarti harapan lama sekolah memiliki keragaman yang tidak jauh berbeda antar Kabupaten/Kota.

  4. Pengeluaran Riil per Kapita

    Pengeluaran riil per kapita terendah di Provinsi Maluku adalah 7091 rupiah tepatnya di Maluku Tenggara Barat sedangkan pengeluaran riil per kapita  tertinggi 15196 rupiah di Ambon. Hal ini mengindikasikan secara rata-rata perngeluaran riil per kapita di Provinsi Maluku 9622 rupiah. Ragam menunjukkan 5253842,41 rupiah yang berarti pengeluaran riil per kapita memiliki keragaman yang sangat jauh berbeda antar Kabupaten/Kota.

3.3.2 Silhouette Index

banyaknya cluster dari k=1 hingga k=10 didapatkan jumlah cluster sebanyak 5 cluster. Hal ini dikarenakan k=5 adalah silhouette index tertinggi.

3.3.3 K-Means Clustering

Hasil Cluster
Cluster Nama
4 Maluku Tenggara Barat
4 Maluku Tenggara
5 Maluku Tengah
5 Buru
4 Kepulauan Aru
5 Seram Bagian Barat
1 Seram Bagian Timur
4 Maluku Barat Daya
4 Buru Selatan
3 Ambon
2 Tual

Berdasarkan Gambar didapatkan bahwa Kabupaten/Kota di Maluku dikelompokan menjadi 5 cluster. Cluster 1 berisi 1 Kabupaten/Kota, cluster 2 berisi 1 Kabupaten/Kota, cluster 3 berisi sebanyak 1 Kabupaten/Kota, cluster 4 sebanyak 5 Kabupaten/Kota, dan cluster 5 memiliki anggota terbanyak dengan 3 Kabupaten/Kota.

3.3.4 Profiling Cluster

Profiling cluster adalah memberikan karakteristik yang mendeskripsikan isi pada setiap cluster yang berbeda dengan cluster lainnya. Karakteristik setiap cluster adalah sebagai berikut:

  1. Cluster 1 : UHH, HLS, dan RLS di bawah rata-rata, namun pengeluaran riil per kapita tinggi.
  2. Cluster 2 :UHH, HLS, dan RLS di atas rata-rata, namun pengeluaran riil per kapita rendah.
  3. Cluster 3 :Semua indikator di atas rata-rata.
  4. Cluster 4 :Semua indikator di bawah rata-rata.
  5. Cluster 5 :UHH pengeluaran riil per kapita di atas rata-rata,namun RLS, HLS di bawah rata-rata.

3.3.5 Visualisasi Cluster

3.4 Pembahasan

Analisis cluster dengan algoritma K-Means mengelompokkan Kabupaten/Kota di Provinsi Maluku berdasarkan indikator IPM kedalam 5 kelompok. Variabel yang berhubungan dengan tingkat kriminalitas adalah Umur harapan hidup, Harapan lama sekolah, Rata-rata lama sekolah, Pendapata riil per kapita.

Cluster 1 hanya terdiri dari Kabupaten Seram Bagian Timur menunjukkan karakteristik UHH, HLS, dan RLS yang berada di bawah rata-rata provinsi, tetapi memiliki pengeluaran riil per kapita yang tinggi. Hal ini menunjukkan bahwa daya beli masyarakat cukup baik, namun berbanding terbalik dengan kualitas hidup dan pendidikan. Kemungkinan besar pengeluaran belum terfokus pada sektor kesehatan dan pendidikan, atau terdapat ketimpangan distribusi kesejahteraan.

Cluster 2 hanya terdiri dari Kota Tual memiliki karakteristik sebaliknya, yaitu UHH, HLS, dan RLS yang tinggi, namun pengeluaran riil per kapita rendah. Kondisi ini mengindikasikan efektivitas penggunaan sumber daya dalam pembangunan manusia, yang bisa jadi didorong oleh kualitas layanan publik atau kesadaran masyarakat terhadap pentingnya pendidikan dan kesehatan.

Cluster 3 hanya terdiri dari Kota Ambon merupakan cluster dengan daerah yang memiliki karakteristik semua indikator di atas rata-rata. Hal ini menjadikannya wilayah ideal dengan kualitas pembangunan manusia yang tinggi. Kota Ambon dapat dijadikan sebagai benchmark dalam perencanaan dan pengembangan wilayah lain di Provinsi Maluku.

Cluster 4 terdiri dari Maluku Tenggara Barat, Maluku Tenggara, Kepulauan Aru, Maluku Barat Daya, dan Buru Selatan mencerminkan wilayah dengan seluruh indikator pembangunan manusia yang masih di bawah rata-rata. Daerah-daerah ini perlu mendapat perhatian khusus dari pemerintah untuk intervensi kebijakan dalam aspek ekonomi, kesehatan, dan pendidikan guna mempercepat proses pembangunan manusia secara menyeluruh.

Cluster 5 terdiri dari Maluku Tengah, Buru, dan Seram Bagian Barat menunjukkan bahwa meskipun UHH, RLS dan pengeluaran riil per kapita tergolong tinggi, namun HLS masih di bawah rata-rata. Artinya, capaian pendidikan yang sudah ditempuh sangat baik namun harapan pendidikan di masa depan menurun. Hal ini mengindikasikan potensi stagnasi pendidikan jangka panjang yang dapat disebabkan oleh minimnya akses pendidikan lanjutan.

Secara keseluruhan, hasil clustering ini memberikan gambaran bahwa meskipun ada daerah dengan pengeluaran tinggi, belum tentu diikuti dengan kualitas hidup yang baik, dan sebaliknya. Temuan ini dapat digunakan sebagai tambahan pandangan dalam merumuskan kebijakan pembangunan yang lebih terarah dan berbasis data, dengan memperhatikan ketimpangan antar wilayah dalam capaian dimensi-dimensi IPM.

4. KESIMPULAN DAN SARAN

4.1 Kesimpulan

  1. Hasil analisis cluster menggunakan algoritma K-Means berdasarkan indikator indeks pembangunan manusia kabupaten/kota di Provinsi Maluku terbagi menjadi 5 cluster. Cluster 1 hanya terdiri dari Kabupaten Seram Bagian Timur. Cluster 2 hanya terdiri dari Kota Tual. Cluster 3 hanya terdiri dari Kota Ambon. Cluster 4 memiliki 5 anggota yang berisi Kabupaten Maluku Tenggara Barat, Kabupaten Maluku Tenggara, Kanupaten Kepulauan Aru, Kabupaten Maluku Barat Daya, dan Kabupaten Maluku Tengah, Kabupaten Buru, dan Kabupaten Seram Bagian Barat.
  2. Cluster 1 memiliki ciri dimensi umur Panjang dan hidup sehat serta dimensi pendidikan yang di bawah rata-rata daerah lain, namun memiliki dimensi hidup layak yang masih di atas rata-rata daerah lain. Cluster 2 memiliki ciri yang berkebalikan dari cluter 1, dimana dimensi umur Panjang dan hidup sehat serta dimensi pendidikan di atas rata-rata daerah lain, namun dimensi hidup layak masih dibawah rata-rata daerah lain. Cluster 3 memiliki ciri semua dimensi dari seluruh indikator di atas rata-rata daerah lain. Cluster 4 seluruh indikator di bawah rata-rata dari daerah lain. Cluster 5 hanya indicator harapan lama sekolah yang dibawah rata-rata.

4.2 Saran

  1. Pemerintah Maluku dapat memanfaatkan informasi yang terdapat pada laporan ini untuk menunjang kebijakan yang akan diberlakukan di Maluku guna mengatasi ketimpangan.
  2. Pemerintah Kota Tual dapat memanfaatkan informasi yang terdapat dalam laporan guna memajukan Kabupaten Klaten agar masalah ketimpangan teratasi.
  3. Untuk Penelitian Selanjutnya, penelitian berikutnya dapat mengembangkan model ini dengan menggunakan metode clustering lain seperti Hierarchical Clustering atau DBSCAN untuk perbandingan.

5. Daftar Pustaka

Afandi, M. I. (2020). Analisis cluster hierarki dengan metode complete linkage pada kabupaten/kota di Provinsi Jawa Timur berdasarkan indikator kemiskinan. Skripsi, Jurusan Matematika, Fakultas Sains dan Teknologi, UIN Maulana Malik Ibrahim Malang.

Alwi, W., & Hasrul, M. (2018). Analisis klaster untuk pengelompokan kabupaten/kota di Provinsi Sulawesi Selatan berdasarkan indikator kesejahteraan rakyat. Jurnal MSA, 6(1).

Badan Pusat Statistik. (2021). Indeks Pembangunan Manusia 2020. Jakarta: Badan Pusat Statistik.

Badan Pusat Statistik. (2024). Indeks Pembangunan Manusia 2023. Jakarta: Badan Pusat Statistik.

Badan Pusat Statistik Provinsi Maluku. (2024). Kompilasi Berita Resmi Statistik Provinsi Maluku: Produk Domestik Regional Bruto (PDRB) 2024. Maluku: Badan Pusat Statistik.

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate data analysis: A global perspective (7th ed.). Pearson Education.

Hanushek, E. A., & Woessmann, L. (2015). The Knowledge Capital of Nations: Education and the Economics of Growth. MIT Press.

Jannah, M., & Indah Fitriana Sari. (2023). Analisis Pengaruh Rata- Rata Lama Sekolah, Angka Harapan Hidup dan Pengeluaran Perkapita Terhadap Kemiskinan Provinsi Nusa Tenggara Barat. EKOMA : Jurnal Ekonomi, Manajemen, Akuntansi3(1), 164–172. https://doi.org/10.56799/ekoma.v3i1.2108

Kurniawan, R., & Managi, S. (2018). Economic Growth and Sustainable Welfare in Indonesia: Spatial and Temporal Analysis. Economic Analysis and Policy, 59, 1-15.

Prasetyo, E. 2012. Data Mining: Konsep dan Aplikasi Menggunakan Matlab. Yogyakarta: Andi Offset.

Schultz, T. W. (1981). Investing in People: The Economics of Population Quality. University of Chicago Press.

Tendean, T., & Purba, W. (2020). Analisis Cluster Provinsi Indonesia Berdasarkan Produksi Bahan Pangan Menggunakan Algoritma K-Means. Jurnal Sains Dan Teknologi1(2), 5-11.

Wahyudi, M., Masitha, Saragih, R., & Solikhun. 2020. Data Mining: Penerapan Algoritma K-Means Clustering dan K-Medoids Clustering. Medan: Yayasan Kita Menulis.

Wahyuning, S. (2021). Dasar-dasar statistika. Semarang: Yayasan Prima Agus Teknik.

Walpole, R. E. 1992. Pengantar Statistika Edisi Ke-3 . Jakarta: PT Gramedia Pustaka Utama.

6. Source Code

Load packages

install.packages(c(“sf”, “dbscan”, “ggplot2”, “factoextra”, “tidyverse”)) library(sf) # Handling spatial data library(dbscan) # DBSCAN clustering library(ggplot2) # Visualization library(factoextra) # Clustering visualization library(tidyverse) # Data manipulation library(tmap) library(dplyr) library(ggplot2) library(readxl) library(tidyr) library(cluster) # Baca shapefile shp<- st_read(“C:/Kuliah/Semester 6/An.Spasial/Datatugas/gadm41_IDN_2.shp”) View(shp)

Filter hanya untuk provinsi Maluku (NAME_1 == “Maluku”)

maluku_shp <- shp%>% filter(NAME_1 == “Maluku”) View(maluku_shp)

maluku_shp <- maluku_shp %>%arrange(NAME_2)

Cek hasil

print(maluku_shp) st_write(maluku_shp, “Maluku.shp”, delete_layer = TRUE) view(maluku_shp$NAME_2)

#Input Data dataPKL <- read_excel(“C:/Kuliah/Semester 6/PKL/Laporan/Data_PKL.xlsx”) data <- data.frame(dataPKL) data dataclus <- data[,-1] head(dataclus) summary(dataclus) var(dataclus$HLS)

var(dataclus$RLS) var(dataclus$UHH)

var(dataclus$Pengeluaran.riil.per.kapita)

Normalize the data

scaled_data <- scale(dataclus) #Optimasi Jmlah cluster fviz_nbclust(dataclus, kmeans, method = “silhouette”) + ggtitle(“Silhouette”)

— K-MEANS Clustering —

set.seed(123) kmeans_result <- kmeans(scaled_data, centers = 5, nstart = 10) data$cluster_kmeans <- as.factor(kmeans_result$cluster) data.frame(kmeans_result$cluster, data$Kabupaten.Kota)

#Visualisasi fviz_cluster(kmeans_result, data = scaled_data) #Profiling Cluster dataclus %>% mutate(Cluster = data$cluster) %>% group_by(Cluster) %>% summarise_all(“mean”)

— Load Shapefile Maluku —

maluku <- withinssmaluku <- maluku_shp maluku$NAME_2 # Gabungkan data clustering dengan shapefile berdasarkan nama kabupaten maluku <- maluku %>% left_join(data, by = c(“NAME_2” = “Kabupaten.Kota”)) maluku # — Peta dengan tmap — tmap_mode(“view”) tm <- tm_shape(maluku) + tm_polygons(“cluster_kmeans”, palette = c(“skyblue”, “blue”, “green”, “yellow”, “purple”), title = “Cluster”) + tm_compass(type = “4star”, position = c(“left”, “top”)) + tm_scale_bar(position = c(“right”, “top”)) + tm_layout(main.title = “Peta Clustering Indikator IPM”, legend.outside = TRUE) tm tmap_save(tm, filename = “peta_cluster.png”, dpi = 300, width = 10, height = 8, units = “in”)