Statistika adalah disiplin ilmu yang mempelajari proses pengumpulan, analisis, interpretasi, presentasi, dan penggunaan data dalam pengambilan keputusan. Dalam berbagai aspek kehidupan, statistika memiliki peranan penting dalam memahami fenomena yang terjadi, menggunakan data sebagai dasar pengambilan keputusan, serta mengungkap pola dan tren yang tersembunyi di dalam data. Disiplin ilmu seperti sains, ekonomi, kedokteran, sosial, lingkungan, dan lainnya menerapkan prinsip statistika dalam penelitian dan salah satunya adalah analisis cluster.
Analisis cluster adalah teknik analisis data yang bertujuan untuk mengelompokkan individu atau objek ke dalam kelompok yang mempunyai ciri yang berbeda antar kelompok, sehingga individu atau objek dalam kelompok tersebut mempunyai ciri yang relatif seragam. Clustering membuat pengelompokan seluruh anggota setiap partisi mempunyai kesamaan berdasarkan matriks tertentu dan salah satu metode yang sering digunakan adalah algoritma K-Means. Algoritma K-Means adalah metode yang memperhitungkan jarak kedekatan antar data dengan centroid atau pusat cluster pada kelompok yang telah ditetapkan(Wahyudi, dkk.,2020). Pengukuran jarak pada permasalahan ini menggunakan square euclidean distance. Tujuan dari analisis cluster adalah untuk mengelompokkan objek ini menjadi satu. Salah satu cara mendapatkan data untuk melakukan analisis cluster adalah mengaskses website Badan Pust Statistik.
BPS Provinsi Maluku (2024) melaporkan bahwa Indeks Pembangunan manusia di Maluku terus mengalami kemajuan. Status pembangunan manusia Maluku pun sudah berada di level “tinggi”. Namun, Provinsi Maluku masih menempati peringkat ke-25 dari 38 provinsi di Indonesia, dengan nilai IPM sebesar 73,40. Indeks Pembangunan Manusia dapat digunakan untuk mengidentifikasi kesenjangan pembangunan dalam sektor sekolah, sektor kesehatan, sektor ekonomi. Perbedaaan IPM yang berbeda antar Provinsi di Indonesia tentu harus diatasi agar sumber daya manusia yang ada memiliki kualitas yang sama di seluruh Indonesia. Walau sudah tergolong tinggi Indeks Pembangunan Manusia (IPM) di Provinsi Maluku harus selalu ditingkatkan dengan cara melakukan peningkatan indikator indikator pendukung. Agar peningkatan tepat sasaran dapat dilakukan pengelompokan daerah di Provinsi Maluku berdasarkan Kabupaten/Kota berdasarkan indikator IPM.
Pengelompokkan daerah berdasarkan indikator Indeks Pembangunan Manusia dapat menambah pandangan pemerintah dalam meningkat fasilitas penunjang dalam meningkatkan Umur Harapan Hidup saat Lahir (UHH), Harapan Lama Sekolah (HLS), Rata-rata Lama Sekolah (RLS), dan Pengeluaran riil per kapita dengan menggunakan analisis cluster. Oleh karena itu, melalui kegiatan PKL mahasiswa diharapkan dapat berkontribusi dan mempelajari bagaimana data-data tersebut dihasilkan sehingga dapat digunakan untuk mengelompokkan daerah tertentu berdasarkan indikator penunjang Indeks Pembangunan Manusia.
Statistika deskriptif merupakan cabang ilmu statistika yang fokus pada pengumpulan, pengolahan, penyajian, dan peringkasan data untuk menggambarkan karakteristik dasar suatu kumpulan data. Menurut Sugiyono (2017), statistika deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku untuk umum atau generalisasi.
Analisis cluster adalah metode statistik yang digunakan untuk mengelompokkan objek ke dalam beberapa kelompok (cluster) berdasarkan karakteristik yang serupa di antara objek tersebut. Tujuan utama analisis cluster adalah untuk menciptakan kelompok yang memiliki kesamaan yang maksimal di dalam kelompok dan meminimalkan kesamaan antar kelompok yang berbeda. Menurut Tendean, T., & Purba, W. (2020) clustering adalah proses untuk mengorganisasikan sekelompok data ke dalam berbagai kelompok-kelompok sedemikian rupa sehingga objek-objek yang serupa akan menjadi satu cluster sedangkan objek-objek yang tidak serupa menjadi anggota clusteryang lain. Menurut Hair, Black, Babin & Anderson (2009), terdapat dua klasifikasi terkait cara pembentukan kelompok atau cluster yaitu metode hierarki dan non hierarki
Analisis cluster non-hirarki melakukan proses clustering dengan
langsung mengelompokkan semua observasi dalam dataset tanpa adanya
tingkatan, sehingga proses pengelompokan terjadi dalam satu level atau
tidak hirarki. Metode yang termasuk dalam jenis ini antara lain: a.
K-Means
Mengelompokkan data berdasarkan centroid yang diperbarui iteratif. b.
K-Medoids Mirip dengan K-Means tetapi menggunakan medoid (poin aktual
dalam dataset) sebagai pusat cluster. c. DBSCAN (Density-based Spatial
Clustering of Applications with Noise) Mengelompokkan data berdasarkan
kepadatan, mampu menemukan cluster dengan bentuk arbitrer dan menangani
noise.
Analisis cluster hirarki adalah metode analisis kelompok yang menggunakan proses clustering bertingkat. Metode ini dibagi menjadi dua pendekatan utama: a. Agglomeratif Clustering (Bottom-Up): Dimulai dengan setiap observasi sebagai cluster terpisah dan menggabungkannya secara bertahap berdasarkan kemiripan hingga semua observasi berada dalam satu cluster. b. Divisif Clustering (Top-Down): Dimulai dengan satu cluster yang mencakup semua observasi dan membagi cluster ini secara bertahap hingga setiap observasi berada dalam cluster terpisah atau sesuai dengan jumlah cluster yang diinginkan.
K-Means adalah teknik pengelompokan non-hirarki yang digunakan dalam analisis data atau sebagai metode data mining yang berbasis unsupervised learning. Metode ini mengelompokkan data dengan menggunakan sistem partisi. Menurut Prasetyo, E. (2012), langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut:
Menentukan k sebagai jumlah cluster yang ingin dibentuk
Memasukan data ke dalam cluster secara acak
Menentukan pusat cluster (centroid) dari data yang ada pada masing-masing cluster dengan persamaan :\(C_{kj}=\frac{X_{1j} +X_{2j}+...+X_{nj}}{{n}}\)
\(C_{kj}\):Pusat cluster ke-k pada variabel ke j(J=1,2,..,p)
\(n\):Banyak data cluster ke-k
Menentukan jarak setiap objek dengan sertiap centorid menggunakan jarak Euclidean
\[ d(X_i,X_g)=\sqrt{\sum_{j=1}^p(X_{ij}-X_{gj})^{2}} \]
Menghitung fungsi objektif dengan formula :
\[ J=\sum_{i=1}^n\sum_{j=1}^ka_{ij}d(X_i,C_{kj})^2 \]
Mengalokasikan masing-masing data ke centoroid terdekat yang dirumuskan sebagai berikut :
\[ a_{ij} = \begin{cases} 1, & \text{if } s = \min\{d(X_i, C_k)\} \\ 0, & \text{otherwise.} \end{cases} \]
Mengulangi Kembali langkah 3-6 sampai tidak ada lagi perpindahan objek atau tidak ada perubahan pada fungsi
Menurut penjelasan Paembonan & Abduh (2021), Metode validasi silhouette index adalah teknik yang digunakan untuk mengevaluasi kualitas pengelompokan(clustering) berdasarkan kriteria internal. Indeks ini mengukur seberapa baik setiap objek ditempatkan dalam clusternya dengan membandingkan jarak rata-rata objek tersebut dengan objek lain dalam cluster yang sama, serta jarak objek tersebut dengan objek dari cluster yang berbeda. Semakin besar nilai silhouette untuk sebuah objek, semakin tepat penempatan objek tersebut dalam clusternya. Koefisien silhouette dihitung sebagai ratarata dari nilai-nilai silhouette untuk setiap objek dalam data, yang dilambangkan dengan s(𝑖).
\[ SC=\frac{1}{n}\sum_{i=1}^{n} s(i) \] \[ SC=\frac{b(i)-a(i)}{max(a(i),b(i))} \]
Indeks Pembangunan Manusia (IPM) menjadi salah satu indikator yang penting dalam melihat sisi lain dari pembangunan. Setiap indikator komponen penghitungan IPM dapat dimanfaatkan untuk mengukur keberhasilan pembangunan kualitas hidup manusia(masyarakat/penduduk). Pada tahun 1990 UNDP menetapkan tiga dimensi pembentuk IPM (Badan Pusat Statistik, 2024). Ketiga dimensi ini merupakan pendekatan yang dipilih dalam penggambaran kualitas hidup manusia dan tidak mengalami perubahan hingga saat ini. dimensi tersebut mencakup:
Dimensi pertama diukur melalui indikator umur harapan hidup saat lahir, yang mencerminkan pentingnya kesehatan dan kecukupan gizi. Dimensi kedua mencakup Harapan Lama Sekolah (HLS) dan Rata-rata Lama Sekolah (RLS), sebagai cerminan kemampuan masyarakat dalam mengakses pendidikan yang berkualitas. Sementara itu, dimensi ketiga menggunakan pengeluaran riil per kapita yang disesuaikan sebagai alternatif indikator dari Pendapatan Nasional Bruto (PNB) per kapita, agar dapat diterapkan pada level kabupaten/kota (Badan Pusat Statistik, 2021).
Umur Harapan Hidup (UHH) mencerminkan tingkat kesehatan dan kualitas hidup masyarakat di suatu wilayah. Indikator ini mengacu pada rata-rata jumlah tahun yang diharapkan dapat dijalani oleh seseorang sejak lahir, dengan asumsi bahwa pola kematian saat ini tetap berlaku (Badan Pusat Statistik, 2021). Peningkatan UHH menunjukkan adanya perbaikan dalam layanan kesehatan, gizi, sanitasi, dan faktor lain yang mendukung kesejahteraan masyarakat. Studi sebelumnya menunjukkan bahwa UHH memiliki korelasi positif dengan tingkat kesejahteraan ekonomi suatu daerah, yang tercermin dalam peningkatan pendapatan dan akses terhadap fasilitas kesehatan.
Harapan Lama Sekolah (HLS) mengukur jumlah tahun pendidikan formal yang diharapkan akan dijalani oleh anak-anak di suatu wilayah. Indikator ini mencerminkan komitmen pemerintah dalam meningkatkan akses pendidikan dan menciptakan sumber daya manusia yang berkualitas. Peningkatan HLS biasanya diikuti dengan perbaikan dalam sistem pendidikan, seperti penyediaan fasilitas yang lebih baik dan peningkatan kualitas tenaga pengajar (Hanushek & Woessmann, 2015). Hasil penelitian menunjukkan bahwa daerah dengan HLS yang lebih tinggi cenderung memiliki tingkat literasi danproduktivitas yang lebih baik, yang pada akhirnya berkontribusi terhadap pertumbuhan ekonomi.
Rata-Rata Lama Sekolah (RLS) adalah indikator yang menggambarkan jumlah tahun rata-rata pendidikan yang telah diselesaikan oleh penduduk usia 25 tahun ke atas. Indikator ini mencerminkan tingkat pencapaian pendidikan masyarakat suatu daerah dan menjadi salah satu faktor yang memengaruhi kualitas tenaga kerja. Penelitian menunjukkan bahwa peningkatan RLS berhubungan erat dengan produktivitas tenaga kerja dan tingkat upah, yang pada gilirannya berkontribusi pada pertumbuhan ekonomi daerah tersebut. Schultz (1981) menekankan bahwa kualitas populasi yang tercermin dalam RLS merupakan investasi jangka panjang yang strategis bagi pembangunan ekonomi.
Pengeluaran riil per kapita adalah indikator yang digunakan untuk mewakili dimensi standar hidup layak. Indikator ini menggambarkan kemampuan daya beli masyarakat selama periode tertentu (Badan Pusat Statistik, 2024). Menurut Jannah, M dan Indah Fitriana Sari (2023), pendapatan perkapita adalah total pendapatan suatu daerah dibagi jumlah penduduk di daerah tersebut untuk tahun yang sama. Angka yang digunakan semestinya adalah total pendapatan regional dibagi jumlah penduduk. Indikator ini terpilih karena mampu mencerminkan tingkat pendapatan dan kesejahteraan masyarakat.
Data yang digunakan dalam penelitian ini berupa data sekunder tentang indikator IPM Kabupaten/Kota di Maluku. Data diperoleh melalui web BPS seperti yang terlampir pada Lampiran Adapun 4 variabel yang akan digunakan
| Variabel | Penjelasan |
| Umur Harapan Hidup (X1) | Usia Harapan Hidup adalah rata-rata usia yang diharapkan bahwa
seorang individu akan hidup sampai pada suatu titik waktu tertentu di masa depan. Variabel ini memiliki satuan Tahun |
Harapan Lama Sekolah (X2) |
Harapan Lama Sekolah adalah indikator yang mengukur rata-rata tahun sekolah yang diharapkan akan diselesaikan oleh seorang individu dalam suatu negara atau wilayah. Variabel ini memiliki satuan Tahun |
| Rata – Rata Lama Sekolah (X3) | Rata-Rata Lama Sekolah adalah indikator yang menggambarkan jumlah tahun rata-rata pendidikan yang telah diselesaikan oleh penduduk usia 25 tahun ke atas. Variabel ini memiliki satuan Tahun |
| Pengeluaran riil per kapita (X4) | Pengeluaran riil per kapita adalah Indikator yang menggambarkan kemampuan daya beli masyarakat selama periode tertentu. Variabel ini memiliki satuan Rupiah |
| Kabupaten.Kota | UHH | HLS | RLS | Pengeluaran.riil.per.kapita |
|---|---|---|---|---|
| Maluku Tenggara Barat | 70.20 | 12.34 | 9.92 | 7091 |
| Maluku Tenggara | 70.93 | 12.91 | 9.84 | 8553 |
| Maluku Tengah | 71.01 | 14.67 | 9.79 | 11183 |
| Buru | 70.34 | 13.24 | 9.02 | 11261 |
| Kepulauan Aru | 70.40 | 12.37 | 9.21 | 8488 |
| Seram Bagian Barat | 71.18 | 13.70 | 9.59 | 9706 |
| Seram Bagian Timur | 68.73 | 12.92 | 9.00 | 10049 |
| Maluku Barat Daya | 69.65 | 12.71 | 9.13 | 7600 |
| Buru Selatan | 70.28 | 12.85 | 8.48 | 8474 |
| Ambon | 73.14 | 16.08 | 12.24 | 15196 |
| Tual | 71.72 | 14.02 | 10.67 | 8238 |
Penelitian ini menggunakan analisi cluster non hierarki dengan metode K-Means. Proses analisis dilakukan dengan menggunakan bantuan software Rstudio. Berikut merupakan prosedur yang dilakukan penulis dalam melakukan analisis statistika ini:
> install.packages(c("sf", "dbscan", "ggplot2", "factoextra", "tidyverse","tmap","dplyr","tidyr","cluster"))
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> library(sf)
> library(dbscan)
> library(ggplot2)
> library(factoextra)
> library(tidyverse)
> library(tmap)
> library(dplyr)
> library(tidyr)
> library(cluster) Kabupaten.Kota UHH HLS RLS Pengeluaran.riil.per.kapita
1 Maluku Tenggara Barat 70.20 12.34 9.92 7091
2 Maluku Tenggara 70.93 12.91 9.84 8553
3 Maluku Tengah 71.01 14.67 9.79 11183
4 Buru 70.34 13.24 9.02 11261
5 Kepulauan Aru 70.40 12.37 9.21 8488
6 Seram Bagian Barat 71.18 13.70 9.59 9706
7 Seram Bagian Timur 68.73 12.92 9.00 10049
8 Maluku Barat Daya 69.65 12.71 9.13 7600
9 Buru Selatan 70.28 12.85 8.48 8474
10 Ambon 73.14 16.08 12.24 15196
11 Tual 71.72 14.02 10.67 8238
| UHH | HLS | RLS | Pengeluaran.riil.per.kapita | |
|---|---|---|---|---|
| Min. :68.73 | Min. :12.34 | Min. : 8.480 | Min. : 7091 | |
| 1st Qu.:70.24 | 1st Qu.:12.78 | 1st Qu.: 9.075 | 1st Qu.: 8356 | |
| Median :70.40 | Median :12.92 | Median : 9.590 | Median : 8553 | |
| Mean :70.69 | Mean :13.44 | Mean : 9.717 | Mean : 9622 | |
| 3rd Qu.:71.09 | 3rd Qu.:13.86 | 3rd Qu.: 9.880 | 3rd Qu.:10616 | |
| Max. :73.14 | Max. :16.08 | Max. :12.240 | Max. :15196 |
Umur Harapan Hidup
Umur harapan hidup terendah di Provinsi Maluku adalah 68,73 tahun tepatnya di Seram Bagian Timur sedangkan umur harapan hidup tertinggi 73,14 di Ambon. Hal ini mengindikasikan secara rata-rata umur harapan hidup di Provinsi Maluku 70,69 tahun. Ragam menunjukkan 1,30 tahun yang berarti umur harapan hidup memiliki keragaman yang tidak jauh berbeda antar Kabupaten/Kota.
Harapan Lama Sekolah
Harapan lama sekolah terendah di Provinsi Maluku adalah 12,34 tahun tepatnya di Maluku Tenggara Barat sedangkan harapan lama sekolah tertinggi 16,08 di Ambon. Hal ini mengindikasikan secara rata-rata harapan lama sekolah di Provinsi Maluku 13,44 tahun. Ragam menunjukkan 1,27 tahun yang berarti harapan lama sekolah memiliki keragaman yang tidak jauh berbeda antar Kabupaten/Kota.
Rata-Rata Lama Sekolah
Rata-rata lama sekolah terendah di Provinsi Maluku adalah 8,48 tahun tepatnya di Buru sedangkan rata-rata lama sekolah tertinggi 12,24 di Ambon. Hal ini mengindikasikan secara rata-rata lama sekolah di Provinsi Maluku 9,72 tahun. Ragam menunjukkan 1,04 tahun yang berarti harapan lama sekolah memiliki keragaman yang tidak jauh berbeda antar Kabupaten/Kota.
Pengeluaran Riil per Kapita
Pengeluaran riil per kapita terendah di Provinsi Maluku adalah 7091 rupiah tepatnya di Maluku Tenggara Barat sedangkan pengeluaran riil per kapita tertinggi 15196 rupiah di Ambon. Hal ini mengindikasikan secara rata-rata perngeluaran riil per kapita di Provinsi Maluku 9622 rupiah. Ragam menunjukkan 5253842,41 rupiah yang berarti pengeluaran riil per kapita memiliki keragaman yang sangat jauh berbeda antar Kabupaten/Kota.
banyaknya cluster dari k=1 hingga k=10 didapatkan jumlah cluster sebanyak 5 cluster. Hal ini dikarenakan k=5 adalah silhouette index tertinggi.
| Cluster | Nama |
|---|---|
| 4 | Maluku Tenggara Barat |
| 4 | Maluku Tenggara |
| 5 | Maluku Tengah |
| 5 | Buru |
| 4 | Kepulauan Aru |
| 5 | Seram Bagian Barat |
| 1 | Seram Bagian Timur |
| 4 | Maluku Barat Daya |
| 4 | Buru Selatan |
| 3 | Ambon |
| 2 | Tual |
Berdasarkan Gambar didapatkan bahwa Kabupaten/Kota di Maluku dikelompokan menjadi 5 cluster. Cluster 1 berisi 1 Kabupaten/Kota, cluster 2 berisi 1 Kabupaten/Kota, cluster 3 berisi sebanyak 1 Kabupaten/Kota, cluster 4 sebanyak 5 Kabupaten/Kota, dan cluster 5 memiliki anggota terbanyak dengan 3 Kabupaten/Kota.
Profiling cluster adalah memberikan karakteristik yang mendeskripsikan isi pada setiap cluster yang berbeda dengan cluster lainnya. Karakteristik setiap cluster adalah sebagai berikut:
Analisis cluster dengan algoritma K-Means mengelompokkan Kabupaten/Kota di Provinsi Maluku berdasarkan indikator IPM kedalam 5 kelompok. Variabel yang berhubungan dengan tingkat kriminalitas adalah Umur harapan hidup, Harapan lama sekolah, Rata-rata lama sekolah, Pendapata riil per kapita.
Cluster 1 hanya terdiri dari Kabupaten Seram Bagian Timur menunjukkan karakteristik UHH, HLS, dan RLS yang berada di bawah rata-rata provinsi, tetapi memiliki pengeluaran riil per kapita yang tinggi. Hal ini menunjukkan bahwa daya beli masyarakat cukup baik, namun berbanding terbalik dengan kualitas hidup dan pendidikan. Kemungkinan besar pengeluaran belum terfokus pada sektor kesehatan dan pendidikan, atau terdapat ketimpangan distribusi kesejahteraan.
Cluster 2 hanya terdiri dari Kota Tual memiliki karakteristik sebaliknya, yaitu UHH, HLS, dan RLS yang tinggi, namun pengeluaran riil per kapita rendah. Kondisi ini mengindikasikan efektivitas penggunaan sumber daya dalam pembangunan manusia, yang bisa jadi didorong oleh kualitas layanan publik atau kesadaran masyarakat terhadap pentingnya pendidikan dan kesehatan.
Cluster 3 hanya terdiri dari Kota Ambon merupakan cluster dengan daerah yang memiliki karakteristik semua indikator di atas rata-rata. Hal ini menjadikannya wilayah ideal dengan kualitas pembangunan manusia yang tinggi. Kota Ambon dapat dijadikan sebagai benchmark dalam perencanaan dan pengembangan wilayah lain di Provinsi Maluku.
Cluster 4 terdiri dari Maluku Tenggara Barat, Maluku Tenggara, Kepulauan Aru, Maluku Barat Daya, dan Buru Selatan mencerminkan wilayah dengan seluruh indikator pembangunan manusia yang masih di bawah rata-rata. Daerah-daerah ini perlu mendapat perhatian khusus dari pemerintah untuk intervensi kebijakan dalam aspek ekonomi, kesehatan, dan pendidikan guna mempercepat proses pembangunan manusia secara menyeluruh.
Cluster 5 terdiri dari Maluku Tengah, Buru, dan Seram Bagian Barat menunjukkan bahwa meskipun UHH, RLS dan pengeluaran riil per kapita tergolong tinggi, namun HLS masih di bawah rata-rata. Artinya, capaian pendidikan yang sudah ditempuh sangat baik namun harapan pendidikan di masa depan menurun. Hal ini mengindikasikan potensi stagnasi pendidikan jangka panjang yang dapat disebabkan oleh minimnya akses pendidikan lanjutan.
Secara keseluruhan, hasil clustering ini memberikan gambaran bahwa meskipun ada daerah dengan pengeluaran tinggi, belum tentu diikuti dengan kualitas hidup yang baik, dan sebaliknya. Temuan ini dapat digunakan sebagai tambahan pandangan dalam merumuskan kebijakan pembangunan yang lebih terarah dan berbasis data, dengan memperhatikan ketimpangan antar wilayah dalam capaian dimensi-dimensi IPM.
Afandi, M. I. (2020). Analisis cluster hierarki dengan metode complete linkage pada kabupaten/kota di Provinsi Jawa Timur berdasarkan indikator kemiskinan. Skripsi, Jurusan Matematika, Fakultas Sains dan Teknologi, UIN Maulana Malik Ibrahim Malang.
Alwi, W., & Hasrul, M. (2018). Analisis klaster untuk pengelompokan kabupaten/kota di Provinsi Sulawesi Selatan berdasarkan indikator kesejahteraan rakyat. Jurnal MSA, 6(1).
Badan Pusat Statistik. (2021). Indeks Pembangunan Manusia 2020. Jakarta: Badan Pusat Statistik.
Badan Pusat Statistik. (2024). Indeks Pembangunan Manusia 2023. Jakarta: Badan Pusat Statistik.
Badan Pusat Statistik Provinsi Maluku. (2024). Kompilasi Berita Resmi Statistik Provinsi Maluku: Produk Domestik Regional Bruto (PDRB) 2024. Maluku: Badan Pusat Statistik.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate data analysis: A global perspective (7th ed.). Pearson Education.
Hanushek, E. A., & Woessmann, L. (2015). The Knowledge Capital of Nations: Education and the Economics of Growth. MIT Press.
Jannah, M., & Indah Fitriana Sari. (2023). Analisis Pengaruh Rata- Rata Lama Sekolah, Angka Harapan Hidup dan Pengeluaran Perkapita Terhadap Kemiskinan Provinsi Nusa Tenggara Barat. EKOMA : Jurnal Ekonomi, Manajemen, Akuntansi, 3(1), 164–172. https://doi.org/10.56799/ekoma.v3i1.2108
Kurniawan, R., & Managi, S. (2018). Economic Growth and Sustainable Welfare in Indonesia: Spatial and Temporal Analysis. Economic Analysis and Policy, 59, 1-15.
Prasetyo, E. 2012. Data Mining: Konsep dan Aplikasi Menggunakan Matlab. Yogyakarta: Andi Offset.
Schultz, T. W. (1981). Investing in People: The Economics of Population Quality. University of Chicago Press.
Tendean, T., & Purba, W. (2020). Analisis Cluster Provinsi Indonesia Berdasarkan Produksi Bahan Pangan Menggunakan Algoritma K-Means. Jurnal Sains Dan Teknologi, 1(2), 5-11.
Wahyudi, M., Masitha, Saragih, R., & Solikhun. 2020. Data Mining: Penerapan Algoritma K-Means Clustering dan K-Medoids Clustering. Medan: Yayasan Kita Menulis.
Wahyuning, S. (2021). Dasar-dasar statistika. Semarang: Yayasan Prima Agus Teknik.
Walpole, R. E. 1992. Pengantar Statistika Edisi Ke-3 . Jakarta: PT Gramedia Pustaka Utama.
Load packages install.packages(c(“sf”, “dbscan”, “ggplot2”, “factoextra”, “tidyverse”)) library(sf) # Handling spatial data library(dbscan) # DBSCAN clustering library(ggplot2) # Visualization library(factoextra) # Clustering visualization library(tidyverse) # Data manipulation library(tmap) library(dplyr) library(ggplot2) library(readxl) library(tidyr) library(cluster) # Baca shapefile shp<- st_read(“C:/Kuliah/Semester 6/An.Spasial/Datatugas/gadm41_IDN_2.shp”) View(shp) Filter hanya untuk provinsi Maluku (NAME_1 == “Maluku”) maluku_shp <- shp%>% filter(NAME_1 == “Maluku”) View(maluku_shp) maluku_shp <- maluku_shp %>%arrange(NAME_2) Cek hasil print(maluku_shp) st_write(maluku_shp, “Maluku.shp”, delete_layer = TRUE) view(maluku_shp$NAME_2) #Input Data dataPKL <- read_excel(“C:/Kuliah/Semester 6/PKL/Laporan/Data_PKL.xlsx”) data <- data.frame(dataPKL) data dataclus <- data[,-1] head(dataclus) summary(dataclus) var(dataclus$HLS) var(dataclus$RLS) var(dataclus$UHH) var(dataclus$Pengeluaran.riil.per.kapita) Normalize the data scaled_data <- scale(dataclus) #Optimasi Jmlah cluster fviz_nbclust(dataclus, kmeans, method = “silhouette”) + ggtitle(“Silhouette”) — K-MEANS Clustering — set.seed(123) kmeans_result <- kmeans(scaled_data, centers = 5, nstart = 10) data$cluster_kmeans <- as.factor(kmeans_result$cluster) data.frame(kmeans_result$cluster, data$Kabupaten.Kota) #Visualisasi fviz_cluster(kmeans_result, data = scaled_data) #Profiling Cluster dataclus %>% mutate(Cluster = data$cluster) %>% group_by(Cluster) %>% summarise_all(“mean”) — Load Shapefile Maluku — maluku <- withinssmaluku <- maluku_shp maluku$NAME_2 # Gabungkan data clustering dengan shapefile berdasarkan nama kabupaten maluku <- maluku %>% left_join(data, by = c(“NAME_2” = “Kabupaten.Kota”)) maluku # — Peta dengan tmap — tmap_mode(“view”) tm <- tm_shape(maluku) + tm_polygons(“cluster_kmeans”, palette = c(“skyblue”, “blue”, “green”, “yellow”, “purple”), title = “Cluster”) + tm_compass(type = “4star”, position = c(“left”, “top”)) + tm_scale_bar(position = c(“right”, “top”)) + tm_layout(main.title = “Peta Clustering Indikator IPM”, legend.outside = TRUE) tm tmap_save(tm, filename = “peta_cluster.png”, dpi = 300, width = 10, height = 8, units = “in”) |