> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

PENDAHULUAN

Latar Belakang

LatarBelakang LatarBelakang LatarBelakang Indeks Pembangunan Manusia (IPM) merupakan indikator penting yang digunakan untuk menggambarkan kualitas hidup masyarakat suatu wilayah. IPM dibentuk dari tiga komponen utama, yaitu angka harapan hidup, tingkat pendidikan, dan standar hidup yang layak. Ketiga komponen tersebut memberikan gambaran menyeluruh mengenai kondisi pembangunan manusia, sehingga IPM menjadi acuan utama dalam evaluasi kebijakan pembangunan daerah maupun nasional.

Namun, realitas pembangunan di Indonesia menunjukkan adanya perbedaan yang cukup signifikan antarwilayah. Beberapa provinsi seperti DKI Jakarta, Bali, dan DI Yogyakarta umumnya memiliki IPM tinggi, sedangkan wilayah Indonesia Timur seperti Papua dan Nusa Tenggara Timur cenderung memiliki IPM lebih rendah. Ketimpangan ini perlu dianalisis untuk melihat pola pengelompokan provinsi berdasarkan kemiripan karakteristik IPM. Salah satu metode statistik yang dapat digunakan untuk tujuan tersebut adalah Analisis Cluster Hierarki. Metode ini memungkinkan pembentukan kelompok provinsi secara bertahap berdasarkan tingkat kedekatannya, dan hasilnya dapat dilihat melalui dendrogram. Dengan menggunakan metode ini, kita dapat mengidentifikasi kelompok provinsi yang memiliki karakteristik pembangunan yang serupa, sehingga hasilnya dapat dimanfaatkan untuk analisis kebijakan, rekomendasi pembangunan, dan pengambilan keputusan berbasis data.

Karena itu, penerapan Analisis Cluster Hierarki pada data IPM Indonesia tahun 2016–2020 penting untuk dilakukan, baik sebagai kebutuhan analisis akademik maupun sebagai alat untuk memahami pola pembangunan manusia secara lebih mendalam.

Tinjauan Pustaka

  1. Teori Terkait Metode Analisis cluster adalah metode statistik multivariat untuk mengelompokkan objek berdasarkan tingkat kemiripan karakteristiknya. Prinsip utamanya adalah menghasilkan kelompok yang homogen di dalam dan heterogen antar kelompok. Dalam cluster hierarki, pengelompokan dilakukan secara bertingkat dan ditampilkan dalam bentuk dendrogram. Beberapa metode penggabungan (linkage) yang umum digunakan yaitu: Single linkage: berdasarkan jarak terdekat antar objek. Complete linkage: berdasarkan jarak terjauh. Average linkage: berdasarkan rata-rata jarak. Ward’s method: meminimalkan ragam dalam cluster dan sering dianggap paling stabil. Untuk data kuantitatif, jarak Euclidean paling umum digunakan. Standardisasi diperlukan bila variabel memiliki skala berbeda agar tidak terjadi dominasi variabel tertentu. Evaluasi cluster dilakukan melalui interpretasi dendrogram dan penilaian homogenitas dalam cluster serta pemisahan antar cluster

  2. Asumsi Walaupun bersifat eksploratif, analisis cluster hierarki memiliki beberapa asumsi operasional: Tipe data sesuai ukuran jarak, biasanya data kuantitatif untuk Euclidean. Variabel telah distandardisasi jika memiliki satuan berbeda. Tidak terdapat outlier ekstrem yang dapat mengganggu struktur cluster. Hubungan antar variabel tidak terlalu tinggi, untuk menghindari redundansi. Data memiliki struktur pengelompokan alami, sehingga hasil cluster bermakna.

Data

Data yang digunakan dalam analisis ini adalah Indeks Pembangunan Manusia (IPM) Indonesia tahun 2016–2020. IPM merupakan indikator komposit yang menggambarkan tingkat pencapaian pembangunan manusia di suatu wilayah melalui tiga dimensi utama, yaitu kesehatan, pendidikan, dan standar hidup layak. Dataset ini bersifat tahunan dan mencakup seluruh provinsi di Indonesia.

Dataset IPM 2016–2020 diperoleh dari portal data statistik Indonesia yang menyediakan data resmi pemerintah secara terbuka. Data tersebut pada dasarnya bersumber dari Badan Pusat Statistik (BPS) sebagai lembaga yang memiliki tugas menyusun dan mempublikasikan indikator resmi pembangunan nasional, termasuk Indeks Pembangunan Manusia. Data yang disediakan telah disusun dalam format tabular dan dapat diunduh secara langsung oleh pengguna.

Dataset ini berisi nama provinsi serta nilai IPM untuk lima tahun berturut-turut, yaitu 2016, 2017, 2018, 2019, dan 2020. Dengan struktur tersebut, data ini sangat sesuai untuk analisis multivariat karena setiap provinsi memiliki lima variabel numerik yang dapat dibandingkan untuk melihat pola kesamaan atau perbedaan.

Sebagian isi dataset IPM 2016–2020 menunjukkan nilai IPM tiap provinsi untuk lima tahun berturut-turut. Misalnya, Provinsi Aceh memiliki nilai IPM sebesar 68,39 pada tahun 2016, meningkat menjadi 69,04 pada 2017, kemudian 71,19 pada 2018, 71,99 pada 2019, dan mencapai 72,18 pada tahun 2020. Provinsi Sumatera Utara mencatat nilai 70,95 pada 2016, 71,48 pada 2017, 71,89 pada 2018, 72,38 pada 2019, dan sedikit menurun menjadi 71,74 pada 2020.

Selanjutnya, Provinsi Sumatera Barat menunjukkan perkembangan yang relatif stabil dengan nilai IPM 70,73 pada 2016, 71,24 pada 2017, 71,73 pada 2018, 72,39 pada 2019, dan 72,50 pada 2020. Provinsi Riau juga menunjukkan tren peningkatan dengan IPM 72,48 pada tahun 2016, 72,85 pada 2017, 73,06 pada 2018, 73,52 pada 2019, dan sedikit menurun menjadi 73,30 pada tahun 2020. Di sisi lain, Provinsi Jambi mencatat IPM 69,62 pada 2016, 70,13 pada 2017, 70,65 pada 2018, 71,26 pada 2019, dan 71,29 pada 2020.

Cuplikan ini menggambarkan bahwa sebagian besar provinsi mengalami peningkatan IPM dari tahun ke tahun, meskipun beberapa provinsi menunjukkan fluktuasi kecil pada tahun 2020.

Tujuan

Melakukan analisis cluster hierarki terhadap data IPM Indonesia untuk mengetahui kelompok provinsi yang memiliki karakteristik pembangunan yang serupa.

SOURCE CODE

Library

library(readxl) library(MVN) library(car)

Impor Data

data <- read.csv(“C:/Users/ASUS/Downloads/ipm_indonesia_2016_2020.csv”, header = TRUE, sep = “,”) data

Plot

plot(hc, labels = data$Provinsi, main = “Dendrogram Cluster Hierarki IPM Indonesia”, xlab = ““, sub =”“, cex = 0.6)

library(rmarkdown)

HASIL DAN PEMBAHASAN

Hasil Cluster 1 — Provinsi dengan IPM Tinggi Provinsi seperti: • DKI Jakarta • DI Yogyakarta • Bali • Kepulauan Riau tergabung pada level ketinggian dendrogram yang rendah, menunjukkan tingkat kemiripan yang tinggi dalam pola kenaikan IPM. Kelompok ini cenderung memiliki kualitas pendidikan, kesehatan, dan standar hidup yang relatif lebih baik dan lebih stabil dibanding provinsi lainnya. Cluster 2 — Provinsi dengan IPM Sedang Provinsi seperti: • Jawa Tengah • Jawa Timur • Sumatera Utara • Kalimantan Selatan termasuk dalam cluster menengah. Mereka memiliki perkembangan IPM yang cukup konsisten, namun tidak setinggi provinsi cluster pertama. Karakteristik pembangunan manusia pada kelompok ini berada pada kategori sedang. Cluster 3 — Provinsi dengan IPM Rendah Provinsi seperti: • Papua • Papua Barat • NTT berada dalam cluster tersendiri karena perbedaan yang signifikan dalam capaian IPM dibanding provinsi lain. Perbedaan ini tercermin dari jarak Euclidean yang relatif besar pada dendrogram, menunjukkan pola perkembangan IPM yang berbeda arah maupun kecepatan peningkatannya.

Pembahasan Scaling dilakukan menggunakan fungsi scale() agar setiap variabel—IPM 2016 hingga 2020—memiliki rata-rata nol dan simpangan baku satu. Langkah ini penting karena IPM tiap tahun berada pada rentang nilai yang berbeda sehingga tanpa scaling variabel tertentu bisa mendominasi proses pembentukan jarak. Matriks jarak Euclidean dihitung dengan dist(), yang mengukur perbedaan multivariat antarprovinsi. Semakin kecil jarak Euclidean,semakin mirip pola perkembangan IPM antarprovinsi tersebut. Metode Ward.D2 dipilih karena metode ini meminimalkan variansi dalam setiap cluster, sehingga menghasilkan kelompok yang lebih homogen. Hasil dari hclust() divisualisasikan menggunakan dendrogram. Dari dendrogram terlihat bahwa provinsi dengan karakteristik pembangunan manusia yang serupa cenderung bergabung lebih awal (jarak kecil), sementara provinsi dengan pola IPM yang sangat berbeda baru bergabung pada jarak yang jauh lebih besar.

KESIMPULAN

Hasil analisis cluster hierarki berhasil mengelompokkan provinsi-provinsi di Indonesia menjadi tiga kelompok utama berdasarkan perkembangan IPM tahun 2016–2020. Cluster yang terbentuk menunjukkan adanya kesenjangan pembangunan manusia antarprovinsi. Provinsi dengan IPM tinggi menunjukkan kemiripan pola pembangunan, sementara provinsi dengan IPM rendah membentuk kelompok tersendiri karena memiliki jarak perbedaan yang besar. Analisis ini dapat digunakan sebagai dasar penetapan prioritas pembangunan wilayah.

DAFTAR PUSTAKA

Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis. Pearson Prentice Hall. Badan Pusat Statistik. (2023). Indeks Pembangunan Manusia. Diakses melalui data.go.id. Everitt, B. S. (2011). Cluster Analysis. Wiley.

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.