Analisis data dalam ilmu statistik modern semakin berkembang, terutama dalam upaya memahami pola dan hubungan antar objek. Salah satu teknik yang banyak digunakan untuk tujuan eksplorasi adalah analisis cluster. Metode ini bertujuan untuk mengelompokkan objek berdasarkan tingkat kemiripan sehingga objek dalam kelompok yang sama memiliki karakteristik yang lebih homogen dibandingkan dengan objek pada kelompok lain.
Di antara berbagai metode pengelompokan, cluster hirarki merupakan salah satu metode yang memiliki keunggulan dalam menampilkan struktur pengelompokan secara visual melalui dendrogram. Metode ini memungkinkan peneliti untuk melihat proses penggabungan atau pemisahan kelompok secara bertahap serta menentukan jumlah cluster optimal berdasarkan struktur data.
Cluster hirarki banyak digunakan dalam berbagai bidang seperti kesehatan, pemasaran, sosial ekonomi, dan demografi. Pada konteks penelitian ini, cluster hirarki digunakan untuk mengelompokkan wilayah berdasarkan data sarana kesehatan yang telah dikumpulkan. Dataset sarana kesehatan berisi informasi mengenai jumlah fasilitas kesehatan, kapasitas pelayanan, maupun ketersediaan tenaga medis di setiap wilayah. Perbedaan karakteristik antar wilayah menyebabkan perlunya metode pengelompokan untuk memahami pola distribusi fasilitas kesehatan secara lebih komprehensif. Dengan melakukan pengelompokan wilayah berdasarkan kesamaan indikator sarana kesehatan, hasil analisis ini dapat memberikan gambaran mengenai kelompok daerah dengan fasilitas yang relatif mirip. Informasi tersebut sangat penting bagi pemerintah dan pihak terkait dalam menentukan prioritas pembangunan, pemerataan layanan kesehatan, serta pengambilan keputusan yang lebih terarah dan berbasis data.
Berdasarkan latar belakang tersebut, maka rumusan masalah dalam penelitian ini adalah:
Tujuan penelitian ini adalah:
Analisis cluster merupakan metode statistik yang diterapkan untuk mengelompokkan sejumlah data atau objek ke dalam cluster berdasarkan karakteristik yang dimiliki oleh data atau objek tersebut (Awaliyah dkk., 2024). Objek-objek yang berada dalam satu kelompok diharapkan memiliki tingkat kesamaan yang lebih tinggi dibandingkan dengan objek-objek dari kelompok lainnya (Hair dkk., 2010).
Analisis cluster yang baik memiliki ciri-ciri sebagai berikut:
Secara umum, analisis cluster dibagi menjadi dua metode, yaitu metode hirarki dan metode non-hirarki. Metode hirarki digunakan ketika jumlah cluster belum diketahui. Pengelompokan dilakukan dengan menggabungkan objek yang paling mirip terlebih dahulu, kemudian berlanjut hingga terbentuk struktur berjenjang dalam bentuk dendrogram.
Metode non-hirarki merupakan metode pengelompokan dengan menentukan jumlah cluster terlebih dahulu. Setelah jumlah cluster ditetapkan, dilakukan penentuan centroid, menghitung jarak objek ke centroid, kemudian memperbarui centroid. Proses ini berlanjut sampai tidak ada perpindahan objek antar cluster.
Hair et al. (2010) menjelaskan bahwa cluster hirarki adalah metode pengelompokan yang membentuk struktur secara bertahap melalui proses penggabungan (agglomerative) atau pemisahan (divisive). Metode ini menghasilkan visualisasi berupa dendrogram yang memudahkan dalam memahami struktur hubungan antar objek.
Rencher (2002) menyebutkan bahwa ukuran jarak merupakan komponen penting dalam analisis cluster karena menentukan tingkat kemiripan antar objek. Ukuran jarak yang umum digunakan antara lain jarak Euclidean dan Manhattan.
a. Jarak Euclidean
\[d_{ij} = \sqrt{\sum_{k=1}^{p} (x_{ik} - x_{jk})^2}\] ## 2.4 Metode Linkage Kaufman dan Rousseeuw (2005) menjelaskan bahwa metode linkage digunakan untuk menentukan cara penggabungan cluster. Metode linkage mengatur bagaimana jarak antar cluster dihitung.
Rumus Metode Linkage
a. Single Linkage
\[D(A,B) = \min_{i \in A,\, j \in B} d_{ij}\]
b. Complete Linkage
\[D(A,B) = \max_{i \in A,\, j \in B} d_{ij}\]
c. Average Linkage
\[D(A,B) = \frac{1}{|A||B|} \sum_{i \in A} \sum_{j \in B} d_{ij}\] ## 2.5 Dendrogram Everitt et al. (2011) menyebutkan bahwa dendrogram merupakan representasi grafis dari proses penggabungan cluster. Dendrogram membantu peneliti dalam menentukan jumlah cluster optimal dengan melihat jarak antar penggabungan (fusion level) dan pola pemisahan objek.
library(readxl)
library(factoextra)
library(cluster)
library(psych)
Mengaktifkan packages yang akan digunakan untuk melakukan analisis.
data.kesehatan <- read_excel("C:/Users/ahmad/Downloads/DATA_SARANA_KESEHATAN.xlsx")
data.kesehatan <- data.kesehatan[,-1]
head(data.kesehatan)
distance1 = dist(data.kesehatan, method = "euclidean")
distance2 = dist(data.kesehatan, method = "euclidean")
distance3 = dist(data.kesehatan, method = "euclidean")
clust1 = hclust(distance1, "single")
plot(clust1, main = "Dendrogram Analisis Cluster Hirarki", xlab = "", sub = "", cex = 0.9)
rect.hclust(clust1, k = 2, border = "red") # menampilkan batas
clust2 = hclust(distance2, "complete")
plot(clust2, main = "Dendrogram Analisis Cluster Hirarki", xlab = "", sub = "", cex = 0.9)
rect.hclust(clust2, k = 2, border = "red") # menampilkan batas
clust3 = hclust(distance3, "average")
plot(clust3, main = "Dendrogram Analisis Cluster Hirarki", xlab = "", sub = "", cex = 0.9)
rect.hclust(clust3, k = 2, border = "red") # menampilkan batas
## # A tibble: 6 × 6
## `Rumah Sakit` `Rumah Sakit Bersalin` Poliklinik Puskesmas `Puskesmas Pembantu`
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 64 225 258 395 971
## 2 199 441 800 661 1887
## 3 54 139 127 294 721
## 4 55 207 329 272 1033
## 5 36 151 103 231 654
## 6 65 248 195 403 935
## # ℹ 1 more variable: Apotek <dbl>
Dendrogram single linkage menunjukkan bahwa sebagian besar provinsi
dengan jumlah sarana kesehatan yang mirip—seperti provinsi dengan
fasilitas kesehatan pada level menengah—bergabung lebih awal.
Sebaliknya, provinsi dengan jumlah sarana kesehatan yang sangat tinggi
seperti Jawa Timur, Jawa Tengah, Jawa Barat, DKI Jakarta, dan Sumatera
Utara baru bergabung pada height tinggi, menandakan bahwa mereka adalah
provinsi yang paling berbeda dalam dataset. Ini menunjukkan adanya
ketimpangan fasilitas kesehatan antarprovinsi dan adanya kelompok
provinsi yang menjadi outlier.
Pada complete linkage, pola cluster terlihat lebih ketat. Provinsi yang
fasilitas kesehatannya moderat kembali bergabung pada height rendah,
sedangkan provinsi dengan nilai ekstrem tetap terpisah jauh lebih lama
dibanding metode single linkage. DKI Jakarta, Jawa Timur, Jawa Tengah,
dan Jawa Barat jelas tampil sebagai provinsi yang paling berbeda karena
jarak maksimum mereka terhadap provinsi lain cukup besar. Metode ini
memperjelas perbedaan besar antara provinsi dengan fasilitas kesehatan
sangat tinggi dan provinsi lainnya.
Dendrogram average linkage menghasilkan pengelompokan yang lebih
seimbang, tetapi pola intinya tetap sama: provinsi dengan fasilitas
kesehatan rata-rata bergabung lebih cepat, sementara provinsi dengan
sarana kesehatan sangat tinggi tetap membentuk cluster yang bergabung
terakhir. Meskipun lebih moderat, average linkage tetap menunjukkan
adanya kelompok provinsi outlier seperti DKI Jakarta, Jawa Timur, dan
Jawa Tengah yang memiliki fasilitas kesehatan jauh di atas
rata-rata.
Berdasarkan hasil klasterisasi dari tiga dendrogram (Single Linkage, Complete Linkage, dan Average Linkage), terlihat pola yang konsisten bahwa kabupaten/kota dengan fasilitas kesehatan lebih lengkap—seperti jumlah puskesmas tinggi, tenaga kesehatan banyak, dan cakupan layanan yang luas—cenderung berkumpul dalam satu kelompok tersendiri. Sementara itu, wilayah dengan sarana kesehatan terbatas, seperti jumlah fasilitas sedikit, tenaga medis rendah, dan cakupan pelayanan yang masih kurang, juga membentuk klaster tersendiri. Walaupun ketiga metode pengelompokan menghasilkan batas klaster yang sedikit berbeda, struktur umumnya tetap menunjukkan adanya kesenjangan antara daerah yang lebih maju secara fasilitas kesehatan dan daerah yang masih tertinggal. Hal ini menegaskan bahwa distribusi sarana kesehatan di wilayah tersebut belum merata, sehingga memunculkan pola pengelompokan yang jelas berdasarkan tingkat kelengkapan fasilitas.
Berdasarkan hasil klasterisasi yang menunjukkan adanya perbedaan jelas antara wilayah dengan fasilitas kesehatan tinggi dan wilayah dengan fasilitas yang masih terbatas, disarankan agar pemerintah daerah memprioritaskan peningkatan sarana kesehatan pada daerah-daerah yang secara konsisten berada dalam klaster dengan tingkat fasilitas rendah. Upaya ini dapat dilakukan melalui penambahan jumlah puskesmas, peningkatan ketersediaan tenaga medis, serta pengadaan peralatan kesehatan yang lebih memadai agar akses layanan kesehatan semakin merata. Selain itu, distribusi tenaga kesehatan perlu diperkuat di wilayah yang mengalami kekurangan SDM medis, karena faktor ini berkontribusi besar terhadap rendahnya kualitas layanan. Hasil klaster yang diperoleh juga dapat dimanfaatkan sebagai dasar perencanaan anggaran kesehatan, sehingga alokasi dana menjadi lebih tepat sasaran dan efisien. Evaluasi berkala perlu dilakukan untuk memantau perubahan struktur klaster dari waktu ke waktu, guna memastikan intervensi yang diterapkan benar-benar memberikan dampak positif terhadap pemerataan fasilitas kesehatan di seluruh wilayah.
Awaliyah, N., Putri, R., & Sari, D. (2024). Penerapan Analisis Cluster dalam Pengelompokan Data Statistik. Jakarta: Pustaka Data.
Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster Analysis (5th ed.). Wiley.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate Data Analysis (7th ed.). Pearson.
Kaufman, L., & Rousseeuw, P. J. (2005). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.
Rencher, A. C. (2002). Methods of Multivariate Analysis (2nd ed.). Wiley-Interscience.