Pembangunan sektor kesehatan merupakan pilar utama dalam peningkatan kualitas hidup masyarakat Indonesia, di mana ketersediaan infrastruktur kesehatan yang memadai menjadi prasyarat mutlak dalam menjamin layanan publik yang merata dan berkualitas. Secara empiris, pentingnya infrastruktur kesehatan telah didukung oleh berbagai studi. Wardhana & Kharisma (2023), secara eksplisit menyatakan bahwa infrastruktur kesehatan berpengaruh signifikan terhadap angka harapan hidup masyarakat. Lebih lanjut, penelitian oleh Pohan dan Halim memperkuat temuan ini dengan menunjukkan bahwa, secara parsial, variabel Infrastruktur Kesehatan dan Tenaga Medis masing-masing secara signifikan berpengaruh positif terhadap Pembangunan Kesehatan Masyarakat di Provinsi Sumatera Utara. Temuan-temuan ini menegaskan bahwa fasilitas kesehatan seperti jumlah rumah sakit, rumah sakit bersalin, poliklinik, puskesmas, puskesmas pembantu, dan apotek adalah determinan kunci bagi capaian pembangunan kesehatan suatu wilayah. Namun, hingga saat ini, masih terdapat permasalahan fundamental terkait ketidakmerataan pembangunan infrastruktur kesehatan di Indonesia yang berdampak pada disparitas akses dan kualitas layanan antar provinsi, sehingga diperlukan analisis sistematis untuk memetakan dan mengelompokkan wilayah-wilayah yang memiliki profil sarana kesehatan serupa guna menjadi dasar perumusan kebijakan pemerataan yang lebih tepat sasaran.
Data yang digunakan dalam penelitian praktikum ini merupakan data sekunder yang disediakan khusus untuk kegiatan Praktikum Analisis Multivariat I. Data taersebut berfokus pada informasi mengenai Sarana Kesehatan di 34 Provinsi.
| Provinsi | Rumah Sakit | Rumah Sakit Bersalan | Poliklinik | Puskesmas | Puskesmas Pembantu | Apotek |
|---|---|---|---|---|---|---|
| Aceh | 64 | 225 | 258 | 395 | 971 | 346 |
| Sumatera Utara | 199 | 441 | 800 | 661 | 1887 | 740 |
| Sumatera Barat | 54 | 139 | 127 | 294 | 721 | 257 |
| Riau | 55 | 207 | 329 | 272 | 1033 | 351 |
| Jambi | 36 | 151 | 103 | 231 | 654 | 211 |
| … | … | … | … | … | … | … |
| Papua | 41 | 26 | 115 | 422 | 1146 | 125 |
Metode statistika multivariat Analisis Cluster merupakan alat yang sangat efektif untuk mengelompokkan objek (dalam hal ini, provinsi) sedemikian rupa sehingga objek-objek dalam satu kelompok memiliki kemiripan (homogenitas) yang tinggi, sementara objek-objek di antara kelompok-kelompok berbeda memiliki perbedaan (heterogenitas) yang maksimal. Pemilihan metode ini sangat relevan karena data yang dianalisis bersifat multivariat, melibatkan enam variabel sarana kesehatan secara simultan. Analisis Cluster dipilih secara spesifik untuk mengelompokkan provinsi dengan jumlah sarana kesehatan yang tinggi dan yang rendah guna mengetahui pola-pola regional yang terbentuk dari disparitas infrastruktur kesehatan. Hasil klasterisasi ini kemudian dapat digunakan untuk mengidentifikasi secara jelas kelompok provinsi mana yang memiliki infrastruktur kesehatan yang superior dan mana yang masih tertinggal, sehingga kesenjangan tersebut dapat dijadikan fokus utama dalam perumusan rekomendasi kebijakan pemerataan fasilitas kesehatan di Indonesia.
Analisis cluster merupakan pengelompokan objek atau kasus menjadi kelompok-kelompok yang lebih kecil dimana setiap kelompok berisi objek yang mirip satu sama lain (Supranto, 2004 ; Fathia dkk, 2016). Dalam pengelompokannya digunakan suatu ukuran yang dapat menerangkan keserupaan atau kedekatan antar data untuk menerangkan struktur grup sederhana dari data yang kompleks, yaitu ukuran jarak atau similaritas dan ukuran jarak yang sering digunakan adalah ukuran jarak Euclidean (Johnson & Wichern, 1982 ; Fathia dkk, 2016).
Analisis cluster hirarki mencakup dua metode utama: penggabungan (agglomerative) dan pembagian (divisive). Dalam pengelompokan penggabungan, setiap titik data dimulai sebagai klaternya sendiri, dan klaster yang paling mirip secara bertahap digabungkan hingga semua titik data menjadi satu klaster. Algoritma untuk pengelompokan hirarki penggabungan sebagai berikut (Govender & Sivakumar, 2019 ; Indah & Octaviana, 2025):
1). Setiap titik data awalnya diperlakukan sebagai klaster terpisah.
2). Jarak antar cluster dihitung.
3). Dua klaster dengan jarak terkecil digabungkan menjadi satu, memperbarui matriks jarak yang sesuai.
4). Langkah 2 dan 3 diulang hingga hanya tersisa satu klaster, yang berisi semua titik data.
Jarak antar dua klaster ditentukan oleh jarak terpendek antara objek dalam satu klaster dengan objek dalam klaster lainnya.
Jarak antar dua klaster ditentukan oleh jarak terbesar antara objek dalam satu klaster dengan objek dalam klaster lainnya.
Jarak antar dua klaster ditentukan oleh jarak rata-rata antara objek dalam satu klaster dengan objek dalam klaster lainnya.
Menurut Indah & Octaviana (2025), terdapat beberapa kriteria yang dapat membantu peneliti dalam memilih dan memvalidasi jumlah cluster yang optimal dalam teknik pengelompokan hirarki dan non hirarki seperti indeks silhouette, indeks dunn, Davies-Bouldin (DB), koefisien konduktivitas dan koefisien korelasi cophenetic. Indeks Dunn dihitung sebagai rasio jarak minimum antara dua observasi dalam cluster yang berbeda dengan jarak maksimum antara dua observasi dalam klaster yang sama. Indeks Dunn yang lebih tinggi menandakan solusi pengelompokan yang lebih optimal. Nilai koefisien konektivitas berada pada kisaran nol hingga tak terhingga. Koefisien konektivitas yang lebih rendah menunjukkan cluster yang terbentuk lebih baik.
Selain itu, indeks validitas Davies-Bouldin (DB) menghitung nilai rata-rata untuk setiap titik dalam kumpulan data. Nilai DB yang lebih kecil menunjukkan jumlah cluster yang lebih baik. Indeks silhouette mengukur kekompakan dan pemisahan cluster, dengan nilai berkisar dari 1 hingga 1. Nilai -1 menunjukkan pengelompokan yang tidak baik, sedangkan 1 menunjukkan pengelompokan yang baik, dan 0 menunjukkan pengamatan di perbatasan antara dua cluster.
Mengetahui metode linkage (Single, Complete, atau Average) yang paling efektif dalam menghasilkan klaster provinsi sarana kesehatan menggunakan teknik Cluster Hirarki.
Mengidentifikasi dan menganalisis profil klaster provinsi yang terbentuk berdasarkan ketersediaan sarana kesehatan tinggi (baik), sedang, dan rendah.
library(ggplot2)
library(factoextra)
library(cluster)
library(knitr)
library(magrittr)
library(clValid)
library(readxl)
cluster <- read_excel("C:/Users/Alya Shafa Dianti/Downloads/data_sarana_kesehatan.xlsx")
cluster %>% head (34) %>% kable(caption = "Data Sarana Kesehatan")
| Provinsi | Rumah Sakit | Rumah Sakit Bersalin | Poliklinik | Puskesmas | Puskesmas Pembantu | Apotek |
|---|---|---|---|---|---|---|
| ACEH | 64 | 225 | 258 | 395 | 971 | 346 |
| SUMATERA UTARA | 199 | 441 | 800 | 661 | 1887 | 740 |
| SUMATERA BARAT | 54 | 139 | 127 | 294 | 721 | 257 |
| RIAU | 55 | 207 | 329 | 272 | 1033 | 351 |
| JAMBI | 36 | 151 | 103 | 231 | 654 | 211 |
| SUMATERA SELATAN | 65 | 248 | 195 | 403 | 935 | 244 |
| BENGKULU | 20 | 5 | 49 | 190 | 456 | 141 |
| LAMPUNG | 53 | 238 | 307 | 350 | 936 | 356 |
| KEP. BANGKA BELITUNG | 21 | 25 | 25 | 63 | 148 | 73 |
| KEP. RIAU | 23 | 35 | 76 | 88 | 243 | 90 |
| DKI JAKARTA | 119 | 156 | 230 | 257 | 3 | 242 |
| JAWA BARAT | 292 | 1245 | 1670 | 1170 | 1800 | 1758 |
| JAWA TENGAH | 274 | 871 | 1232 | 921 | 1832 | 2068 |
| DI YOGYAKARTA | 61 | 102 | 158 | 126 | 300 | 226 |
| JAWA TIMUR | 317 | 1183 | 1101 | 1036 | 2338 | 1842 |
| BANTEN | 87 | 280 | 467 | 267 | 346 | 402 |
| BALI | 49 | 61 | 71 | 124 | 495 | 214 |
| NUSA TENGGARA BARAT | 31 | 20 | 72 | 173 | 550 | 237 |
| NUSA TENGGARA TIMUR | 48 | 42 | 108 | 414 | 1030 | 172 |
| KALIMANTAN BARAT | 39 | 95 | 98 | 264 | 836 | 123 |
| KALIMANTAN TENGAH | 19 | 63 | 95 | 221 | 1101 | 85 |
| KALIMANTAN SELATAN | 34 | 126 | 131 | 253 | 464 | 162 |
| KALIMANTAN TIMUR | 39 | 56 | 125 | 199 | 727 | 196 |
| KALIMANTAN UTARA | 11 | 4 | 15 | 59 | 179 | 49 |
| SULAWESI UTARA | 46 | 77 | 68 | 217 | 540 | 170 |
| SULAWESI TENGAH | 29 | 58 | 60 | 224 | 698 | 181 |
| SULAWESI SELATAN | 75 | 121 | 180 | 493 | 1394 | 490 |
| SULAWESI TENGGARA | 31 | 56 | 40 | 283 | 557 | 189 |
| GORONTALO | 14 | 2 | 42 | 96 | 250 | 97 |
| SULAWESI BARAT | 10 | 8 | 16 | 100 | 340 | 47 |
| MALUKU | 27 | 20 | 31 | 235 | 481 | 66 |
| MALUKU UTARA | 20 | 11 | 28 | 142 | 277 | 76 |
| PAPUA BARAT | 16 | 10 | 29 | 177 | 495 | 79 |
| PAPUA | 41 | 26 | 115 | 422 | 1146 | 125 |
datastand <- scale(cluster[2:7])
datastand %>% head (5) %>% kable(caption = "Hasil Standarisasi Data Cluster")
| Rumah Sakit | Rumah Sakit Bersalin | Poliklinik | Puskesmas | Puskesmas Pembantu | Apotek |
|---|---|---|---|---|---|
| -0.0526359 | 0.1186997 | 0.0246767 | 0.2903606 | 0.3647786 | -0.0198266 |
| 1.6368669 | 0.8200116 | 1.4413175 | 1.2964990 | 2.0230279 | 0.7590507 |
| -0.1777843 | -0.1605263 | -0.3177218 | -0.0916694 | -0.0878003 | -0.1957659 |
| -0.1652694 | 0.0602571 | 0.2102514 | -0.1748839 | 0.4770182 | -0.0099424 |
| -0.4030513 | -0.1215645 | -0.3804512 | -0.3299653 | -0.2090915 | -0.2867008 |
n <- dim(datastand)
data <- data.matrix(datastand,1:6)
rownames(data) = c(1:nrow(data))
ds <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust",
hc_metric = "euclidean", hc_method = "single")
d <- cophenetic(hc)
cor.sing <- cor(ds,d)
cor.sing
## [1] 0.96096
dc <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust",
hc_metric = "euclidean", hc_method = "complete")
d <- cophenetic(hc)
cor.comp <- cor(dc,d)
cor.comp
## [1] 0.9340591
da <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust",
hc_metric = "euclidean", hc_method = "average")
d <- cophenetic(hc)
cor.ave <- cor(da,d)
cor.ave
## [1] 0.9416371
# korelasi cophenetic antar metode
datastand <- dist(datastand)
methods <- c("single", "complete", "average", "ward.D2")
cor_values <- sapply(methods, function(m) {
hc_all <- hclust(datastand, method = m)
d_coph <- cophenetic(hc_all)
cor(datastand, d_coph)
})
cor_values
## single complete average ward.D2
## 0.9609600 0.9340591 0.9416371 0.9340157
inval <- clValid(data,2:7, clMethods = "hierarchical",
validation = "internal", metric = "euclidean", method ="single")
summary(inval)
##
## Clustering Methods:
## hierarchical
##
## Cluster sizes:
## 2 3 4 5 6 7
##
## Validation Measures:
## 2 3 4 5 6 7
##
## hierarchical Connectivity 4.4536 7.2159 9.7159 11.7159 15.1448 17.5738
## Dunn 0.6497 0.9032 0.6219 0.5359 0.3589 0.3490
## Silhouette 0.7993 0.6725 0.6351 0.6253 0.2632 0.2633
##
## Optimal Scores:
##
## Score Method Clusters
## Connectivity 4.4536 hierarchical 2
## Dunn 0.9032 hierarchical 3
## Silhouette 0.7993 hierarchical 2
clus_hier <- eclust(data, FUNcluster = "hclust",
k = 3, hc_methode = "single",
graph = TRUE)
dend <- fviz_dend(clus_hier, rect = TRUE,
show_labels = TRUE, cex = 0.5)
idclus <- clus_hier$cluster
idobs <- as.numeric(names(idclus))
print(dend)
link_centroid <- eclust(cluster, FUNcluster = "hclust", k = 3, hc_method = "single", graph = TRUE)
cluster_member <- link_centroid$cluster
cluster_member
## [1] 1 2 1 1 1 1 1 1 1 1 1 3 3 1 3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
n <- length(idclus)
c1 <- vector()
c2 <- vector()
c3 <- vector()
for (i in 1:n){
if(idclus[i] == 1){
c1 = c(c1, i)
}
else if(idclus[i] == 2){
c2 = c(c2, i)
}
else if(idclus[i] == 3){
c3 = c(c3, i)
}
}
clustering = list(Cluster1 = c1, Cluster2 = c2, Cluster3 = c3)
print(clustering)
## $Cluster1
## [1] 1 2 4 6 8 19 21 27 34
##
## $Cluster2
## [1] 3 5 7 9 10 11 14 16 17 18 20 22 23 24 25 26 28 29 30 31 32 33
##
## $Cluster3
## [1] 12 13 15
karakteristik_cluster <- aggregate(cluster, list(cluster_member), mean)
karakteristik_cluster
## Group.1 Provinsi Rumah Sakit Rumah Sakit Bersalin Poliklinik Puskesmas
## 1 1 NA 41.23333 88.900 121.600 234.400
## 2 2 NA 199.00000 441.000 800.000 661.000
## 3 3 NA 294.33333 1099.667 1334.333 1042.333
## Puskesmas Pembantu Apotek
## 1 610.2 189.900
## 2 1887.0 740.000
## 3 1990.0 1889.333
Berdasarkan hasil perhitungan korelasi cophentic antar metode linkage diperoleh:
| Single Linkage | Complete Linkage | Average Linkage | Ward.D2 Linkage |
|---|---|---|---|
| 0.9609600 | 0.9340591 | 0.9416371 | 0.9340157 |
Terlihat bahwa nilai cophenetic correlation coefficient tertinggi yang mendekati 1 adalah metode single linkage yaitu 0.9609600 artinya pada analisis kluster hirarki metode terbaik adalah single linkage.
Berdasarkan hasil perhitungan connectovity, dunn, dan silhouette diperoleh:
| Indeks | Score | Method | Cluster |
|---|---|---|---|
| Connectivity | 4.4536 | hierarchical | 2 |
| Dunn | 0.9032 | hierarchical | 3 |
| Silhouette | 0.7993 | hierarchical | 2 |
Terlihat bahwa indeks connectivity dan silhouette menghasilkan 2 kluster, sedangkan pada indeks silhouette menghasilkan 3 kluster. Karena penelitian ini bertujuan untuk mengetahui kelompok provinsi dengan sarana kesehatan tinggi, sedang, dan rendah sehingga digunakan 3 kluster.
Berdasarkan hasil klusterisasi dengan metode jarak euclidien dan single linkage diperoleh 3 kluster dengan masing-masing kluster memiliki karakteristik sebagai berikut:
| Kluster | n | Rumah Sakit | Rumah Sakit Bersalin | Poliklinik | Puskesmas | Puskesmas Pembantu | Apotek |
|---|---|---|---|---|---|---|---|
| 1 | 9 | 41.233 | 88.900 | 121.600 | 234.400 | 610.200 | 189.900 |
| 2 | 22 | 199.000 | 441.000 | 800.000 | 661.000 | 1887.000 | 740.000 |
| 3 | 3 | 294.333 | 1099.667 | 1334.333 | 1042.333 | 1990.0 | 1899.333 |
Klaster 1, yang terdiri dari 9 provinsi, secara jelas merepresentasikan kelompok wilayah dengan ketersediaan sarana kesehatan yang paling rendah di semua jenis fasilitas. Nilai rata-rata untuk sarana rujukan seperti Rumah Sakit (42), Rumah Sakit Bersalin (89), Poliklinik (122), Puskesmas (235), dan Apotek (190) menunjukkan keterbatasan akses ke layanan kesehatan tingkat lanjut. Meskipun fasilitas rujukan rendah, jumlah Puskesmas Pembantu (611) relatif tinggi dibandingkan dengan fasilitas lainnya, mengindikasikan bahwa upaya penyediaan layanan kesehatan di klaster ini mungkin lebih difokuskan pada jangkauan layanan primer hingga ke wilayah terpencil, sebagai respons terhadap tantangan geografis dan keterbatasan anggaran di provinsi-provinsi yang umumnya tertinggal dalam pembangunan infrastruktur kesehatan secara menyeluruh.
Klaster 2 merupakan kelompok terbesar yang mencakup 22 provinsi, merefleksikan kondisi ketersediaan sarana kesehatan pada level menengah yang cukup stabil. Nilai rata-rata fasilitas di klaster ini menunjukkan peningkatan signifikan dibandingkan Klaster 1, dengan Rumah Sakit (200), Rumah Sakit Bersalin (441), Poliklinik (800), Puskesmas (661), Puskesmas Pembantu (1887), dan Apotek (740) yang mengindikasikan kemampuan provinsi untuk menyediakan layanan rujukan dan penunjang dalam jumlah yang memadai. Kelompok ini kemungkinan besar terdiri dari provinsi-provinsi yang sudah mencapai tingkat pembangunan yang seimbang atau berfungsi sebagai pusat-pusat regional yang sedang berkembang, memastikan mayoritas penduduk memiliki akses yang wajar terhadap berbagai jenis fasilitas, mulai dari Puskesmas hingga Rumah Sakit.
Klaster 3, yang hanya terdiri dari 3 provinsi, adalah kelompok dengan tingkat ketersediaan sarana kesehatan tertinggi atau unggul dalam semua variabel. Klaster ini menunjukkan dominasi fasilitas kesehatan tingkat rujukan dan penunjang, seperti Rumah Sakit Bersalin (1100), Poliklinik (1335), Puskesmas (1043), Puskesmas Pembantu (1990), dan Apotek (1900), yang nilainya jauh melampaui kedua klaster lainnya. Angka-angka yang sangat tinggi ini mengindikasikan bahwa provinsi-provinsi di klaster ini adalah sentra metropolitan dan pusat ekonomi utama dengan kepadatan populasi dan tingkat urbanisasi yang sangat tinggi, sehingga memiliki kapasitas dan kebutuhan untuk menyediakan infrastruktur kesehatan terlengkap yang tidak hanya melayani penduduknya sendiri tetapi juga berfungsi sebagai rujukan bagi provinsi-provinsi lain.
Metode linkage yang menghasilkan nilai korelasi cophenetic tertinggi adalah single linkage. Hal ini mengindikasikan bahwa metode linkage yang paling efektif digunakan untuk kasus ini adalah single linkage, karena menunjukkan bahwa jarak antar observasi dalam klasterisasi paling mirip dengan jarak awal data mentah. Berdasarkan hasil klasterisasi dengan jarak euclidean dan Single linkage, metode ini terbukti berhasil membentuk klaster yang sangat ekstrem dimana klaster 1 dan klaster 3 sangat jauh berbeda, sehingga hasil klasterisasi menunjukkan efektifitas yang sangat tinggi. Meskipun demikian, perlu dicatat bahwa metode single linkage memiliki potensi kerentanan terhadap efek rantai.
Berdasarkan analissi klasterisasi, provinsi-provinsi di Indonesia terbagi menjadi tiga kelompok utama yang menunjukkan disparitas infrastruktur kesehatan yang signifikan. Klaster 3 merupakan kelompok terkecil dengan 3 provinsi yang memiliki ketersediaan sarana kesehatan sangat tinggi di semua variabel. Sebaliknya, klaster 1 yang terdiri dari 9 provinsi menunjukkan ketersediaan sarana kesehatan terendag yang mengindikasikan perlunya intervensi kebijakan pemerataan yang cepat. Mayoritas provinsi berada di klaster 2 yang terdiri dari 22 provinsi yang memiliki profin infrastruktur yang cukup baik dan seimbang. Pembagian klater ini secara jelas memetakan ketidakmerataan pembangunan infrastruktur kesehatan antara pusat-pusat metropolitan yang unggul dan wilayah-wilayah yang masih tertinggal.
Disarankan agar pemerintah memfokuskan prioritas kebijakan dan alokasi anggaran pembangunan infrastruktur kesehatan secara khusus pada provinsi-provinsi di Klaster 1 (Kelompok Sarana Kesehatan Terbatas) untuk mengatasi disparitas ekstrem yang ditemukan, terutama dengan meningkatkan jumlah Rumah Sakit Bersalin, Poliklinik, dan Apotek. Selain intervensi pembangunan, perlu dilakukan validasi metodologi lebih lanjut pada penelitian mendatang, yaitu dengan membandingkan hasil klasterisasi dari Single Linkage dengan metode lain seperti Average Linkage untuk memastikan stabilitas dan keandalan klasterisasi yang dihasilkan, mengingat potensi kerentanan Single Linkage terhadap efek rantai (chaining effect).
Fathia, A. N., & dkk. (2016). Analisis Klaster Kecamatan di Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage. Jurnal Gaussian, 801-810.
Indah, Y. M., & Octaviana, S. (2025). Analisis Perbandingan Metode Klaster Hierarki dan Non Hierarki Terhadap Tingkat Pengangguran di Pulau Jawa Tahun 2023. Journal Of Statistics Theory and Aplications, 92-104.
Pohan, M., & Halim, R. (t.thn.). Analisis Ketersediaan Infrastruktur Kesehatan dan Aksebilitas Terhadap Pembangunan Kesehatan Penduduk di Provinsi Sumatera Utara. 77-91.
Wardhana, A., & Kharisma, B. (2023). Infrastruktur dan Pengeluaran Bidang Kesehatan Terhadap Kualitas Hidup di Indonesia. Jurnal Edukasi (Ekonomi, Pendidikan da Akuntansi), 145-156.
Yudhastria, H. N. (2024, November 27). Analisis Cluster Hierarki. Diambil kembali dari rstudio pubs static: https://rstudio-pubs-static.s3.amazonaws.com/1250370_847f879696b445808bbbc3164f75b63e.html