BAB I Pendahuluan

1.1 Latar Belakang

Pembangunan sektor kesehatan merupakan pilar utama dalam peningkatan kualitas hidup masyarakat Indonesia, di mana ketersediaan infrastruktur kesehatan yang memadai menjadi prasyarat mutlak dalam menjamin layanan publik yang merata dan berkualitas. Secara empiris, pentingnya infrastruktur kesehatan telah didukung oleh berbagai studi. Wardhana & Kharisma (2023), secara eksplisit menyatakan bahwa infrastruktur kesehatan berpengaruh signifikan terhadap angka harapan hidup masyarakat. Lebih lanjut, penelitian oleh Pohan dan Halim memperkuat temuan ini dengan menunjukkan bahwa, secara parsial, variabel Infrastruktur Kesehatan dan Tenaga Medis masing-masing secara signifikan berpengaruh positif terhadap Pembangunan Kesehatan Masyarakat di Provinsi Sumatera Utara. Temuan-temuan ini menegaskan bahwa fasilitas kesehatan seperti jumlah rumah sakit, rumah sakit bersalin, poliklinik, puskesmas, puskesmas pembantu, dan apotek adalah determinan kunci bagi capaian pembangunan kesehatan suatu wilayah. Namun, hingga saat ini, masih terdapat permasalahan fundamental terkait ketidakmerataan pembangunan infrastruktur kesehatan di Indonesia yang berdampak pada disparitas akses dan kualitas layanan antar provinsi, sehingga diperlukan analisis sistematis untuk memetakan dan mengelompokkan wilayah-wilayah yang memiliki profil sarana kesehatan serupa guna menjadi dasar perumusan kebijakan pemerataan yang lebih tepat sasaran.

1.2 Data yang Digunakan

Data yang digunakan dalam penelitian praktikum ini merupakan data sekunder yang disediakan khusus untuk kegiatan Praktikum Analisis Multivariat I. Data taersebut berfokus pada informasi mengenai Sarana Kesehatan di 34 Provinsi.

Provinsi Rumah Sakit Rumah Sakit Bersalan Poliklinik Puskesmas Puskesmas Pembantu Apotek
Aceh 64 225 258 395 971 346
Sumatera Utara 199 441 800 661 1887 740
Sumatera Barat 54 139 127 294 721 257
Riau 55 207 329 272 1033 351
Jambi 36 151 103 231 654 211
Papua 41 26 115 422 1146 125

1.3 Latar Belakang Metode

Metode statistika multivariat Analisis Cluster merupakan alat yang sangat efektif untuk mengelompokkan objek (dalam hal ini, provinsi) sedemikian rupa sehingga objek-objek dalam satu kelompok memiliki kemiripan (homogenitas) yang tinggi, sementara objek-objek di antara kelompok-kelompok berbeda memiliki perbedaan (heterogenitas) yang maksimal. Pemilihan metode ini sangat relevan karena data yang dianalisis bersifat multivariat, melibatkan enam variabel sarana kesehatan secara simultan. Analisis Cluster dipilih secara spesifik untuk mengelompokkan provinsi dengan jumlah sarana kesehatan yang tinggi dan yang rendah guna mengetahui pola-pola regional yang terbentuk dari disparitas infrastruktur kesehatan. Hasil klasterisasi ini kemudian dapat digunakan untuk mengidentifikasi secara jelas kelompok provinsi mana yang memiliki infrastruktur kesehatan yang superior dan mana yang masih tertinggal, sehingga kesenjangan tersebut dapat dijadikan fokus utama dalam perumusan rekomendasi kebijakan pemerataan fasilitas kesehatan di Indonesia.

1.4 Tinjaun Pustaka Metode

1.4.1 Analisis Klaster

Analisis cluster merupakan pengelompokan objek atau kasus menjadi kelompok-kelompok yang lebih kecil dimana setiap kelompok berisi objek yang mirip satu sama lain (Supranto, 2004 ; Fathia dkk, 2016). Dalam pengelompokannya digunakan suatu ukuran yang dapat menerangkan keserupaan atau kedekatan antar data untuk menerangkan struktur grup sederhana dari data yang kompleks, yaitu ukuran jarak atau similaritas dan ukuran jarak yang sering digunakan adalah ukuran jarak Euclidean (Johnson & Wichern, 1982 ; Fathia dkk, 2016).

1.4.2 Klaster Hierarki

Analisis cluster hirarki mencakup dua metode utama: penggabungan (agglomerative) dan pembagian (divisive). Dalam pengelompokan penggabungan, setiap titik data dimulai sebagai klaternya sendiri, dan klaster yang paling mirip secara bertahap digabungkan hingga semua titik data menjadi satu klaster. Algoritma untuk pengelompokan hirarki penggabungan sebagai berikut (Govender & Sivakumar, 2019 ; Indah & Octaviana, 2025):

1). Setiap titik data awalnya diperlakukan sebagai klaster terpisah.

2). Jarak antar cluster dihitung.

3). Dua klaster dengan jarak terkecil digabungkan menjadi satu, memperbarui matriks jarak yang sesuai.

4). Langkah 2 dan 3 diulang hingga hanya tersisa satu klaster, yang berisi semua titik data.

1.4.3 Metode Single Linkage

Jarak antar dua klaster ditentukan oleh jarak terpendek antara objek dalam satu klaster dengan objek dalam klaster lainnya.

1.4.4 Metode Complete Linkage

Jarak antar dua klaster ditentukan oleh jarak terbesar antara objek dalam satu klaster dengan objek dalam klaster lainnya.

1.4.5 Metode Average Linkage

Jarak antar dua klaster ditentukan oleh jarak rata-rata antara objek dalam satu klaster dengan objek dalam klaster lainnya.

1.4.6 Penentuan Metode Linkage Terbaik

Menurut Indah & Octaviana (2025), terdapat beberapa kriteria yang dapat membantu peneliti dalam memilih dan memvalidasi jumlah cluster yang optimal dalam teknik pengelompokan hirarki dan non hirarki seperti indeks silhouette, indeks dunn, Davies-Bouldin (DB), koefisien konduktivitas dan koefisien korelasi cophenetic. Indeks Dunn dihitung sebagai rasio jarak minimum antara dua observasi dalam cluster yang berbeda dengan jarak maksimum antara dua observasi dalam klaster yang sama. Indeks Dunn yang lebih tinggi menandakan solusi pengelompokan yang lebih optimal. Nilai koefisien konektivitas berada pada kisaran nol hingga tak terhingga. Koefisien konektivitas yang lebih rendah menunjukkan cluster yang terbentuk lebih baik.

Selain itu, indeks validitas Davies-Bouldin (DB) menghitung nilai rata-rata untuk setiap titik dalam kumpulan data. Nilai DB yang lebih kecil menunjukkan jumlah cluster yang lebih baik. Indeks silhouette mengukur kekompakan dan pemisahan cluster, dengan nilai berkisar dari 1 hingga 1. Nilai -1 menunjukkan pengelompokan yang tidak baik, sedangkan 1 menunjukkan pengelompokan yang baik, dan 0 menunjukkan pengamatan di perbatasan antara dua cluster.

1.5 Tujuan

  1. Mengetahui metode linkage (Single, Complete, atau Average) yang paling efektif dalam menghasilkan klaster provinsi sarana kesehatan menggunakan teknik Cluster Hirarki.

  2. Mengidentifikasi dan menganalisis profil klaster provinsi yang terbentuk berdasarkan ketersediaan sarana kesehatan tinggi (baik), sedang, dan rendah.

BAB II Source Code

2.1 Library

library(ggplot2)
library(factoextra)
library(cluster)
library(knitr)
library(magrittr)
library(clValid)
library(readxl)

2.2 Data

cluster <- read_excel("C:/Users/Alya Shafa Dianti/Downloads/data_sarana_kesehatan.xlsx")
cluster %>% head (34) %>% kable(caption = "Data Sarana Kesehatan")
Data Sarana Kesehatan
Provinsi Rumah Sakit Rumah Sakit Bersalin Poliklinik Puskesmas Puskesmas Pembantu Apotek
ACEH 64 225 258 395 971 346
SUMATERA UTARA 199 441 800 661 1887 740
SUMATERA BARAT 54 139 127 294 721 257
RIAU 55 207 329 272 1033 351
JAMBI 36 151 103 231 654 211
SUMATERA SELATAN 65 248 195 403 935 244
BENGKULU 20 5 49 190 456 141
LAMPUNG 53 238 307 350 936 356
KEP. BANGKA BELITUNG 21 25 25 63 148 73
KEP. RIAU 23 35 76 88 243 90
DKI JAKARTA 119 156 230 257 3 242
JAWA BARAT 292 1245 1670 1170 1800 1758
JAWA TENGAH 274 871 1232 921 1832 2068
DI YOGYAKARTA 61 102 158 126 300 226
JAWA TIMUR 317 1183 1101 1036 2338 1842
BANTEN 87 280 467 267 346 402
BALI 49 61 71 124 495 214
NUSA TENGGARA BARAT 31 20 72 173 550 237
NUSA TENGGARA TIMUR 48 42 108 414 1030 172
KALIMANTAN BARAT 39 95 98 264 836 123
KALIMANTAN TENGAH 19 63 95 221 1101 85
KALIMANTAN SELATAN 34 126 131 253 464 162
KALIMANTAN TIMUR 39 56 125 199 727 196
KALIMANTAN UTARA 11 4 15 59 179 49
SULAWESI UTARA 46 77 68 217 540 170
SULAWESI TENGAH 29 58 60 224 698 181
SULAWESI SELATAN 75 121 180 493 1394 490
SULAWESI TENGGARA 31 56 40 283 557 189
GORONTALO 14 2 42 96 250 97
SULAWESI BARAT 10 8 16 100 340 47
MALUKU 27 20 31 235 481 66
MALUKU UTARA 20 11 28 142 277 76
PAPUA BARAT 16 10 29 177 495 79
PAPUA 41 26 115 422 1146 125

2.3 Standarisasi Data

datastand <- scale(cluster[2:7])
datastand %>% head (5) %>% kable(caption = "Hasil Standarisasi Data Cluster")
Hasil Standarisasi Data Cluster
Rumah Sakit Rumah Sakit Bersalin Poliklinik Puskesmas Puskesmas Pembantu Apotek
-0.0526359 0.1186997 0.0246767 0.2903606 0.3647786 -0.0198266
1.6368669 0.8200116 1.4413175 1.2964990 2.0230279 0.7590507
-0.1777843 -0.1605263 -0.3177218 -0.0916694 -0.0878003 -0.1957659
-0.1652694 0.0602571 0.2102514 -0.1748839 0.4770182 -0.0099424
-0.4030513 -0.1215645 -0.3804512 -0.3299653 -0.2090915 -0.2867008
n <- dim(datastand)
data <- data.matrix(datastand,1:6)
rownames(data) = c(1:nrow(data))

2.4 Single Linkage

ds <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust", 
             hc_metric = "euclidean", hc_method = "single")
d <- cophenetic(hc)
cor.sing <- cor(ds,d)
cor.sing
## [1] 0.96096

2.5 Complete Linkage

dc <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust", 
             hc_metric = "euclidean", hc_method = "complete")
d <- cophenetic(hc)
cor.comp <- cor(dc,d)
cor.comp
## [1] 0.9340591

2.6 Average Linkage

da <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust", 
             hc_metric = "euclidean", hc_method = "average")
d <- cophenetic(hc)
cor.ave <- cor(da,d)
cor.ave
## [1] 0.9416371

2.7 Penentuan Linkage Terbaik

# korelasi cophenetic antar metode
datastand <- dist(datastand)
methods <- c("single", "complete", "average", "ward.D2")
cor_values <- sapply(methods, function(m) {
  hc_all <- hclust(datastand, method = m)
  d_coph <- cophenetic(hc_all)
  cor(datastand, d_coph)
})
cor_values
##    single  complete   average   ward.D2 
## 0.9609600 0.9340591 0.9416371 0.9340157

2.8 Validasi Jumlah CLuster

inval <- clValid(data,2:7, clMethods = "hierarchical",
          validation = "internal", metric = "euclidean", method ="single")
summary(inval)
## 
## Clustering Methods:
##  hierarchical 
## 
## Cluster sizes:
##  2 3 4 5 6 7 
## 
## Validation Measures:
##                                  2       3       4       5       6       7
##                                                                           
## hierarchical Connectivity   4.4536  7.2159  9.7159 11.7159 15.1448 17.5738
##              Dunn           0.6497  0.9032  0.6219  0.5359  0.3589  0.3490
##              Silhouette     0.7993  0.6725  0.6351  0.6253  0.2632  0.2633
## 
## Optimal Scores:
## 
##              Score  Method       Clusters
## Connectivity 4.4536 hierarchical 2       
## Dunn         0.9032 hierarchical 3       
## Silhouette   0.7993 hierarchical 2

2.9 Visualisasi Dendogram

clus_hier <- eclust(data, FUNcluster = "hclust",
                    k = 3, hc_methode = "single",
                    graph = TRUE)
dend <- fviz_dend(clus_hier, rect = TRUE, 
                  show_labels = TRUE, cex = 0.5)
idclus <- clus_hier$cluster
idobs <- as.numeric(names(idclus))
print(dend)

link_centroid <- eclust(cluster, FUNcluster = "hclust", k = 3, hc_method = "single", graph = TRUE)
cluster_member <- link_centroid$cluster
cluster_member
##  [1] 1 2 1 1 1 1 1 1 1 1 1 3 3 1 3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
n <- length(idclus)
c1 <- vector()
c2 <- vector()
c3 <- vector()
for (i in 1:n){
  if(idclus[i] == 1){ 
    c1 = c(c1, i) 
  }
  else if(idclus[i] == 2){ 
    c2 = c(c2, i) 
  }
  else if(idclus[i] == 3){ 
    c3 = c(c3, i) 
  }
}

clustering = list(Cluster1 = c1, Cluster2 = c2, Cluster3 = c3) 
print(clustering)
## $Cluster1
## [1]  1  2  4  6  8 19 21 27 34
## 
## $Cluster2
##  [1]  3  5  7  9 10 11 14 16 17 18 20 22 23 24 25 26 28 29 30 31 32 33
## 
## $Cluster3
## [1] 12 13 15

2.10 Karakteristik Klaster

karakteristik_cluster <- aggregate(cluster, list(cluster_member), mean)
karakteristik_cluster
##   Group.1 Provinsi Rumah Sakit Rumah Sakit Bersalin Poliklinik Puskesmas
## 1       1       NA    41.23333               88.900    121.600   234.400
## 2       2       NA   199.00000              441.000    800.000   661.000
## 3       3       NA   294.33333             1099.667   1334.333  1042.333
##   Puskesmas Pembantu   Apotek
## 1              610.2  189.900
## 2             1887.0  740.000
## 3             1990.0 1889.333

BAB III Hasil dan Pembahasan

3.1 Penentuan Linkage Terbaik

Berdasarkan hasil perhitungan korelasi cophentic antar metode linkage diperoleh:

Single Linkage Complete Linkage Average Linkage Ward.D2 Linkage
0.9609600 0.9340591 0.9416371 0.9340157

Terlihat bahwa nilai cophenetic correlation coefficient tertinggi yang mendekati 1 adalah metode single linkage yaitu 0.9609600 artinya pada analisis kluster hirarki metode terbaik adalah single linkage.

3.2 Validasi Jumlah Klaster

Berdasarkan hasil perhitungan connectovity, dunn, dan silhouette diperoleh:

Indeks Score Method Cluster
Connectivity 4.4536 hierarchical 2
Dunn 0.9032 hierarchical 3
Silhouette 0.7993 hierarchical 2

Terlihat bahwa indeks connectivity dan silhouette menghasilkan 2 kluster, sedangkan pada indeks silhouette menghasilkan 3 kluster. Karena penelitian ini bertujuan untuk mengetahui kelompok provinsi dengan sarana kesehatan tinggi, sedang, dan rendah sehingga digunakan 3 kluster.

3.3 Hasil Klasterisasi

Berdasarkan hasil klusterisasi dengan metode jarak euclidien dan single linkage diperoleh 3 kluster dengan masing-masing kluster memiliki karakteristik sebagai berikut:

Kluster n Rumah Sakit Rumah Sakit Bersalin Poliklinik Puskesmas Puskesmas Pembantu Apotek
1 9 41.233 88.900 121.600 234.400 610.200 189.900
2 22 199.000 441.000 800.000 661.000 1887.000 740.000
3 3 294.333 1099.667 1334.333 1042.333 1990.0 1899.333
  • Klaster 1, yang terdiri dari 9 provinsi, secara jelas merepresentasikan kelompok wilayah dengan ketersediaan sarana kesehatan yang paling rendah di semua jenis fasilitas. Nilai rata-rata untuk sarana rujukan seperti Rumah Sakit (42), Rumah Sakit Bersalin (89), Poliklinik (122), Puskesmas (235), dan Apotek (190) menunjukkan keterbatasan akses ke layanan kesehatan tingkat lanjut. Meskipun fasilitas rujukan rendah, jumlah Puskesmas Pembantu (611) relatif tinggi dibandingkan dengan fasilitas lainnya, mengindikasikan bahwa upaya penyediaan layanan kesehatan di klaster ini mungkin lebih difokuskan pada jangkauan layanan primer hingga ke wilayah terpencil, sebagai respons terhadap tantangan geografis dan keterbatasan anggaran di provinsi-provinsi yang umumnya tertinggal dalam pembangunan infrastruktur kesehatan secara menyeluruh.

  • Klaster 2 merupakan kelompok terbesar yang mencakup 22 provinsi, merefleksikan kondisi ketersediaan sarana kesehatan pada level menengah yang cukup stabil. Nilai rata-rata fasilitas di klaster ini menunjukkan peningkatan signifikan dibandingkan Klaster 1, dengan Rumah Sakit (200), Rumah Sakit Bersalin (441), Poliklinik (800), Puskesmas (661), Puskesmas Pembantu (1887), dan Apotek (740) yang mengindikasikan kemampuan provinsi untuk menyediakan layanan rujukan dan penunjang dalam jumlah yang memadai. Kelompok ini kemungkinan besar terdiri dari provinsi-provinsi yang sudah mencapai tingkat pembangunan yang seimbang atau berfungsi sebagai pusat-pusat regional yang sedang berkembang, memastikan mayoritas penduduk memiliki akses yang wajar terhadap berbagai jenis fasilitas, mulai dari Puskesmas hingga Rumah Sakit.

  • Klaster 3, yang hanya terdiri dari 3 provinsi, adalah kelompok dengan tingkat ketersediaan sarana kesehatan tertinggi atau unggul dalam semua variabel. Klaster ini menunjukkan dominasi fasilitas kesehatan tingkat rujukan dan penunjang, seperti Rumah Sakit Bersalin (1100), Poliklinik (1335), Puskesmas (1043), Puskesmas Pembantu (1990), dan Apotek (1900), yang nilainya jauh melampaui kedua klaster lainnya. Angka-angka yang sangat tinggi ini mengindikasikan bahwa provinsi-provinsi di klaster ini adalah sentra metropolitan dan pusat ekonomi utama dengan kepadatan populasi dan tingkat urbanisasi yang sangat tinggi, sehingga memiliki kapasitas dan kebutuhan untuk menyediakan infrastruktur kesehatan terlengkap yang tidak hanya melayani penduduknya sendiri tetapi juga berfungsi sebagai rujukan bagi provinsi-provinsi lain.

Bab IV Penutup

4.1 Kesimpulan

Metode linkage yang menghasilkan nilai korelasi cophenetic tertinggi adalah single linkage. Hal ini mengindikasikan bahwa metode linkage yang paling efektif digunakan untuk kasus ini adalah single linkage, karena menunjukkan bahwa jarak antar observasi dalam klasterisasi paling mirip dengan jarak awal data mentah. Berdasarkan hasil klasterisasi dengan jarak euclidean dan Single linkage, metode ini terbukti berhasil membentuk klaster yang sangat ekstrem dimana klaster 1 dan klaster 3 sangat jauh berbeda, sehingga hasil klasterisasi menunjukkan efektifitas yang sangat tinggi. Meskipun demikian, perlu dicatat bahwa metode single linkage memiliki potensi kerentanan terhadap efek rantai.

Berdasarkan analissi klasterisasi, provinsi-provinsi di Indonesia terbagi menjadi tiga kelompok utama yang menunjukkan disparitas infrastruktur kesehatan yang signifikan. Klaster 3 merupakan kelompok terkecil dengan 3 provinsi yang memiliki ketersediaan sarana kesehatan sangat tinggi di semua variabel. Sebaliknya, klaster 1 yang terdiri dari 9 provinsi menunjukkan ketersediaan sarana kesehatan terendag yang mengindikasikan perlunya intervensi kebijakan pemerataan yang cepat. Mayoritas provinsi berada di klaster 2 yang terdiri dari 22 provinsi yang memiliki profin infrastruktur yang cukup baik dan seimbang. Pembagian klater ini secara jelas memetakan ketidakmerataan pembangunan infrastruktur kesehatan antara pusat-pusat metropolitan yang unggul dan wilayah-wilayah yang masih tertinggal.

4.2 Saran

Disarankan agar pemerintah memfokuskan prioritas kebijakan dan alokasi anggaran pembangunan infrastruktur kesehatan secara khusus pada provinsi-provinsi di Klaster 1 (Kelompok Sarana Kesehatan Terbatas) untuk mengatasi disparitas ekstrem yang ditemukan, terutama dengan meningkatkan jumlah Rumah Sakit Bersalin, Poliklinik, dan Apotek. Selain intervensi pembangunan, perlu dilakukan validasi metodologi lebih lanjut pada penelitian mendatang, yaitu dengan membandingkan hasil klasterisasi dari Single Linkage dengan metode lain seperti Average Linkage untuk memastikan stabilitas dan keandalan klasterisasi yang dihasilkan, mengingat potensi kerentanan Single Linkage terhadap efek rantai (chaining effect).

4.3 Daftar Pustaka

Fathia, A. N., & dkk. (2016). Analisis Klaster Kecamatan di Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage. Jurnal Gaussian, 801-810.

Indah, Y. M., & Octaviana, S. (2025). Analisis Perbandingan Metode Klaster Hierarki dan Non Hierarki Terhadap Tingkat Pengangguran di Pulau Jawa Tahun 2023. Journal Of Statistics Theory and Aplications, 92-104.

Pohan, M., & Halim, R. (t.thn.). Analisis Ketersediaan Infrastruktur Kesehatan dan Aksebilitas Terhadap Pembangunan Kesehatan Penduduk di Provinsi Sumatera Utara. 77-91.

Wardhana, A., & Kharisma, B. (2023). Infrastruktur dan Pengeluaran Bidang Kesehatan Terhadap Kualitas Hidup di Indonesia. Jurnal Edukasi (Ekonomi, Pendidikan da Akuntansi), 145-156.

Yudhastria, H. N. (2024, November 27). Analisis Cluster Hierarki. Diambil kembali dari rstudio pubs static: https://rstudio-pubs-static.s3.amazonaws.com/1250370_847f879696b445808bbbc3164f75b63e.html