BAB I Pendahuluan

1.1 Latar Belakang

Pembangunan sektor kesehatan merupakan pilar utama dalam peningkatan kualitas hidup masyarakat Indonesia, di mana ketersediaan infrastruktur kesehatan yang memadai menjadi prasyarat mutlak dalam menjamin layanan publik yang merata dan berkualitas. Secara empiris, pentingnya infrastruktur kesehatan telah didukung oleh berbagai studi. Wardhana & Kharisma (2023), secara eksplisit menyatakan bahwa infrastruktur kesehatan berpengaruh signifikan terhadap angka harapan hidup masyarakat. Lebih lanjut, penelitian oleh Pohan dan Halim memperkuat temuan ini dengan menunjukkan bahwa, secara parsial, variabel Infrastruktur Kesehatan dan Tenaga Medis masing-masing secara signifikan berpengaruh positif terhadap Pembangunan Kesehatan Masyarakat di Provinsi Sumatera Utara. Temuan-temuan ini menegaskan bahwa fasilitas kesehatan seperti jumlah rumah sakit, rumah sakit bersalin, poliklinik, puskesmas, puskesmas pembantu, dan apotek adalah determinan kunci bagi capaian pembangunan kesehatan suatu wilayah. Namun, hingga saat ini, masih terdapat permasalahan fundamental terkait ketidakmerataan pembangunan infrastruktur kesehatan di Indonesia yang berdampak pada disparitas akses dan kualitas layanan antar provinsi, sehingga diperlukan analisis sistematis untuk memetakan dan mengelompokkan wilayah-wilayah yang memiliki profil sarana kesehatan serupa guna menjadi dasar perumusan kebijakan pemerataan yang lebih tepat sasaran.

1.2 Data yang Digunakan

Data yang digunakan dalam penelitian praktikum ini merupakan data sekunder yang disediakan khusus untuk kegiatan Praktikum Analisis Multivariat I. Data taersebut berfokus pada informasi mengenai Sarana Kesehatan di 34 Provinsi.

Provinsi	Rumah Sakit	Rumah Sakit Bersalan	Poliklinik	Puskesmas	Puskesmas Pembantu	Apotek
Aceh	64	225	258	395	971	346
Sumatera Utara	199	441	800	661	1887	740
Sumatera Barat	54	139	127	294	721	257
Riau	55	207	329	272	1033	351
Jambi	36	151	103	231	654	211
…	…	…	…	…	…	…
Papua	41	26	115	422	1146	125

1.3 Latar Belakang Metode

Metode statistika multivariat Analisis Cluster merupakan alat yang sangat efektif untuk mengelompokkan objek (dalam hal ini, provinsi) sedemikian rupa sehingga objek-objek dalam satu kelompok memiliki kemiripan (homogenitas) yang tinggi, sementara objek-objek di antara kelompok-kelompok berbeda memiliki perbedaan (heterogenitas) yang maksimal. Pemilihan metode ini sangat relevan karena data yang dianalisis bersifat multivariat, melibatkan enam variabel sarana kesehatan secara simultan. Analisis Cluster dipilih secara spesifik untuk mengelompokkan provinsi dengan jumlah sarana kesehatan yang tinggi dan yang rendah guna mengetahui pola-pola regional yang terbentuk dari disparitas infrastruktur kesehatan. Hasil klasterisasi ini kemudian dapat digunakan untuk mengidentifikasi secara jelas kelompok provinsi mana yang memiliki infrastruktur kesehatan yang superior dan mana yang masih tertinggal, sehingga kesenjangan tersebut dapat dijadikan fokus utama dalam perumusan rekomendasi kebijakan pemerataan fasilitas kesehatan di Indonesia.

1.4 Tinjaun Pustaka Metode

1.4.1 Analisis Klaster

Analisis cluster merupakan pengelompokan objek atau kasus menjadi kelompok-kelompok yang lebih kecil dimana setiap kelompok berisi objek yang mirip satu sama lain (Supranto, 2004 ; Fathia dkk, 2016). Dalam pengelompokannya digunakan suatu ukuran yang dapat menerangkan keserupaan atau kedekatan antar data untuk menerangkan struktur grup sederhana dari data yang kompleks, yaitu ukuran jarak atau similaritas dan ukuran jarak yang sering digunakan adalah ukuran jarak Euclidean (Johnson & Wichern, 1982 ; Fathia dkk, 2016).

1.4.2 Klaster Hierarki

Analisis cluster hirarki mencakup dua metode utama: penggabungan (agglomerative) dan pembagian (divisive). Dalam pengelompokan penggabungan, setiap titik data dimulai sebagai klaternya sendiri, dan klaster yang paling mirip secara bertahap digabungkan hingga semua titik data menjadi satu klaster. Algoritma untuk pengelompokan hirarki penggabungan sebagai berikut (Govender & Sivakumar, 2019 ; Indah & Octaviana, 2025):

1). Setiap titik data awalnya diperlakukan sebagai klaster terpisah.

2). Jarak antar cluster dihitung.

3). Dua klaster dengan jarak terkecil digabungkan menjadi satu, memperbarui matriks jarak yang sesuai.

4). Langkah 2 dan 3 diulang hingga hanya tersisa satu klaster, yang berisi semua titik data.

1.4.3 Metode Single Linkage

Jarak antar dua klaster ditentukan oleh jarak terpendek antara objek dalam satu klaster dengan objek dalam klaster lainnya.

1.4.4 Metode Complete Linkage

Jarak antar dua klaster ditentukan oleh jarak terbesar antara objek dalam satu klaster dengan objek dalam klaster lainnya.

1.4.5 Metode Average Linkage

Jarak antar dua klaster ditentukan oleh jarak rata-rata antara objek dalam satu klaster dengan objek dalam klaster lainnya.

**1.4.6 Penentuan Metode Linkage Terbaik**

Menurut Indah & Octaviana (2025), terdapat beberapa kriteria yang dapat membantu peneliti dalam memilih dan memvalidasi jumlah cluster yang optimal dalam teknik pengelompokan hirarki dan non hirarki seperti indeks silhouette, indeks dunn, Davies-Bouldin (DB), koefisien konduktivitas dan koefisien korelasi cophenetic. Indeks Dunn dihitung sebagai rasio jarak minimum antara dua observasi dalam cluster yang berbeda dengan jarak maksimum antara dua observasi dalam klaster yang sama. Indeks Dunn yang lebih tinggi menandakan solusi pengelompokan yang lebih optimal. Nilai koefisien konektivitas berada pada kisaran nol hingga tak terhingga. Koefisien konektivitas yang lebih rendah menunjukkan cluster yang terbentuk lebih baik.

Selain itu, indeks validitas Davies-Bouldin (DB) menghitung nilai rata-rata untuk setiap titik dalam kumpulan data. Nilai DB yang lebih kecil menunjukkan jumlah cluster yang lebih baik. Indeks silhouette mengukur kekompakan dan pemisahan cluster, dengan nilai berkisar dari 1 hingga 1. Nilai -1 menunjukkan pengelompokan yang tidak baik, sedangkan 1 menunjukkan pengelompokan yang baik, dan 0 menunjukkan pengamatan di perbatasan antara dua cluster.

1.5 Tujuan

Mengetahui metode linkage (Single, Complete, atau Average) yang paling efektif dalam menghasilkan klaster provinsi sarana kesehatan menggunakan teknik Cluster Hirarki.
Mengidentifikasi dan menganalisis profil klaster provinsi yang terbentuk berdasarkan ketersediaan sarana kesehatan tinggi (baik), sedang, dan rendah.

BAB II Source Code

2.1 Library

library(ggplot2)
library(factoextra)
library(cluster)
library(knitr)
library(magrittr)
library(clValid)
library(readxl)

2.2 Data

cluster <- read_excel("C:/Users/Alya Shafa Dianti/Downloads/data_sarana_kesehatan.xlsx")
cluster %>% head (34) %>% kable(caption = "Data Sarana Kesehatan")

Data Sarana Kesehatan
Provinsi	Rumah Sakit	Rumah Sakit Bersalin	Poliklinik	Puskesmas	Puskesmas Pembantu	Apotek
ACEH	64	225	258	395	971	346
SUMATERA UTARA	199	441	800	661	1887	740
SUMATERA BARAT	54	139	127	294	721	257
RIAU	55	207	329	272	1033	351
JAMBI	36	151	103	231	654	211
SUMATERA SELATAN	65	248	195	403	935	244
BENGKULU	20	5	49	190	456	141
LAMPUNG	53	238	307	350	936	356
KEP. BANGKA BELITUNG	21	25	25	63	148	73
KEP. RIAU	23	35	76	88	243	90
DKI JAKARTA	119	156	230	257	3	242
JAWA BARAT	292	1245	1670	1170	1800	1758
JAWA TENGAH	274	871	1232	921	1832	2068
DI YOGYAKARTA	61	102	158	126	300	226
JAWA TIMUR	317	1183	1101	1036	2338	1842
BANTEN	87	280	467	267	346	402
BALI	49	61	71	124	495	214
NUSA TENGGARA BARAT	31	20	72	173	550	237
NUSA TENGGARA TIMUR	48	42	108	414	1030	172
KALIMANTAN BARAT	39	95	98	264	836	123
KALIMANTAN TENGAH	19	63	95	221	1101	85
KALIMANTAN SELATAN	34	126	131	253	464	162
KALIMANTAN TIMUR	39	56	125	199	727	196
KALIMANTAN UTARA	11	4	15	59	179	49
SULAWESI UTARA	46	77	68	217	540	170
SULAWESI TENGAH	29	58	60	224	698	181
SULAWESI SELATAN	75	121	180	493	1394	490
SULAWESI TENGGARA	31	56	40	283	557	189
GORONTALO	14	2	42	96	250	97
SULAWESI BARAT	10	8	16	100	340	47
MALUKU	27	20	31	235	481	66
MALUKU UTARA	20	11	28	142	277	76
PAPUA BARAT	16	10	29	177	495	79
PAPUA	41	26	115	422	1146	125

2.3 Standarisasi Data

datastand <- scale(cluster[2:7])
datastand %>% head (5) %>% kable(caption = "Hasil Standarisasi Data Cluster")

Hasil Standarisasi Data Cluster
Rumah Sakit	Rumah Sakit Bersalin	Poliklinik	Puskesmas	Puskesmas Pembantu	Apotek
-0.0526359	0.1186997	0.0246767	0.2903606	0.3647786	-0.0198266
1.6368669	0.8200116	1.4413175	1.2964990	2.0230279	0.7590507
-0.1777843	-0.1605263	-0.3177218	-0.0916694	-0.0878003	-0.1957659
-0.1652694	0.0602571	0.2102514	-0.1748839	0.4770182	-0.0099424
-0.4030513	-0.1215645	-0.3804512	-0.3299653	-0.2090915	-0.2867008

n <- dim(datastand)
data <- data.matrix(datastand,1:6)
rownames(data) = c(1:nrow(data))

2.4 Single Linkage

ds <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust", 
             hc_metric = "euclidean", hc_method = "single")
d <- cophenetic(hc)
cor.sing <- cor(ds,d)
cor.sing

## [1] 0.96096

2.5 Complete Linkage

dc <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust", 
             hc_metric = "euclidean", hc_method = "complete")
d <- cophenetic(hc)
cor.comp <- cor(dc,d)
cor.comp

## [1] 0.9340591

2.6 Average Linkage

da <- dist(data)
hc <- eclust(datastand, FUNcluster = "hclust", 
             hc_metric = "euclidean", hc_method = "average")
d <- cophenetic(hc)
cor.ave <- cor(da,d)
cor.ave

## [1] 0.9416371

2.7 Penentuan Linkage Terbaik

# korelasi cophenetic antar metode
datastand <- dist(datastand)
methods <- c("single", "complete", "average", "ward.D2")
cor_values <- sapply(methods, function(m) {
  hc_all <- hclust(datastand, method = m)
  d_coph <- cophenetic(hc_all)
  cor(datastand, d_coph)
})
cor_values

##    single  complete   average   ward.D2 
## 0.9609600 0.9340591 0.9416371 0.9340157

2.8 Validasi Jumlah CLuster

inval <- clValid(data,2:7, clMethods = "hierarchical",
          validation = "internal", metric = "euclidean", method ="single")
summary(inval)

## 
## Clustering Methods:
##  hierarchical 
## 
## Cluster sizes:
##  2 3 4 5 6 7 
## 
## Validation Measures:
##                                  2       3       4       5       6       7
##                                                                           
## hierarchical Connectivity   4.4536  7.2159  9.7159 11.7159 15.1448 17.5738
##              Dunn           0.6497  0.9032  0.6219  0.5359  0.3589  0.3490
##              Silhouette     0.7993  0.6725  0.6351  0.6253  0.2632  0.2633
## 
## Optimal Scores:
## 
##              Score  Method       Clusters
## Connectivity 4.4536 hierarchical 2       
## Dunn         0.9032 hierarchical 3       
## Silhouette   0.7993 hierarchical 2

2.9 Visualisasi Dendogram

clus_hier <- eclust(data, FUNcluster = "hclust",
                    k = 3, hc_methode = "single",
                    graph = TRUE)
dend <- fviz_dend(clus_hier, rect = TRUE, 
                  show_labels = TRUE, cex = 0.5)
idclus <- clus_hier$cluster
idobs <- as.numeric(names(idclus))
print(dend)

link_centroid <- eclust(cluster, FUNcluster = "hclust", k = 3, hc_method = "single", graph = TRUE)
cluster_member <- link_centroid$cluster
cluster_member

##  [1] 1 2 1 1 1 1 1 1 1 1 1 3 3 1 3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

n <- length(idclus)
c1 <- vector()
c2 <- vector()
c3 <- vector()
for (i in 1:n){
  if(idclus[i] == 1){ 
    c1 = c(c1, i) 
  }
  else if(idclus[i] == 2){ 
    c2 = c(c2, i) 
  }
  else if(idclus[i] == 3){ 
    c3 = c(c3, i) 
  }
}

clustering = list(Cluster1 = c1, Cluster2 = c2, Cluster3 = c3) 
print(clustering)

## $Cluster1
## [1]  1  2  4  6  8 19 21 27 34
## 
## $Cluster2
##  [1]  3  5  7  9 10 11 14 16 17 18 20 22 23 24 25 26 28 29 30 31 32 33
## 
## $Cluster3
## [1] 12 13 15

2.10 Karakteristik Klaster

karakteristik_cluster <- aggregate(cluster, list(cluster_member), mean)
karakteristik_cluster

##   Group.1 Provinsi Rumah Sakit Rumah Sakit Bersalin Poliklinik Puskesmas
## 1       1       NA    41.23333               88.900    121.600   234.400
## 2       2       NA   199.00000              441.000    800.000   661.000
## 3       3       NA   294.33333             1099.667   1334.333  1042.333
##   Puskesmas Pembantu   Apotek
## 1              610.2  189.900
## 2             1887.0  740.000
## 3             1990.0 1889.333

BAB III Hasil dan Pembahasan

3.1 Penentuan Linkage Terbaik

Berdasarkan hasil perhitungan korelasi cophentic antar metode linkage diperoleh:

Single Linkage	Complete Linkage	Average Linkage	Ward.D2 Linkage
0.9609600	0.9340591	0.9416371	0.9340157

Terlihat bahwa nilai cophenetic correlation coefficient tertinggi yang mendekati 1 adalah metode single linkage yaitu 0.9609600 artinya pada analisis kluster hirarki metode terbaik adalah single linkage.

3.2 Validasi Jumlah Klaster

Berdasarkan hasil perhitungan connectovity, dunn, dan silhouette diperoleh:

Indeks	Score	Method	Cluster
Connectivity	4.4536	hierarchical	2
Dunn	0.9032	hierarchical	3
Silhouette	0.7993	hierarchical	2

Terlihat bahwa indeks connectivity dan silhouette menghasilkan 2 kluster, sedangkan pada indeks silhouette menghasilkan 3 kluster. Karena penelitian ini bertujuan untuk mengetahui kelompok provinsi dengan sarana kesehatan tinggi, sedang, dan rendah sehingga digunakan 3 kluster.

3.3 Hasil Klasterisasi

Berdasarkan hasil klusterisasi dengan metode jarak euclidien dan single linkage diperoleh 3 kluster dengan masing-masing kluster memiliki karakteristik sebagai berikut:

Kluster	n	Rumah Sakit	Rumah Sakit Bersalin	Poliklinik	Puskesmas	Puskesmas Pembantu	Apotek
1	9	41.233	88.900	121.600	234.400	610.200	189.900
2	22	199.000	441.000	800.000	661.000	1887.000	740.000
3	3	294.333	1099.667	1334.333	1042.333	1990.0	1899.333

Klaster 1, yang terdiri dari 9 provinsi, secara jelas merepresentasikan kelompok wilayah dengan ketersediaan sarana kesehatan yang paling rendah di semua jenis fasilitas. Nilai rata-rata untuk sarana rujukan seperti Rumah Sakit (42), Rumah Sakit Bersalin (89), Poliklinik (122), Puskesmas (235), dan Apotek (190) menunjukkan keterbatasan akses ke layanan kesehatan tingkat lanjut. Meskipun fasilitas rujukan rendah, jumlah Puskesmas Pembantu (611) relatif tinggi dibandingkan dengan fasilitas lainnya, mengindikasikan bahwa upaya penyediaan layanan kesehatan di klaster ini mungkin lebih difokuskan pada jangkauan layanan primer hingga ke wilayah terpencil, sebagai respons terhadap tantangan geografis dan keterbatasan anggaran di provinsi-provinsi yang umumnya tertinggal dalam pembangunan infrastruktur kesehatan secara menyeluruh.
Klaster 2 merupakan kelompok terbesar yang mencakup 22 provinsi, merefleksikan kondisi ketersediaan sarana kesehatan pada level menengah yang cukup stabil. Nilai rata-rata fasilitas di klaster ini menunjukkan peningkatan signifikan dibandingkan Klaster 1, dengan Rumah Sakit (200), Rumah Sakit Bersalin (441), Poliklinik (800), Puskesmas (661), Puskesmas Pembantu (1887), dan Apotek (740) yang mengindikasikan kemampuan provinsi untuk menyediakan layanan rujukan dan penunjang dalam jumlah yang memadai. Kelompok ini kemungkinan besar terdiri dari provinsi-provinsi yang sudah mencapai tingkat pembangunan yang seimbang atau berfungsi sebagai pusat-pusat regional yang sedang berkembang, memastikan mayoritas penduduk memiliki akses yang wajar terhadap berbagai jenis fasilitas, mulai dari Puskesmas hingga Rumah Sakit.
Klaster 3, yang hanya terdiri dari 3 provinsi, adalah kelompok dengan tingkat ketersediaan sarana kesehatan tertinggi atau unggul dalam semua variabel. Klaster ini menunjukkan dominasi fasilitas kesehatan tingkat rujukan dan penunjang, seperti Rumah Sakit Bersalin (1100), Poliklinik (1335), Puskesmas (1043), Puskesmas Pembantu (1990), dan Apotek (1900), yang nilainya jauh melampaui kedua klaster lainnya. Angka-angka yang sangat tinggi ini mengindikasikan bahwa provinsi-provinsi di klaster ini adalah sentra metropolitan dan pusat ekonomi utama dengan kepadatan populasi dan tingkat urbanisasi yang sangat tinggi, sehingga memiliki kapasitas dan kebutuhan untuk menyediakan infrastruktur kesehatan terlengkap yang tidak hanya melayani penduduknya sendiri tetapi juga berfungsi sebagai rujukan bagi provinsi-provinsi lain.

Bab IV Penutup

4.1 Kesimpulan

Metode linkage yang menghasilkan nilai korelasi cophenetic tertinggi adalah single linkage. Hal ini mengindikasikan bahwa metode linkage yang paling efektif digunakan untuk kasus ini adalah single linkage, karena menunjukkan bahwa jarak antar observasi dalam klasterisasi paling mirip dengan jarak awal data mentah. Berdasarkan hasil klasterisasi dengan jarak euclidean dan Single linkage, metode ini terbukti berhasil membentuk klaster yang sangat ekstrem dimana klaster 1 dan klaster 3 sangat jauh berbeda, sehingga hasil klasterisasi menunjukkan efektifitas yang sangat tinggi. Meskipun demikian, perlu dicatat bahwa metode single linkage memiliki potensi kerentanan terhadap efek rantai.

Berdasarkan analissi klasterisasi, provinsi-provinsi di Indonesia terbagi menjadi tiga kelompok utama yang menunjukkan disparitas infrastruktur kesehatan yang signifikan. Klaster 3 merupakan kelompok terkecil dengan 3 provinsi yang memiliki ketersediaan sarana kesehatan sangat tinggi di semua variabel. Sebaliknya, klaster 1 yang terdiri dari 9 provinsi menunjukkan ketersediaan sarana kesehatan terendag yang mengindikasikan perlunya intervensi kebijakan pemerataan yang cepat. Mayoritas provinsi berada di klaster 2 yang terdiri dari 22 provinsi yang memiliki profin infrastruktur yang cukup baik dan seimbang. Pembagian klater ini secara jelas memetakan ketidakmerataan pembangunan infrastruktur kesehatan antara pusat-pusat metropolitan yang unggul dan wilayah-wilayah yang masih tertinggal.

4.2 Saran

Disarankan agar pemerintah memfokuskan prioritas kebijakan dan alokasi anggaran pembangunan infrastruktur kesehatan secara khusus pada provinsi-provinsi di Klaster 1 (Kelompok Sarana Kesehatan Terbatas) untuk mengatasi disparitas ekstrem yang ditemukan, terutama dengan meningkatkan jumlah Rumah Sakit Bersalin, Poliklinik, dan Apotek. Selain intervensi pembangunan, perlu dilakukan validasi metodologi lebih lanjut pada penelitian mendatang, yaitu dengan membandingkan hasil klasterisasi dari Single Linkage dengan metode lain seperti Average Linkage untuk memastikan stabilitas dan keandalan klasterisasi yang dihasilkan, mengingat potensi kerentanan Single Linkage terhadap efek rantai (chaining effect).

4.3 Daftar Pustaka

Fathia, A. N., & dkk. (2016). Analisis Klaster Kecamatan di Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage. Jurnal Gaussian, 801-810.

Indah, Y. M., & Octaviana, S. (2025). Analisis Perbandingan Metode Klaster Hierarki dan Non Hierarki Terhadap Tingkat Pengangguran di Pulau Jawa Tahun 2023. Journal Of Statistics Theory and Aplications, 92-104.

Pohan, M., & Halim, R. (t.thn.). Analisis Ketersediaan Infrastruktur Kesehatan dan Aksebilitas Terhadap Pembangunan Kesehatan Penduduk di Provinsi Sumatera Utara. 77-91.

Wardhana, A., & Kharisma, B. (2023). Infrastruktur dan Pengeluaran Bidang Kesehatan Terhadap Kualitas Hidup di Indonesia. Jurnal Edukasi (Ekonomi, Pendidikan da Akuntansi), 145-156.

Yudhastria, H. N. (2024, November 27). Analisis Cluster Hierarki. Diambil kembali dari rstudio pubs static: https://rstudio-pubs-static.s3.amazonaws.com/1250370_847f879696b445808bbbc3164f75b63e.html

UAP Praktikum Analisis Multivariat 1

Alya Shafa Dianti

2025-11-21