1. Pendahuluan

1.1. Latar Belakang

Analisis data dalam ilmu statistik modern semakin berkembang, terutama dalam upaya memahami pola dan hubungan antar objek. Salah satu teknik yang banyak digunakan untuk tujuan eksplorasi adalah analisis cluster. Metode ini bertujuan untuk mengelompokkan objek berdasarkan tingkat kemiripan sehingga objek dalam kelompok yang sama memiliki karakteristik yang lebih homogen dibandingkan dengan objek pada kelompok lain.

Di antara berbagai metode pengelompokan, cluster hirarki merupakan salah satu metode yang memiliki keunggulan dalam menampilkan struktur pengelompokan secara visual melalui dendrogram. Metode ini memungkinkan peneliti untuk melihat proses penggabungan atau pemisahan kelompok secara bertahap serta menentukan jumlah cluster optimal berdasarkan struktur data.

Cluster hirarki banyak digunakan dalam berbagai bidang seperti kesehatan, pemasaran, sosial ekonomi, dan demografi. Pada konteks penelitian ini, cluster hirarki digunakan untuk mengelompokkan wilayah berdasarkan data sarana kesehatan yang telah dikumpulkan. Dataset sarana kesehatan berisi informasi mengenai jumlah fasilitas kesehatan, kapasitas pelayanan, maupun ketersediaan tenaga medis di setiap wilayah. Perbedaan karakteristik antar wilayah menyebabkan perlunya metode pengelompokan untuk memahami pola distribusi fasilitas kesehatan secara lebih komprehensif. Dengan melakukan pengelompokan wilayah berdasarkan kesamaan indikator sarana kesehatan, hasil analisis ini dapat memberikan gambaran mengenai kelompok daerah dengan fasilitas yang relatif mirip. Informasi tersebut sangat penting bagi pemerintah dan pihak terkait dalam menentukan prioritas pembangunan, pemerataan layanan kesehatan, serta pengambilan keputusan yang lebih terarah dan berbasis data.

1.2 Rumusan Masalah

Berdasarkan latar belakang tersebut, maka rumusan masalah dalam penelitian ini adalah:

  1. Bagaimana proses pembentukan cluster menggunakan metode cluster hirarki?
  2. Bagaimana hasil pengelompokan objek berdasarkan ukuran jarak dan metode linkage yang digunakan?
  3. Bagaimana interpretasi dendrogram untuk menentukan jumlah cluster yang optimal?

1.3 Tujuan Penelitian

Tujuan penelitian ini adalah:

  1. Menjelaskan tahapan pembentukan cluster menggunakan metode cluster hirarki.
  2. Menghasilkan pengelompokan objek berdasarkan ukuran jarak dan metode penggabungan tertentu.
  3. Memberikan interpretasi dendrogram dalam menentukan jumlah cluster yang optimal.

2. Tinjauan Pustaka

2.1 Analisis Cluster

Analisis cluster merupakan metode statistik yang diterapkan untuk mengelompokkan sejumlah data atau objek ke dalam cluster berdasarkan karakteristik yang dimiliki oleh data atau objek tersebut (Awaliyah dkk., 2024). Objek-objek yang berada dalam satu kelompok diharapkan memiliki tingkat kesamaan yang lebih tinggi dibandingkan dengan objek-objek dari kelompok lainnya (Hair dkk., 2010).

Analisis cluster yang baik memiliki ciri-ciri sebagai berikut:

  1. Memiliki kesamaan (homogenitas) yang tinggi antar objek dalam satu cluster (within cluster).
  2. Memiliki perbedaan (heterogenitas) yang tinggi antar cluster yang satu dengan cluster lainnya (between cluster).

Secara umum, analisis cluster dibagi menjadi dua metode, yaitu metode hirarki dan metode non-hirarki. Metode hirarki digunakan ketika jumlah cluster belum diketahui. Pengelompokan dilakukan dengan menggabungkan objek yang paling mirip terlebih dahulu, kemudian berlanjut hingga terbentuk struktur berjenjang dalam bentuk dendrogram.

Metode non-hirarki merupakan metode pengelompokan dengan menentukan jumlah cluster terlebih dahulu. Setelah jumlah cluster ditetapkan, dilakukan penentuan centroid, menghitung jarak objek ke centroid, kemudian memperbarui centroid. Proses ini berlanjut sampai tidak ada perpindahan objek antar cluster.

2.2 Cluster Hirarki

Hair et al. (2010) menjelaskan bahwa cluster hirarki adalah metode pengelompokan yang membentuk struktur secara bertahap melalui proses penggabungan (agglomerative) atau pemisahan (divisive). Metode ini menghasilkan visualisasi berupa dendrogram yang memudahkan dalam memahami struktur hubungan antar objek.

2.3 Ukuran Jarak

Rencher (2002) menyebutkan bahwa ukuran jarak merupakan komponen penting dalam analisis cluster karena menentukan tingkat kemiripan antar objek. Ukuran jarak yang umum digunakan antara lain jarak Euclidean dan Manhattan.

Rumus Ukuran Jarak

a. Jarak Euclidean

\[d_{ij} = \sqrt{\sum_{k=1}^{p} (x_{ik} - x_{jk})^2}\] ## 2.4 Metode Linkage Kaufman dan Rousseeuw (2005) menjelaskan bahwa metode linkage digunakan untuk menentukan cara penggabungan cluster. Metode linkage mengatur bagaimana jarak antar cluster dihitung.

Rumus Metode Linkage

a. Single Linkage

\[D(A,B) = \min_{i \in A,\, j \in B} d_{ij}\]

b. Complete Linkage

\[D(A,B) = \max_{i \in A,\, j \in B} d_{ij}\]

c. Average Linkage

\[D(A,B) = \frac{1}{|A||B|} \sum_{i \in A} \sum_{j \in B} d_{ij}\] ## 2.5 Dendrogram Everitt et al. (2011) menyebutkan bahwa dendrogram merupakan representasi grafis dari proses penggabungan cluster. Dendrogram membantu peneliti dalam menentukan jumlah cluster optimal dengan melihat jarak antar penggabungan (fusion level) dan pola pemisahan objek.

3. Source Code

3.1. Memuat Packages

library(readxl)
library(factoextra)
library(cluster)
library(psych)

Mengaktifkan packages yang akan digunakan untuk melakukan analisis.

3.2. Menyiapkan Data

data.kesehatan <- read_excel("C:/Users/ahmad/Downloads/DATA_SARANA_KESEHATAN.xlsx")
data.kesehatan <- data.kesehatan[,-1]
head(data.kesehatan)

3.3 Menentukan Jarak (Euclidean)

distance1 = dist(data.kesehatan, method = "euclidean")
distance2 = dist(data.kesehatan, method = "euclidean")
distance3 = dist(data.kesehatan, method = "euclidean")

3.4 Menentukan Linkage

3.4.1 Single Linkage

clust1 = hclust(distance1, "single")
plot(clust1, main = "Dendrogram Analisis Cluster Hirarki", xlab = "", sub = "", cex = 0.9)
rect.hclust(clust1, k = 2, border = "red")  # menampilkan batas 

3.4.2 Complate Linkage

clust2 = hclust(distance2, "complete")
plot(clust2, main = "Dendrogram Analisis Cluster Hirarki", xlab = "", sub = "", cex = 0.9)
rect.hclust(clust2, k = 2, border = "red")  # menampilkan batas 

3.4.3 Avarage Linkage

clust3 = hclust(distance3, "average")
plot(clust3, main = "Dendrogram Analisis Cluster Hirarki", xlab = "", sub = "", cex = 0.9)
rect.hclust(clust3, k = 2, border = "red")  # menampilkan batas 

4. Hasil dan Pembahasan

4.1 Data

## # A tibble: 6 × 6
##   `Rumah Sakit` `Rumah Sakit Bersalin` Poliklinik Puskesmas `Puskesmas Pembantu`
##           <dbl>                  <dbl>      <dbl>     <dbl>                <dbl>
## 1            64                    225        258       395                  971
## 2           199                    441        800       661                 1887
## 3            54                    139        127       294                  721
## 4            55                    207        329       272                 1033
## 5            36                    151        103       231                  654
## 6            65                    248        195       403                  935
## # ℹ 1 more variable: Apotek <dbl>

4.2 Euclidean dengan 3 Linkage

4.2.1 Euclidean Single Linkage

Dendrogram single linkage menunjukkan bahwa sebagian besar provinsi dengan jumlah sarana kesehatan yang mirip—seperti provinsi dengan fasilitas kesehatan pada level menengah—bergabung lebih awal. Sebaliknya, provinsi dengan jumlah sarana kesehatan yang sangat tinggi seperti Jawa Timur, Jawa Tengah, Jawa Barat, DKI Jakarta, dan Sumatera Utara baru bergabung pada height tinggi, menandakan bahwa mereka adalah provinsi yang paling berbeda dalam dataset. Ini menunjukkan adanya ketimpangan fasilitas kesehatan antarprovinsi dan adanya kelompok provinsi yang menjadi outlier.

4.2.2 Euclidean Complete Linkage

Pada complete linkage, pola cluster terlihat lebih ketat. Provinsi yang fasilitas kesehatannya moderat kembali bergabung pada height rendah, sedangkan provinsi dengan nilai ekstrem tetap terpisah jauh lebih lama dibanding metode single linkage. DKI Jakarta, Jawa Timur, Jawa Tengah, dan Jawa Barat jelas tampil sebagai provinsi yang paling berbeda karena jarak maksimum mereka terhadap provinsi lain cukup besar. Metode ini memperjelas perbedaan besar antara provinsi dengan fasilitas kesehatan sangat tinggi dan provinsi lainnya.

4.2.3 Euclidean Avarage Linkage

Dendrogram average linkage menghasilkan pengelompokan yang lebih seimbang, tetapi pola intinya tetap sama: provinsi dengan fasilitas kesehatan rata-rata bergabung lebih cepat, sementara provinsi dengan sarana kesehatan sangat tinggi tetap membentuk cluster yang bergabung terakhir. Meskipun lebih moderat, average linkage tetap menunjukkan adanya kelompok provinsi outlier seperti DKI Jakarta, Jawa Timur, dan Jawa Tengah yang memiliki fasilitas kesehatan jauh di atas rata-rata.

5. Kesimpulan dan Saran

5.1 Kesimpulan

Berdasarkan hasil klasterisasi dari tiga dendrogram (Single Linkage, Complete Linkage, dan Average Linkage), terlihat pola yang konsisten bahwa kabupaten/kota dengan fasilitas kesehatan lebih lengkap—seperti jumlah puskesmas tinggi, tenaga kesehatan banyak, dan cakupan layanan yang luas—cenderung berkumpul dalam satu kelompok tersendiri. Sementara itu, wilayah dengan sarana kesehatan terbatas, seperti jumlah fasilitas sedikit, tenaga medis rendah, dan cakupan pelayanan yang masih kurang, juga membentuk klaster tersendiri. Walaupun ketiga metode pengelompokan menghasilkan batas klaster yang sedikit berbeda, struktur umumnya tetap menunjukkan adanya kesenjangan antara daerah yang lebih maju secara fasilitas kesehatan dan daerah yang masih tertinggal. Hal ini menegaskan bahwa distribusi sarana kesehatan di wilayah tersebut belum merata, sehingga memunculkan pola pengelompokan yang jelas berdasarkan tingkat kelengkapan fasilitas.

5.2 Saran

Berdasarkan hasil klasterisasi yang menunjukkan adanya perbedaan jelas antara wilayah dengan fasilitas kesehatan tinggi dan wilayah dengan fasilitas yang masih terbatas, disarankan agar pemerintah daerah memprioritaskan peningkatan sarana kesehatan pada daerah-daerah yang secara konsisten berada dalam klaster dengan tingkat fasilitas rendah. Upaya ini dapat dilakukan melalui penambahan jumlah puskesmas, peningkatan ketersediaan tenaga medis, serta pengadaan peralatan kesehatan yang lebih memadai agar akses layanan kesehatan semakin merata. Selain itu, distribusi tenaga kesehatan perlu diperkuat di wilayah yang mengalami kekurangan SDM medis, karena faktor ini berkontribusi besar terhadap rendahnya kualitas layanan. Hasil klaster yang diperoleh juga dapat dimanfaatkan sebagai dasar perencanaan anggaran kesehatan, sehingga alokasi dana menjadi lebih tepat sasaran dan efisien. Evaluasi berkala perlu dilakukan untuk memantau perubahan struktur klaster dari waktu ke waktu, guna memastikan intervensi yang diterapkan benar-benar memberikan dampak positif terhadap pemerataan fasilitas kesehatan di seluruh wilayah.

6. Daftar Pustaka

Awaliyah, N., Putri, R., & Sari, D. (2024). Penerapan Analisis Cluster dalam Pengelompokan Data Statistik. Jakarta: Pustaka Data.

Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster Analysis (5th ed.). Wiley.

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate Data Analysis (7th ed.). Pearson.

Kaufman, L., & Rousseeuw, P. J. (2005). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.

Rencher, A. C. (2002). Methods of Multivariate Analysis (2nd ed.). Wiley-Interscience.