Analisis Cluster Hierarki untuk Mengidentifikasi Pola Distribusi Satuan Pendidikan Antarprovinsi di Indonesia

Arina Nayla Mufida

2025-11-30

BAB I

PENDAHULUAN

1.1 Latar Belakang

Pendidikan merupakan faktor penting yang menentukan kualitas pembangunan sumber daya manusia di setiap daerah. Perbedaan jumlah satuan pendidikan antarprovinsi menunjukkan adanya variasi kapasitas layanan pendidikan yang perlu dipahami secara mendalam. Ketimpangan tersebut dapat memengaruhi pemerataan akses belajar dan peluang pengembangan masyarakat. Oleh karena itu, analisis berdasarkan data jumlah sekolah per provinsi menjadi langkah penting untuk melihat pola dan kebutuhan wilayah. Pemikiran ini sejalan dengan urgensi pemerataan dalam perencanaan pendidikan (Suryadi & Tilaar, 2010).

Data mengenai jumlah SD, SMP, SMA, SMK, dan perguruan tinggi per provinsi dapat dimanfaatkan untuk memahami karakteristik wilayah berdasarkan ketersediaan fasilitas pendidikan. Penggunaan metode statistik seperti hierarchical clustering memungkinkan pengelompokan provinsi yang memiliki kesamaan dalam struktur pendidikannya. Teknik ini membantu memetakan wilayah secara lebih objektif dan memberikan gambaran mengenai kelompok provinsi dengan kondisi pendidikan yang serupa. Analisis berbasis data ini menjadi penting dalam mendukung pengambilan keputusan strategis di sektor pendidikan. Hal ini sejalan dengan pentingnya penggunaan data kuantitatif dalam manajemen pendidikan (Fattah, 2009).

Hasil klasterisasi provinsi diharapkan mampu menunjukkan kelompok wilayah yang perlu mendapatkan prioritas peningkatan fasilitas pendidikan. Informasi tersebut dapat membantu pemerintah dalam merancang kebijakan pemerataan sarana pendidikan agar lebih tepat sasaran. Selain itu, hasil pengelompokan dapat digunakan untuk analisis lanjutan terkait faktor sosial-ekonomi yang memengaruhi ketersediaan fasilitas pendidikan. Pendekatan ini memberikan gambaran yang lebih komprehensif mengenai kondisi pendidikan nasional. Pandangan ini sejalan dengan pentingnya analisis data dalam evaluasi dan perencanaan pendidikan (Arifin, 2017).

1.2 Rumusan Masalah

Berdasarkan latar belakang penelitian ini, dapat dirumuskan masalah dalam penelitian sebagai berikut.

  1. Bagaimana pola distribusi jumlah desa yang memiliki fasilitas pendidikan pada jenjang SD, SMP, SMA, SMK, dan perguruan tinggi di setiap provinsi di Indonesia tahun 2024?
  2. Bagaimana hasil pengelompokan provinsi di Indonesia berdasarkan kesamaan jumlah desa yang memiliki fasilitas pendidikan menggunakan metode cluster hierarki?
  3. Bagaimana karakteristik masing-masing cluster provinsi yang terbentuk berdasarkan hasil analisis cluster hierarki?

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah tersebut, tujuan dari penelitian ini sebagai berikut.

  1. Mendeskripsikan pola distribusi jumlah desa yang memiliki fasilitas pendidikan pada setiap jenjang pendidikan di seluruh provinsi di Indonesia tahun 2024.
  2. Mengelompokkan provinsi-provinsi di Indonesia berdasarkan kesamaan jumlah desa yang memiliki fasilitas pendidikan menggunakan metode cluster hierarki.
  3. Mengidentifikasi dan menganalisis karakteristik masing-masing cluster provinsi berdasarkan hasil pengelompokan yang diperoleh.

1.4 Manfaat Penelitian

Manfaat yang diharapkan dari penelitian ini sebagai berikut.

  1. Memberikan gambaran pengelompokan data multivariat berdasarkan tingkat kemiripan objek melalui penerapan metode cluster hierarki.
  2. Menjadi contoh penerapan analisis cluster hierarki dengan berbagai ukuran jarak dan metode linkage dalam mengkaji struktur dan pola data.
  3. Memberikan referensi metodologis dalam pemilihan kombinasi ukuran jarak dan metode linkage yang optimal berdasarkan evaluasi koefisien siluet.

BAB II

TINJAUAN PUSTAKA

2.1 Standarisasi Data

Standarisasi data merupakan proses mengubah skala variabel agar memiliki satuan yang sebanding, terutama ketika variabel memiliki rentang nilai berbeda. Hal ini penting karena metode cluster berbasis jarak sangat dipengaruhi oleh perbedaan skala antar variabel (Santoso, 2019). Tanpa standarisasi, variabel bersatuan besar akan mendominasi perhitungan jarak.

Menurut (Supranto, 2009), metode yang paling umum digunakan adalah Z-score standardization, di mana data diubah berdasarkan rata-rata dan standar deviasi. Perlu ditegaskan bahwa standarisasi dilakukan untuk memperoleh nilai yang terpusat pada nol dan memiliki variasi seragam.

Adapun rumus standarisasi Z-score adalah sebagai berikut: \[ Z_i = \frac{X - \bar{X}}{s} \] dengan:
- \(X\) : nilai asli
- \(\bar{X}\) : rata-rata variabel
- \(s\) : standart deviasi

2.2 Ukuran Jarak

Ukuran jarak merupakan komponen utama dalam analisis cluster karena menentukan tingkat kemiripan antar objek. Dua objek dikatakan semakin mirip apabila jarak antar keduanya semakin kecil (Widarjono, 2015). Terdapat beberapa ukuran jarak yang umum digunakan, yaitu Euclidean, Manhattan, dan Mahalanobis. Setiap ukuran jarak memiliki karakteristik dan sensitivitas yang berbeda terhadap skala variabel dan hubungan antarvariabel. Penggunaan ukuran jarak yang tepat menjadi penting agar struktur cluster yang terbentuk dapat merepresentasikan hubungan multivariat secara akurat (Kusnadi, 2018).

2.2.1 Jarak Euclidean

Jarak Euclidean merupakan ukuran jarak paling umum dalam ruang multidimensi dan dihitung berdasarkan akar kuadrat dari jumlah selisih kuadrat antar variabel. Jarak ini sensitif terhadap perbedaan skala sehingga sering digunakan setelah proses standarisasi data (Santoso, 2019). Adapun rumus jarak Euclidean sebagai berikut. \[ d_{ij} = \sqrt{\sum_{k=1}^{p} (x_{ik} - x_{jk})^2} \] dengan:
- \(d_{ij}\) : jarak Euclidean antar objek ke-i dan objek ke-j
- \(x_{ik}\) : nilai objek ke-i pada variabel ke-k
- \(p\) : jumlah variabel

2.2.2 Jarak Manhattan

Jarak Manhattan digunakan untuk menghitung jarak berdasarkan jumlah selisih absolut antar variabel. Jarak ini kurang sensitif terhadap nilai ekstrem sehingga lebih stabil ketika digunakan pada data yang mengandung variabel bervariasi besar (Kusnadi, 2018). Adapun rumus jarak Manhattan sebagai berikut. \[ d_{ij} = \sum_{k=1}^{p} \lvert x_{ik} - x_{jk} \rvert \] dengan:
- \(d_{ij}\) : jarak Euclidean antar objek ke-i dan objek ke-j
- \(x_{ik}\) : nilai objek ke-i pada variabel ke-k
- \(p\) : jumlah variabel

2.2.3 Jarak Mahalanobis

Jarak Mahalanobis digunakan untuk mempertimbangkan korelasi antar variabel sehingga lebih tepat digunakan ketika variabel saling berkaitan secara statistik (Tampubolon, 2017). Jarak ini mengukur kedekatan menggunakan struktur kovarians data. Adapun rumus perhitungan jarak Mahalanobis sebagai berikut. \[ D_{ij} = \sqrt{(x_i - x_j)' \, S^{-1} \, (x_i - x_j)} \] dengan:
- \(D_{ij}\) : jarak Mahalanobis antara objek ke-i dan objek ke-j
- \(x_{i}\) : vektor data berukuran 𝑝×1 untuk objek ke-i
- \(x_{j}\) : vektor data berukuran 𝑝×1 untuk objek ke-j
- \(S^{-1}\) : matriks invers dari kovarians data

2.3 Metode Clustering Hierarki

Metode clustering hierarki merupakan teknik pengelompokan data yang dilakukan secara bertingkat, baik melalui pendekatan penggabungan (agglomerative) maupun pemisahan (divisive) (Suliyanto, 2014). Pada pendekatan agglomerative yang paling umum digunakan, proses diawali dengan menganggap setiap objek sebagai satu cluster, kemudian secara bertahap digabungkan sesuai jarak atau kemiripan antar objek hingga membentuk satu cluster besar. Metode ini tidak membutuhkan penentuan jumlah cluster di awal sehingga memberikan fleksibilitas dalam eksplorasi struktur data. Tujuan diterapkannya clustering hierarki adalah untuk mengidentifikasi struktur pengelompokan secara alami, memahami pola kedekatan antar objek, serta memperoleh representasi visual berupa dendrogram. Selain itu, metode ini bermanfaat karena memberikan gambaran menyeluruh mengenai proses penggabungan cluster pada berbagai tingkat jarak sehingga memudahkan peneliti dalam menilai stabilitas cluster (Kurniawan, 2020).

Pada clustering hierarki, perhitungan jarak antar cluster dilakukan berdasarkan prinsip pemilihan dua cluster dengan jarak minimum sesuai metode linkage yang digunakan. Secara umum, jarak antar cluster pada langkah ke-t dapat dituliskan sebagai: \[ D(C_i, C_j) = \min_{x \in C_i,\; y \in C_j} d(x, y) \] dimana:
- \(D(C_i, C_j)\) : jarak antara cluster \(C_{i}\) dan cluster \(C_{j}\)
- \(d(x, y)\) : jarak antara objek x dan objek y

Rumus tersebut menggambarkan proses fundamental bahwa pemilihan cluster yang digabungkan didasarkan pada jarak atau ukuran kedekatan tertentu antar unit data atau antar cluster.

2.4 Metode Linkage

Metode linkage merupakan aturan untuk menghitung jarak antara dua cluster setelah penggabungan terjadi. Perbedaan metode linkage akan menghasilkan struktur cluster yang berbeda karena setiap metode memiliki cara sendiri dalam menilai jarak antar cluster (Kurniawan, 2020). Pemilihan metode linkage sangat penting karena hasil akhir pengelompokan dapat berubah secara signifikan, terutama pada data multivariat.

2.4.1 Single Linkage

Single linkage menentukan jarak antar cluster berdasarkan jarak minimum antar objek pada dua cluster yang berbeda. Metode ini cenderung membentuk cluster panjang dan ramping karena penggabungan berlangsung selama terdapat dua objek yang sangat dekat. Adapun rumus untuk menghitung jarak dengan metode linkage adalah sebagai berikut. \[ D(C_i, C_j) = \min_{x \in C_i,\; y \in C_j} d(x, y) \] dimana:
- \(D(C_i, C_j)\) : jarak antara cluster \(C_{i}\) dan \(C_{j}\)
- \(d(x, y)\) : jarak antara objek x dan y

2.4.2 Complete Linkage

Complete linkage menggunakan jarak maksimum antar objek dari dua cluster. Metode ini menghasilkan cluster yang lebih kompak dibandingkan single linkage karena cluster hanya digabungkan ketika keseluruhan anggotanya memiliki jarak relatif kecil. Rumusnya adalah: \[ D(C_i, C_j) = \max_{x \in C_i,\; y \in C_j} d(x, y) \] dimana:
- \(D(C_i, C_j)\) : jarak antara cluster \(C_{i}\) dan \(C_{j}\)
- \(d(x, y)\) : jarak antara objek x dan y

2.4.3 Average Linkage

Average linkage menggunakan rata-rata jarak antar seluruh objek pada dua cluster yang berbeda. Pendekatan ini berada di antara single maupun complete linkage dan memberikan hasil yang lebih stabil karena mempertimbangkan semua informasi jarak (Widarjono, 2015). Rumusnya yaitu: \[ D(C_i, C_j) = \frac{1}{|C_i| |C_j|} \sum_{x \in C_i} \sum_{y \in C_j} d(x, y) \] dimana:
- \(D(C_i, C_j)\) : jarak antara cluster \(C_{i}\) dan \(C_{j}\)
- \({|C_i|}\) : jumlah anggota pada cluster \(C_{i}\)
- \({|C_j|}\) : jumlah anggota pada cluster \(C_{j}\)
- \(d(x, y)\) : jarak antara objek x dan y

2.4.4 Ward’s Method

Ward’s method menggabungkan cluster dengan tujuan meminimalkan peningkatan within-cluster variance. Metode ini cenderung menghasilkan cluster berjumlah seimbang dan kompak, sehingga banyak digunakan dalam aplikasi sosial dan pendidikan (Suharjo, 2013). Rumus kenaikan varians Ward adalah: \[ D(C_i, C_j) = \frac{|C_i| |C_j|}{|C_i| + |C_j|} \, \| \bar{x}_{C_i} - \bar{x}_{C_j} \|^2 \] dimana:
- \(D(C_i, C_j)\) : jarak antara cluster \(C_{i}\) dan \(C_{j}\)
- \({|C_i|}\) : jumlah anggota pada cluster \(C_{i}\)
- \({|C_j|}\) : jumlah anggota pada cluster \(C_{j}\)
- \(\bar{x}_{C_i}\) : rata-rata vektor objek pada cluster \({C_i}\)
- \(\bar{x}_{C_j}\) : rata-rata vektor objek pada cluster \({C_ij\)

2.5 Penentuan Jumlah Cluster

Penentuan jumlah cluster merupakan langkah penting dalam analisis cluster karena menentukan stabilitas dan interpretasi hasil. Pada clustering hierarki, salah satu cara yang digunakan adalah menganalisis dendrogram untuk melihat adanya lonjakan (jump) jarak penggabungan. Lonjakan ini mengindikasikan bahwa pada titik tersebut penggabungan sudah tidak lagi mengelompokkan objek yang benar-benar mirip sehingga pemotongan pada titik sebelum lonjakan sering dipilih sebagai jumlah cluster optimal (Setiawan, 2012).

Selain itu, jumlah cluster juga dapat ditentukan menggunakan nilai koefisien siluet. Nilai siluet menunjukkan kualitas pengelompokan dengan membandingkan kedekatan objek terhadap cluster-nya sendiri dibandingkan cluster lainnya. Jumlah cluster yang dipilih umumnya adalah jumlah yang memberikan nilai siluet rata-rata tertinggi, karena nilai yang mendekati 1 menandakan bahwa struktur cluster sudah terbentuk secara jelas (Yuniarti, 2018).

Metode lain adalah memanfaatkan inconsistency coefficient, yaitu ukuran yang membandingkan jarak penggabungan pada suatu level dengan beberapa level sebelumnya. Ketika nilai inconsistency meningkat signifikan, hal tersebut menandai batas alami pemisahan cluster. Dengan demikian, penentuan jumlah cluster tidak hanya mengandalkan visualisasi dendrogram tetapi juga ukuran statistik yang mendukung kestabilannya.

2.6 Evaluasi Cluster

Evaluasi cluster penting dilakukan untuk memastikan bahwa cluster yang terbentuk memiliki kualitas yang baik dan menggambarkan struktur data secara valid. Analisis cluster sendiri bertujuan untuk mengidentifikasi kelompok objek yang memiliki karakteristik serupa berdasarkan ukuran kedekatan tertentu sehingga proses evaluasi menjadi penting untuk mengukur seberapa baik objek berada dalam cluster yang tepat (Widarjono, 2015). Koefisien Silhouette digunakan untuk menilai kualitas cluster melalui perbandingan rata-rata jarak objek terhadap cluster-nya sendiri dan jarak objek terhadap cluster terdekat lainnya (Yuniarti, 2018). Nilai siluet yang tinggi menunjukkan bahwa objek berada dalam cluster yang tepat, sedangkan nilai negatif menandakan bahwa objek lebih mirip dengan cluster lain. Rumus koefisien siluet adalah: \[ s(i) = \frac{b(i) - a(i)}{\max\{a(i),\, b(i)\}} \] dimana:
- \(a_{i}\) : rata-rata jarak objek ke cluster asal
- \(b_{i}\) : rata-rata jarak objek ke cluster tetangga terdekat

Evaluasi menggunakan siluet membantu memastikan bahwa hasil pengelompokan tidak hanya terbentuk secara matematis tetapi juga bermakna secara interpretatif.

2.7 Dendogram

Dendrogram adalah diagram yang menggambarkan proses penggabungan cluster secara bertingkat dalam analisis clustering hierarki. Diagram ini menampilkan penggabungan cluster pada berbagai tingkat jarak sehingga peneliti dapat memahami hubungan antar objek dan struktur pengelompokan secara menyeluruh (Wahyuni, 2016). Dendrogram membantu menvisualisasikan kapan objek atau cluster digabungkan, serta menunjukkan intensitas kedekatan melalui tinggi atau rendahnya cabang penggabungan.

Penggunaan dendrogram memiliki tujuan untuk memberikan gambaran visual yang memudahkan identifikasi jumlah cluster yang sesuai serta membantu dalam memahami pola dan hierarki dalam data. Selain itu, dendrogram bermanfaat dalam menunjukkan objek yang menjadi outlier, cluster yang terlalu besar atau terlalu kecil, dan hubungan kompleks antar objek yang mungkin sulit terlihat hanya dari matriks jarak. Melalui dendrogram, peneliti dapat menentukan titik pemotongan berdasarkan jarak penggabungan yang signifikan sehingga jumlah cluster dapat ditentukan secara objektif dan informatif.

BAB III

DATA

Data yang digunakan merupakan data sekunder yang bersumber dari publikasi Jumlah Desa yang Memiliki Fasilitas Sekolah Menurut Provinsi dan Tingkat Pendidikan Tahun 2024 yang diambil melalui website resmi Badan Pusat Statistik (BPS).

Sumber: [Badan Pusat Statistik Indonesia. (18 Juli 2025). Jumlah Desa yang Memiliki Fasilitas Sekolah Menurut Provinsi dan Tingkat Pendidikan, 2024.]

BAB IV

SOURCE CODE

4.1 Library

Adapun librabry() yang digunakan dalam rangkaian analisis ini sebagai berikut.

library(readxl)
library(DT)
library(cluster)
library(knitr)
library(kableExtra)
library(stats)
library(graphics)
library(prettydoc)
library(htmltools)
  • library(readxl) digunakan untuk mengimpor data penelitian dari file Excel (.xlsx) ke dalam R.
  • library(DT) digunakan untuk menampilkan data dan hasil analisis dalam bentuk tabel interaktif pada dokumen HTML.
  • library(cluster) digunakan untuk melakukan evaluasi hasil pengelompokan dengan menghitung koefisien siluet guna menilai kualitas cluster yang terbentuk.
  • library(knitr) digunakan untuk membantu proses penyusunan laporan R Markdown, khususnya dalam menampilkan tabel hasil analisis dalam format yang rapi.
  • library(kableExtra) digunakan untuk memperindah tampilan tabel hasil analisis, seperti pengaturan gaya tabel, scroll, dan penekanan baris tertentu.
  • library(stats) digunakan dalam proses analisis statistik, meliputi standarisasi data, perhitungan jarak, dan pembentukan cluster hierarki.
  • library(graphics) dDigunakan untuk visualisasi hasil analisis, khususnya dalam pembuatan dendrogram cluster hierarki.
  • library(prettydoc) digunakan untuk mengatur tampilan dan format output dokumen R Markdown (khususnya HTML) agar lebih rapi dan menarik.
  • library(htmltools) digunakan untuk mengelola dan mengatur elemen HTML pada dokumen R Markdown, seperti pengaturan caption, penambahan elemen HTML, dan pengaturan tampilan tabel atau konten berbasis web.

4.2 Import dan Persiapan Data

4.2.1 Membaca File Excel

data <- read_excel("C:/Users/nayla/Downloads/DATA_SEKOLAH.xlsx")

Fungsi read_excel() digunakan untuk mengambil data dari file eksternal dalam format Excel. Hasil pembacaan kemudian disimpan ke dalam objek data sehingga dapat diolah lebih lanjut.

4.2.2 Mengubah Tipe Data

data$PROVINSI <- as.character(data$PROVINSI)

Kolom PROVINSI diubah menjadi tipe karakter untuk memastikan tidak dianggap sebagai faktor atau variabel numerik.

4.2.3 Memilih Variabel untuk Clustering

X <- data[, c("SD", "SMP", "SMU", "SMK", "Perguruan Tinggi")]
row.names(X) <- data$PROVINSI
## Warning: Setting row names on a tibble is deprecated.

Variabel numerik yang akan dianalisis diambil dan disimpan dalam objek X. Nama baris diberi label berdasarkan nama provinsi untuk memudahkan interpretasi hasil clustering.

4.3 Standarisasi Data

X_scaled <- scale(X)

Data dinormalisasi menggunakan fungsi scale() agar setiap variabel memiliki skala yang setara, sehingga tidak ada variabel yang mendominasi perhitungan jarak.

4.4 Ukuran Jarak

4.4.1 Jarak Euclidean

d_euclidean <- dist(X_scaled, method = "euclidean")

Fungsi dist() digunakan untuk menghitung jarak antar-observasi menggunakan metode Euclidean, yang disimpan dalam objek d_euclidean .

4.4.2 Jarak Manhattan

d_manhattan <- dist(X_scaled, method = "manhattan")

Fungsi dist() digunakan untuk menghitung jarak antar-observasi menggunakan metode Manhattan, yang disimpan dalam objek d_manhattan .

4.4.3 Jarak Mahalanobis

S <- cov(X_scaled)
S_inv <- solve(S)

Fungsi cov() menghasilkan matriks kovarians yang kemudian disimpan dalam objek S. Dan funsi solve() digunakan untuk menghitung invers dari matriks S yang disimpan dalam objek S_inv .

mahalanobis_dist <- function(X, S_inv) {
  n <- nrow(X)
  D <- matrix(0, n, n)
  for (i in 1:n) {
    for (j in 1:n) {
      diff <- as.matrix(X[i,] - X[j,])
      D[i, j] <- sqrt(t(diff) %*% S_inv %*% diff)
    }
  }
  as.dist(D)
}

d_mahalanobis <- mahalanobis_dist(X_scaled, S_inv)

Fungsi diatas dibuat untuk menghitung jarak Mahalanobis secara manual untuk seluruh pasangan observasi. Hasil perhitungan jarak Mahalanobis disimpan dalam objek d_mahalanobis .

Lalu, dari perhitungan semua jarak diatas, disimpan dalam satu list dengan objek distance_list untuk memudahkan iterasi pada langkah clustering.

distance_list <- list(
  Euclidean   = d_euclidean,
  Manhattan   = d_manhattan,
  Mahalanobis = d_mahalanobis
)

4.5 Clustering dan Perbandingan Linkage

4.5.1 Menentukan Metode Linkage

linkages <- c("single", "complete", "average", "centroid", "ward.D2")

Kode diatas digunakan untuk membandingkan kualitas hasil clustering berdasarkan berbagai kombinasi jarak dan metode linkage, daftar metode linkage disimpan dalam objek linkages.

4.5.2 Menentukan Banyak Cluster

k <- 3

Objek k digunakan untuk menentukan jumlah cluster yang akan dibentuk.

4.5.3 Melakukan Clustering dan Evaluasi

hasil <- data.frame()

for (dist_name in names(distance_list)) {
  d <- distance_list[[dist_name]]
  
  for (link in linkages) {
    hc <- hclust(d, method = link)
    cl <- cutree(hc, k = k)
    sil <- mean(silhouette(cl, d)[, 3])
    
    hasil <- rbind(
      hasil,
      data.frame(
        Distance = dist_name,
        Linkage = link,
        Mean_Silhouette = round(sil, 3)
      )
    )
  }
}

Objek hasil dibuat sebagai data frame kosong untuk menyimpan ringkasan evaluasi. Kemudian, melalui perulangan pertama, setiap jenis jarak pada distance_list diambil satu per satu, dan di dalamnya dilakukan perulangan kedua untuk mencoba seluruh metode linkage. Pada setiap kombinasi, fungsi hclust() membentuk hierarchical clustering, lalu cutree() memotong dendrogram menjadi 3 cluster. Nilai silhouette rata-rata dihitung untuk menilai kualitas pembentukan cluster. Hasil setiap kombinasi meliputi jenis jarak, metode linkage, dan nilai silhouette ditambahkan ke data frame hasil.

4.6 Kombinasi Terbaik

terbaik <- hasil[which.max(hasil$Mean_Silhouette), ]

Objek terbaik digunakan untuk menyimpan kombinasi jarak dan linkage dengan nilai Mean Silhouette paling tinggi, sehingga mewakili hasil clustering yang paling optimal.

4.7 Visualisasi Dendogram

hc_best <- hclust(
  distance_list[[terbaik$Distance]],
  method = terbaik$Linkage
)

plot(hc_best,
     main = paste(
       "Dendrogram Cluster Hirarki\n",
       "Jarak:", terbaik$Distance,
       "| Linkage:", terbaik$Linkage
     ),
     xlab = "",
     sub = "",
     cex = 0.6)

rect.hclust(hc_best, k = k, border = "red")

Kode tersebut digunakan untuk membentuk dan menampilkan dendrogram berdasarkan kombinasi jarak dan metode linkage yang telah dinilai sebagai yang terbaik pada tahap sebelumnya. Baris pertama menjalankan hclust() menggunakan jarak yang diambil dari distance_list sesuai nilai terbaik$Distance, serta metode linkage yang ditentukan oleh terbaik$Linkage, sehingga menghasilkan objek cluster hierarki yang paling optimal dan disimpan dalam hc_best. Selanjutnya, fungsi plot() digunakan untuk menampilkan dendrogram dari hasil clustering tersebut, di mana judul grafik dibuat melalui paste() untuk mencantumkan informasi jarak dan linkage terbaik agar interpretasi lebih jelas. Parameter lain seperti xlab, sub, dan cex diatur untuk memperindah tampilan dendrogram. Terakhir, rect.hclust() menggambar kotak berwarna merah untuk menandai pembagian cluster sebanyak k kelompok, sehingga struktur cluster yang terbentuk terlihat lebih jelas. Menampilkan dendrogram dengan konfigurasi terbaik ini penting agar pola pengelompokan dapat divisualisasikan secara akurat dan memberikan gambaran yang kuat tentang hasil clustering yang paling optimal.

BAB V

HASIL DAN PEMBAHASAN

5.1 Standarisasi Data

Hasil standarisasi menggunakan metode z-score menghasilkan data dengan skala yang seragam sehingga setiap variabel—jumlah desa yang memiliki fasilitas pendidikan tingkat SD, SMP, SMU, SMK, dan Perguruan Tinggi memiliki kontribusi yang seimbang dalam proses pengelompokan. Standarisasi ini penting karena masing-masing jenjang pendidikan memiliki satuan dan rentang nilai yang berbeda, sehingga perlu diseragamkan agar tidak menimbulkan bias pada hasil clustering. Data yang telah distandarkan ini selanjutnya digunakan untuk mengelompokkan provinsi berdasarkan kemiripan ketersediaan fasilitas pendidikan pada tahun 2024. Dengan demikian, cluster yang terbentuk nantinya diharapkan mampu merepresentasikan pola distribusi fasilitas pendidikan antar provinsi secara lebih objektif dan dapat mengurangi pengaruh perbedaan skala antar variabel.

5.2 Ukuran Jarak

Setelah data distandarisasi, langkah berikutnya dalam analisis cluster hierarki adalah menghitung jarak antar objek (provinsi). Jarak ini digunakan untuk mengukur tingkat kemiripan antar provinsi berdasarkan variabel jumlah desa yang memiliki fasilitas pendidikan. Semakin kecil jarak antar dua provinsi, semakin mirip karakteristiknya dalam hal distribusi fasilitas pendidikan.

5.2.1 Jarak Ecluidan

Hasil perhitungan jarak Euclidean ditunjukkan pada Tabel berikut.
Matriks Jarak Euclidean antar Provinsi
ACEH SUMATERA UTARA SUMATERA BARAT RIAU JAMBI SUMATERA SELATAN BENGKULU LAMPUNG KEP. BANGKA BELITUNG KEP. RIAU DKI JAKARTA JAWA BARAT JAWA TENGAH DI YOGYAKARTA JAWA TIMUR BANTEN BALI NUSA TENGGARA BARAT NUSA TENGGARA TIMUR KALIMANTAN BARAT KALIMANTAN TENGAH KALIMANTAN SELATAN KALIMANTAN TIMUR KALIMANTAN UTARA SULAWESI UTARA SULAWESI TENGAH SULAWESI SELATAN SULAWESI TENGGARA GORONTALO SULAWESI BARAT MALUKU MALUKU UTARA PAPUA BARAT PAPUA BARAT DAYA PAPUA PAPUA SELATAN PAPUA TENGAH PAPUA PEGUNUNGAN
ACEH 0.000 1.930 1.331 0.904 1.435 0.286 1.896 0.655 2.394 2.274 2.086 6.601 4.451 2.120 6.950 1.204 2.095 1.286 0.677 1.035 1.626 1.346 1.793 2.478 1.476 1.294 0.605 1.275 2.232 2.129 1.726 1.786 2.424 2.400 2.250 2.471 2.452 2.447
SUMATERA UTARA 1.930 0.000 3.049 2.575 3.214 2.050 3.701 2.047 4.187 4.060 3.671 4.756 2.604 3.848 5.059 2.240 3.855 2.895 2.027 2.817 3.425 3.181 3.558 4.276 3.237 3.083 1.580 3.080 4.033 3.902 3.529 3.563 4.232 4.202 4.054 4.277 4.250 4.258
SUMATERA BARAT 1.331 3.049 0.000 0.655 0.558 1.168 0.862 1.112 1.230 1.072 0.822 7.441 5.581 0.843 7.999 1.095 0.905 0.460 1.476 0.650 0.794 0.567 0.640 1.314 0.451 0.666 1.545 0.650 1.113 0.980 0.630 0.761 1.281 1.245 1.102 1.346 1.295 1.327
RIAU 0.904 2.575 0.655 0.000 0.706 0.658 1.227 0.561 1.678 1.553 1.443 7.043 5.138 1.400 7.541 0.825 1.382 0.425 0.911 0.456 0.971 0.787 1.069 1.767 0.852 0.692 1.101 0.642 1.529 1.391 1.020 1.048 1.738 1.702 1.564 1.793 1.756 1.763
JAMBI 1.435 3.214 0.558 0.706 0.000 1.225 0.531 1.187 1.006 0.907 1.158 7.702 5.744 0.847 8.219 1.369 0.740 0.586 1.376 0.459 0.304 0.297 0.434 1.095 0.374 0.275 1.762 0.221 0.844 0.721 0.366 0.357 1.059 1.028 0.892 1.107 1.080 1.075
SUMATERA SELATAN 0.286 2.050 1.168 0.658 1.225 0.000 1.715 0.418 2.213 2.096 1.950 6.679 4.595 1.949 7.072 1.031 1.914 1.057 0.519 0.824 1.429 1.181 1.605 2.300 1.306 1.095 0.665 1.071 2.050 1.936 1.542 1.581 2.252 2.225 2.078 2.299 2.277 2.273
BENGKULU 1.896 3.701 0.862 1.227 0.531 1.715 0.000 1.696 0.523 0.464 1.085 8.181 6.203 0.554 8.719 1.820 0.333 1.035 1.853 0.931 0.368 0.556 0.270 0.606 0.524 0.663 2.252 0.672 0.350 0.295 0.254 0.246 0.552 0.532 0.395 0.591 0.578 0.564
LAMPUNG 0.655 2.047 1.112 0.561 1.187 0.418 1.696 0.000 2.170 2.050 1.848 6.550 4.597 1.873 7.036 0.693 1.854 0.901 0.583 0.831 1.418 1.216 1.547 2.260 1.271 1.093 0.716 1.079 2.015 1.877 1.516 1.532 2.225 2.193 2.050 2.273 2.241 2.248
KEP. BANGKA BELITUNG 2.394 4.187 1.230 1.678 1.006 2.213 0.523 2.170 0.000 0.181 1.115 8.594 6.694 0.517 9.179 2.194 0.362 1.407 2.362 1.432 0.862 1.063 0.632 0.091 0.975 1.174 2.719 1.177 0.191 0.299 0.676 0.664 0.116 0.073 0.170 0.174 0.103 0.149
KEP. RIAU 2.274 4.060 1.072 1.553 0.907 2.096 0.464 2.050 0.181 0.000 0.946 8.451 6.574 0.352 9.041 2.049 0.237 1.269 2.274 1.333 0.808 0.964 0.509 0.249 0.854 1.091 2.583 1.090 0.227 0.239 0.563 0.588 0.246 0.198 0.147 0.322 0.244 0.307
DKI JAKARTA 2.086 3.671 0.822 1.443 1.158 1.950 1.085 1.848 1.115 0.946 0.000 7.843 6.150 0.614 8.516 1.593 0.857 1.110 2.262 1.423 1.277 1.174 0.873 1.163 0.938 1.329 2.239 1.332 1.121 1.015 0.966 1.096 1.156 1.119 1.034 1.219 1.145 1.230
JAWA BARAT 6.601 4.756 7.441 7.043 7.702 6.679 8.181 6.550 8.594 8.451 7.843 0.000 3.192 8.177 1.753 6.412 8.248 7.247 6.658 7.365 7.944 7.725 7.981 8.681 7.702 7.624 6.111 7.624 8.471 8.311 7.990 8.018 8.659 8.620 8.484 8.710 8.663 8.696
JAWA TENGAH 4.451 2.604 5.581 5.138 5.744 4.595 6.203 4.597 6.694 6.574 6.150 3.192 0.000 6.351 3.050 4.757 6.358 5.460 4.490 5.328 5.922 5.684 6.072 6.782 5.730 5.580 4.129 5.599 6.535 6.413 6.050 6.084 6.733 6.708 6.558 6.771 6.750 6.756
DI YOGYAKARTA 2.120 3.848 0.843 1.400 0.847 1.949 0.554 1.873 0.517 0.352 0.614 8.177 6.351 0.000 8.799 1.796 0.265 1.087 2.166 1.233 0.840 0.893 0.426 0.580 0.698 1.034 2.379 1.042 0.511 0.417 0.534 0.622 0.571 0.530 0.438 0.636 0.562 0.637
JAWA TIMUR 6.950 5.059 7.999 7.541 8.219 7.072 8.719 7.036 9.179 9.041 8.516 1.753 3.050 8.799 0.000 7.048 8.841 7.815 7.033 7.837 8.447 8.212 8.549 9.268 8.246 8.111 6.525 8.103 9.036 8.891 8.529 8.562 9.234 9.200 9.055 9.285 9.248 9.266
BANTEN 1.204 2.240 1.095 0.825 1.369 1.031 1.820 0.693 2.194 2.049 1.593 6.412 4.757 1.796 7.048 0.000 1.858 0.864 1.264 1.189 1.644 1.457 1.594 2.281 1.383 1.388 1.015 1.372 2.081 1.915 1.615 1.647 2.265 2.223 2.093 2.322 2.268 2.305
BALI 2.095 3.855 0.905 1.382 0.740 1.914 0.333 1.854 0.362 0.237 0.857 8.248 6.358 0.265 8.841 1.858 0.000 1.104 2.087 1.156 0.665 0.792 0.319 0.444 0.650 0.916 2.401 0.924 0.298 0.196 0.418 0.447 0.416 0.378 0.255 0.470 0.417 0.464
NUSA TENGGARA BARAT 1.286 2.895 0.460 0.425 0.586 1.057 1.035 0.901 1.407 1.269 1.110 7.247 5.460 1.087 7.815 0.864 1.104 0.000 1.307 0.640 0.883 0.758 0.822 1.494 0.717 0.724 1.441 0.663 1.288 1.126 0.815 0.839 1.479 1.437 1.309 1.540 1.488 1.514
NUSA TENGGARA TIMUR 0.677 2.027 1.476 0.911 1.376 0.519 1.853 0.583 2.362 2.274 2.262 6.658 4.490 2.166 7.033 1.264 2.087 1.307 0.000 0.956 1.518 1.362 1.780 2.449 1.501 1.196 0.928 1.198 2.185 2.078 1.720 1.711 2.405 2.382 2.242 2.441 2.429 2.411
KALIMANTAN BARAT 1.035 2.817 0.650 0.456 0.459 0.824 0.931 0.831 1.432 1.333 1.423 7.365 5.328 1.233 7.837 1.189 1.156 0.640 0.956 0.000 0.623 0.443 0.844 1.519 0.587 0.291 1.374 0.302 1.258 1.152 0.772 0.799 1.475 1.450 1.307 1.520 1.500 1.489
KALIMANTAN TENGAH 1.626 3.425 0.794 0.971 0.304 1.429 0.368 1.418 0.862 0.808 1.277 7.944 5.922 0.840 8.447 1.644 0.665 0.883 1.518 0.623 0.000 0.362 0.430 0.946 0.462 0.346 1.989 0.366 0.677 0.605 0.342 0.287 0.901 0.882 0.754 0.935 0.927 0.900
KALIMANTAN SELATAN 1.346 3.181 0.567 0.787 0.297 1.181 0.556 1.216 1.063 0.964 1.174 7.725 5.684 0.893 8.212 1.457 0.792 0.758 1.362 0.443 0.362 0.000 0.514 1.146 0.288 0.252 1.729 0.269 0.894 0.813 0.429 0.510 1.088 1.068 0.919 1.132 1.117 1.107
KALIMANTAN TIMUR 1.793 3.558 0.640 1.069 0.434 1.605 0.270 1.547 0.632 0.509 0.873 7.981 6.072 0.426 8.549 1.594 0.319 0.822 1.780 0.844 0.430 0.514 0.000 0.721 0.378 0.622 2.095 0.627 0.497 0.358 0.156 0.240 0.689 0.654 0.512 0.744 0.701 0.722
KALIMANTAN UTARA 2.478 4.276 1.314 1.767 1.095 2.300 0.606 2.260 0.091 0.249 1.163 8.681 6.782 0.580 9.268 2.281 0.444 1.494 2.449 1.519 0.946 1.146 0.721 0.000 1.060 1.260 2.806 1.263 0.271 0.390 0.763 0.752 0.101 0.091 0.239 0.139 0.073 0.126
SULAWESI UTARA 1.476 3.237 0.451 0.852 0.374 1.306 0.524 1.271 0.975 0.854 0.938 7.702 5.730 0.698 8.246 1.383 0.650 0.717 1.501 0.587 0.462 0.288 0.378 1.060 0.000 0.420 1.789 0.469 0.826 0.718 0.377 0.492 1.011 0.985 0.833 1.058 1.028 1.042
SULAWESI TENGAH 1.294 3.083 0.666 0.692 0.275 1.095 0.663 1.093 1.174 1.091 1.329 7.624 5.580 1.034 8.111 1.388 0.916 0.724 1.196 0.291 0.346 0.252 0.622 1.260 0.420 0.000 1.657 0.143 0.995 0.901 0.548 0.553 1.213 1.191 1.050 1.251 1.238 1.221
SULAWESI SELATAN 0.605 1.580 1.545 1.101 1.762 0.665 2.252 0.716 2.719 2.583 2.239 6.111 4.129 2.379 6.525 1.015 2.401 1.441 0.928 1.374 1.989 1.729 2.095 2.806 1.789 1.657 0.000 1.646 2.567 2.441 2.049 2.112 2.766 2.735 2.587 2.821 2.787 2.796
SULAWESI TENGGARA 1.275 3.080 0.650 0.642 0.221 1.071 0.672 1.079 1.177 1.090 1.332 7.624 5.599 1.042 8.103 1.372 0.924 0.663 1.198 0.302 0.366 0.269 0.627 1.263 0.469 0.143 1.646 0.000 1.003 0.903 0.541 0.537 1.218 1.193 1.055 1.259 1.244 1.227
GORONTALO 2.232 4.033 1.113 1.529 0.844 2.050 0.350 2.015 0.191 0.227 1.121 8.471 6.535 0.511 9.036 2.081 0.298 1.288 2.185 1.258 0.677 0.894 0.497 0.271 0.826 0.995 2.567 1.003 0.000 0.184 0.522 0.504 0.240 0.218 0.151 0.285 0.260 0.244
SULAWESI BARAT 2.129 3.902 0.980 1.391 0.721 1.936 0.295 1.877 0.299 0.239 1.015 8.311 6.413 0.417 8.891 1.915 0.196 1.126 2.078 1.152 0.605 0.813 0.358 0.390 0.718 0.901 2.441 0.903 0.184 0.000 0.413 0.379 0.379 0.339 0.243 0.431 0.384 0.401
MALUKU 1.726 3.529 0.630 1.020 0.366 1.542 0.254 1.516 0.676 0.563 0.966 7.990 6.050 0.534 8.529 1.615 0.418 0.815 1.720 0.772 0.342 0.429 0.156 0.763 0.377 0.548 2.049 0.541 0.522 0.413 0.000 0.208 0.725 0.694 0.551 0.781 0.747 0.751
MALUKU UTARA 1.786 3.563 0.761 1.048 0.357 1.581 0.246 1.532 0.664 0.588 1.096 8.018 6.084 0.622 8.562 1.647 0.447 0.839 1.711 0.799 0.287 0.510 0.240 0.752 0.492 0.553 2.112 0.537 0.504 0.379 0.208 0.000 0.724 0.692 0.569 0.769 0.742 0.735
PAPUA BARAT 2.424 4.232 1.281 1.738 1.059 2.252 0.552 2.225 0.116 0.246 1.156 8.659 6.733 0.571 9.234 2.265 0.416 1.479 2.405 1.475 0.901 1.088 0.689 0.101 1.011 1.213 2.766 1.218 0.240 0.379 0.725 0.724 0.000 0.054 0.181 0.084 0.054 0.080
PAPUA BARAT DAYA 2.400 4.202 1.245 1.702 1.028 2.225 0.532 2.193 0.073 0.198 1.119 8.620 6.708 0.530 9.200 2.223 0.378 1.437 2.382 1.450 0.882 1.068 0.654 0.091 0.985 1.191 2.735 1.193 0.218 0.339 0.694 0.692 0.054 0.000 0.155 0.129 0.062 0.118
PAPUA 2.250 4.054 1.102 1.564 0.892 2.078 0.395 2.050 0.170 0.147 1.034 8.484 6.558 0.438 9.055 2.093 0.255 1.309 2.242 1.307 0.754 0.919 0.512 0.239 0.833 1.050 2.587 1.055 0.151 0.243 0.551 0.569 0.181 0.155 0.000 0.245 0.204 0.230
PAPUA SELATAN 2.471 4.277 1.346 1.793 1.107 2.299 0.591 2.273 0.174 0.322 1.219 8.710 6.771 0.636 9.285 2.322 0.470 1.540 2.441 1.520 0.935 1.132 0.744 0.139 1.058 1.251 2.821 1.259 0.285 0.431 0.781 0.769 0.084 0.129 0.245 0.000 0.092 0.066
PAPUA TENGAH 2.452 4.250 1.295 1.756 1.080 2.277 0.578 2.241 0.103 0.244 1.145 8.663 6.750 0.562 9.248 2.268 0.417 1.488 2.429 1.500 0.927 1.117 0.701 0.073 1.028 1.238 2.787 1.244 0.260 0.384 0.747 0.742 0.054 0.062 0.204 0.092 0.000 0.105
PAPUA PEGUNUNGAN 2.447 4.258 1.327 1.763 1.075 2.273 0.564 2.248 0.149 0.307 1.230 8.696 6.756 0.637 9.266 2.305 0.464 1.514 2.411 1.489 0.900 1.107 0.722 0.126 1.042 1.221 2.796 1.227 0.244 0.401 0.751 0.735 0.080 0.118 0.230 0.066 0.105 0.000

Matriks jarak Euclidean tersebut menunjukkan tingkat kemiripan antar provinsi berdasarkan jumlah desa yang memiliki fasilitas pendidikan. Semakin kecil jarak antar dua provinsi, semakin mirip pola distribusi fasilitas pendidikannya. Sebaliknya, jarak yang besar menunjukkan bahwa kedua provinsi memiliki karakteristik fasilitas pendidikan yang lebih berbeda.

5.2.2 Jarak Manhattan

Hasil perhitungan jarak Manhattan ditunjukkan pada Tabel berikut.
Matriks Jarak Manhattan antar Provinsi
ACEH SUMATERA UTARA SUMATERA BARAT RIAU JAMBI SUMATERA SELATAN BENGKULU LAMPUNG KEP. BANGKA BELITUNG KEP. RIAU DKI JAKARTA JAWA BARAT JAWA TENGAH DI YOGYAKARTA JAWA TIMUR BANTEN BALI NUSA TENGGARA BARAT NUSA TENGGARA TIMUR KALIMANTAN BARAT KALIMANTAN TENGAH KALIMANTAN SELATAN KALIMANTAN TIMUR KALIMANTAN UTARA SULAWESI UTARA SULAWESI TENGAH SULAWESI SELATAN SULAWESI TENGGARA GORONTALO SULAWESI BARAT MALUKU MALUKU UTARA PAPUA BARAT PAPUA BARAT DAYA PAPUA PAPUA SELATAN PAPUA TENGAH PAPUA PEGUNUNGAN
ACEH 0.000 4.250 2.390 1.631 2.884 0.516 3.987 1.167 5.020 4.714 3.615 13.954 9.656 4.143 15.464 2.010 4.250 2.363 1.239 2.013 3.371 2.849 3.612 5.219 2.915 2.614 1.309 2.613 4.700 4.376 3.581 3.647 5.140 5.066 4.740 5.245 5.166 5.210
SUMATERA UTARA 4.250 0.000 6.641 5.637 7.135 4.554 8.237 4.483 9.270 8.964 7.674 9.703 5.406 8.393 11.214 4.472 8.500 6.242 4.377 6.263 7.621 7.099 7.862 9.469 7.165 6.864 3.348 6.863 8.950 8.626 7.831 7.897 9.390 9.316 8.991 9.496 9.416 9.460
SUMATERA BARAT 2.390 6.641 0.000 1.403 0.724 2.141 1.596 2.266 2.629 2.324 1.646 16.344 12.047 1.752 17.855 2.169 1.859 0.914 3.025 1.176 1.267 1.076 1.221 2.829 0.830 1.172 3.293 1.020 2.309 1.985 1.191 1.257 2.750 2.675 2.350 2.855 2.776 2.819
RIAU 1.631 5.637 1.403 0.000 1.497 1.115 2.600 1.154 3.633 3.327 2.926 15.341 11.043 2.756 16.851 1.430 2.863 0.732 1.623 0.892 1.984 1.529 2.225 3.832 1.528 1.343 2.289 1.289 3.313 2.989 2.194 2.260 3.753 3.679 3.353 3.859 3.779 3.823
JAMBI 2.884 7.135 0.724 1.497 0.000 2.581 1.102 2.651 2.135 1.830 2.290 16.838 12.541 1.694 18.349 2.663 1.365 1.217 2.757 0.871 0.547 0.610 0.836 2.335 0.654 0.448 3.787 0.376 1.815 1.491 0.751 0.763 2.256 2.181 1.856 2.361 2.282 2.325
SUMATERA SELATAN 0.516 4.554 2.141 1.115 2.581 0.000 3.683 0.670 4.716 4.411 3.665 14.257 9.960 3.839 15.768 1.857 3.946 1.847 1.075 1.710 3.068 2.546 3.308 4.916 2.611 2.310 1.229 2.309 4.396 4.072 3.278 3.344 4.837 4.762 4.437 4.942 4.863 4.906
BENGKULU 3.987 8.237 1.596 2.600 1.102 3.683 0.000 3.754 1.033 0.836 1.894 17.940 13.643 1.072 19.451 3.765 0.689 2.024 3.860 1.974 0.706 1.138 0.558 1.233 1.072 1.373 4.889 1.374 0.713 0.475 0.488 0.472 1.154 1.079 0.754 1.259 1.179 1.223
LAMPUNG 1.167 4.483 2.266 1.154 2.651 0.670 3.754 0.000 4.787 4.481 3.790 14.187 9.889 3.910 15.697 1.314 4.017 1.759 1.150 1.780 3.138 2.616 3.379 4.986 2.682 2.381 1.461 2.380 4.467 4.143 3.348 3.414 4.907 4.833 4.507 5.013 4.933 4.977
KEP. BANGKA BELITUNG 5.020 9.270 2.629 3.633 2.135 4.716 1.033 4.787 0.000 0.305 1.721 18.973 14.676 0.877 20.484 4.798 0.770 3.028 4.893 3.007 1.649 2.171 1.408 0.200 2.105 2.406 5.922 2.407 0.320 0.644 1.439 1.372 0.230 0.151 0.297 0.379 0.185 0.328
KEP. RIAU 4.714 8.964 2.324 3.327 1.830 4.411 0.836 4.481 0.305 0.000 1.433 18.668 14.371 0.571 20.178 4.493 0.465 2.722 4.587 2.701 1.543 1.865 1.102 0.505 1.799 2.100 5.616 2.101 0.437 0.520 1.133 1.212 0.518 0.403 0.271 0.667 0.474 0.617
DKI JAKARTA 3.615 7.674 1.646 2.926 2.290 3.665 1.894 3.790 1.721 1.433 0.000 17.378 13.081 0.988 18.889 3.203 1.371 2.339 4.549 2.781 2.388 2.334 1.535 1.843 1.716 2.565 4.326 2.666 1.859 1.586 1.851 1.958 1.951 1.836 1.704 2.100 1.907 2.050
JAWA BARAT 13.954 9.703 16.344 15.341 16.838 14.257 17.940 14.187 18.973 18.668 17.378 0.000 6.753 18.096 3.449 14.175 18.203 15.946 14.081 15.967 17.325 16.803 17.566 19.173 16.868 16.567 13.051 16.566 18.653 18.329 17.535 17.601 19.094 19.019 18.694 19.199 19.120 19.163
JAWA TENGAH 9.656 5.406 12.047 11.043 12.541 9.960 13.643 9.889 14.676 14.371 13.081 6.753 0.000 13.799 5.808 9.878 13.906 11.648 9.783 11.670 13.028 12.506 13.268 14.876 12.571 12.270 8.754 12.269 14.356 14.032 13.237 13.304 14.797 14.722 14.397 14.902 14.823 14.866
DI YOGYAKARTA 4.143 8.393 1.752 2.756 1.694 3.839 1.072 3.910 0.877 0.571 0.988 18.096 13.799 0.000 19.607 3.921 0.383 2.151 4.125 2.275 1.656 1.602 0.857 1.076 1.228 1.964 5.045 2.002 0.871 0.669 1.119 1.239 1.061 0.946 0.814 1.210 1.023 1.159
JAWA TIMUR 15.464 11.214 17.855 16.851 18.349 15.768 19.451 15.697 20.484 20.178 18.889 3.449 5.808 19.607 0.000 15.686 19.714 17.456 15.591 17.477 18.835 18.313 19.076 20.683 18.379 18.078 14.562 18.077 20.164 19.840 19.045 19.111 20.604 20.530 20.205 20.710 20.630 20.674
BANTEN 2.010 4.472 2.169 1.430 2.663 1.857 3.765 1.314 4.798 4.493 3.203 14.175 9.878 3.921 15.686 0.000 4.028 1.770 2.464 2.322 3.150 2.959 3.390 4.998 2.713 2.773 2.061 2.719 4.478 4.154 3.359 3.426 4.919 4.844 4.519 5.024 4.944 4.988
BALI 4.250 8.500 1.859 2.863 1.365 3.946 0.689 4.017 0.770 0.465 1.371 18.203 13.906 0.383 19.714 4.028 0.000 2.258 4.122 2.236 1.273 1.491 0.638 0.970 1.335 1.636 5.152 1.655 0.540 0.365 0.809 0.893 0.891 0.816 0.491 0.996 0.917 0.960
NUSA TENGGARA BARAT 2.363 6.242 0.914 0.732 1.217 1.847 2.024 1.759 3.028 2.722 2.339 15.946 11.648 2.151 17.456 1.770 2.258 0.000 2.210 1.345 1.764 1.572 1.620 3.227 1.327 1.462 2.894 1.333 2.708 2.384 1.589 1.655 3.148 3.074 2.748 3.254 3.174 3.218
NUSA TENGGARA TIMUR 1.239 4.377 3.025 1.623 2.757 1.075 3.860 1.150 4.893 4.587 4.549 14.081 9.783 4.125 15.591 2.464 4.122 2.210 0.000 1.886 3.244 2.722 3.485 5.092 2.969 2.487 1.422 2.486 4.573 4.249 3.454 3.520 5.013 4.939 4.613 5.118 5.039 5.083
KALIMANTAN BARAT 2.013 6.263 1.176 0.892 0.871 1.710 1.974 1.780 3.007 2.701 2.781 15.967 11.670 2.275 17.477 2.322 2.236 1.345 1.886 0.000 1.358 0.836 1.599 3.206 1.119 0.601 2.915 0.600 2.687 2.363 1.568 1.634 3.127 3.053 2.727 3.232 3.153 3.197
KALIMANTAN TENGAH 3.371 7.621 1.267 1.984 0.547 3.068 0.706 3.138 1.649 1.543 2.388 17.325 13.028 1.656 18.835 3.150 1.273 1.764 3.244 1.358 0.000 0.602 0.853 1.848 0.691 0.757 4.273 0.758 1.329 1.023 0.627 0.502 1.769 1.695 1.460 1.874 1.795 1.839
KALIMANTAN SELATAN 2.849 7.099 1.076 1.529 0.610 2.546 1.138 2.616 2.171 1.865 2.334 16.803 12.506 1.602 18.313 2.959 1.491 1.572 2.722 0.836 0.602 0.000 0.944 2.370 0.618 0.489 3.751 0.530 1.851 1.531 0.732 0.938 2.291 2.217 1.891 2.396 2.317 2.361
KALIMANTAN TIMUR 3.612 7.862 1.221 2.225 0.836 3.308 0.558 3.379 1.408 1.102 1.535 17.566 13.268 0.857 19.076 3.390 0.638 1.620 3.485 1.599 0.853 0.944 0.000 1.607 0.697 1.107 4.514 1.144 1.088 0.764 0.316 0.423 1.528 1.454 1.128 1.634 1.554 1.598
KALIMANTAN UTARA 5.219 9.469 2.829 3.832 2.335 4.916 1.233 4.986 0.200 0.505 1.843 19.173 14.876 1.076 20.683 4.998 0.970 3.227 5.092 3.206 1.848 2.370 1.607 0.000 2.304 2.605 6.121 2.607 0.519 0.843 1.638 1.572 0.163 0.153 0.479 0.257 0.141 0.227
SULAWESI UTARA 2.915 7.165 0.830 1.528 0.654 2.611 1.072 2.682 2.105 1.799 1.716 16.868 12.571 1.228 18.379 2.713 1.335 1.327 2.969 1.119 0.691 0.618 0.697 2.304 0.000 0.850 3.817 0.950 1.785 1.461 0.753 0.891 2.225 2.151 1.826 2.331 2.251 2.295
SULAWESI TENGAH 2.614 6.864 1.172 1.343 0.448 2.310 1.373 2.381 2.406 2.100 2.565 16.567 12.270 1.964 18.078 2.773 1.636 1.462 2.487 0.601 0.757 0.489 1.107 2.605 0.850 0.000 3.516 0.252 2.086 1.762 1.022 1.033 2.526 2.452 2.127 2.632 2.552 2.596
SULAWESI SELATAN 1.309 3.348 3.293 2.289 3.787 1.229 4.889 1.461 5.922 5.616 4.326 13.051 8.754 5.045 14.562 2.061 5.152 2.894 1.422 2.915 4.273 3.751 4.514 6.121 3.817 3.516 0.000 3.515 5.602 5.278 4.483 4.549 6.042 5.968 5.643 6.148 6.068 6.112
SULAWESI TENGGARA 2.613 6.863 1.020 1.289 0.376 2.309 1.374 2.380 2.407 2.101 2.666 16.566 12.269 2.002 18.077 2.719 1.655 1.333 2.486 0.600 0.758 0.530 1.144 2.607 0.950 0.252 3.515 0.000 2.087 1.763 1.059 1.034 2.528 2.453 2.128 2.633 2.553 2.597
GORONTALO 4.700 8.950 2.309 3.313 1.815 4.396 0.713 4.467 0.320 0.437 1.859 18.653 14.356 0.871 20.164 4.478 0.540 2.708 4.573 2.687 1.329 1.851 1.088 0.519 1.785 2.086 5.602 2.087 0.000 0.351 1.119 1.053 0.440 0.402 0.240 0.546 0.466 0.510
SULAWESI BARAT 4.376 8.626 1.985 2.989 1.491 4.072 0.475 4.143 0.644 0.520 1.586 18.329 14.032 0.669 19.840 4.154 0.365 2.384 4.249 2.363 1.023 1.531 0.764 0.843 1.461 1.762 5.278 1.763 0.351 0.000 0.849 0.729 0.764 0.690 0.461 0.870 0.790 0.834
MALUKU 3.581 7.831 1.191 2.194 0.751 3.278 0.488 3.348 1.439 1.133 1.851 17.535 13.237 1.119 19.045 3.359 0.809 1.589 3.454 1.568 0.627 0.732 0.316 1.638 0.753 1.022 4.483 1.059 1.119 0.849 0.000 0.328 1.559 1.485 1.159 1.664 1.585 1.629
MALUKU UTARA 3.647 7.897 1.257 2.260 0.763 3.344 0.472 3.414 1.372 1.212 1.958 17.601 13.304 1.239 19.111 3.426 0.893 1.655 3.520 1.634 0.502 0.938 0.423 1.572 0.891 1.033 4.549 1.034 1.053 0.729 0.328 0.000 1.493 1.419 1.130 1.598 1.519 1.563
PAPUA BARAT 5.140 9.390 2.750 3.753 2.256 4.837 1.154 4.907 0.230 0.518 1.951 19.094 14.797 1.061 20.604 4.919 0.891 3.148 5.013 3.127 1.769 2.291 1.528 0.163 2.225 2.526 6.042 2.528 0.440 0.764 1.559 1.493 0.000 0.115 0.400 0.167 0.098 0.138
PAPUA BARAT DAYA 5.066 9.316 2.675 3.679 2.181 4.762 1.079 4.833 0.151 0.403 1.836 19.019 14.722 0.946 20.530 4.844 0.816 3.074 4.939 3.053 1.695 2.217 1.454 0.153 2.151 2.452 5.968 2.453 0.402 0.690 1.485 1.419 0.115 0.000 0.325 0.264 0.119 0.223
PAPUA 4.740 8.991 2.350 3.353 1.856 4.437 0.754 4.507 0.297 0.271 1.704 18.694 14.397 0.814 20.205 4.519 0.491 2.748 4.613 2.727 1.460 1.891 1.128 0.479 1.826 2.127 5.643 2.128 0.240 0.461 1.159 1.130 0.400 0.325 0.000 0.505 0.426 0.469
PAPUA SELATAN 5.245 9.496 2.855 3.859 2.361 4.942 1.259 5.013 0.379 0.667 2.100 19.199 14.902 1.210 20.710 5.024 0.996 3.254 5.118 3.232 1.874 2.396 1.634 0.257 2.331 2.632 6.148 2.633 0.546 0.870 1.664 1.598 0.167 0.264 0.505 0.000 0.193 0.128
PAPUA TENGAH 5.166 9.416 2.776 3.779 2.282 4.863 1.179 4.933 0.185 0.474 1.907 19.120 14.823 1.023 20.630 4.944 0.917 3.174 5.039 3.153 1.795 2.317 1.554 0.141 2.251 2.552 6.068 2.553 0.466 0.790 1.585 1.519 0.098 0.119 0.426 0.193 0.000 0.204
PAPUA PEGUNUNGAN 5.210 9.460 2.819 3.823 2.325 4.906 1.223 4.977 0.328 0.617 2.050 19.163 14.866 1.159 20.674 4.988 0.960 3.218 5.083 3.197 1.839 2.361 1.598 0.227 2.295 2.596 6.112 2.597 0.510 0.834 1.629 1.563 0.138 0.223 0.469 0.128 0.204 0.000

Perhitungan jarak Manhattan digunakan untuk mengukur tingkat perbedaan antar provinsi berdasarkan jumlah desa yang memiliki fasilitas pendidikan. Jarak ini menghitung total selisih absolut antar nilai setiap variabel, sehingga sensitif terhadap perbedaan nyata pada tiap jenjang pendidikan. Matriks jarak yang dihasilkan menggambarkan seberapa dekat atau jauhnya karakteristik antar provinsi: semakin kecil nilai jarak, semakin mirip pola ketersediaan fasilitas pendidikan di provinsi tersebut, sedangkan jarak yang besar menunjukkan perbedaan yang lebih signifikan. Jarak Manhattan ini kemudian menjadi dasar dalam proses pembentukan cluster pada analisis cluster hierarki, di mana kelompok provinsi dengan kemiripan paling tinggi akan bergabung terlebih dahulu pada dendrogram.

5.2.3 Jarak Mahalanobis

Hasil perhitungan jarak Mahalanobis ditunjukkan pada Tabel berikut.
Matriks Jarak Mahalanobis antar Provinsi
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
0.000 2.438 3.222 3.344 3.148 1.440 3.083 3.300 3.483 3.161 4.203 7.301 6.073 3.553 3.787 3.965 3.310 3.300 4.569 4.073 3.977 2.291 3.252 3.418 3.310 3.763 4.506 2.967 3.715 3.740 3.143 3.550 3.112 3.142 2.971 3.311 3.305 3.298
2.438 0.000 4.515 4.014 3.080 2.247 2.822 3.023 3.459 3.411 5.051 6.378 5.404 4.027 3.540 3.788 2.968 3.369 4.406 4.731 4.104 2.804 3.366 3.379 3.746 4.001 6.100 2.902 3.886 3.637 3.758 3.223 2.959 2.999 2.957 2.804 3.068 3.104
3.222 4.515 0.000 2.457 3.002 2.998 2.980 3.214 2.614 2.142 2.637 5.859 6.147 1.664 4.872 2.782 2.927 3.081 4.365 2.582 3.071 2.234 2.271 2.645 1.867 2.811 2.464 3.158 2.465 2.804 1.764 3.333 2.828 2.799 2.601 3.342 2.907 2.906
3.344 4.014 2.457 0.000 1.522 2.168 2.352 1.515 2.195 2.177 4.684 5.576 6.583 2.819 4.211 1.994 2.843 1.627 2.551 1.781 1.807 2.175 1.974 2.287 2.582 1.808 3.345 1.678 1.945 1.981 1.439 1.911 2.663 2.566 2.561 3.060 2.712 2.517
3.148 3.080 3.002 1.522 0.000 1.846 1.037 0.604 1.227 1.503 4.627 5.514 5.974 2.532 4.451 1.753 1.723 1.389 2.339 2.314 1.445 1.522 1.209 1.279 2.205 1.554 4.496 0.464 1.345 1.037 1.396 0.510 1.527 1.443 1.537 1.751 1.556 1.308
1.440 2.247 2.998 2.168 1.846 0.000 2.107 1.941 2.540 2.391 4.508 6.480 5.992 3.127 3.554 2.931 2.589 2.138 3.305 3.115 2.806 1.601 2.337 2.511 2.777 2.680 4.296 1.644 2.721 2.649 2.239 2.277 2.362 2.347 2.261 2.575 2.524 2.418
3.083 2.822 2.980 2.352 1.037 2.107 0.000 1.422 0.786 1.109 4.140 5.604 5.410 2.067 4.850 2.045 0.913 2.057 2.902 2.688 1.783 1.134 0.874 0.750 1.710 1.782 4.799 1.108 1.221 0.974 1.510 1.011 0.687 0.693 0.758 0.847 0.719 0.448
3.300 3.023 3.214 1.515 0.604 1.941 1.422 0.000 1.641 1.912 4.908 5.195 5.835 2.838 4.100 1.753 2.074 1.506 2.069 2.308 1.497 1.821 1.550 1.712 2.438 1.598 4.514 0.704 1.650 1.365 1.680 0.835 1.955 1.876 1.955 2.132 1.966 1.738
3.483 3.459 2.614 2.195 1.227 2.540 0.786 1.641 0.000 0.617 3.795 5.300 5.745 1.564 5.092 1.617 0.884 1.953 3.127 2.512 1.732 1.424 0.440 0.168 1.500 1.756 4.546 1.512 0.785 0.517 1.193 1.155 0.763 0.680 0.769 1.148 0.691 0.537
3.161 3.411 2.142 2.177 1.503 2.391 1.109 1.912 0.617 0.000 3.243 5.365 5.856 1.120 4.890 1.609 0.913 1.908 3.528 2.637 2.113 1.288 0.542 0.567 1.357 2.052 4.269 1.779 1.122 1.043 1.100 1.583 0.806 0.729 0.656 1.320 0.833 0.872
4.203 5.051 2.637 4.684 4.627 4.508 4.140 4.908 3.795 3.243 0.000 6.232 6.689 2.360 5.850 3.966 3.511 4.462 6.480 4.961 5.055 3.688 3.630 3.729 3.233 4.835 4.762 4.834 4.078 4.205 3.735 4.785 3.606 3.620 3.431 3.927 3.659 3.893
7.301 6.378 5.859 5.576 5.514 6.480 5.604 5.195 5.300 5.365 6.232 0.000 7.146 5.251 5.692 4.118 5.332 5.290 6.100 5.819 5.604 5.984 5.211 5.363 5.498 5.619 6.924 5.807 5.332 5.128 5.515 5.398 5.623 5.550 5.604 5.715 5.503 5.565
6.073 5.404 6.147 6.583 5.974 5.992 5.410 5.835 5.745 5.856 6.689 7.146 0.000 5.697 7.029 6.437 5.587 7.019 5.677 5.604 5.501 5.142 5.540 5.776 4.816 5.230 6.764 5.776 5.551 5.795 5.711 6.046 5.637 5.739 5.589 5.599 5.638 5.567
3.553 4.027 1.664 2.819 2.532 3.127 2.067 2.838 1.564 1.120 2.360 5.251 5.697 0.000 5.235 2.128 1.633 2.796 4.263 2.917 2.763 1.866 1.382 1.551 1.188 2.597 3.974 2.776 1.737 1.915 1.596 2.634 1.677 1.667 1.499 2.120 1.681 1.803
3.787 3.540 4.872 4.211 4.451 3.554 4.850 4.100 5.092 4.890 5.850 5.692 7.029 5.235 0.000 4.290 4.985 3.965 5.321 5.306 5.284 4.544 4.823 5.087 5.167 5.157 5.555 4.437 5.265 5.084 4.788 4.757 5.019 4.969 4.914 5.169 5.104 5.112
3.965 3.788 2.782 1.994 1.753 2.931 2.045 1.753 1.617 1.609 3.966 4.118 6.437 2.128 4.290 0.000 1.929 1.412 3.497 2.911 2.427 2.456 1.561 1.668 2.457 2.488 4.535 2.175 1.855 1.502 1.869 1.738 2.039 1.908 1.999 2.327 1.976 1.986
3.310 2.968 2.927 2.843 1.723 2.589 0.913 2.074 0.884 0.913 3.511 5.332 5.587 1.633 4.985 1.929 0.000 2.229 3.732 3.261 2.485 1.563 1.046 0.746 1.767 2.462 5.071 1.928 1.597 1.309 1.860 1.626 0.389 0.403 0.487 0.556 0.308 0.625
3.300 3.369 3.081 1.627 1.389 2.138 2.057 1.506 1.953 1.908 4.462 5.290 7.019 2.796 3.965 1.412 2.229 0.000 3.399 3.154 2.609 2.375 1.944 1.951 2.990 2.710 4.692 1.726 2.285 1.889 2.068 1.539 2.152 2.017 2.129 2.400 2.185 2.140
4.569 4.406 4.365 2.551 2.339 3.305 2.902 2.069 3.127 3.528 6.480 6.100 5.677 4.263 5.321 3.497 3.732 3.399 0.000 2.129 1.598 3.091 3.036 3.248 3.431 1.751 4.743 2.138 2.659 2.726 2.842 2.426 3.558 3.526 3.571 3.686 3.550 3.221
4.073 4.731 2.582 1.781 2.314 3.115 2.688 2.308 2.512 2.637 4.961 5.819 5.604 2.917 5.306 2.911 3.261 3.154 2.129 0.000 1.258 2.361 2.245 2.655 2.156 1.047 2.882 2.313 1.796 2.257 1.588 2.580 3.078 3.043 2.971 3.465 3.092 2.826
3.977 4.104 3.071 1.807 1.445 2.806 1.783 1.497 1.732 2.113 5.055 5.604 5.501 2.763 5.284 2.427 2.485 2.609 1.598 1.258 0.000 1.975 1.628 1.877 2.030 0.413 4.033 1.448 1.108 1.362 1.425 1.538 2.303 2.265 2.284 2.565 2.280 1.959
2.291 2.804 2.234 2.175 1.522 1.601 1.134 1.821 1.424 1.288 3.688 5.984 5.142 1.866 4.544 2.456 1.563 2.375 3.091 2.361 1.975 0.000 1.152 1.412 1.260 1.757 3.952 1.441 1.509 1.664 1.199 1.833 1.310 1.350 1.148 1.666 1.453 1.317
3.252 3.366 2.271 1.974 1.209 2.337 0.874 1.550 0.440 0.542 3.630 5.211 5.540 1.382 4.823 1.561 1.046 1.944 3.036 2.245 1.628 1.152 0.000 0.522 1.187 1.563 4.171 1.458 0.698 0.678 0.862 1.294 0.929 0.869 0.827 1.377 0.920 0.782
3.418 3.379 2.645 2.287 1.279 2.511 0.750 1.712 0.168 0.567 3.729 5.363 5.776 1.551 5.087 1.668 0.746 1.951 3.248 2.655 1.877 1.412 0.522 0.000 1.549 1.896 4.633 1.554 0.940 0.664 1.291 1.204 0.612 0.523 0.633 1.012 0.543 0.439
3.310 3.746 1.867 2.582 2.205 2.777 1.710 2.438 1.500 1.357 3.233 5.498 4.816 1.188 5.167 2.457 1.767 2.990 3.431 2.156 2.030 1.260 1.187 1.549 0.000 1.753 3.663 2.284 1.294 1.716 1.207 2.373 1.686 1.724 1.516 2.089 1.713 1.640
3.763 4.001 2.811 1.808 1.554 2.680 1.782 1.598 1.756 2.052 4.835 5.619 5.230 2.597 5.157 2.488 2.462 2.710 1.751 1.047 0.413 1.757 1.563 1.896 1.753 0.000 3.749 1.516 1.098 1.472 1.261 1.730 2.278 2.256 2.223 2.576 2.275 1.969
4.506 6.100 2.464 3.345 4.496 4.296 4.799 4.514 4.546 4.269 4.762 6.924 6.764 3.974 5.555 4.535 5.071 4.692 4.743 2.882 4.033 3.952 4.171 4.633 3.663 3.749 0.000 4.522 4.066 4.520 3.381 4.903 4.916 4.886 4.708 5.413 4.993 4.867
2.967 2.902 3.158 1.678 0.464 1.644 1.108 0.704 1.512 1.779 4.834 5.807 5.776 2.776 4.437 2.175 1.928 1.726 2.138 2.313 1.448 1.441 1.458 1.554 2.284 1.516 4.522 0.000 1.554 1.361 1.566 0.811 1.694 1.646 1.702 1.867 1.751 1.476
3.715 3.886 2.465 1.945 1.345 2.721 1.221 1.650 0.785 1.122 4.078 5.332 5.551 1.737 5.265 1.855 1.597 2.285 2.659 1.796 1.108 1.509 0.698 0.940 1.294 1.098 4.066 1.554 0.000 0.627 0.857 1.373 1.452 1.408 1.407 1.823 1.406 1.164
3.740 3.637 2.804 1.981 1.037 2.649 0.974 1.365 0.517 1.043 4.205 5.128 5.795 1.915 5.084 1.502 1.309 1.889 2.726 2.257 1.362 1.664 0.678 0.664 1.716 1.472 4.520 1.361 0.627 0.000 1.204 0.897 1.217 1.129 1.244 1.507 1.132 0.906
3.143 3.758 1.764 1.439 1.396 2.239 1.510 1.680 1.193 1.100 3.735 5.515 5.711 1.596 4.788 1.869 1.860 2.068 2.842 1.588 1.425 1.199 0.862 1.291 1.207 1.261 3.381 1.566 0.857 1.204 0.000 1.687 1.669 1.617 1.519 2.148 1.714 1.534
3.550 3.223 3.333 1.911 0.510 2.277 1.011 0.835 1.155 1.583 4.785 5.398 6.046 2.634 4.757 1.738 1.626 1.539 2.426 2.580 1.538 1.833 1.294 1.204 2.373 1.730 4.903 0.811 1.373 0.897 1.687 0.000 1.481 1.391 1.562 1.599 1.453 1.209
3.112 2.959 2.828 2.663 1.527 2.362 0.687 1.955 0.763 0.806 3.606 5.623 5.637 1.677 5.019 2.039 0.389 2.152 3.558 3.078 2.303 1.310 0.929 0.612 1.686 2.278 4.916 1.694 1.452 1.217 1.669 1.481 0.000 0.153 0.240 0.530 0.202 0.397
3.142 2.999 2.799 2.566 1.443 2.347 0.693 1.876 0.680 0.729 3.620 5.550 5.739 1.667 4.969 1.908 0.403 2.017 3.526 3.043 2.265 1.350 0.869 0.523 1.724 2.256 4.886 1.646 1.408 1.129 1.617 1.391 0.153 0.000 0.284 0.605 0.220 0.397
2.971 2.957 2.601 2.561 1.537 2.261 0.758 1.955 0.769 0.656 3.431 5.604 5.589 1.499 4.914 1.999 0.487 2.129 3.571 2.971 2.284 1.148 0.827 0.633 1.516 2.223 4.708 1.702 1.407 1.244 1.519 1.562 0.240 0.284 0.000 0.744 0.389 0.526
3.311 2.804 3.342 3.060 1.751 2.575 0.847 2.132 1.148 1.320 3.927 5.715 5.599 2.120 5.169 2.327 0.556 2.400 3.686 3.465 2.565 1.666 1.377 1.012 2.089 2.576 5.413 1.867 1.823 1.507 2.148 1.599 0.530 0.605 0.744 0.000 0.511 0.669
3.305 3.068 2.907 2.712 1.556 2.524 0.719 1.966 0.691 0.833 3.659 5.503 5.638 1.681 5.104 1.976 0.308 2.185 3.550 3.092 2.280 1.453 0.920 0.543 1.713 2.275 4.993 1.751 1.406 1.132 1.714 1.453 0.202 0.220 0.389 0.511 0.000 0.351
3.298 3.104 2.906 2.517 1.308 2.418 0.448 1.738 0.537 0.872 3.893 5.565 5.567 1.803 5.112 1.986 0.625 2.140 3.221 2.826 1.959 1.317 0.782 0.439 1.640 1.969 4.867 1.476 1.164 0.906 1.534 1.209 0.397 0.397 0.526 0.669 0.351 0.000

Perhitungan jarak Mahalanobis digunakan untuk mengukur kedekatan antar provinsi dengan mempertimbangkan korelasi antar variabel fasilitas pendidikan. Berbeda dari Euclidean dan Manhattan, jarak Mahalanobis menyesuaikan perbedaan antar provinsi berdasarkan struktur kovarians sehingga lebih sensitif terhadap hubungan antar jenjang pendidikan. Matriks jarak yang diperoleh menunjukkan tingkat kemiripan pola fasilitas pendidikan antar provinsi nilai kecil menandakan provinsi yang lebih mirip. Jarak ini kemudian menjadi dasar pembentukan cluster pada analisis cluster hierarki.

5.3 Clustering dan Perbandingan Linkage

Pada bagian ini, dilakukan analisis cluster hierarki untuk mengelompokkan provinsi berdasarkan jumlah lembaga pendidikan dari SD hingga Perguruan Tinggi. Analisis menggunakan berbagai jenis jarak (Euclidean, Manhattan, Mahalanobis) dan metode linkage (single, complete, average, centroid, ward.D2) untuk menemukan kombinasi yang menghasilkan struktur cluster terbaik. Optimalitas cluster ditentukan dari nilai rata-rata silhouette, di mana nilai yang lebih tinggi menunjukkan cluster yang lebih jelas terpisah dan homogen.
Perbandingan Mean Silhouette tiap Jarak dan Linkage
Distance Linkage Mean_Silhouette
Euclidean single 0.730
Euclidean complete 0.710
Euclidean average 0.710
Euclidean centroid 0.710
Euclidean ward.D2 0.490
Manhattan single 0.738
Manhattan complete 0.724
Manhattan average 0.724
Manhattan centroid 0.724
Manhattan ward.D2 0.537
Mahalanobis single 0.539
Mahalanobis complete 0.539
Mahalanobis average 0.539
Mahalanobis centroid 0.539
Mahalanobis ward.D2 0.386

Berdasarkan hasil, kombinasi jarak dan linkage tertentu dapat memberikan pengelompokan provinsi yang lebih baik, dan perbedaan metode linkage memengaruhi bentuk cluster meskipun jarak yang digunakan sama. Analisis ini menjadi dasar untuk visualisasi dendrogram dan pemahaman karakteristik setiap cluster provinsi.

5.4 Kombinasi Terbaik

Tabel di bawah menunjukkan kombinasi terbaik dari seluruh percobaan jarak dan linkage yang telah dihitung.
Kombinasi Jarak dan Linkage Terbaik
Distance Linkage Mean_Silhouette
6 Manhattan single 0.738

Dari tabel terlihat kombinasi jarak dan linkage tertentu memberikan nilai mean silhouette tertinggi, yang menandakan cluster yang terbentuk lebih jelas terpisah dan lebih homogen. Dengan mengetahui kombinasi terbaik ini, langkah selanjutnya adalah membuat dendrogram dan menambahkan label cluster, sehingga karakteristik tiap kelompok provinsi dapat dianalisis lebih lanjut.

5.5 Visualisasi Dendogram

Pada bagian ini ditampilkan dendrogram sebagai visualisasi dari proses clustering secara hirarki. Dendrogram membantu melihat pola kemiripan antarobjek serta urutan penggabungan klaster, sehingga dapat mendukung analisis dalam penentuan jumlah klaster yang tepat.

Dendrogram menunjukkan bagaimana objek-objek dikelompokkan berdasarkan tingkat kemiripannya. Objek yang berada pada cabang yang sama dan menyatu pada ketinggian yang rendah memiliki tingkat kemiripan yang lebih tinggi. Sebaliknya, penggabungan yang terjadi pada ketinggian yang lebih tinggi menggambarkan bahwa objek atau kelompok tersebut memiliki perbedaan yang lebih besar. Jarak atau tinggi penggabungan (height) pada dendrogram merupakan indikator seberapa mirip atau berbeda objek-objek tersebut. Dengan melihat pola percabangan ini, dapat diidentifikasi kelompok-kelompok objek yang cenderung berada dalam satu klaster serta dipahami struktur keseluruhan pengelompokan data. Dendrogram juga membantu menentukan jumlah klaster yang wajar dengan memperhatikan bagian percabangan yang paling jelas terpisah.

BAB VI

KESIMPULAN

Berdasarkan hasil analisis cluster hierarki terhadap data jumlah desa yang memiliki fasilitas pendidikan di setiap provinsi di Indonesia, dapat disimpulkan bahwa terdapat perbedaan karakteristik ketersediaan fasilitas pendidikan antarprovinsi. Proses standarisasi data dan evaluasi berbagai kombinasi jarak serta metode linkage menunjukkan bahwa jarak Manhattan dengan metode linkage single merupakan kombinasi terbaik dengan nilai rata-rata silhouette sebesar 0,738, yang menandakan struktur cluster yang kuat dan pemisahan antarcluster yang jelas. Berdasarkan dendrogram, provinsi-provinsi terbagi ke dalam tiga cluster utama yang mencerminkan ketimpangan distribusi fasilitas pendidikan antarwilayah, sehingga hasil pengelompokan ini dapat menjadi dasar dalam mendukung upaya pemerataan pembangunan sarana pendidikan yang lebih tepat sasaran.

DAFTAR PUSTAKA

Arifin, Z. (2017). Evaluasi Pembelajaran: Prinsip, Teknik, dan Prosedur. Bandung: Remaja Rosdakarya.

Fattah, N. (2009). Analisis Kebijakan Pendidikan. Bandung: Remaja Rosdakarya.

Kurniawan, A. (2020). Analisis Statistik dengan R. Malang: UB Press.

Kusnadi, H. (2018). Statistika Terapan untuk Ilmu Sosial. Jakarta: Kencana Prenada Media.

Santoso, S. (2019). Menguasai Statistik Multivariat. Jakarta: PT Elex Media Komputindo.

Setiawan, A. (2012). Pengantar Data Mining: Konsep dan Implementasi. Yogyakarta: Andi.

Suharjo. (2013). Metode Statistika untuk Penelitian Sosial. Jakarta: Bumi Aksara.

Supranto, J. (2009). Statistik: Teori dan Aplikasi. Jakarta: Erlangga.

Suliyanto. (2014). Metode Riset Bisnis. Yogyakarta: Andi.

Suryadi, A., & Tilaar, H. A. R. (2010). Analisis Kebijakan Pendidikan: Suatu Pengantar. Bandung: Remaja Rosdakarya.

Tampubolon, M. P. (2017). Analisis Multivariat dengan SPSS. Jakarta: Mitra Wacana Media.

Wahyuni, S. (2016). Statistik Multivariat. Yogyakarta: Graha Ilmu.

Widarjono, A. (2015). Analisis Multivariat Terapan dengan Program R. Yogyakarta: UPP STIM YKPN.

Yuniarti, D. (2018). Data Mining untuk Penelitian. Bandung: Informatika.