Library:
> # LIBRARY
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)
> library(dplyr)
Pembangunan infrastruktur memiliki peran yang sangat strategis dalam mendukung aktivitas sosial, ekonomi, dan pelayanan publik di suatu wilayah. Ketersediaan infrastruktur yang memadai tidak hanya meningkatkan kualitas hidup masyarakat, tetapi juga menjadi dasar dalam pemerataan pembangunan. Kabupaten Lombok Barat sebagai salah satu daerah dengan dinamika pertumbuhan yang cukup pesat di Provinsi Nusa Tenggara Barat memiliki karakteristik infrastruktur yang berbeda-beda pada setiap kecamatannya. Perbedaan tersebut terlihat terutama pada jumlah dan distribusi fasilitas dasar seperti tempat ibadah, sekolah, dan fasilitas kesehatan, yang merupakan elemen penting dalam menjamin terpenuhinya kebutuhan masyarakat.
Namun, keberagaman kondisi infrastruktur tersebut seringkali menyulitkan pemerintah daerah dalam menentukan prioritas pembangunan secara efektif. Oleh karena itu, diperlukan suatu metode analisis yang mampu mengelompokkan kecamatan berdasarkan kemiripan karakteristik infrastrukturnya sehingga dapat memberikan gambaran yang lebih terstruktur mengenai tingkat perkembangan masing-masing wilayah. Analisis Cluster Hierarki merupakan salah satu teknik statistik yang sesuai untuk tujuan tersebut, karena mampu mengidentifikasi kelompok wilayah yang memiliki pola kesamaan dalam variabel-variabel infrastruktur yang diamati.
Dengan menggunakan variabel seperti jumlah tempat ibadah yang mencerminkan kondisi fasilitas keagamaan, jumlah sekolah yang menunjukkan ketersediaan sarana pendidikan, serta jumlah fasilitas kesehatan yang merepresentasikan akses pelayanan kesehatan, penelitian ini bertujuan untuk mengelompokkan kecamatan-kecamatan di Kabupaten Lombok Barat secara objektif. Hasil pengelompokan diharapkan dapat menjadi dasar bagi pemerintah daerah dalam merumuskan kebijakan pembangunan yang lebih tepat sasaran, khususnya dalam upaya pemerataan penyediaan infrastruktur dan peningkatan kesejahteraan masyarakat di seluruh wilayah Kabupaten Lombok Barat.
Mendeskripsikan kondisi infrastruktur di setiap kecamatan di Kabupaten Lombok Barat berdasarkan jumlah tempat ibadah, sekolah, dan fasilitas kesehatan.
Mengelompokkan kecamatan di Kabupaten Lombok Barat menggunakan Analisis Cluster Hierarki berdasarkan variabel fasilitas infrastruktur.
Mengidentifikasi karakteristik setiap cluster yang terbentuk sebagai dasar pertimbangan dalam perencanaan dan pemerataan pembangunan infrastruktur daerah.
> #2. IMPORT DATA
> library(readxl)
> Data_Mini_Project_Anmul <- read_excel("D:/DOCUMENTS/Analisis Multivariat/Data Mini Project Anmul.xlsx")
> View (Data_Mini_Project_Anmul)
> data <- data.frame(Data_Mini_Project_Anmul)
> kable(Data_Mini_Project_Anmul)
| Nama Desa | x1 ( pendidikan ) | x2 ( kesehatan ) | x3 ( Tempat Ibadah ) |
|---|---|---|---|
| Jatisela | 12 | 12 | 36 |
| Sesela | 17 | 9 | 23 |
| Midang | 11 | 6 | 27 |
| Kekeri | 3 | 7 | 29 |
| Penimbung | 10 | 5 | 36 |
| Mambalan | 3 | 5 | 9 |
| Dopang | 4 | 4 | 17 |
| Tamansari | 11 | 2 | 18 |
| Gunungsari | 18 | 2 | 12 |
| Kekait | 10 | 1 | 21 |
| Mekarsari | 4 | 1 | 8 |
| Guntur Macan | 2 | 2 | 13 |
| Gelangsar | 2 | 1 | 8 |
| Ranjok | 3 | 1 | 19 |
| Bukit Tinggi | 6 | 2 | 11 |
| Jeringo | 4 | 2 | 12 |
Data yang digunakan merupakan data sekunder yang bersumber dari Pemerintah Kecamatan Gunungsari terkait mengenai kondisi infrastruktur di Kecamatan Gunungsari. Data tersebut mencakup variabel pendidikan, kesehatan, dan tempat ibadah, yang menggambarkan ketersediaan serta distribusi fasilitas umum bagi masyarakat. Informasi ini meliputi jumlah serta sebaran sekolah, sarana kesehatan seperti puskesmas dan posyandu, serta tempat ibadah yang ada di wilayah Kecamatan Gunungsari. Variabel prediktor dan variabel respon yang digunakan dalam penelitian ini seperti hasil di atas.
Metode yang digunakan dalam analisis ini adalah Analisis Cluster Hierarki (Hierarchical Clustering untuk mengelompokan objek (desa) berdasarkan karakteristik variabel yang diukur, langkah-langkah analisis cluster hierarki seperti berikut:
statistika deskriptif Tahap ini bertujuan untuk memperoleh gambaran umum mengenai karakteristik setiap variabel (rata-rata, median, minimum, maksimum) sebelum dilakukan analisis lebih lanjut.
Uji Asumsi Clucter
Sebelum melakukan klasterisasi, dilakukan pengujian untuk memastikan kelayakan data: Uji Kaiser-Meyer-Olkin (KMO): Untuk mengukur kecukupan sampel (sampling adequacy) dan menguji apakah data cocok untuk dianalisis klaster atau faktor. Nilai MSA (Measure of Sampling Adequacy) harus dipertimbangkan.
Uji Multikolinearitas (Korelasi Pearson): Untuk memeriksa hubungan linearitas antar variabel. Meskipun korelasi yang kuat tidak menghalangi klasterisasi, hasil ini membantu memahami keterkaitan antar variabel pembentuk klaster.
Karena satuan dan rentang nilai (x1, x2, dan x3) berbeda secara signifikan, data perlu dinormalisasi (distandardisasi) menggunakan metode Z-score (seperti yang dilakukan oleh fungsi scale() di R). Hal ini penting agar semua variabel memiliki kontribusi yang setara dalam perhitungan jarak. \[\text{Z} = \frac{(X_i - \bar{X})}{S}\] Keterangan:
\(X_i\): Nilai data observasi.
\(\bar{X}\): Nilai rata-rata variabel.
\(S\): Standar deviasi variabel.
Jarak antar objek (desa) dihitung menggunakan Jarak Euclidean (Euclidean Distance) pada data yang telah distandardisasi. Jarak ini menentukan tingkat kemiripan atau ketidakmiripan antar desa. \[\text{Jarak Euclidean} = \sqrt{\sum_{i=1}^{p} (X_{ij} - X_{kj})^2}\] Keterangan:
\(X_{ij}\): Nilai variabel \(j\) untuk objek \(i\).
\(X_{kj}\): Nilai variabel \(j\) untuk objek \(k\).
Pemilihan Metode Linkage Optimal: Membandingkan beberapa metode linkage (seperti Single, Complete, Average, Centroid, dan Ward’s Method) menggunakan Koefisien Korelasi Kofenetik (Cophenetic Correlation Coefficient). Metode dengan nilai koefisien tertinggi dipilih karena paling baik mempertahankan struktur jarak data asli.Pemilihan Jumlah Klaster (\(k\)) Optimal: Menentukan jumlah klaster terbaik (\(k\)) menggunakan Indikator Validasi Internal seperti Dunn Index, Connectivity, dan Silhouette Coefficient. Metode Silhouette sering menjadi tolok ukur utama karena mengukur seberapa baik setiap objek cocok dengan klaster yang ditugaskan.Pembentukan Klaster: Berdasarkan metode linkage yang terpilih (Average Linkage) dan jumlah klaster optimal (\(k=2\)), klaster dibentuk dan hasilnya divisualisasikan menggunakan Dendrogram.
> # STATISTIKA DESKRIPTIF
> statdes <- summary(Data_Mini_Project_Anmul)
> statdes
Nama Desa x1 ( pendidikan ) x2 ( kesehatan ) x3 ( Tempat Ibadah )
Length:16 Min. : 2.0 Min. : 1.000 Min. : 8.00
Class :character 1st Qu.: 3.0 1st Qu.: 1.750 1st Qu.:11.75
Mode :character Median : 5.0 Median : 2.000 Median :17.50
Mean : 7.5 Mean : 3.875 Mean :18.69
3rd Qu.:11.0 3rd Qu.: 5.250 3rd Qu.:24.00
Max. :18.0 Max. :12.000 Max. :36.00
X1 (pendidikan): jumlah fasilitas pendidikan bervariasi dari 2 hingga 18 unit dengan rata-rata 8 unit.
X2 (kesehatan): jumlah fasilitas kesehatan bervariasi dari 1 hingga 12 unit, dengan rata-rata 4 unit.
X3 (Tempat Ibadah): Jumlah tempat ibadah bervariasi dari 8 hingga 36 unit, dengan rata-rata 19 unit.
> ## 4.Uji KMO (Sampel Representatif)
> kmo <- KMO(Data_Mini_Project_Anmul[, 2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = Data_Mini_Project_Anmul[, 2:4])
Overall MSA = 0.62
MSA for each item =
x1 ( pendidikan ) x2 ( kesehatan ) x3 ( Tempat Ibadah )
0.84 0.59 0.59
Nilai Overall MSA (Measure of Sampling Adequacy) adalah 0.62 secara umum, nilai MSA di atas 0.5 menunjukkan bahwa data cukup memadai untuk dilakukan analisis faktor atau klaster. Dalam konteks ini, meskipun hasilnya tidak ideal (seringkali idealnya di atas 0.7 atau 0.8), data ini masih dapat diproses untuk klastering, terutama karena klastering adalah teknik eksplorasi.
Nilai MSA per item untuk x1 (pendidikan) adalah 0.84 (sangat baik), namun untuk x2 (kesehatan) dan x3 (Tempat Ibadah) masing-masing 0.59 (cukup).
> # 5. STANDARISASI DATA
> datastand <- scale(Data_Mini_Project_Anmul[, 2:4])
> rownames(datastand) <- Data_Mini_Project_Anmul$`Nama Desa`
> datastand
x1 ( pendidikan ) x2 ( kesehatan ) x3 ( Tempat Ibadah )
Jatisela 0.8524521 2.48970887 1.85578378
Sesela 1.7996212 1.57043175 0.46227105
Midang 0.6630183 0.65115463 0.89104420
Kekeri -0.8524521 0.95758033 1.10543077
Penimbung 0.4735845 0.34472892 1.85578378
Mambalan -0.8524521 0.34472892 -1.03843497
Dopang -0.6630183 0.03830321 -0.18088867
Tamansari 0.6630183 -0.57454820 -0.07369538
Gunungsari 1.9890550 -0.57454820 -0.71685511
Kekait 0.4735845 -0.88097391 0.24788448
Mekarsari -0.6630183 -0.88097391 -1.14562825
Guntur Macan -1.0418859 -0.57454820 -0.60966182
Gelangsar -1.0418859 -0.88097391 -1.14562825
Ranjok -0.8524521 -0.88097391 0.03349790
Bukit Tinggi -0.2841507 -0.57454820 -0.82404839
Jeringo -0.6630183 -0.57454820 -0.71685511
attr(,"scaled:center")
x1 ( pendidikan ) x2 ( kesehatan ) x3 ( Tempat Ibadah )
7.5000 3.8750 18.6875
attr(,"scaled:scale")
x1 ( pendidikan ) x2 ( kesehatan ) x3 ( Tempat Ibadah )
5.278889 3.263434 9.328942
Beberapa desa menunjukkan Z-score positif yang tinggi, menandakan ketersediaan sarana yang jauh di atas rata-rata:
A. Jatisela: Memiliki fasilitas Kesehatan (\(X_2\)) tertinggi dengan 2.49 standar deviasi di atas rata-rata (Nilai Z-score: 2.4897). Fasilitas Pendidikan (\(X_1\)) dan Tempat Ibadah (\(X_3\)) juga tinggi (Z-score masing-masing 0.852 dan 1.856).Gunungsari: Memiliki fasilitas Pendidikan (\(X_1\)) tertinggi dengan 1.99 standar deviasi di atas rata-rata (Nilai Z-score: 1.9890).Penimbung: Memiliki fasilitas Tempat Ibadah (\(X_3\)) yang sangat tinggi, 1.86 standar deviasi di atas rata-rata (Nilai Z-score: 1.8558), setara dengan Jatisela.
B. Desa dengan Ketersediaan Sarana Rendah (Z-score Negatif Jauh)Sebaliknya, beberapa desa menunjukkan Z-score negatif yang signifikan, menandakan ketersediaan sarana yang di bawah rata-rata:Mekarsari dan Gelangsar: Keduanya menunjukkan nilai \(X_3\) (Tempat Ibadah) yang sangat rendah, sekitar 1.15 standar deviasi di bawah rata-rata (Z-score: -1.1456).Guntur Macan dan Gelangsar: Keduanya memiliki nilai \(X_1\) (Pendidikan) terendah, sekitar 1.04 standar deviasi di bawah rata-rata (Z-score: -1.0418).Sebagian besar desa pada klaster 2 (Mambalan hingga Jeringo) menunjukkan Z-score negatif pada hampir semua variabel.
> # 6. MENGHITUNG JARAK EUCLIDEAN
> jarak <- dist(datastand, method = "euclidean")
> jarak
Jatisela Sesela Midang Kekeri Penimbung Mambalan
Sesela 1.9193950
Midang 2.0849195 1.5234116
Kekeri 2.4118760 2.7969151 1.5609321
Penimbung 2.1781826 2.2809205 1.0298079 1.6422514
Mambalan 3.9854911 3.2845028 2.4725366 2.2297415 3.1835319
Dopang 3.5290332 2.9708022 1.8119051 1.5923484 2.3524025 0.9301438
Tamansari 3.6260786 2.4859737 1.5598301 2.4565030 2.1456573 2.0180296
Gunungsari 4.1593279 2.4550280 2.4178629 3.7070617 3.1241306 3.0037721
Kekait 3.7537159 2.7953040 1.6724107 2.4236420 2.0218031 2.2170562
Mekarsari 4.7609481 3.8287496 2.8729472 2.9126334 3.4355040 1.2448787
Guntur Macan 4.3653877 3.7180831 2.5809232 2.3075627 3.0364689 1.0318924
Gelangsar 4.8947414 4.0827555 3.0662927 2.9126334 3.5787529 1.2448787
Ranjok 4.1939154 3.6368570 2.3193650 2.1282203 2.5654330 1.6283082
Bukit Tinggi 4.2264687 3.2554050 2.3110645 2.5284925 2.9327007 1.1018160
Jeringo 4.2784101 3.4721565 2.4178629 2.3883109 2.9589537 0.9921538
Dopang Tamansari Gunungsari Kekait Mekarsari Guntur Macan
Sesela
Midang
Kekeri
Penimbung
Mambalan
Dopang
Tamansari 1.4647356
Gunungsari 2.7742278 1.4737800
Kekait 1.5234116 0.4829032 1.8224352
Mekarsari 1.3325888 1.7324289 2.7039297 1.7982613
Guntur Macan 0.8384354 1.7871650 3.0328358 1.7680308 0.7243600
Gelangsar 1.3854001 2.0370654 3.0764177 2.0587687 0.3788676 0.6173789
Ranjok 0.9627654 1.5498509 2.9548416 1.3432553 1.1942461 0.7371813
Bukit Tinggi 0.9658064 1.2083703 2.2757316 1.3479983 0.5838245 0.7874797
Jeringo 0.8141541 1.4737800 2.6520733 1.5220004 0.5270134 0.3937399
Gelangsar Ranjok Bukit Tinggi
Sesela
Midang
Kekeri
Penimbung
Mambalan
Dopang
Tamansari
Gunungsari
Kekait
Mekarsari
Guntur Macan
Gelangsar
Ranjok 1.1942461
Bukit Tinggi 0.8783354 1.0734286
Jeringo 0.6490638 0.8323530 0.3937399
Hasil Kunci: Tiga pasangan desa memiliki jarak Euclidean di bawah 0.4:
Mekarsari - Gelangsar: 0.3788 (Terpendek)
Guntur Macan - Jeringo: 0.3937
Bukit Tinggi - Jeringo: 0.3937
Interpretasi: Nilai yang sangat kecil ini mengindikasikan bahwa desa-desa ini, yang semuanya berada dalam Klaster 2, memiliki profil Z-score yang hampir identik. Artinya, tingkat kekurangan fasilitas di antara desa-desa ini relatif seragam.
Hasil Kunci: Jarak terpanjang tercatat antara:
Jatisela (Klaster 1) - Gelangsar (Klaster 2): 4.8947 (Terpanjang)
Jatisela (Klaster 1) - Mekarsari (Klaster 2): 4.7609
Interpretasi: Nilai yang sangat besar ini merupakan indikator kuat adanya disparitas ekstrem antara kelompok desa yang memiliki fasilitas terlengkap (Klaster 1, diwakili oleh Jatisela) dan kelompok desa yang memiliki fasilitas terbatas (Klaster 2, diwakili oleh Gelangsar dan Mekarsari).
> # KOEFISIEN KORELASI COPHENETIC
> ## Single Linkage
> hc_single <- hclust(jarak, method = "single")
> cor_single <- cor(jarak, cophenetic(hc_single))
> ## Average Linkage
> hc_average <- hclust(jarak, method = "average")
> cor_average <- cor(jarak, cophenetic(hc_average))
> ## Complete Linkage
> hc_complete <- hclust(jarak, method = "complete")
> cor_complete <- cor(jarak, cophenetic(hc_complete))
> ## Centroid Linkage
> hc_centroid <- hclust(jarak, method = "centroid")
> cor_centroid <- cor(jarak, cophenetic(hc_centroid))
> ## Ward’s Method
> hc_ward <- hclust(jarak, method = "ward.D")
> cor_ward <- cor(jarak, cophenetic(hc_ward))
> ## Ringkasan Koefisien Korelasi
> KorCop <- data.frame(
+ Metode = c("Single Linkage", "Average Linkage", "Complete Linkage", "Centroid Linkage", "Ward's Method"),
+ Koefisien_Korelasi = c(cor_single, cor_average, cor_complete, cor_centroid, cor_ward)
+ )
> KorCop
Metode Koefisien_Korelasi
1 Single Linkage 0.8357160
2 Average Linkage 0.8140224
3 Complete Linkage 0.8057851
4 Centroid Linkage 0.8455076
5 Ward's Method 0.7825779
Metode Optimal: Centroid Linkage menghasilkan koefisien korelasi kofenetik tertinggi (0.8455).
Interpretasi: Metode Centroid Linkage adalah pilihan terbaik karena dendrogram yang dibentuk menggunakan metode ini paling setia dan akurat dalam mencerminkan perbedaan jarak fasilitas publik yang sebenarnya antar desa.
Kualitas Umum: Semua metode linkage yang diuji menghasilkan nilai koefisien di atas 0.78, yang secara umum dianggap sebagai representasi yang cukup baik hingga sangat baik (nilai > 0.7 sering dianggap baik).
> # 8. ANALISIS CLUSTER dengan METODE AVERAGE LINKAGE
> plot(hc_average,
+ labels = Data_Mini_Project_Anmul$`Nama Desa`,
+ hang = 1,
+ main = "Cluster Dendrogram",
+ xlab = "Nama Desa",
+ ylab = "Jarak")
Dendrogram ini adalah representasi visual dari seluruh proses analisis klaster hierarki, menunjukkan bagaimana 16 desa digabungkan secara bertahap berdasarkan kemiripan profil fasilitas publik mereka.
Sumbu dan MaknaSumbu X (Horizontal): Menunjukkan nama-nama desa (Nama Desa).Sumbu Y (Vertikal): Menunjukkan Jarak (Tingkat Ketidakmiripan). Semakin tinggi batang horizontal, semakin besar jarak (perbedaan) antara desa/klaster yang digabungkan.
Proses Pengelompokan (Kenaikan Jarak)
A. Kemiripan Tinggi (Penggabungan Awal di Jarak Rendah)Penggabungan dimulai dari bawah (jarak nol). Desa yang digabungkan pertama kali adalah yang paling mirip:Contoh: Desa Mambalan, Dopang, dan Ranjok digabungkan pada jarak yang sangat rendah. Ini menunjukkan ketiganya memiliki profil fasilitas yang hampir identik (Sesuai dengan hasil klaster 2).
B. Pembentukan Klaster Besar Dendrogram menunjukkan pembentukan dua kelompok utama, yang terpisah pada jarak vertikal yang cukup tinggi, mengonfirmasi hasil \(k=2\): Klaster Kiri (Kelompok Fasilitas Rendah): Mencakup Mambalan hingga Gunungsari. Kelompok ini menunjukkan bahwa mayoritas desa memiliki profil fasilitas yang relatif mirip, yaitu di bawah rata-rata. Klaster Kanan (Kelompok Fasilitas Tinggi): Mencakup Kekeri hingga Jatisela. Kelompok ini menunjukkan desa-desa dengan profil fasilitas di atas rata-rata.
> # PENENTUAN JUMLAH CLUSTER OPTIMAL
> inval <- clValid(datastand, 2:5,
+ clMethods = "hierarchical",
+ validation = "internal",
+ metric = "euclidean",
+ method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 6.8270 10.5210 16.7079 18.2079
Dunn 0.5070 0.4952 0.6296 0.6631
Silhouette 0.4622 0.3776 0.4281 0.3971
Optimal Scores:
Score Method Clusters
Connectivity 6.8270 hierarchical 2
Dunn 0.6631 hierarchical 5
Silhouette 0.4622 hierarchical 2
> plot_nb <- fviz_nbclust(datastand, FUN = hcut, hc_method = "average", method = "silhouette")
> print(plot_nb)
Hasil jumlah cluster Optimal:
Jumlah cluater terbaik untuk data Anda adalah \(k=2\).
Kualitas Klastering: Nilai rata-rata \(0.46\) menunjukkan struktur cluster yang wajar atau memadai. Meskipun tidak mendekati 1 (yang berarti pemisahan cluster yang sempurna), nilai ini adalah yang terbaik yang dapat dicapai data ini dan menunjukkan bahwa pembagian menjadi dua kelompok adalah yang paling koheren secara internal.
> # 10. PEMBENTUKAN ANGGOTA CLUSTER
> anggota <- data.frame(
+ Cluster = cutree(hc_average, k = 2)
+ )
> anggota
Cluster
Jatisela 1
Sesela 1
Midang 1
Kekeri 1
Penimbung 1
Mambalan 2
Dopang 2
Tamansari 2
Gunungsari 2
Kekait 2
Mekarsari 2
Guntur Macan 2
Gelangsar 2
Ranjok 2
Bukit Tinggi 2
Jeringo 2
Klaster Jumlah Desa Anggota Desa:
Klaster 1 yaitu 5 Desa yang terdiri: Jatisela, Sesela, Midang, Kekeri, Penimbung
Klaster 2 yaitu 11 Desa yang terdiri: Mambalan, Dopang, Tamansari, Gunungsari, Kekait, Mekarsari, Guntur Macan, Gelangsar, Ranjok, Bukit Tinggi, Jeringo
> # 11. VISUALISASI DENDOGRAM dengan WARNA CLUSTER
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, main = "Hasil Analisis Cluster", cex = 0.5)
Sumbu X: Menunjukkan nama-nama desa yang menjadi objek pengamatan.
A. Klaster Merah (Fasilitas Sedang-Rendah) Anggota: 11 Desa (Mambalan, Dopang, Ranjok, Mekarsari, Guntur Macan, Gelangsar, Bukit Tinggi, Jeringo, Gunungsari, Tamansari, Kekait).
Karakteristik: Kelompok ini terdiri dari mayoritas desa. Penggabungan di dalam klaster ini terjadi pada ketinggian yang relatif rendah, menunjukkan bahwa desa-desa ini sangat mirip satu sama lain. Berdasarkan analisis rata-rata sebelumnya, kelompok ini dicirikan oleh ketersediaan fasilitas yang relatif di bawah rata-rata.
B. Klaster Biru-Hijau (Fasilitas Tinggi) Anggota: 5 Desa (Kekeri, Midang, Penimbung, Jatisela, Sesela).
Karakteristik: Kelompok ini terdiri dari minoritas desa. Desa-desa ini juga cukup mirip satu sama lain (homogenitas internal). Kelompok ini dicirikan oleh ketersediaan fasilitas yang jauh di atas rata-rata.
Intinya: Jarak tertinggi ini menunjukkan bahwa perbedaan (kesenjangan) profil fasilitas antara Klaster Merah (fasilitas rendah) dan Klaster Biru-Hijau (fasilitas tinggi) adalah perbedaan yang paling besar dari semua perbandingan dalam data.
> # 12. NILAI MEAN SETIAP CLUSTER
> idclus <- clus_hier$cluster
> aggregate(data[, 2:4], list(Cluster = idclus), mean)
Cluster x1...pendidikan.. x2...kesehatan.. x3...Tempat.Ibadah..
1 1 10.600000 7.800000 30.20000
2 2 6.090909 2.090909 13.45455
A. Klaster 1 (5 Desa) Profil: Desa-desa dalam klaster ini memiliki rata-rata fasilitas di atas rata-rata keseluruhan untuk semua indikator.
Rata-rata Pendidikan (10.60) jauh di atas rata-rata total (7.50).
Rata-rata Kesehatan (7.80) hampir dua kali lipat rata-rata total (3.88).
Rata-rata Tempat Ibadah (30.20) jauh di atas rata-rata total (18.69).
Penamaan: Klaster ini diinterpretasikan sebagai Klaster Desa Berkualitas Tinggi atau Klaster Desa dengan Fasilitas Sarana Publik Lengkap.
B. Klaster 2 (11 Desa) Profil: Desa-desa dalam klaster ini memiliki rata-rata fasilitas di bawah rata-rata keseluruhan untuk semua indikator.
Rata-rata Pendidikan (6.09) lebih rendah dari rata-rata total (7.50).
Rata-rata Kesehatan (2.09) jauh di bawah rata-rata total (3.88).
Rata-rata Tempat Ibadah (13.45) jauh di bawah rata-rata total (18.69).
Penamaan: Klaster ini diinterpretasikan sebagai Klaster Desa Berkualitas Sedang-Rendah atau Klaster Desa dengan Ketersediaan Fasilitas Sarana Publik Terbatas.
Klaster 1: Desa Berkualitas Tinggi (Fasilitas Lengkap)Klaster 1 hanya terdiri dari 5 desa (Jatisela, Sesela, Midang, Kekeri, Penimbung). Klaster ini mewakili desa-desa dengan profil ketersediaan fasilitas sarana publik yang paling optimal.Rata-rata Klaster: \(X_1\) (10.60), \(X_2\) (7.80), \(X_3\) (30.20).Perbandingan: Rata-rata ketiga variabel secara signifikan di atas rata-rata keseluruhan populasi desa.Profil Utama:\(X_2\) (Kesehatan) dan \(X_3\) (Tempat Ibadah) Tertinggi: Klaster ini memiliki rata-rata fasilitas kesehatan yang hampir dua kali lipat dari rata-rata total (7.80 vs 3.88) dan rata-rata tempat ibadah yang jauh di atas rata-rata total (30.20 vs 18.69).Contoh Desa Ekstrem: Desa Jatisela dan Penimbung menunjukkan profil \(X_3\) (Tempat Ibadah) tertinggi (Z-score 1.856), sementara Desa Sesela menunjukkan profil \(X_2\) (Kesehatan) tertinggi (Z-score 1.570). Hal ini menandakan keberhasilan dalam penyediaan infrastruktur dasar dan keagamaan yang memadai.Karakteristik: Klaster ini merefleksikan desa-desa yang mungkin berfungsi sebagai pusat layanan atau memiliki alokasi sumber daya yang lebih besar, ditandai oleh konsentrasi fasilitas yang tinggi, yang berujung pada tingginya kualitas hidup dasar.
Klaster 2: Desa Berkualitas Sedang-Rendah (Fasilitas Terbatas)Klaster 2 berisi 11 desa (Mambalan, Dopang, Tamansari, Gunungsari, Kekait, Mekarsari, Guntur Macan, Gelangsar, Ranjok, Bukit Tinggi, Jeringo), yang merupakan mayoritas dari seluruh populasi desa.Rata-rata Klaster: \(X_1\) (6.09), \(X_2\) (2.09), \(X_3\) (13.45). Perbandingan: Rata-rata ketiga variabel jauh di bawah rata-rata keseluruhan populasi desa.Profil Utama:\(X_2\) (Kesehatan) Terendah: Klaster ini memiliki rata-rata fasilitas kesehatan yang sangat minim (2.09), menunjukkan potensi kesenjangan akses layanan kesehatan yang serius di kelompok ini.\(X_3\) (Tempat Ibadah) Terendah: Rata-rata fasilitas tempat ibadah juga jauh di bawah rata-rata keseluruhan (13.45). Contoh Desa Ekstrem: Desa Gelangsar dan Mekarsari menunjukkan profil \(X_3\) (Tempat Ibadah) terendah (Z-score -1.146), sedangkan Desa Guntur Macan dan Gelangsar menunjukkan profil \(X_1\) (Pendidikan) terendah (Z-score -1.042). Hal ini mengindikasikan bahwa pembangunan infrastruktur dasar masih menjadi tantangan utama di wilayah ini.
Berdasarkan hasil analisis Agglomerative Hierarchical Clustering terhadap 16 desa menggunakan variabel ketersediaan fasilitas Pendidikan, Kesehatan, dan Tempat Ibadah, dapat ditarik kesimpulan sebagai berikut:
Struktur Pengelompokan: Desa-desa dapat dipisahkan ke dalam dua klaster utama yang menunjukkan adanya disparitas (kesenjangan) yang sangat signifikan dalam ketersediaan sarana publik antar kelompok desa. Perbedaan ini konsisten pada ketiga variabel yang diukur (\(X_1, X_2, X_3\)).
Penentuan Klaster Optimal: Hasil analisis dendrogram, didukung oleh indikator validasi internal, khususnya Average Silhouette Width (mencapai nilai tertinggi \(\approx 0.46\)), menunjukkan bahwa jumlah klaster optimal adalah dua klaster (\(k=2\)). Pemilihan klaster ini didasarkan pada metode Average Linkage, yang menghasilkan koefisien korelasi kofenetik yang tinggi, memastikan dendrogram mereplikasi jarak data asli dengan baik.
Karakteristik Klaster:
Klaster 1 (Fasilitas Tinggi): Terdiri dari 5 desa (Jatisela, Sesela, Midang, Kekeri, Penimbung). Kelompok ini memiliki ciri khas sebagai wilayah dengan ketersediaan sarana publik tertinggi di semua indikator. Rata-rata ketiga variabel (misalnya, \(X_2\) Kesehatan rata-rata 7.80) secara signifikan jauh di atas rata-rata keseluruhan.
Klaster 2 (Fasilitas Sedang-Rendah): Terdiri dari 11 desa lainnya. Kelompok ini memiliki karakteristik ketersediaan fasilitas pada kategori terbatas. Rata-rata ketiga variabel (misalnya, \(X_2\) Kesehatan rata-rata 2.09) berada di bawah rata-rata keseluruhan, mencerminkan kebutuhan akan peningkatan infrastruktur dasar.
Saran yang dapat diberikan berdasarkan temuan klasterisasi dalam penelitian ini adalah sebagai berikut:
Untuk Pemerintah Daerah: Perlu memfokuskan upaya pemerataan infrastruktur dan sarana publik, terutama di desa-desa yang termasuk dalam Klaster 2. Prioritas utama harus diberikan pada peningkatan ketersediaan fasilitas Kesehatan dan Pendidikan agar mencapai standar minimal yang setara dengan Klaster 1.Untuk Pemangku Kebijakan Pembangunan: Dapat menyusun strategi program afirmasi infrastruktur yang ditargetkan secara spesifik untuk 11 desa di Klaster 2. Sementara itu, Klaster 1 dapat difokuskan pada program pengembangan dan pemeliharaan kualitas sarana yang ada, agar desa-desa tersebut dapat dijadikan model percontohan (benchmark) bagi desa lain dalam pengelolaan fasilitas publik.
Untuk Tenaga Pembangunan Desa: Desa-desa yang termasuk dalam Klaster 1 (terutama Jatisela, yang memiliki \(X_2\) dan \(X_3\) tertinggi) dapat dijadikan model bagi desa lain dalam hal perencanaan dan pemanfaatan alokasi dana desa untuk pembangunan infrastruktur sosial.
Untuk Peneliti Selanjutnya:Dapat menambahkan variabel lain yang lebih rinci dan komprehensif, seperti kualitas/kondisi fisik bangunan, rasio tenaga ahli (dokter/guru bersertifikat), dan tingkat pemanfaatan sarana yang ada.Dapat mempertimbangkan penggunaan data time series atau data longitudinal untuk menganalisis perubahan status klaster desa dari waktu ke waktu.Dapat membandingkan metode klastering non-hierarki lain, seperti K-Means, untuk menguji konsistensi dan stabilitas pembagian klaster yang dihasilkan.
Johnson, R. A., & Wichern, D. W. (2019). (Untuk dasar Multivariate Analysis dan Cluster Analysis)
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2019). Multivariate data analysis (8th ed.). Cengage Learning.
Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster analysis (5th ed.). John Wiley & Sons.
Keterangan:
X1 =(Pendidikan)
X2 =(Kesehatan)
X3 =(Tempat Ibadah)