Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Akses terhadap pelayanan dasar merupakan salah satu indikator penting dalam menilai kualitas hidup masyarakat dan pembangunan suatu negara. Di Indonesia, yang merupakan negara kepulauan dengan keragaman sosial, ekonomi, dan budaya yang tinggi, akses terhadap pelayanan dasar seperti kesehatan, pendidikan, air bersih, dan sanitasi sangat bervariasi antar provinsi. Ketidakmerataan ini dapat mempengaruhi kesejahteraan masyarakat dan berkontribusi pada ketimpangan sosial.

Dari data Badan Pusat Statistik (BPS) menunjukkan bahwa beberapa provinsi di Indonesia masih memiliki proporsi rumah tangga dengan akses pelayanan dasar yang rendah. Ketimpangan ini dapat disebabkan oleh beberapa faktor, seperti tingkat ekonomi, infrastruktur, dan kebijakan daerah. Sehingga perlu dilakukan analisis untuk mengetaui pola ketimpangan ini agar kebijakan yang diterapkan lebih efektif dan terarah.

Analisis cluster adalah metode statistik yang berguna untuk mengelompokkan provinsi berdasarkan karakteristik yang serupa, termasuk proporsi rumah tangga yang memiliki akses terhadap pelayanan dasar. Melalui pendekatan ini, pemerintah dan pemangku kebijakan dapat mengenali kelompok provinsi dengan tantangan yang sejenis, sehingga kebijakan yang diterapkan dapat menjadi lebih efektif dan terarah.

Secara umum, analisis cluster dibagi menjadi dua metode utama, yaitu metode hierarki dan metode non-hierarki. Metode hierarki digunakan ketika jumlah cluster belum diketahui sebelumnya. Proses pada metode ini dapat dilakukan melalui penggabungan bertahap (agglomerative) atau pemisahan bertahap (divisive). Sebaliknya, pada metode non-hierarki, jumlah cluster sudah ditentukan lebih dahulu sesuai kebutuhan peneliti.

Dalam metode agglomerative, setiap objek pengamatan dianggap sebagai kelompok tersendiri dengan satu anggota, lalu dua kelompok atau objek yang memiliki jarak paling dekat digabungkan menjadi satu kelompok. Sementara itu, metode divisive dimulai dengan menganggap semua objek sebagai satu kelompok besar, yang kemudian dipecah secara bertahap hingga terbentuk kelompok-kelompok kecil dengan satu anggota setiap kelompok.

Hasil dari metode agglomerative dapat divisualisasikan menggunakan dendogram, yaitu diagram yang menggambarkan proses pembentukan cluster. Garis horizontal pada dendogram menunjukkan skala kemiripan, di mana nilai skala yang lebih kecil menandakan tingkat kemiripan yang lebih tinggi antar individu (Supranto, 2004).

1.2 Rumusan Masalah

Bagaimana pola distribusi proporsi rumah tangga dengan akses pelayanan dasar di Indonesia menurut provinsi?
Apakah terdapat perbedaan signifikan dalam akses pelayanan dasar antarprovinsi di Indonesia?
Bagaimana pengelompokan provinsi berdasarkan kesamaan proporsi rumah tangga dengan akses pelayanan dasar menggunakan analisis cluster?

1.3 Tujuan

Menganalisis pola distribusi proporsi rumah tangga dengan akses pelayanan dasar di Indonesia menurut provinsi.
Mengidentifikasi perbedaan akses pelayanan dasar antarprovinsi di Indonesia.
Mengelompokkan provinsi berdasarkan kesamaan proporsi rumah tangga dengan akses pelayanan dasar menggunakan metode analisis cluster.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif merupakan salah satu metode statistik yang berfokus pada pengumpulan dan penyajian data untuk menghasilkan informasi yang bermanfaat (Martias, 2021). Menurut Solikhah (2016), statistika deskriptif, yang juga dikenal sebagai statistik deduktif, statistik sederhana, atau statistik deskriptif, mencakup berbagai kegiatan seperti menghimpun, menyusun, mengatur, mengolah, menyajikan, dan menganalisis data numerik. Tujuannya adalah memberikan gambaran yang terstruktur, ringkas, dan jelas mengenai suatu fenomena, peristiwa, atau kondisi sehingga dapat diperoleh pemahaman atau makna tertentu dari data tersebut.

2.2 Analisis Cluster

Analisis cluster merupakan teknik statistik yang digunakan untuk mengelompokkan objek ke dalam kelompok-kelompok berdasarkan tingkat kesamaan, sehingga objek dalam satu kelompok memiliki kemiripan yang lebih tinggi dibandingkan dengan objek di kelompok lain (Silvi, 2018). Dengan kata lain, tujuan analisis cluster adalah untuk mengklasifikasikan objek-objek berdasarkan kemiripan di antara mereka dan mengelompokkan data ke dalam beberapa kategori.

Secara umum, analisis cluster terbagi menjadi dua metode utama: metode hierarki dan metode non-hierarki. Metode hierarki digunakan ketika jumlah cluster belum diketahui sebelumnya, dengan proses yang dilakukan melalui penggabungan bertahap (agglomerative) atau pemisahan bertahap (divisive). Sementara itu, pada metode non-hierarki, jumlah cluster ditentukan terlebih dahulu sesuai kebutuhan peneliti.

Tahapan dalam analisis cluster menurut Hemelia dan Bagus (2019) adalah sebagai berikut:

Proses Standarisasi Data
Langkah awal dalam analisis cluster adalah melakukan standarisasi data menggunakan z-score. Tujuannya adalah untuk memperkecil perbedaan satuan antar variabel dan menyamakan skala pada variabel yang memiliki satuan berbeda.
Menentukan Ukuran Kemiripan
Analisis cluster melibatkan pengukuran kemiripan menggunakan ukuran asosiasi, korelasi, atau jarak antar objek. Salah satu metode yang sering digunakan untuk mengukur jarak antar objek adalah Euclidean Distance.
Memilih Prosedur Pengelompokan
Proses pengelompokan dapat dilakukan dengan dua metode utama, yaitu metode hierarki dan metode non-hierarki.
Menentukan Jumlah Cluster
Menentukan jumlah cluster yang optimal adalah tantangan utama dalam analisis cluster. Penentuan ini dapat didasarkan pada pertimbangan teoretis, konseptual, atau praktis. Selain itu, cluster yang terbentuk sebaiknya memiliki ukuran yang relevan dan bermanfaat.
Menginterpretasikan Hasil Cluster
Tahap akhir adalah interpretasi cluster yang telah terbentuk. Interpretasi dilakukan dengan melihat rata-rata pada setiap variabel untuk memahami karakteristik masing-masing cluster.

2.3 Uji Asumsi

2.3.1 Uji Sampel Representatif

Sampel representatif adalah kondisi di mana sampel yang diambil mampu mencerminkan atau menggambarkan karakteristik populasi secara akurat. Untuk memastikan bahwa sampel bersifat representatif, dapat dilakukan uji Kaiser Meyer Olkin (KMO). Menurut Supranto (2004) rumus uji KMO didefinisikan sebagai berikut:

\[ KMO = \frac{\sum_{i=1}^{n}\sum_{j \neq 1} r_{ij}^2}{\sum_{i=1}^{n}\sum_{j \neq 1} r_{ij}^2 + \sum_{i=1}^{n} \sum_{j \neq 1} a_{ij}^2} \]

Keterangan: \(a_{ij}=-\frac{v_{ij}}{\sqrt{v_{ii}v_{jj}}}\)

\(n\) : banyaknya variabel

\(r_{ij}\) : korelasi antar variabel \(x_i\) dan \(x_j\)

\(a_{ij}\) : korelasi parsial antara \(x_i\) dan \(x_j\)

\(v_{ij}\) : invers matriks korelasi antara \(x_i\) dan \(x_j\)

Jika nilai KMO lebih dari 0.5, maka sampel dianggap cukup representatif untuk mewakili populasi.

2.3.2 Uji Non-Multikolinieritas

Masalah multikolinearitas terjadi apabila nilai absolut koefisien korelasi antara variabel independen melebihi 0.8. Sebaliknya, jika nilai koefisien korelasi berada di bawah 0.8, maka model dinyatakan bebas dari multikolinearitas dan memenuhi asumsi non-multikolinearitas (Gujarati,1995).

2.4 Standarisadi Data

Standarisasi variabel diterapkan ketika terdapat perbedaan satuan yang cukup besar di antara variabel-variabel dalam penelitian. Proses ini dilakukan dengan menyesuaikan nilai rata-rata menjadi nol dan menetapkan variansi sebesar 1 (satu). Dengan kata lain, data diubah menjadi Z-Score, yaitu transformasi data ke dalam bentuk distribusi normal standar N(0,1), yang dapat dihitung menggunakan:

\[ Z=\frac{X_i-\bar{x}}{\sigma} \]

Keterangan:

\(X_i\) : data ke-i

\(\bar{x}\) : rata-rata data

\(\sigma\) : simpangan baku

2.5 Jarak Euclidean

Jarak Euclidean adalah ukuran panjang garis lurus yang menghubungkan dua objek. Jarak ini merupakan salah satu jenis jarak yang paling sering digunakan dalam analisis cluster. Jarak Euclidean menghitung jarak antara dua titik dalam ruang Euclidean untuk menganalisis hubungan antara sudut dan jarak. Berikut adalah rumus untuk menghitung jarak Euclidean:

\[ d_{euc}(x,y)=\sqrt{\sum_{i=1}^{n}(x_i-y_i)^2} \]

Keterangan:

\(d_{euc}(x,y)\) : kuadrat jarak euclidean antar objek-\(x\) dan objek-\(y\)

\(x_i\) : nilai dari objek-\(x\) pada amatan ke-\(i\)

\(y_i\) : nilai dari objek-\(y\) pada amatan ke-\(i\)

2.6 Metode Cluster Hierarki

Metode hierarki merupakan salah satu pendekatan clustering yang digunakan ketika informasi awal mengenai karakteristik objek yang akan dikelompokkan masih terbatas, sehingga jumlah cluster belum dapat ditentukan. Pada metode ini, pembentukan cluster dimulai dengan mengelompokkan objek-objek yang memiliki kemiripan paling tinggi terlebih dahulu, kemudian dilanjutkan ke objek lain dengan tingkat kemiripan berikutnya. Proses ini berlanjut hingga terbentuk kelompok-kelompok yang tersusun dalam struktur hierarki, menyerupai pohon berjenjang.

Metode clustering hierarki terbagi menjadi dua teknik utama, yaitu agglomerative (penggabungan) dan divisive (pemecahan) (Johnson & Wichern, 2002). Pada teknik agglomerative, setiap objek awalnya dianggap sebagai cluster terpisah, kemudian objek-objek dengan jarak terdekat digabungkan menjadi satu cluster. Sebaliknya, pada teknik divisive, semua objek awalnya berada dalam satu cluster, lalu objek dengan perbedaan paling mencolok dipisahkan untuk membentuk cluster baru.

Salah satu algoritma hierarki yang sering digunakan adalah agglomerative, yang mencakup beberapa metode seperti single linkage, complete linkage, average linkage, ward, dan centroid (Supranto, 2004).

Hasil clustering menggunakan metode hierarki biasanya divisualisasikan dalam bentuk dendogram. Dendogram adalah representasi grafis yang menggambarkan langkah-langkah analisis clustering, menunjukkan proses pembentukan cluster dan nilai koefisien jarak pada setiap tahap. Garis vertikal pada dendogram menunjukkan jarak Euclidean antara dua objek, sementara garis horizontal menggambarkan objek-objek yang dikelompokkan.

2.7 Koefisien Korelasi Cophenetic

Setelah proses clustering selesai, langkah selanjutnya adalah melakukan uji validitas cluster untuk menilai kualitas hasil analisis cluster. Pada penelitian ini, validitas hasil clustering diuji menggunakan koefisien korelasi Cophenetic. Koefisien ini mengukur korelasi antara elemen-elemen asli dalam matriks ketidakmiripan (matriks jarak Euclidean kuadrat) dan elemen-elemen yang dihasilkan dari dendogram (matriks Cophenetic) (Silva & Dias, 2013).

Menurut Saracli et al. (2013), koefisien korelasi Cophenetic dihitung menggunakan rumus berikut:

\[ r_{coph}=\frac{\sum_{i<j}(d_{ij}-\bar{d})(d_{cij}-\bar{d}_c)}{\sqrt{[\sum_{i<j}(d_{ij}-\bar{d})^2][\sum_{i<j}(d_{cij}-\bar{d}_c)^2}} \]

Keterangan:

\(r_{coph}\) : koefisien korelasi Cophenetic

\(d_{ij}\) : jarak Squared Euclidean antar ojek \(i\) dan \(j\)

\(\bar{d}\) : rata-rata jarak Squared Euclidean antar ojek \(i\) dan \(j\)

2.8 Metode Average Linkage

Metode average linkage mengelompokkan objek dengan mendasarkan pada jarak rata-rata antara semua anggota dalam satu cluster dan semua anggota di cluster lainnya (Johnson & Wichern, 2007). Pada metode ini, jarak rata-rata antara sampel di satu kelompok dengan sampel di kelompok lain digunakan sebagai dasar pengelompokan. Perhitungan jarak antar kelompok dilakukan menggunakan persamaan berikut:

\[ d_{(ij)k}=average(d_{ik},d_{jk}) \]

Keterengan:

\(d_{(ij)k}\) : jarak antar kelompok \((i,j)\) dan \(k\)

\(d_{ik}\) : jarak rata-rata antara kelompok \(i\) dengan \(k\)

\(d_{jk}\) : jarak rata-rata antara kelompok \(j\) dengan \(k\)

2.9 Validasi Cluster

Validasi cluster adalah proses yang bertujuan untuk mengevaluasi hasil analisis cluster secara kuantitatif dan objektif. Hair et al. (2006) menyatakan bahwa validasi digunakan oleh peneliti untuk memastikan bahwa kelompok-kelompok cluster yang terbentuk dapat menjelaskan dan mewakili populasi secara keseluruhan. Validasi cluster juga digunakan untuk menyelesaikan masalah utama dalam analisis cluster, yaitu menentukan jumlah kelompok yang paling optimal. Kelompok yang optimal adalah kelompok dengan jarak antar individu atau objek di dalam cluster yang sangat rapat (terpendek), namun terpisah secara jelas atau memiliki jarak yang jauh dari cluster lainnya (Dubes & Jain, 1988). Dalam analisis ini, validitas cluster dinilai menggunakan indeks Connectivity, Dunn, dan indeks Silhouette.

Indeks Connectivity

\[ Conn(C)=\sum_{i=1}^{N}\sum_{j=1}^{L}X_{i,nni(j)} \]

Keterangan:

\(Conn(C)\) : indeks Connectivity

\(nni(j)\) : pengamatan tetangga terdekat \(i\) ke \(j\) dan \(L\)

\(N\) : banyak pengamatan

\(L\) : banyak cluster

Semakin rendah nilai indeks Connectivity, semakin baik atau optimal pembentukan jumlah cluster yang dihasilkan (Halim & Widodo, 2017).
Indeks Dunn

Indeks Dunn merupakan perbandingan antara jarak minimum antar observasi pada cluster yang berbeda dengan jarak maksimum di dalam masing-masing cluster. Rumus untuk menghitung indeks Dunn dinyatakan sebagai berikut:

\[ C=\frac{d_{min}}{d_{max}} \]

Keterangan :

\(d_{min}\) : jarak terkecil antara observasi pada cluster yang berbeda

\(d_{max}\) : jarak terbesar pada masing-masing cluster
Indeks Silhoutte

Indeks ini digunakan untuk menilai tingkat kepercayaan dalam proses clustering pada suatu pengamatan, di mana cluster dianggap terbentuk dengan baik jika nilai indeks mendekati 1, dan sebaliknya, jika nilai indeks mendekati -1. Rumus untuk menghitung indeks Silhoutte dinyatakan sebagai berikut:

\[ S(i)=\frac{b(i)-a(i)}{max[a(i),b(i)]} \]

Keterangan:

\(S(i)\) : indeks Silhoutte

\(a(i)\) : rata-rata kemiripan antara ojek ke \(i\) dengan objek lain di dalam cluster-nya

\(b(i)\) : nilai minimum dari ata-rata kemiripan antara ojek ke \(i\) dengan objek lain di dalam cluster-nya

2.10 Dendogram

Dendogram adalah representasi visual dari proses pembentukan cluster yang didasarkan pada nilai koefisien jarak di setiap tahap hingga menghasilkan cluster akhir, yaitu satu objek menjadi satu cluster (Dzikrullah, 2022). Secara matematis dan visual, dendogram menggambarkan prosedur clustering yang dilakukan melalui analisis cluster hierarki, dengan bentuk menyerupai diagram pohon. Titik-titik dalam dendogram mewakili cluster, sementara panjang batang menunjukkan jarak di mana objek-objek digabungkan dalam cluster. Struktur dendogram bervariasi tergantung pada metode jarak dan linkage yang digunakan dalam proses clustering. Untuk menentukan jumlah cluster yang terbentuk, dendogram dipotong pada selisih jarak penggabungan terbesar atau pada bagian yang menghasilkan cluster yang lebih bermakna. Pemotongan dilakukan pada selisih jarak penggabungan terbesar untuk mengidentifikasi kelompok-kelompok yang relevan.

2.11 Data

Data pada kasus ini menggunakan data skunder yang diperoleh dari Badan Pusat Statistik (BPS) mengenai Proporsi rumah tangga dengan akses terhadap pelayanan dasar menurut provinsi (Persen), 2022-2023, namun hanya digunakan data pada tahun 2023. Data tersebut berisi Proporsi rumah tangga dengan akses terhadap pelayanan dasar berdasarkan tiga akses, yaitu akses pada layanan air minum, akses pada layanan sanitasi dasar, dan akses pada fasilitas kesehatan dasar. Data tersebut dapat dilihat di bawah ini:

3 SOURCE CODE

3.1 Library

> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)

Sebelum memulai analisis, perlu mengaktifkan packages yang diperlukan untuk mendukung proses analisis.

3.2 Impor Data

> data <- read_excel("D:/KULIAH/SEMESTER 5/ANALISIS MULTIVARIAT I/Proporsi rumah tangga dengan akses terhadap pelayanan dasar menurut provinsi.xlsx")
> data.frame(data)
               Provinsi Akses.pada.layanan.air.minum
1                  ACEH                        39.36
2        SUMATERA UTARA                        45.33
3        SUMATERA BARAT                        40.98
4                  RIAU                        35.29
5                 JAMBI                        51.42
6      SUMATERA SELATAN                        56.57
7              BENGKULU                        48.85
8               LAMPUNG                        56.07
9  KEP. BANGKA BELITUNG                        23.01
10            KEP. RIAU                        18.46
11          DKI JAKARTA                        25.45
12           JAWA BARAT                        40.74
13          JAWA TENGAH                        53.88
14        DI YOGYAKARTA                        68.16
15           JAWA TIMUR                        53.04
16               BANTEN                        37.60
17                 BALI                        44.62
18  NUSA TENGGARA BARAT                        52.61
19  NUSA TENGGARA TIMUR                        37.59
20     KALIMANTAN BARAT                        56.53
21    KALIMANTAN TENGAH                        27.98
22   KALIMANTAN SELATAN                        41.28
23     KALIMANTAN TIMUR                        16.51
24     KALIMANTAN UTARA                        22.62
25       SULAWESI UTARA                        37.10
26      SULAWESI TENGAH                        36.95
27     SULAWESI SELATAN                        45.07
28    SULAWESI TENGGARA                        44.58
29            GORONTALO                        26.66
30       SULAWESI BARAT                        35.49
31               MALUKU                        39.85
32         MALUKU UTARA                        45.42
33          PAPUA BARAT                        30.72
34                PAPUA                        25.86
   Akses.pada.layanan.sanitasi.dasar Akses.pada.fasilitas.kesehatan.dasar
1                              78.85                                72.59
2                              84.18                                73.92
3                              70.97                                88.77
4                              84.58                                72.29
5                              83.04                                73.41
6                              80.54                                75.24
7                              80.28                                81.41
8                              84.58                                79.39
9                              93.21                                88.17
10                             91.10                                85.97
11                             93.50                                76.83
12                             74.88                                82.03
13                             85.20                                86.15
14                             96.42                                84.29
15                             83.72                                83.37
16                             86.41                                82.79
17                             95.70                                90.54
18                             85.11                                75.48
19                             75.67                                43.50
20                             79.89                                77.59
21                             76.31                                75.67
22                             82.89                                83.31
23                             91.21                                78.87
24                             84.22                                76.24
25                             85.91                                86.48
26                             75.80                                78.81
27                             93.69                                85.52
28                             88.99                                84.74
29                             81.72                                82.44
30                             80.73                                77.18
31                             78.17                                74.11
32                             80.64                                83.62
33                             76.30                                65.38
34                             43.00                                31.78

Mengimpor data dalam format xlsx dilakukan menggunakan fungsi read_excel, kemudian hasilnya disimpan ke dalam variabel data.

3.3 Analisis Cluster

3.3.1 Statistika Deskriptif

> statdes <- summary(data)
> statdes
   Provinsi         Akses pada layanan air minum
 Length:34          Min.   :16.51               
 Class :character   1st Qu.:31.86               
 Mode  :character   Median :40.30               
                    Mean   :40.05               
                    3rd Qu.:47.99               
                    Max.   :68.16               
 Akses pada layanan sanitasi dasar Akses pada fasilitas kesehatan dasar
 Min.   :43.00                     Min.   :31.78                       
 1st Qu.:79.11                     1st Qu.:75.30                       
 Median :83.38                     Median :79.13                       
 Mean   :82.57                     Mean   :77.58                       
 3rd Qu.:86.28                     3rd Qu.:84.12                       
 Max.   :96.42                     Max.   :90.54

Menampilkan ringkasan statistik deskriptif dari data menggunakan fungsi summary(), yang disimpan ke variabel statdes.

3.4 Uji Asumsi

3.4.1 Uji Sampel Representatif

> kmo <- KMO(data[,2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA =  0.52
MSA for each item = 
        Akses pada layanan air minum    Akses pada layanan sanitasi dasar 
                                0.72                                 0.51 
Akses pada fasilitas kesehatan dasar 
                                0.51

Mengukur kecocokan sampel untuk merepresentifkan populasi dengan fungsi KMO(). Nilai KMO menunjukkan seberapa baik sampel merepresentatifkan populasi. Dengan argumen data[,2:4] fungsi hanya akan menggunakan kolom ke-2 sampai ke-4 dari data untuk perhitungan KMO.

3.4.2 Uji Non-Multikolinieritas

> korelasi <- cor(data[,2:4], method = 'pearson')
> korelasi
                                     Akses pada layanan air minum
Akses pada layanan air minum                            1.0000000
Akses pada layanan sanitasi dasar                       0.1333828
Akses pada fasilitas kesehatan dasar                    0.1977359
                                     Akses pada layanan sanitasi dasar
Akses pada layanan air minum                                 0.1333828
Akses pada layanan sanitasi dasar                            1.0000000
Akses pada fasilitas kesehatan dasar                         0.7189668
                                     Akses pada fasilitas kesehatan dasar
Akses pada layanan air minum                                    0.1977359
Akses pada layanan sanitasi dasar                               0.7189668
Akses pada fasilitas kesehatan dasar                            1.0000000

Melakukan uji asumsi non-multikolinearitas dengan perhitungan korelasi antar variabel menggunakan fungsi cor(), dengan metode pearson yang disimpan ke variabel korelasi.

3.5 Standarisasi

> datastand <- scale(data[,2:4])
> datastand
      Akses pada layanan air minum Akses pada layanan sanitasi dasar
 [1,]                  -0.05617695                       -0.39337684
 [2,]                   0.43091394                        0.17011815
 [3,]                   0.07599846                       -1.22646137
 [4,]                  -0.38824729                        0.21240670
 [5,]                   0.92779559                        0.04959577
 [6,]                   1.34798287                       -0.21470770
 [7,]                   0.71810990                       -0.24219526
 [8,]                   1.30718799                        0.21240670
 [9,]                  -1.39016958                        1.12478227
[10,]                  -1.76140300                        0.90171014
[11,]                  -1.19109056                        1.15544147
[12,]                   0.05641692                       -0.81309075
[13,]                   1.12850641                        0.27795396
[14,]                   2.29360823                        1.46414792
[15,]                   1.05997101                        0.12148631
[16,]                  -0.19977494                        0.40587684
[17,]                   0.37298520                        1.38802852
[18,]                   1.02488741                        0.26843904
[19,]                  -0.20059083                       -0.72957085
[20,]                   1.34471928                       -0.28342660
[21,]                  -0.98466846                       -0.66190916
[22,]                   0.10047539                        0.03373756
[23,]                  -1.92050304                        0.91333950
[24,]                  -1.42198959                        0.17434700
[25,]                  -0.24056982                        0.35301615
[26,]                  -0.25280828                       -0.71582707
[27,]                   0.40970060                        1.17552853
[28,]                   0.36972161                        0.67863802
[29,]                  -1.09236695                       -0.08995646
[30,]                  -0.37192934                       -0.19462063
[31,]                  -0.01619797                       -0.46526738
[32,]                   0.43825701                       -0.20413556
[33,]                  -0.76111251                       -0.66296638
[34,]                  -1.15763876                       -4.18348854
      Akses pada fasilitas kesehatan dasar
 [1,]                        -0.4276298379
 [2,]                        -0.3137597327
 [3,]                         0.9576470814
 [4,]                        -0.4533148241
 [5,]                        -0.3574242091
 [6,]                        -0.2007457937
 [7,]                         0.3275087547
 [8,]                         0.1545631813
 [9,]                         0.9062771091
[10,]                         0.7179205441
[11,]                        -0.0646153671
[12,]                         0.3805910594
[13,]                         0.7333315358
[14,]                         0.5740846217
[15,]                         0.4953173308
[16,]                         0.4456596910
[17,]                         1.1091884997
[18,]                        -0.1801978047
[19,]                        -2.9182173277
[20,]                         0.0004532645
[21,]                        -0.1639306469
[22,]                         0.4901803336
[23,]                         0.1100425387
[24,]                        -0.1151291732
[25,]                         0.7615850205
[26,]                         0.1049055414
[27,]                         0.6793930649
[28,]                         0.6126121009
[29,]                         0.4156938738
[30,]                        -0.0346495499
[31,]                        -0.2974925748
[32,]                         0.5167214859
[33,]                        -1.0449256716
[34,]                        -3.9216441197
attr(,"scaled:center")
        Akses pada layanan air minum    Akses pada layanan sanitasi dasar 
                            40.04853                             82.57088 
Akses pada fasilitas kesehatan dasar 
                            77.58471 
attr(,"scaled:scale")
        Akses pada layanan air minum    Akses pada layanan sanitasi dasar 
                           12.256440                             9.458824 
Akses pada fasilitas kesehatan dasar 
                           11.679975

Melakukan standarisasi data ke bentuk Zscore pada kolom ke-2 sampai ke-4, yang kemudian disimpan ke variabel datastand .

3.6 Menghitung Jarak Euclidien

> jarak <- dist(datastand, method = "euclidean")
> jarak
           1         2         3         4         5         6         7
2  0.7534922                                                            
3  1.6218793 1.9216854                                                  
4  0.6913061 0.8320391 2.0680133                                        
5  1.0813674 0.5131507 2.0207159 1.3295380                              
6  1.4335494 1.0009388 1.9958617 1.8057444 0.5205399                    
7  1.0920670 0.8146835 1.3334771 1.4284168 0.7734619 0.8225256          
8  1.6014638 0.9944702 2.0569669 1.8011153 0.6577059 0.5570776 0.7639281
9  2.4214977 2.3908615 2.7713957 1.9195749 2.8506016 3.2430251 2.5784574
10 2.4284423 2.5309770 2.8218127 1.9319648 3.0189823 3.4290840 2.7584280
11 1.9541358 1.9141143 2.8851337 1.2980598 2.4079681 2.8883792 2.3983736
12 0.9176373 1.2605835 0.7101073 1.3945502 1.4311518 1.5375817 0.8755438
13 1.7894108 1.2628000 1.8496908 1.9269063 1.1323340 1.0786037 0.7769637
14 3.1583731 2.4356541 3.5077474 3.1328509 2.1758012 2.0768066 2.3355089
15 1.5371083 1.0260037 1.7317372 1.7336394 0.8659138 0.8249128 0.5265862
16 1.1925022 1.0149229 1.7328330 0.9386734 1.4294388 1.7884405 1.1298096
17 2.3915258 1.8738845 2.6356637 2.0983275 2.0615940 2.2880804 1.8405879
18 1.2914809 0.6166930 2.1047110 1.4403757 0.2978731 0.5815872 0.7827041
19 2.5173216 2.8269131 3.9173622 2.6454264 2.9048267 3.1698290 3.4082670
20 1.4689637 1.0674609 1.8480225 1.8587440 0.6424995 0.2126358 0.7080287
21 1.0018699 1.6488152 1.6436758 1.0972191 2.0496824 2.3754172 1.8212981
22 1.0243740 0.8798346 1.3443309 1.0774765 1.1845436 1.4475424 0.6957538
23 2.3392971 2.5022286 3.0468343 1.7766502 3.0128696 3.4716106 2.8887420
24 1.5117576 1.8635245 2.3145369 1.0883204 2.3655359 2.7984712 2.2247386
25 1.4160986 1.2809014 1.6227769 1.2318934 1.6460022 1.9421356 1.2090350
26 0.6528644 1.1948454 1.0469142 1.0915913 1.4810288 1.7050149 1.1029784
27 1.9758557 1.4133834 2.4409707 1.6874097 1.6159013 1.8941422 1.4929433
28 1.5532896 1.0585375 1.9582457 1.3885563 1.2837878 1.5545458 1.0249840
29 1.3700177 1.7088376 1.7176829 1.1586130 2.1675431 2.5200929 1.8190051
30 0.5418829 0.9249293 1.4999957 0.5841388 1.3612898 1.7280305 1.1496119
31 0.1539554 0.7771026 1.4708134 0.7886339 1.0769400 1.3903703 0.9897454
32 1.0826249 0.9109439 1.1708103 1.3407413 1.0335174 1.1586510 0.3399524
33 0.9750214 1.6277471 2.2424493 1.1204061 1.9577573 2.3155688 2.0612432
34 5.2712713 5.8731781 5.8372385 5.6520055 5.9136877 5.9895280 6.0915947
           8         9        10        11        12        13        14
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9  2.9450367                                                            
10 3.1951153 0.4722855                                                  
11 2.6793189 0.9915668 1.0009987                                        
12 1.6331448 2.4747344 2.5216666 2.3726784                              
13 0.6092589 2.6628476 2.9564989 2.6052320 1.5697708                    
14 1.6479925 3.7142617 4.0963571 3.5561725 3.1981683 1.6702928          
15 0.4306926 2.6793058 2.9357201 2.5396587 1.3761240 0.2929676 1.8250494
16 1.5469664 1.4649344 1.6609211 1.3434785 1.2472971 1.3650827 2.7117135
17 1.7793625 1.7942091 2.2237826 1.9693261 2.3400846 1.3943982 1.9952251
18 0.4414727 2.7832089 2.9951733 2.3897052 1.5563181 0.9194364 1.8995563
19 3.5500280 4.4136698 4.2800363 3.5605344 3.3098588 4.0144009 4.8197099
20 0.5205854 3.2067407 3.4010740 2.9163173 1.4438739 0.9481596 2.0696521
21 2.4735546 2.1218016 1.9559866 1.8317306 1.1845753 2.4807116 3.9764159
22 1.2651944 1.8935516 2.0668414 1.7983772 0.8550258 1.0842564 2.6197224
23 3.3032224 0.9797710 0.6284614 0.7881379 2.6385546 3.1762655 4.2752145
24 2.7427345 1.3955682 1.1568191 1.0091642 1.8456591 2.6899163 3.9930276
25 1.6684726 1.3921704 1.6173760 1.4933128 1.2622055 1.3714235 2.7734146
26 1.8159494 2.3072993 2.2952281 2.1001802 0.4255384 1.8139874 3.3847684
27 1.4172275 1.8148235 2.1886415 1.7653567 2.0417391 1.1511869 1.9087952
28 1.1428139 1.8391576 2.1453539 1.7669503 1.5418328 0.8665306 2.0784249
29 2.4325864 1.3434837 1.2338366 1.3384541 1.3578880 2.2734402 3.7289618
30 1.7380759 1.9138914 1.9232629 1.5794273 0.8593082 1.7505511 3.1979933
31 1.5540100 2.4218004 2.4383257 2.0152671 0.7655400 1.7103580 3.1332882
32 1.0294208 2.2936695 2.4701984 2.2002672 0.7315461 0.8693529 2.4957541
33 2.5461576 2.7201012 2.5605508 2.1100940 1.6501484 2.7601068 4.0592029
34 6.4818772 7.1791805 6.9100895 6.5864986 5.5984587 6.8410326 8.0011549
          15        16        17        18        19        20        21
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16 1.2924023                                                            
17 1.5661789 1.3164143                                                  
18 0.6922042 1.3821666 1.8278332                                        
19 3.7370487 3.5503395 4.5861982 3.1614192                              
20 0.6999475 1.7489455 2.2287492 0.6629351 3.3325165                    
21 2.2866716 1.4587067 2.7688085 2.2145264 2.8645158 2.3656539          
22 0.9635134 0.4802291 1.5137823 1.1657741 3.5057746 1.3742520 1.4454490
23 3.1078439 1.8251198 2.5463132 3.0291023 3.8506636 3.4793585 1.8526349
24 2.5564756 1.3645142 2.4887569 2.4495498 3.1884456 2.8067052 0.9449633
25 1.3475574 0.3229045 1.2524091 1.5797121 3.8359534 1.8701664 1.5621573
26 1.6052740 1.1735185 2.4137958 1.6378553 3.0236050 1.6583048 0.7815365
27 1.2520944 1.0091855 0.4808621 1.3928972 4.1163892 1.8611204 2.4559392
28 0.8947739 0.6531448 0.8659294 1.1072728 3.8438347 1.5003090 2.0577798
29 2.1641642 1.0215034 2.1937710 2.2285197 3.5098910 2.4797671 0.8213972
30 1.5592072 0.7879920 2.0899860 1.4787514 2.9377699 1.7193025 0.7813587
31 1.4597832 1.1596845 2.3590085 1.2790395 2.6404650 1.4049675 0.9972171
32 0.7021510 0.8855787 1.7000777 1.0262351 3.5331308 1.0461806 1.6424253
33 2.5107887 1.9181685 3.1832319 2.1920461 1.9564872 2.3814691 0.9089173
34 6.5543993 6.4072709 7.6611937 6.2114008 3.7218750 6.0708423 5.1528488
          22        23        24        25        26        27        28
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23 2.2366399                                                            
24 1.6444057 0.9194171                                                  
25 0.5402880 1.8869673 1.4819930                                        
26 0.9138343 2.3313978 1.4858701 1.2545133                              
27 1.1979601 2.4130379 2.2335440 1.0517289 2.0847494                    
28 0.7094925 2.3564359 1.9985359 0.7075862 1.6092987 0.5029495          
29 1.2015495 1.3363513 0.6784398 1.0205017 1.0923196 1.9817155 1.6634955
30 0.7421321 1.9096052 1.1159035 0.9752696 0.5525591 1.7315054 1.3158930
31 0.9397059 2.3860049 1.5551891 1.3570468 0.5298008 1.9565036 1.5118677
32 0.4139861 2.6415691 2.0007503 0.9116919 0.9534106 1.3895145 0.8906073
33 1.8932196 2.2721968 1.4150526 2.1369759 1.2582843 2.7792341 2.4137356
34 6.2315361 6.5432496 5.7922507 6.5843394 5.3904078 7.2349955 6.8214796
          29        30        31        32        33
2                                                   
3                                                   
4                                                   
5                                                   
6                                                   
7                                                   
8                                                   
9                                                   
10                                                  
11                                                  
12                                                  
13                                                  
14                                                  
15                                                  
16                                                  
17                                                  
18                                                  
19                                                  
20                                                  
21                                                  
22                                                  
23                                                  
24                                                  
25                                                  
26                                                  
27                                                  
28                                                  
29                                                  
30 0.8560340                                        
31 1.3444824 0.5185373                              
32 1.5381980 0.9800523 0.9683304                    
33 1.6035833 1.1796055 1.0736102 2.0218197          
34 5.9643748 5.6246896 5.3162515 6.1709985 4.5636409

Menghitung matriks jarak antar baris data dalam datastand menggunakan metode Euclidean distance. Hasilnya disimpan dalam variabel jarak, yang mempresentasikan jarak antar-pasangan data.

3.7 Koefisien Korelasi Cophenetic

> #Single Linkage
> hiers <- hclust(dist(data[,2:4]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
Error in hclust(d1, "single"): object 'd1' not found
> d2 <- cophenetic(hc1)
Error in cophenetic(hc1): object 'hc1' not found
> cors <- cor(d1,d2)
Error in is.data.frame(y): object 'd2' not found
> cors
Error in eval(expr, envir, enclos): object 'cors' not found
> #Average Linkage
> hierave <- hclust(dist(data[,2:4]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
Error in hclust(d1, "ave"): object 'd1' not found
> d3 <- cophenetic(hc2)
Error in cophenetic(hc2): object 'hc2' not found
> corave <- cor(d1,d3)
Error in is.data.frame(y): object 'd3' not found
> corave
Error in eval(expr, envir, enclos): object 'corave' not found
> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:4]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
Error in hclust(d1, "complete"): object 'd1' not found
> d4 <- cophenetic(hc3)
Error in cophenetic(hc3): object 'hc3' not found
> corcomp <- cor(d1,d4)
Error in is.data.frame(y): object 'd4' not found
> corcomp
Error in eval(expr, envir, enclos): object 'corcomp' not found
> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:4]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
Error in hclust(d1, "centroid"): object 'd1' not found
> d5 <- cophenetic(hc4)
Error in cophenetic(hc4): object 'hc4' not found
> corcen <- cor(d1,d5)
Error in is.data.frame(y): object 'd5' not found
> corcen
Error in eval(expr, envir, enclos): object 'corcen' not found
> #Ward
> hierward <- hclust(dist(data[,2:4]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
Error in hclust(d1, "ward.D"): object 'd1' not found
> d6 <- cophenetic(hc5)
Error in cophenetic(hc5): object 'hc5' not found
> corward <- cor(d1,d6)
Error in is.data.frame(y): object 'd6' not found
> corward
Error in eval(expr, envir, enclos): object 'corward' not found
> 
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
Error in data.frame(cors, corave, corcomp, corcen, corward): object 'cors' not found
> KorCop
Error in eval(expr, envir, enclos): object 'KorCop' not found

Melakukan klasterisasi hierarki dengan berbagai metode (single linkage, average linkage, complete linkage, centroid linkage, dan Ward’s method), menghitung korelasi Cophenetic untuk mengevaluasi kesesuaian struktur klaster dengan data asli, lalu menyimpan hasil korelasi dari semua metode dalam data frame KorCop.

3.8 Indeks Validitas

> inval <- clValid(datastand, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 

Validation Measures:
                                2      3      4
                                               
hierarchical Connectivity  2.9290 5.8579 8.7869
             Dunn          0.7722 0.4576 0.4736
             Silhouette    0.6774 0.4707 0.3255

Optimal Scores:

             Score  Method       Clusters
Connectivity 2.9290 hierarchical 2       
Dunn         0.7722 hierarchical 2       
Silhouette   0.6774 hierarchical 2       
> optimalScores(inval)
                 Score       Method Clusters
Connectivity 2.9289683 hierarchical        2
Dunn         0.7722197 hierarchical        2
Silhouette   0.6774061 hierarchical        2
> plot(inval)

Mengevaluasi performa klasterisasi hierarki dengan average linkage, menggunakan metrik internal untuk menentukan kualitas klaster terbaik (2 atau 3 klaster), lalu menampilkan ringkasan, skor optimal, dan grafik hasil evaluasi.

3.9 Metode Average Linkage

> hirave <- hclust(dist(scale(data[,2:4])), method = "average")
> hirave

Call:
hclust(d = dist(scale(data[, 2:4])), method = "average")

Cluster method   : average 
Distance         : euclidean 
Number of objects: 34 
> plot(hirave, labels(data$Provinsi), hang = 1, col = "purple", main = "Cluster Dendogram", sub = " ", xlab = "PROVINSI", ylab = "Jarak")

> anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = 2))
> anggotaave
                     id cutree.hirave..k...2.
1                  ACEH                     1
2        SUMATERA UTARA                     1
3        SUMATERA BARAT                     1
4                  RIAU                     1
5                 JAMBI                     1
6      SUMATERA SELATAN                     1
7              BENGKULU                     1
8               LAMPUNG                     1
9  KEP. BANGKA BELITUNG                     1
10            KEP. RIAU                     1
11          DKI JAKARTA                     1
12           JAWA BARAT                     1
13          JAWA TENGAH                     1
14        DI YOGYAKARTA                     1
15           JAWA TIMUR                     1
16               BANTEN                     1
17                 BALI                     1
18  NUSA TENGGARA BARAT                     1
19  NUSA TENGGARA TIMUR                     1
20     KALIMANTAN BARAT                     1
21    KALIMANTAN TENGAH                     1
22   KALIMANTAN SELATAN                     1
23     KALIMANTAN TIMUR                     1
24     KALIMANTAN UTARA                     1
25       SULAWESI UTARA                     1
26      SULAWESI TENGAH                     1
27     SULAWESI SELATAN                     1
28    SULAWESI TENGGARA                     1
29            GORONTALO                     1
30       SULAWESI BARAT                     1
31               MALUKU                     1
32         MALUKU UTARA                     1
33          PAPUA BARAT                     1
34                PAPUA                     2
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

> idclus = clus_hier$cluster
> idclus
 [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
> aggregate(data,list(idclus),mean)
  Group.1 Provinsi Akses pada layanan air minum
1       1       NA                     40.47848
2       2       NA                     25.86000
  Akses pada layanan sanitasi dasar Akses pada fasilitas kesehatan dasar
1                             83.77                             78.97273
2                             43.00                             31.78000

Melakukan klasterisasi hierarki menggunakan metode average linkage pada data yang distandardisasi (kolom 2-4) dan divisualisasikan dalam bentuk dendogram dengan label provinsi. Dendogram dipotong menjadi 2 klaster menggunakan cutree, dan hasil anggota klaster disimpan dalam anggotaave. Dengan fungsi eclust, klasterisasi ulang dilakukan untuk mempermudah analisis dan divisualisasikan menggunakan fviz_dend, yang menampilkan batas klaster. Hasil klaster disimpan dalam idclus, lalu aggregate digunakan untuk menghitung rata-rata nilai variabel tiap klaster, memberikan gambaran karakteristik masing-masing klaster.

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

Dari Data yang digunakan, didapatkan hasil analisis statistik deskriptif sebagai berikut:

	Akses pada layanan air minum	Akses pada layanan sanitasi dasar	Akses pada fasilitas kesehatan dasar
Min	16.51	43	31.78
Mean	40.05	82.57	77.58
Max	68.16	96.42	90.54

Pada layanan air minum, akses terendah tercatat sebesar 16,51%, dengan rata-rata 40,05%, dan akses tertinggi mencapai 68,16%. Layanan sanitasi dasar memiliki cakupan lebih baik, dengan akses minimum 43%, rata-rata 82,57%, dan maksimum 96,42%. Sementara itu, fasilitas kesehatan dasar mencatat akses minimum 31,78%, rata-rata 77,58%, dan maksimum 90,54%. Secara keseluruhan, layanan sanitasi dasar memiliki cakupan yang relatif lebih tinggi dibandingkan layanan lainnya, sedangkan layanan air minum memiliki cakupan terendah. Terdapat disparitas signifikan antara wilayah dengan akses terendah dan tertinggi, terutama pada layanan air minum dengan selisih sebesar 51,65%.

4.2 Uji Asumsi

4.2.1 Uji Sampel Representatif

Menggunakan Kaiser Mayer Olkin (KMO) menguji seberapa baik variabel cocok untuk dianalisis dengan analisis faktor. Berikut hasil uji KMO:

Overall MSA = 0.52

	Akses pada layanan air minum	Akses pada layanan sanitasi dasar	Akses pada fasilitas kesehatan dasar
Nilai KMO	0.72	0.51	0.51

Dari hasil uji KMO, nilai KMO pada persentase Akses pada layanan air minum sebesar 0.72, nilai KMO pada persentase Akses pada layanan sanitasi dasar dan Akses pada fasilitas kesehatandasar sebesar 0.51. Nilai KMO pada tiap variabel lebih dari 0.5, sehingga menunjukkan bahwa sampel dapat merepresentatifkan populasi.

4.2.2 Uji Non-Multikolinieritas

Uji asumsi Non-Multikolinieritas dengan melihat nilai korelasi antar variabel. Jika nilai korelasi kurang dari 0.8 maka dapat dikatakan bahwa tidak terjadi multikolinieritas tiap variabelnya. Berikut merupakan hasil korelasi antar variabel:

	Akses pada layanan air minum	Akses pada layanan sanitasi dasar	Akses pada fasilitas kesehatan dasar
Akses pada layanan air minum	1.0000000	0.1333828	0.1977359
Akses pada layanan sanitasi dasar		1.0000000	0.7189668
Akses pada fasilitas kesehatandasar			1.0000000

Dari hasil nilai korelasi di atas tiap variabel nilai korelasinya kurang dari 0.8, sehingga antar variabel dapat dikatan tidak terjadi multikolinieritas.

4.3 Standarisasi

Setelah uji asumsi dilakukan dan hasilnya memenuhi persyaratan, langkah selanjutnya adalah menstandarisasi variabel ke dalam bentuk Z-score. Hasil dari standarisasi ini kemudian digunakan untuk mengelompokkan provinsi-provinsi di Indonesia berdasarkan proporsi rumah tangga dengan akses pelayanan dasar di Indonesia.

4.4 Koefisien Korelasi Cophenetic

Koefisien korelasi Cophenetic dijadikan acuan untuk memilih metode terbaik dalam analisis cluster. Metode yang memiliki nilai korelasi paling mendekati 1 akan dipilih sebagai metode yang paling sesuai untuk data ini. Berikut hasil koefisien korelasi Cophenetic:

Metode	Single Linkage	Average Linkage	CompleteLinkage	Centroid Linkage	Ward’s Methode
Nilai Korelasi	0.7527467	0.8460337	0.5398191	0.8298467	0.6264126

Dari hasil di atas, nilai korelasi Cophenetic yang paling mendekati 1 adalah metode average linkage dan dipilih menjadi metode terbaik. Sehingga akan melakukan analisis cluster dengan menggunakan metode average linkage.

4.5 Analisis Cluster Metode Average Linkage

Dengan metode average linkage merupakan teknik analisis yang menggunakan rata-rata jarak antara seluruh objek dalam satu klaster dengan seluruh objek di klaster lainnya. Jarak yang digunakan dalam analisis ini adalah jarak Euclidean, sebagaimana diperhitungkan pada subbab Jarak Euclidean.

Pada analisis ini, ditetapkan aturan penghentian (stopping rule) sebanyak 2 hingga 4 klaster. Stopping rule merupakan jumlah klaster awal yang dipertimbangkan sebelum menentukan klaster optimal yang sebenarnya. Penentuan jumlah klaster optimal dilakukan dengan menggunakan tiga indeks validitas klaster, yaitu Connectivity Index, Dunn Index, dan Silhouette Index. Hasil penentuan jumlah klaster optimal menggunakan metode average linkage berdasarkan indeks validitas klaster ditampilkan pada tabel berikut:

	Score	Cluster
Connectivity	2.9290	2
Dunn	0.7722	2
Silhouette	0.6774	2

Berdasarkan hasil di atas, dapat dilihat bahwa jumlah klaster optimal menurut Connectivity Index, Dunn Index, dan Silhouette Index adalah 2 klaster. Oleh karena itu, berdasarkan ketiga indeks validitas klaster, yaitu Connectivity Index, Dunn Index, dan Silhouette Index, ditetapkan bahwa jumlah klaster optimal pada metode Average Linkage adalah 2 klaster, berdasarkan proporsi rumah tangga dengan akses pelayanan dasar di Indonesia.

Hasil analisis klaster divisualisasikan dalam bentuk dendogram, seperti yang ditampilkan pada subbab 3.9. Dendogram tersebut menunjukkan bahwa pengelompokan provinsi di Indonesia berdasarkan faktor-faktor penyebab kekerasan seksual membentuk 2 klaster. Garis horizontal pada dendogram mewakili provinsi yang dikelompokkan, sedangkan garis vertikal menunjukkan jarak Euclidean antar provinsi.

Klaster pertama, yang ditandai dengan warna biru, mencakup 33 provinsi, yaitu Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, DKI Jakarta, Jawa Barat, Jawa Tengah, DI Yogyakarta, Jawa Timur, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat. Klaster kedua, yang ditandai dengan warna merah, terdiri dari satu provinsi, yaitu Papua. Rincian pengelompokan ini dapat dilihat pada tabel anggota klaster di subbab 3.9.

Setelah jumlah klaster dan anggota yang terbentuk ditentukan, langkah berikutnya adalah mendeskripsikan ciri khas dari masing-masing klaster untuk menggambarkan karakteristiknya. Setiap klaster memiliki sifat yang berbeda berdasarkan proporsi rumah tangga dengan akses pelayanan dasar di Indonesia. Karakteristik akses-akses tersebut dapat dianalisis melalui nilai rata-rata dari masing-masing variabel. Tinggi atau rendahnya nilai rata-rata variabel dalam setiap klaster yang dihasilkan menggunakan metode Average Linkage disajikan dalam tabel berikut:

Variabe	Cluster	Nilai Rata-rata
Akses pada layanan air minum	Cluster 1	40.47848
	Cluster 2	25.86000
Akses pada layanan sanitasi dasar	Cluster 1	83.77
	Cluster 2	43.00
Akses pada fasilitas kesehatan dasar	Cluster 1	78.97273
	Cluster 2	31.78000

Dari hasil tersebut, pada akses layanan air minum klaster 1 memiliki rata-rata sebesar 40.47, yang menunjukkan bahwa akses terhadap layanan air minum relatif lebih tinggi dibandingkan dengan klaster 2, yang memiliki rata-rata 25.86. Artinya, provinsi dalam klaster 1 umumnya memiliki akses yang lebih baik terhadap layanan air minum dibandingkan dengan klaster 2.

Pada akses layanan sanitasi dasar nilai rata-rata akses sanitasi dasar pada klaster 1 adalah 83.77, lebih tinggi daripada klaster 2, yang memiliki rata-rata 43.00. Perbedaan ini cukup besar, sehingga akses terhadap layanan sanitasi dasar di kedua klaster menunjukkan perbedaan yang signifikan.

Pada akses fasilitas kesehatan dasar klaster 1 memiliki rata-rata akses sebesar 78.97, lebih tinggi dibandingkan dengan klaster 2, yang rata-ratanya adalah 31.78. Hal ini menunjukkan bahwa provinsi dalam klaster 1 memiliki akses yang lebih baik terhadap fasilitas kesehatan dasar dibandingkan dengan klaster 2.

5 Kesimpulan

Dari hasil analisis klaster di atas, dapat disimpulkan bahwa pengelompokan pada Proporsi Rumah Tangga dengan Akses Pelayanan Dasar di Indonesia Menurut Provinsi dengan menggunakan metode Average Linkage akan dikelompokkan menjadi 2 klaster. Dimana klaster pertama berisikan 33 provinsi dan klaster kedua berisikan 1 provinsi.

Yang kemudian dianalisis ciri khas dari masing-masing klaster untuk menggambarkan karakteristiknya, dengan menggunakan nilai rata-rata variabel dalam setiap klaster yang dihasilkan menggunakan metode Average Linkage dapat disimpulkan bahwa secara keseluruhan, Klaster 1 cenderung memiliki akses yang lebih baik terhadap layanan dasar seperti air minum, sanitasi, dan fasilitas kesehatan, dibandingkan dengan Klaster 2 yang memiliki rata-rata lebih rendah pada semua variabel tersebut.

Hasil ini dapat digunakan untuk memahami perbedaan akses antar kelompok atau wilayah yang tergabung dalam dua klaster tersebut, dan mungkin untuk menentukan kebijakan atau tindakan peningkatan akses di wilayah yang masuk dalam Klaster 2.

6 DAFTAR PUSTAKA

Supranto & Johanes. (2004). Analisis Multivariat Arti & Interpretasi. Jakarta: PT. Rineka Cipta.
Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.

Martias, L. D.(2021).Statistika Deskriptif Sebagai Kumpulan Informasi. FIHRIS: Jurnal Ilmu Perpustakaan dan Informasi, 16(1), 40-59.

Sholikhah, A., (2016). Statistik deskriptif dalam penelitian kualitatif. KOMUNIKA: Jurnal Dakwah Dan Komunikasi, 10(2), 342-362.

Silvi, R. (2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K-Means Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. Jurnal Matematika “MANTIK”, 4(1), 22-31.

Hemelia, & Sumargo, B. (2019). Pengklasifikasian Pengguna Internet Lingkungan Pedesaan Menurut Jenjang Pendidikan di Indonesia Menggunakan Metode Cluster Average Linkage. Jurnal Statistika dan Aplikasinya (JSA), 3(1), 22-29.

Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.

Badan Pusat Statistik (BPS). Proporsi rumah tangga dengan akses terhadap pelayanan dasar menurut provinsi (Persen), 2022-2023. Diakses pada 23 November 2024 di https://www.bps.go.id/id/statistics-table/2/MjAxNiMy/proporsi-rumah-tangga-dengan-akses-terhadap-pelayanan-dasar-menurut-provinsi--persen-.html

Johnson, N. & Wichern, D. (2002). Applied Multivariate Statistical Analysis. Prentice-Hall.

Englewood Cliffs, N. J. Silva, A. R. & Dias C. T. (2013). A Chopenetic Correlation Coefficient for Tocher’s Method. Pesq Agropee. Brasilia.

Hair, J. F., dkk. (2006). Multivariate Data Analysis Sixth Edition. New Jersey: Pearson Education Inc.

Dzikrullah, A. A. (2022). Pengelompokan Provinsi Berdasarkan Kualitas Jaringan Internet Dengan Metode Centroid Linkage. Journal of Mathematics, Computations, and Statistics, 5(1), 48-57.