1 PENDAHULUAN

1.1 Latar Belakang

Kondisi pembangunan manusia di Indonesia masih menunjukkan adanya ketimpangan antarprovinsi, terutama dalam aspek kesejahteraan dan akses layanan dasar. Persentase penduduk miskin, kepemilikan fasilitas buang air besar sendiri, serta akses terhadap sumber air minum layak merupakan indikator penting untuk menggambarkan kualitas kehidupan rumah tangga dan tingkat kesejahteraan masyarakat. Tingginya persentase penduduk miskin sering kali berhubungan dengan keterbatasan fasilitas sanitasi dan rendahnya akses terhadap air minum layak, yang pada akhirnya berdampak pada kesehatan masyarakat dan pencapaian pembangunan berkelanjutan (SDGs), khususnya tujuan 1 (no poverty), tujuan 3 (good health and well-being), dan tujuan 6 (clean water and sanitation).

Perbedaan capaian antarprovinsi membuat pemerintah perlu memahami pola kemiripan karakteristik wilayah sebagai dasar perumusan kebijakan yang lebih efisien dan terarah. Salah satu pendekatan statistik yang mampu mengelompokkan provinsi berdasarkan kemiripan karakteristik tersebut adalah analisis cluster hierarki. Dengan metode ini, provinsi-provinsi dapat dikelompokkan sesuai tingkat kesejahteraan dan kualitas layanan dasarnya, sehingga pemerintah dapat mengidentifikasi wilayah yang membutuhkan perhatian lebih serta merumuskan prioritas intervensi sesuai kondisi regional masing-masing.

1.2 Rumusan Masalah

Berdasarkan latar belakang tersebut, maka rumusan masalah penelitian ini adalah sebagai berikut.

1. Bagaimana pola pengelompokan provinsi di Indonesia berdasarkan persentase penduduk miskin, persentase rumah tangga yang memiliki fasilitas buang air besar sendiri, dan persentase rumah tangga yang memiliki akses sanitasi layak?

2. Berapa jumlah cluster yang terbentuk dan bagaimana karakteristik masing-masing cluster?

3. Provinsi mana saja yang tergolong dalam kelompok dengan kondisi sanitasi dan kesejahteraan yang relatif rendah, dan provinsi mana yang berada dalam kelompok dengan kondisi lebih baik?

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah tersebut, maka tujuan penelitian ini adalah sebagai berikut.

1.Mengelompokkan provinsi-provinsi di Indonesia berdasarkan tiga indikator kesejahteraan dan sanitasi, yaitu persentase penduduk miskin, persentase rumah tangga yang memiliki fasilitas buang air besar sendiri, dan persentase rumah tangga dengan akses sanitasi layak.

2. Mendeskripsikan karakteristik cluster yang terbentuk, baik cluster dengan kondisi relatif baik maupun cluster dengan kondisi relatif rendah.

3. Mengidentifikasi provinsi-provinsi yang perlu mendapat prioritas peningkatan akses layanan dasar dan penanggulangan kemiskinan berdasarkan hasil pengelompokan.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif adalah metode yang digunakan untuk menggambarkan dan meringkas data sehingga lebih mudah dipahami. Statistik deskriptif mencakup ukuran pemusatan data seperti mean, median, dan modus, serta ukuran sebaran data seperti rentang, varians, dan standar deviasi (Hair et al., 2010). Dalam penelitian kesehatan, statistik deskriptif digunakan untuk menampilkan kondisi indikator seperti persentase penduduk miskin, persentase rumah tangga yang memiliki fasilitas buang air sendiri, dan persentase rumah tangga dengan akses sanitasi layak, sehingga memberikan gambaran awal mengenai pola dan distribusi data sebelum analisis lebih lanjut.

2.2 Analisis Multivariat

Analisis multivariat adalah metode statistik yang digunakan untuk menganalisis lebih dari satu variabel secara bersamaan. Tujuan utamanya adalah untuk memahami hubungan antar variabel, mengidentifikasi pola tersembunyi, dan memastikan bahwa data layak dianalisis secara bersama-sama (Everitt et al., 2011). Sebelum melakukan clustering, dilakukan uji asumsi multivariat, seperti Kaiser-Meyer-Olkin (KMO) Measure of Sampling Adequacy untuk memeriksa kecukupan sampel dan kebermaknaan korelasi antar variabel. Selain itu, standarisasi data menggunakan Z-score sering dilakukan agar variabel dengan skala berbeda tidak mendominasi hasil analisis.

2.3 Analisis Cluster

Analisis cluster adalah teknik multivariat yang digunakan untuk mengelompokkan objek atau wilayah ke dalam kelompok yang homogen berdasarkan kesamaan karakteristik (Hair et al., 2010; Everitt et al., 2011). Objek dalam satu cluster memiliki kemiripan yang tinggi, sedangkan objek antar cluster memiliki perbedaan yang signifikan. Analisis cluster sangat berguna dalam penelitian kesehatan masyarakat untuk mengidentifikasi provinsi atau wilayah dengan kondisi sosial, ekonomi, dan sanitasi yang serupa. Dalam analisis cluster terdapat 2 metode, yaitu hierarki dan non-hierarki.

2.3.1 Langkah-langkah Analisis Cluster

Dalam analisis cluster, terdapat beberapa tahapan yang harus dilakukan, yaitu sebagai berikut.

a. Memilih variabel yang relevan dan bersih dari missing value atau noise.

b. Standarisasi data agar variabel dengan skala besar tidak mendominasi.

c. Perhitungan jarak antar objek dengan metode pengukuran jarak yang sesuai.

d. Pembentukan cluster dengan metode clustering yang sesuai, yaitu dengan metode hierarki atau non-hierarki.

e. Penentuan banyaknya cluster optimum.

f. Interpretasi hasil cluster berdasrkan rata-rata setiap variabel.

2.3.2 Jarak Analisis Cluster

Pengukuran jarak dalam analisis cluster dilakukan untuk menentukan kemiripan antar objek. Metode pengukuran jarak yang dapat digunakan, yaitu sebagai berikut.

a. Jarak Euclidean

Menghitung jarak lurus antara dua titik dalam ruang Euclidean.

\[ d\left(x,y\right)=\sqrt{\sum_{i}\left(x_i-y_i\right)^2} \]

b. Jarak Manhattan

Mengukur jarak berdasarkan jumlah absolut perbedaan dalam setiap dimensi.

\[ d\left(x,y\right)=\sum_{i}{{|x}_i-y_i|} \]

c. Jarak Mahalanobis

Mempertimbangkan korelasi antar variabel dan jika dua variabel berkorelasi kuat, maka jarak Mahalanobis kurang signifikan.

\[ d\left(x,y\right)=\sqrt{\left(x-y\right)' S^{-1}\left(x-y\right)} \]

2.3.3 Analisis Cluster Hierarki

Analisis cluster hierarki membentuk cluster secara bertingkat dan biasanya divisualisasikan dengan dendrogram. Hierarchical clustering cocok ketika jumlah cluster belum diketahui sebelumnya.

2.3.3.1 Metode Analisis Cluster Hierarki

Metode cluster hierarki terbagi menjadi 2 pendekatan utama, yaitu sebagai berikut.

a. Agglomerative Approach

Dengan pendekatan ini, cluster dimulai dari setiap objek sebagai cluster tunggal, kemudian digabungkan secara bertahap hingga terbentuk satu cluster besar.

b. Divisive Approch

Kebalikan dari pendekatan sebelumnya, dengan pendekatan ini, cluster dimulai dari semua objek dalam satu cluster besar, kemudian dibagi bertahap menjadi cluster yang lebih kecil.

2.3.3.2 Penggabungan Cluster

Terdapat beberapa metode penggabungan cluster, yaitu sebagai berikut.

a.Single Linkage

Teknik ini menghitung semua jarak berpasangan antar  anggota di cluster 1 dan cluster lainnya. Lalu, jarak yang terkecil dijadikan sebagai jarak antar kedua cluster.

\[ d(K_{1},K_{2})=min[d(x,y)] \]

a. Complete Linkage

Teknik ini menghitung semua jarak berpasangan antar anggota di cluster 1 dan cluster lainnya. Lalu, jarak yang terbesar dijadikan sebagai jarak antar kedua cluster.

\[ d(K_{1},K_{2})=max[d(x,y)] \]

b. Average Linkage

Teknik ini menghitung semua jarak berpasangan antar anggota di cluster 1 dan cluster lainnya. Lalu, rata-rata dari jarak tersebut dijadikan sebagai jarak antar kedua cluster.

\[ d(K_{1},K_{2})=\frac{1}{n_{K_1} n_{K_2}}[d (x, y)] \]

c. Centroid Linkage

Jarak antar dua cluster dihitung dari jarak antara centroid cluster 1 dan centroid cluster 2.

\[ d(K_{1},K_{2})=d(\bar{x},\bar{y}) \]

d. Ward’s Method

Metode ini meminimumkan variasi total dalam cluster. Pada setiap tahap iterasi, pasangan cluster yang memiliki variasi antar cluster terkecil akan digabungkan menjadi satu cluster.

\[ d(K_{1},K_{2})= \sqrt{ \frac{ 2 n_{K_1} n_{K_2} }{ n_{K_1+} n_{K_2} } } \, \|\bar{x}-\bar{y}\| \]

2.3.3.3 Validitas Cluster

Validitas cluster digunakan untuk menilai kualitas dan konsistensi hasil cluster. Beberapa metode validasi cluster yaitu sebagai berikut.

a. Indeks Connectivity

Banyak clulster terbaik ditunjukkan dengan semakin kecil nilai indeks connectivity.

\[ Conn(C) = \sum_{i} \sum_{j} \{ X_i , nn_{i(j)} \} \]

b. Indeks Dunn

Banyak cluster terbaik ditunjukkan dengan semakin besar nilai indeks Dunn.

\[ D = \min_{1 \le i \le n} \left\{ \min_{\substack{1 \le k \le n \\ i \ne k}} \left\{ \frac{ d(c_i , c_j) }{ \min_{1 \le k \le n} \left( d'(c_k) \right) } \right\}\right\} \]

c. Indeks Silhouette

Banyak cluster terbaik ditunjukkan dengan semakin besar nilai indeks Silhouette.

\[ S_i = \frac{b_i - a_i}{\max(b_i, a_i)} \]

2.3.3.4 Dendogram

Dendrogram adalah diagram pohon yang digunakan untuk memvisualisasikan hasil hierarchical clustering. Setiap daun (leaf) mewakili satu objek atau observasi, sedangkan cabang (branch) menunjukkan penggabungan atau pemisahan cluster pada berbagai tingkat kesamaan atau jarak. Tinggi cabang mencerminkan tingkat dissimilarity antar cluster, sehingga cabang yang lebih rendah menunjukkan objek atau cluster yang lebih mirip. Dendrogram juga digunakan untuk menentukan jumlah cluster optimal dengan memotong diagram pada level jarak tertentu, serta membantu interpretasi struktur internal data dan karakteristik setiap cluster (Everitt et al., 2011).

2.4 Data

Data yang digunakan pada analisis ini bersumber dari BPS, yang mencakup 34 Provinsi di Indonesi, dengan tiga variabel yang dianalisis. Ketiga variabel tersebut diukur pada tahun 2021, yaitu sebagai berikut.

a. Persentase rumah tangga yang memiliki fasilitas buang air besar sendiri,

b. Persentase penduduk miskin, dan

c. Persentase rumah tangga yang memiliki akses sanitasi layak.

Provinsi Fasilitas
Buang Air
Sendiri
Penduduk
Miskin (%)
Sanitasi
Layak (%)
ACEH 80.38 15.53 77.55
SUMATERA UTARA 88.91 8.49 82.02
SUMATERA BARAT 79.04 6.04 68.68
RIAU 92.30 7.00 83.64
JAMBI 87.90 7.67 80.36
SUMATERA SELATAN 82.81 12.79 77.29
BENGKULU 88.62 14.43 79.81
LAMPUNG 91.92 11.67 83.89
KEP. BANGKA BELITUNG 92.46 4.67 92.24
KEP. RIAU 94.55 5.75 91.62
DKI JAKARTA 86.46 4.67 95.17
JAWA BARAT 86.16 7.97 71.66
JAWA TENGAH 88.66 11.25 83.28
DI YOGYAKARTA 83.80 11.91 97.12
JAWA TIMUR 83.80 10.59 80.97
BANTEN 88.04 6.50 82.89
BALI 85.95 4.72 95.95
NUSA TENGGARA BARAT 73.32 13.83 82.85
NUSA TENGGARA TIMUR 79.20 20.44 73.36
KALIMANTAN BARAT 84.50 6.84 78.39
KALIMANTAN TENGAH 84.60 5.16 73.77
KALIMANTAN SELATAN 87.24 4.56 81.43
KALIMANTAN TIMUR 93.53 6.27 89.77
KALIMANTAN UTARA 92.44 6.83 79.80
SULAWESI UTARA 81.86 7.36 84.85
SULAWESI TENGAH 76.90 12.18 76.06
SULAWESI SELATAN 88.62 8.53 91.57
SULAWESI TENGGARA 85.64 11.74 85.62
GORONTALO 67.43 15.41 78.58
SULAWESI BARAT 77.96 11.85 80.12
MALUKU 72.87 16.30 76.77
MALUKU UTARA 69.73 6.38 77.11
PAPUA BARAT 75.48 21.82 77.89
PAPUA 63.34 27.38 40.81

3 SOURCE CODE

3.1 Library

> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)
> library(dplyr)

3.2 Impor Data

> data <- read_excel("C:/Users/felic/OneDrive/Documents/STATISTIKA/SEMESTER 5/Analisis Multivariat I/Kesehatan_prov.xlsx")
> data <- data.frame(data)
> head(data)
          Provinsi Fasilitas.Buang.Air.Sendiri Penduduk.Miskin Sanitasi.Layak
1             ACEH                       80.38           15.53          77.55
2   SUMATERA UTARA                       88.91            8.49          82.02
3   SUMATERA BARAT                       79.04            6.04          68.68
4             RIAU                       92.30            7.00          83.64
5            JAMBI                       87.90            7.67          80.36
6 SUMATERA SELATAN                       82.81           12.79          77.29

3.3 Statistika Deskriptif

> data$Fasilitas.Buang.Air.Sendiri <- as.numeric(data$Fasilitas.Buang.Air.Sendiri)
> data$Penduduk.Miskin <- as.numeric(data$Penduduk.Miskin)
> data$Sanitasi.Layak <- as.numeric(data$Sanitasi.Layak)
> 
> statdes <- summary(data)
> statdes
   Provinsi         Fasilitas.Buang.Air.Sendiri Penduduk.Miskin Sanitasi.Layak 
 Length:34          Min.   :63.34               Min.   : 4.56   Min.   :40.81  
 Class :character   1st Qu.:79.08               1st Qu.: 6.41   1st Qu.:77.36  
 Mode  :character   Median :85.12               Median : 8.51   Median :80.67  
                    Mean   :83.42               Mean   :10.43   Mean   :80.97  
                    3rd Qu.:88.62               3rd Qu.:12.64   3rd Qu.:84.61  
                    Max.   :94.55               Max.   :27.38   Max.   :97.12  

3.4 Uji Asumsi

> ##Uji KMO (Sampel Representatif)
> kmo <- KMO(data[, 2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA =  0.72
MSA for each item = 
Fasilitas.Buang.Air.Sendiri             Penduduk.Miskin 
                       0.70                        0.72 
             Sanitasi.Layak 
                       0.75 
> ##Uji Multikolinearitas (Korelasi Pearson)
> korelasi <- cor(data[, 2:4], method = "pearson")
> korelasi
                            Fasilitas.Buang.Air.Sendiri Penduduk.Miskin
Fasilitas.Buang.Air.Sendiri                   1.0000000      -0.6485611
Penduduk.Miskin                              -0.6485611       1.0000000
Sanitasi.Layak                                0.6141628      -0.5944900
                            Sanitasi.Layak
Fasilitas.Buang.Air.Sendiri      0.6141628
Penduduk.Miskin                 -0.5944900
Sanitasi.Layak                   1.0000000

3.5 Standarisasi Data

> datastand <- scale(data[, 2:4])
> rownames(datastand) <- data$Provinsi
> head(datastand)
                 Fasilitas.Buang.Air.Sendiri Penduduk.Miskin Sanitasi.Layak
ACEH                             -0.39270576       0.9428940    -0.34429310
SUMATERA UTARA                    0.70770510      -0.3579943     0.10605259
SUMATERA BARAT                   -0.56557218      -0.8107182    -1.23793209
RIAU                              1.14503134      -0.6333243     0.26926512
JAMBI                             0.57741027      -0.5095182    -0.06118988
SUMATERA SELATAN                 -0.07922412       0.4365824    -0.37048771

3.6 Menghitung Jarak Euclidean

> jarak <- dist(datastand, method = "euclidean")
> jarak
                          ACEH SUMATERA UTARA SUMATERA BARAT      RIAU
SUMATERA UTARA       1.7623920                                        
SUMATERA BARAT       1.9757604      1.9059089                         
RIAU                 2.2859469      0.5419402      2.2867611          
JAMBI                1.7693993      0.2605884      1.6678886 0.6683728
SUMATERA SELATAN     0.5960775      1.2156070      1.5952282 1.7472222
BENGKULU             1.1059509      1.1206043      2.2777899 1.5030879
LAMPUNG              1.7700352      0.7290876      2.4882454 0.8647054
KEP. BANGKA BELITUNG 2.9404158      1.3297285      2.9488021 0.9677355
KEP. RIAU            2.9354629      1.3119382      3.0574232 0.8854243
DKI JAKARTA          2.7917046      1.5340694      2.8465748 1.4499485
JAWA BARAT           1.6910553      1.1065770      1.0300463 1.4547515
JAWA TENGAH          1.4490411      0.5265569      2.1518889 0.9157365
DI YOGYAKARTA        2.1282637      1.7743461      3.1246587 1.9672300
JAWA TIMUR           1.0708180      0.7722282      1.6177480 1.3095165
BANTEN               2.0125100      0.3943339      1.8452175 0.5623723
BALI                 2.8183178      1.6126766      2.8986889 1.5448913
NUSA TENGGARA BARAT  1.1015037      2.2417713      2.1574663 2.7557930
NUSA TENGGARA TIMUR  1.0122040      2.6844737      2.7024381 3.1774957
KALIMANTAN BARAT     1.6935750      0.7418694      1.2144927 1.1371694
KALIMANTAN TENGAH    2.0281307      1.1741536      0.8965978 1.4460733
KALIMANTAN SELATAN   2.2461288      0.7598172      1.6863770 0.8239935
KALIMANTAN TIMUR     2.7058162      1.0644959      2.8303224 0.6517587
KALIMANTAN UTARA     2.2486379      0.5928688      2.0651184 0.3885674
SULAWESI UTARA       1.6901305      0.9757324      1.6869550 1.3539511
SULAWESI TENGAH      0.7792802      1.7960960      1.3843113 2.3337262
SULAWESI SELATAN     2.1904886      0.9629034      2.6565614 0.9713934
SULAWESI TENGGARA    1.2696282      0.8186354      2.1787795 1.2430362
GORONTALO            1.6739787      3.0714478      2.4971876 3.6011721
SULAWESI BARAT       0.7917817      1.5548563      1.5812761 2.0859510
MALUKU               0.9823666      2.5776454      2.2118525 3.1169170
MALUKU UTARA         2.1790649      2.5532219      1.4723309 2.9872359
PAPUA BARAT          1.3235155      3.0400823      3.0942598 3.5416616
PAPUA                4.8299246      6.3484776      5.2474734 6.8380873
                         JAMBI SUMATERA SELATAN  BENGKULU   LAMPUNG
SUMATERA UTARA                                                     
SUMATERA BARAT                                                     
RIAU                                                               
JAMBI                                                              
SUMATERA SELATAN     1.1924513                                     
BENGKULU             1.2538220        0.8473920                    
LAMPUNG              0.9704412        1.3660716 0.7812213          
KEP. BANGKA BELITUNG 1.4442689        2.4636849 2.2508424 1.5445673
KEP. RIAU            1.4658657        2.4638209 2.1385864 1.3850271
DKI JAKARTA          1.6025409        2.3912477 2.3927013 1.8603140
JAWA BARAT           0.9064943        1.1409572 1.4831952 1.5930492
JAWA TENGAH          0.7306034        1.0073285 0.6837681 0.4320500
DI YOGYAKARTA        1.9351471        2.0085137 1.9091517 1.6958453
JAWA TIMUR           0.7580712        0.5648314 0.9506811 1.1061955
BANTEN               0.3347221        1.4575545 1.4997101 1.0832190
BALI                 1.6814977        2.4335342 2.4458465 1.9284065
NUSA TENGGARA BARAT  2.2127707        1.3599685 2.0004695 2.4347148
NUSA TENGGARA TIMUR  2.7065171        1.5401099 1.7698561 2.5385810
KALIMANTAN BARAT     0.5052715        1.1263451 1.5066592 1.4212269
KALIMANTAN TENGAH    0.9149650        1.4720529 1.8903632 1.8380308
KALIMANTAN SELATAN   0.5908722        1.6773055 1.8397527 1.4669907
KALIMANTAN TIMUR     1.2219732        2.2237240 1.9187859 1.1788821
KALIMANTAN UTARA     0.6085223        1.6793461 1.4883215 0.9870034
SULAWESI UTARA       0.9027995        1.2656709 1.6507899 1.5257459
SULAWESI TENGAH      1.7017384        0.7806046 1.6129324 2.0942009
SULAWESI SELATAN     1.1442920        1.8031255 1.6100820 1.0566846
SULAWESI TENGGARA    0.9651184        0.9355461 0.8587804 0.8287878
GORONTALO            3.0085188        2.0464378 2.7424044 3.2779813
SULAWESI BARAT       1.4971650        0.7091759 1.4558203 1.8408249
MALUKU               2.5364092        1.4379620 2.0836322 2.6992677
MALUKU UTARA         2.3787496        2.0616903 2.8679608 3.1010800
PAPUA BARAT          3.0766563        1.9188762 2.1853198 2.8950183
PAPUA                6.2594382        5.2043371 5.6391962 6.3920768
                     KEP. BANGKA BELITUNG KEP. RIAU DKI JAKARTA JAWA BARAT
SUMATERA UTARA                                                            
SUMATERA BARAT                                                            
RIAU                                                                      
JAMBI                                                                     
SUMATERA SELATAN                                                          
BENGKULU                                                                  
LAMPUNG                                                                   
KEP. BANGKA BELITUNG                                                      
KEP. RIAU                       0.3412098                                 
DKI JAKARTA                     0.8284078 1.1211373                       
JAWA BARAT                      2.3089778 2.3202679   2.4461385           
JAWA TENGAH                     1.5917205 1.5219282   1.7302869  1.3571655
DI YOGYAKARTA                   1.8109795 1.8777483   1.3950557  2.6837039
JAWA TIMUR                      1.9323530 1.9683411   1.8333389  1.0985737
BANTEN                          1.1518855 1.2239636   1.2986678  1.1885637
BALI                            0.9192900 1.2072245   0.1029049  2.5199383
NUSA TENGGARA BARAT             3.1395360 3.2420363   2.6979768  2.2775543
NUSA TENGGARA TIMUR             3.8776327 3.8306849   3.7679137  2.4789477
KALIMANTAN BARAT                1.7782897 1.8703220   1.7557654  0.7410765
KALIMANTAN TENGAH               2.1210885 2.2121503   2.1712174  0.5960768
KALIMANTAN SELATAN              1.2806275 1.4112451   1.3880853  1.1770010
KALIMANTAN TIMUR                0.4103561 0.2475617   1.1023859  2.0812583
KALIMANTAN UTARA                1.3153345 1.2377548   1.7754739  1.1718663
SULAWESI UTARA                  1.6344202 1.7982562   1.2962474  1.4444107
SULAWESI TENGAH                 2.9346868 3.0089354   2.6746219  1.4928968
SULAWESI SELATAN                0.8710407 0.9214873   0.8473187  2.0334856
SULAWESI TENGGARA               1.7104571 1.7063857   1.6259407  1.5709571
GORONTALO                       4.0322427 4.1415642   3.5719858  2.8660865
SULAWESI BARAT                  2.5981403 2.6820403   2.2938499  1.5360779
MALUKU                          3.6652906 3.7230463   3.3359438  2.3608875
MALUKU UTARA                    3.3198900 3.5217531   2.8405163  2.2091397
PAPUA BARAT                     4.1147844 4.0967765   3.8833275  2.9735682
PAPUA                           7.6531341 7.6413563   7.5166708  5.5848903
                     JAWA TENGAH DI YOGYAKARTA JAWA TIMUR    BANTEN      BALI
SUMATERA UTARA                                                               
SUMATERA BARAT                                                               
RIAU                                                                         
JAMBI                                                                        
SUMATERA SELATAN                                                             
BENGKULU                                                                     
LAMPUNG                                                                      
KEP. BANGKA BELITUNG                                                         
KEP. RIAU                                                                    
DKI JAKARTA                                                                  
JAWA BARAT                                                                   
JAWA TENGAH                                                                  
DI YOGYAKARTA          1.5336863                                             
JAWA TIMUR             0.6797938     1.6452691                               
BANTEN                 0.8822421     1.8313708  0.9527835                    
BALI                   1.7909859     1.3623574  1.8791492 1.3828037          
NUSA TENGGARA BARAT    2.0360111     2.0051493  1.4906862 2.3325168 2.6889437
NUSA TENGGARA TIMUR    2.3177563     2.9269122  2.0622472 2.9761835 3.7915728
KALIMANTAN BARAT       1.0930621     2.1087210  0.7455812 0.6465630 1.8216262
KALIMANTAN TENGAH      1.5680272     2.6646871  1.2424250 1.0499956 2.2428517
KALIMANTAN SELATAN     1.2635349     2.1308023  1.2002708 0.4009959 1.4726001
KALIMANTAN TIMUR       1.2919197     1.7916665  1.7317169 0.9918978 1.1941107
KALIMANTAN UTARA       1.0138030     2.2734136  1.3186993 0.6502521 1.8709375
SULAWESI UTARA         1.1450987     1.5158114  0.7560941 0.8365729 1.3292807
SULAWESI TENGAH        1.6912216     2.3014569  1.0598885 1.9079864 2.6979366
SULAWESI SELATAN       0.9747905     1.0437362  1.2930669 0.9544913 0.8994600
SULAWESI TENGGARA      0.4642854     1.1830900  0.5665469 1.0531212 1.6635596
GORONTALO              2.8837475     2.8925736  2.3045603 3.1572874 3.5598675
SULAWESI BARAT         1.4209217     1.8711334  0.7931813 1.6571578 2.3112420
MALUKU                 2.3345829     2.6171873  1.8112151 2.7366721 3.3406677
MALUKU UTARA           2.6757984     2.8987834  2.0127129 2.4329009 2.8417001
PAPUA BARAT            2.6458954     2.8738271  2.3567998 3.3004822 3.8883794
PAPUA                  6.1531535     6.8791701  5.7413421 6.5584444 7.5433202
                     NUSA TENGGARA BARAT NUSA TENGGARA TIMUR KALIMANTAN BARAT
SUMATERA UTARA                                                               
SUMATERA BARAT                                                               
RIAU                                                                         
JAMBI                                                                        
SUMATERA SELATAN                                                             
BENGKULU                                                                     
LAMPUNG                                                                      
KEP. BANGKA BELITUNG                                                         
KEP. RIAU                                                                    
DKI JAKARTA                                                                  
JAWA BARAT                                                                   
JAWA TENGAH                                                                  
DI YOGYAKARTA                                                                
JAWA TIMUR                                                                   
BANTEN                                                                       
BALI                                                                         
NUSA TENGGARA BARAT                                                          
NUSA TENGGARA TIMUR            1.7266792                                     
KALIMANTAN BARAT               1.9875651           2.6532735                 
KALIMANTAN TENGAH              2.3496958           2.9084795        0.5596339
KALIMANTAN SELATAN             2.4858406           3.2167469        0.6294842
KALIMANTAN TIMUR               3.0389186           3.6065031        1.6378704
KALIMANTAN UTARA               2.8020586           3.1085643        1.0341033
SULAWESI UTARA                 1.6382037           2.7017844        0.7408165
SULAWESI TENGAH                0.8798996           1.5785135        1.4106886
SULAWESI SELATAN               2.3720750           3.1122542        1.4639810
SULAWESI TENGGARA              1.6592263           2.1909711        1.1713442
GORONTALO                      0.9206866           1.8563377        2.7124680
SULAWESI BARAT                 0.7535343           1.7346383        1.2646152
MALUKU                         0.7660988           1.1705153        2.3094068
MALUKU UTARA                   1.5633551           2.8957301        1.9116504
PAPUA BARAT                    1.5834193           0.7096627        3.0031387
PAPUA                          5.0858590           4.0724658        6.0159780
                     KALIMANTAN TENGAH KALIMANTAN SELATAN KALIMANTAN TIMUR
SUMATERA UTARA                                                            
SUMATERA BARAT                                                            
RIAU                                                                      
JAMBI                                                                     
SUMATERA SELATAN                                                          
BENGKULU                                                                  
LAMPUNG                                                                   
KEP. BANGKA BELITUNG                                                      
KEP. RIAU                                                                 
DKI JAKARTA                                                               
JAWA BARAT                                                                
JAWA TENGAH                                                               
DI YOGYAKARTA                                                             
JAWA TIMUR                                                                
BANTEN                                                                    
BALI                                                                      
NUSA TENGGARA BARAT                                                       
NUSA TENGGARA TIMUR                                                       
KALIMANTAN BARAT                                                          
KALIMANTAN TENGAH                                                         
KALIMANTAN SELATAN           0.8507964                                    
KALIMANTAN TIMUR             1.9919010          1.2100774                 
KALIMANTAN UTARA             1.2195188          0.8080366        1.0195221
SULAWESI UTARA               1.2394831          0.9317309        1.5977351
SULAWESI TENGAH              1.6500472          2.0136187        2.7754368
SULAWESI SELATAN             1.9679279          1.2702378        0.7800651
SULAWESI TENGGARA            1.7092998          1.4075122        1.4941532
GORONTALO                    2.9544100          3.2608534        3.9319642
SULAWESI BARAT               1.6343980          1.8070026        2.4582271
MALUKU                       2.5726758          2.8919188        3.5005671
MALUKU UTARA                 1.9605954          2.3248749        3.3247676
PAPUA BARAT                  3.3217170          3.5497905        3.8873028
PAPUA                        5.9504271          6.6359156        7.3970061
                     KALIMANTAN UTARA SULAWESI UTARA SULAWESI TENGAH
SUMATERA UTARA                                                      
SUMATERA BARAT                                                      
RIAU                                                                
JAMBI                                                               
SUMATERA SELATAN                                                    
BENGKULU                                                            
LAMPUNG                                                             
KEP. BANGKA BELITUNG                                                
KEP. RIAU                                                           
DKI JAKARTA                                                         
JAWA BARAT                                                          
JAWA TENGAH                                                         
DI YOGYAKARTA                                                       
JAWA TIMUR                                                          
BANTEN                                                              
BALI                                                                
NUSA TENGGARA BARAT                                                 
NUSA TENGGARA TIMUR                                                 
KALIMANTAN BARAT                                                    
KALIMANTAN TENGAH                                                   
KALIMANTAN SELATAN                                                  
KALIMANTAN TIMUR                                                    
KALIMANTAN UTARA                                                    
SULAWESI UTARA              1.4599042                               
SULAWESI TENGAH             2.2667753      1.4095957                
SULAWESI SELATAN            1.3219967      1.1249984       2.2765329
SULAWESI TENGGARA           1.3915948      0.9480885       1.4851059
GORONTALO                   3.5970132      2.4651742       1.3831798
SULAWESI BARAT              2.0858826      1.0810170       0.4355806
MALUKU                      3.0869275      2.1764052       0.9246635
MALUKU UTARA                2.9433820      1.7577138       1.4196505
PAPUA BARAT                 3.5350456      2.8824754       1.8001906
PAPUA                       6.6289671      6.2514267       4.8540080
                     SULAWESI SELATAN SULAWESI TENGGARA GORONTALO
SUMATERA UTARA                                                   
SUMATERA BARAT                                                   
RIAU                                                             
JAMBI                                                            
SUMATERA SELATAN                                                 
BENGKULU                                                         
LAMPUNG                                                          
KEP. BANGKA BELITUNG                                             
KEP. RIAU                                                        
DKI JAKARTA                                                      
JAWA BARAT                                                       
JAWA TENGAH                                                      
DI YOGYAKARTA                                                    
JAWA TIMUR                                                       
BANTEN                                                           
BALI                                                             
NUSA TENGGARA BARAT                                              
NUSA TENGGARA TIMUR                                              
KALIMANTAN BARAT                                                 
KALIMANTAN TENGAH                                                
KALIMANTAN SELATAN                                               
KALIMANTAN TIMUR                                                 
KALIMANTAN UTARA                                                 
SULAWESI UTARA                                                   
SULAWESI TENGAH                                                  
SULAWESI SELATAN                                                 
SULAWESI TENGGARA           0.9268084                            
GORONTALO                   3.2865861         2.5458987          
SULAWESI BARAT              1.8969029         1.1353666 1.5172759
MALUKU                      2.9005336         2.0539963 0.7435077
MALUKU UTARA                2.8668197         2.4348900 1.7012448
PAPUA BARAT                 3.2869317         2.4070362 1.5767906
PAPUA                       6.9943773         6.0835370 4.4329318
                     SULAWESI BARAT    MALUKU MALUKU UTARA PAPUA BARAT
SUMATERA UTARA                                                        
SUMATERA BARAT                                                        
RIAU                                                                  
JAMBI                                                                 
SUMATERA SELATAN                                                      
BENGKULU                                                              
LAMPUNG                                                               
KEP. BANGKA BELITUNG                                                  
KEP. RIAU                                                             
DKI JAKARTA                                                           
JAWA BARAT                                                            
JAWA TENGAH                                                           
DI YOGYAKARTA                                                         
JAWA TIMUR                                                            
BANTEN                                                                
BALI                                                                  
NUSA TENGGARA BARAT                                                   
NUSA TENGGARA TIMUR                                                   
KALIMANTAN BARAT                                                      
KALIMANTAN TENGAH                                                     
KALIMANTAN SELATAN                                                    
KALIMANTAN TIMUR                                                      
KALIMANTAN UTARA                                                      
SULAWESI UTARA                                                        
SULAWESI TENGAH                                                       
SULAWESI SELATAN                                                      
SULAWESI TENGGARA                                                     
GORONTALO                                                             
SULAWESI BARAT                                                        
MALUKU                    1.1051010                                   
MALUKU UTARA              1.4969490 1.8776060                         
PAPUA BARAT               1.8833310 1.0800607    2.9489830            
PAPUA                     5.2418888 4.3392291    5.3956126   4.1790123

3.7 Menghitung Korelasi Cophenetic

3.7.1 Single Linkage

> hc_single <- hclust(jarak, method = "single")
> cor_single <- cor(jarak, cophenetic(hc_single))

3.7.2 Average Linkage

> hc_average <- hclust(jarak, method = "average")
> cor_average <- cor(jarak, cophenetic(hc_average))

3.7.3 Complete Linkage

> hc_complete <- hclust(jarak, method = "complete")
> cor_complete <- cor(jarak, cophenetic(hc_complete))

3.7.4 Centroid Linkage

> hc_centroid <- hclust(jarak, method = "centroid")
> cor_centroid <- cor(jarak, cophenetic(hc_centroid))

3.7.5 Ward’s Method

> hc_ward <- hclust(jarak, method = "ward.D")
> cor_ward <- cor(jarak, cophenetic(hc_ward))
> ##Ringkasan Koefisien Korelasi
> KorCop <- data.frame(
+   Metode = c("Single Linkage", "Average Linkage", "Complete Linkage", "Centroid Linkage", "Ward's Method"),
+   Koefisien_Korelasi = c(cor_single, cor_average, cor_complete, cor_centroid, cor_ward)
+ )
> KorCop
            Metode Koefisien_Korelasi
1   Single Linkage          0.8132167
2  Average Linkage          0.8695696
3 Complete Linkage          0.8002051
4 Centroid Linkage          0.8576177
5    Ward's Method          0.5094066

3.8 Analisis Cluster dengan Metode Average Linkage

> plot(hc_average, 
+      labels = data$Provinsi, 
+      hang = 1, 
+      main = "Cluster Dendrogram",
+      xlab = "Provinsi", 
+      ylab = "Jarak",
+      cex = 0.5)

3.9 Penentuan Jumlah Cluster Optimal

> inval <- clValid(datastand, 2:4, 
+                  clMethods = "hierarchical", 
+                  validation = "internal", 
+                  metric = "euclidean", 
+                  method = "average")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 

Validation Measures:
                                 2       3       4
                                                  
hierarchical Connectivity   2.9290 13.4988 16.7024
             Dunn           0.9833  0.1831  0.2111
             Silhouette     0.6585  0.3790  0.3437

Optimal Scores:

             Score  Method       Clusters
Connectivity 2.9290 hierarchical 2       
Dunn         0.9833 hierarchical 2       
Silhouette   0.6585 hierarchical 2       
> plot_nb <- fviz_nbclust(datastand, FUN = hcut, hc_method = "average", method = "silhouette")
> print(plot_nb)

3.10 Pembentukan Anggota Cluster

> anggota <- data.frame(
+   Cluster = cutree(hc_complete, k = 2)
+ )
> anggota
                     Cluster
ACEH                       1
SUMATERA UTARA             1
SUMATERA BARAT             1
RIAU                       1
JAMBI                      1
SUMATERA SELATAN           1
BENGKULU                   1
LAMPUNG                    1
KEP. BANGKA BELITUNG       1
KEP. RIAU                  1
DKI JAKARTA                1
JAWA BARAT                 1
JAWA TENGAH                1
DI YOGYAKARTA              1
JAWA TIMUR                 1
BANTEN                     1
BALI                       1
NUSA TENGGARA BARAT        1
NUSA TENGGARA TIMUR        1
KALIMANTAN BARAT           1
KALIMANTAN TENGAH          1
KALIMANTAN SELATAN         1
KALIMANTAN TIMUR           1
KALIMANTAN UTARA           1
SULAWESI UTARA             1
SULAWESI TENGAH            1
SULAWESI SELATAN           1
SULAWESI TENGGARA          1
GORONTALO                  1
SULAWESI BARAT             1
MALUKU                     1
MALUKU UTARA               1
PAPUA BARAT                1
PAPUA                      2

3.11 Visualisasi Dendogram

> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, main = "Hasil Analisis Cluster", cex = 0.5)

3.12 Nilai Mean Setiap Cluster

> idclus <- clus_hier$cluster
> aggregate(data[, 2:4], list(Cluster = idclus), mean)
  Cluster Fasilitas.Buang.Air.Sendiri Penduduk.Miskin Sanitasi.Layak
1       1                    84.03273        9.913636       82.18424
2       2                    63.34000       27.380000       40.81000

4 HASIL DAN PEMBAHASAN

4.1 Asumsi Sampel Representatif

> kmo <- KMO(data[, 2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA =  0.72
MSA for each item = 
Fasilitas.Buang.Air.Sendiri             Penduduk.Miskin 
                       0.70                        0.72 
             Sanitasi.Layak 
                       0.75 

Berdasarkan Uji KMO (Kaiser-Meyer-Olkin) diperoleh nilai MSA (Measure of Sampling Adequency) secara keseluruhan bernilai lebih besar dari 0,72 (>0,5). Artinya hubungan antar variabel cukup kuat dan tidak terlalu banyak noise. Nilai MSA tiap variabel juga bernilai lebih dari 0,5. Sehingga dapat disimpulkan bahwa sampel sudah representatif terhadap populasi. Artinya, data memadai untuk digunakan dalam Analisis Cluster Hierarki.

4.2 Asumsi Non Multikolinearitas

> korelasi <- cor(data[, 2:4], method = "pearson")
> korelasi
                            Fasilitas.Buang.Air.Sendiri Penduduk.Miskin
Fasilitas.Buang.Air.Sendiri                   1.0000000      -0.6485611
Penduduk.Miskin                              -0.6485611       1.0000000
Sanitasi.Layak                                0.6141628      -0.5944900
                            Sanitasi.Layak
Fasilitas.Buang.Air.Sendiri      0.6141628
Penduduk.Miskin                 -0.5944900
Sanitasi.Layak                   1.0000000

Pendeteksian asumsi non-multikolinieritas dapat dilakukan melalui korelasi antar variabel. Didapatkan semua korelasi antar variabel bernilai kurang dari 0.8. Sehingga, dapat disimpulkan bahwa tidak terjadi multikolinieritas.

4.3 Deskripsi Data

> statdes <- summary(data)
> statdes
   Provinsi         Fasilitas.Buang.Air.Sendiri Penduduk.Miskin Sanitasi.Layak 
 Length:34          Min.   :63.34               Min.   : 4.56   Min.   :40.81  
 Class :character   1st Qu.:79.08               1st Qu.: 6.41   1st Qu.:77.36  
 Mode  :character   Median :85.12               Median : 8.51   Median :80.67  
                    Mean   :83.42               Mean   :10.43   Mean   :80.97  
                    3rd Qu.:88.62               3rd Qu.:12.64   3rd Qu.:84.61  
                    Max.   :94.55               Max.   :27.38   Max.   :97.12  

Berdasarkan hasil statistik deskriptif, terlihat bahwa akses fasilitas buang air sendiri di sebagian besar provinsi di Indonesia tergolong tinggi. Nilai median sebesar 85,12 persen menunjukkan bahwa setengah dari provinsi sudah memiliki tingkat akses di atas angka tersebut, sementara rata-rata nasional berada pada kisaran 83 persen. Pada variabel penduduk miskin, terlihat adanya ketimpangan yang cukup besar antarprovinsi. Rata-rata tingkat kemiskinan mencapai 10,43 persen, namun terdapat provinsi dengan tingkat kemiskinan yang sangat rendah (sekitar 4,5 persen) dan provinsi lain yang mencapai hingga 27 persen. Hal ini mengindikasikan bahwa disparitas kesejahteraan masih menjadi isu penting. Sementara itu, akses sanitasi layak juga menunjukkan pola yang cenderung baik, dengan nilai median sekitar 80,67 persen dan rata-rata sebesar 80,97 persen. Secara keseluruhan, sebagian besar provinsi telah memiliki akses sanitasi dan fasilitas dasar yang baik, namun variasi tingkat kemiskinan dan ketimpangan akses sanitasi pada provinsi tertentu menunjukkan perlunya kebijakan yang lebih terfokus pada daerah dengan kondisi terendah. Berdasarkan hasil analisis statistika deskriptif, diperoleh bahwa ketiga variabel memiliki range yang cukup jauh. Sehingga diperlukan standarisasi data agar variabel dengan skala besar tidak mendominasi jarak analisis cluster.

4.4 Standarisasi Data

> datastand <- scale(data[, 2:4])
> rownames(datastand) <- data$Provinsi
> head(datastand)
                 Fasilitas.Buang.Air.Sendiri Penduduk.Miskin Sanitasi.Layak
ACEH                             -0.39270576       0.9428940    -0.34429310
SUMATERA UTARA                    0.70770510      -0.3579943     0.10605259
SUMATERA BARAT                   -0.56557218      -0.8107182    -1.23793209
RIAU                              1.14503134      -0.6333243     0.26926512
JAMBI                             0.57741027      -0.5095182    -0.06118988
SUMATERA SELATAN                 -0.07922412       0.4365824    -0.37048771

Standarisasi data dilakukan dengan menggunakan Z-score, agar hasil cluster tidak bias.

4.5 Penentuan Linkage Terbaik

> KorCop <- data.frame(
+   Metode = c("Single Linkage", "Average Linkage", "Complete Linkage", "Centroid Linkage", "Ward's Method"),
+   Koefisien_Korelasi = c(cor_single, cor_average, cor_complete, cor_centroid, cor_ward)
+ )
> KorCop
            Metode Koefisien_Korelasi
1   Single Linkage          0.8132167
2  Average Linkage          0.8695696
3 Complete Linkage          0.8002051
4 Centroid Linkage          0.8576177
5    Ward's Method          0.5094066

Berdasarkan hasil perhitungan koefisien korelasi Cophenetic, diperoleh bahwa Metode Average Linkage memiliki nilai tertinggi yaitu sebesar 0,8696, yang menunjukkan bahwa metode ini paling baik dalam merepresentasikan struktur jarak asli antar provinsi. Nilai koefisien yang mendekati 1 menandakan bahwa dendrogram yang dihasilkan mencerminkan hubungan antar data dengan baik.

4.6 Hasil Dendogram

> plot(hc_average, 
+      labels = data$Provinsi, 
+      hang = 1, 
+      main = "Cluster Dendrogram",
+      xlab = "Provinsi", 
+      ylab = "Jarak",
+      cex = 0.5)

4.7 Penentuan Jumlah Cluster Optimum

> #
> inval <- clValid(datastand, 2:4, 
+                  clMethods = "hierarchical", 
+                  validation = "internal", 
+                  metric = "euclidean", 
+                  method = "average")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 

Validation Measures:
                                 2       3       4
                                                  
hierarchical Connectivity   2.9290 13.4988 16.7024
             Dunn           0.9833  0.1831  0.2111
             Silhouette     0.6585  0.3790  0.3437

Optimal Scores:

             Score  Method       Clusters
Connectivity 2.9290 hierarchical 2       
Dunn         0.9833 hierarchical 2       
Silhouette   0.6585 hierarchical 2       
> plot_nb <- fviz_nbclust(datastand, FUN = hcut, hc_method = "average", method = "silhouette")
> print(plot_nb)

Berdasarkan ketiga Indeks Validitas (Connectivity, Dunn Index, dan Silhouette), menunjukkan bahwa jumlah cluster optimum adalah 2 cluster. Adapun berdasarkan plot Silhouette menunjukkan bahwa jumlah cluster optimum adalah 2 cluster.

4.8 Hasil Clustering

> #Pembentukan Anggota Cluster 
> anggota <- data.frame(
+   Cluster = cutree(hc_complete, k = 2)
+ )
> anggota
                     Cluster
ACEH                       1
SUMATERA UTARA             1
SUMATERA BARAT             1
RIAU                       1
JAMBI                      1
SUMATERA SELATAN           1
BENGKULU                   1
LAMPUNG                    1
KEP. BANGKA BELITUNG       1
KEP. RIAU                  1
DKI JAKARTA                1
JAWA BARAT                 1
JAWA TENGAH                1
DI YOGYAKARTA              1
JAWA TIMUR                 1
BANTEN                     1
BALI                       1
NUSA TENGGARA BARAT        1
NUSA TENGGARA TIMUR        1
KALIMANTAN BARAT           1
KALIMANTAN TENGAH          1
KALIMANTAN SELATAN         1
KALIMANTAN TIMUR           1
KALIMANTAN UTARA           1
SULAWESI UTARA             1
SULAWESI TENGAH            1
SULAWESI SELATAN           1
SULAWESI TENGGARA          1
GORONTALO                  1
SULAWESI BARAT             1
MALUKU                     1
MALUKU UTARA               1
PAPUA BARAT                1
PAPUA                      2
> 
> #Visualisasi Dendogram dengan Warna Cluster
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, main = "Hasil Analisis Cluster", cex = 0.5)

> 
> #Nilai Mean Setiap Cluster
> idclus <- clus_hier$cluster
> aggregate(data[, 2:4], list(Cluster = idclus), mean)
  Cluster Fasilitas.Buang.Air.Sendiri Penduduk.Miskin Sanitasi.Layak
1       1                    84.03273        9.913636       82.18424
2       2                    63.34000       27.380000       40.81000

Berdasarkan hasil pengelompokan, Cluster 1, yang memiliki rata-rata Fasilitas Buang Air Sendiri sebesar 84,03%, Penduduk Miskin 9,91%, dan Sanitasi Layak 82,18%. Cluster 1 terdiri dari provinsi-provinsi dengan kondisi sanitasi relatif baik dan tingkat kemiskinan yang lebih rendah. Provinsi yang termasuk dalam cluster ini adalah Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, DKI Jakarta, Jawa Barat, Jawa Tengah, DI Yogyakarta, Jawa Timur, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, dan Papua Barat.

Sementara itu, Cluster 2, yang memiliki rata-rata Fasilitas Buang Air Sendiri sebesar 63,34%, Penduduk Miskin 27,38%, dan Sanitasi Layak 40,81%, hanya beranggotakan Provinsi Papua, yang menunjukkan karakteristik sanitasi yang jauh lebih rendah serta tingkat kemiskinan yang jauh lebih tinggi dibandingkan provinsi-provinsi lainnya.

5 KESIMPULAN

Berdasarkan hasil analisis cluster hierarki dengan menggunakan metode agglomerative hierarchical clustering dengan jarak Euclidean terhadap data 34 provinsi di Indonesia yang telah distandarisasi, terbentuk dua cluster utama yang menggambarkan perbedaan kondisi sanitasi dan kesejahteraan antarprovinsi.

Cluster 1 beranggotakan 33 provinsi, yaitu Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, DKI Jakarta, Jawa Barat, Jawa Tengah, DI Yogyakarta, Jawa Timur, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, dan Papua Barat. Cluster ini memiliki karakteristik rata-rata akses sanitasi dan fasilitas buang air besar sendiri yang relatif tinggi (masing-masing 82,18% dan 84,03%) serta tingkat kemiskinan yang lebih rendah (9,91%). Hal ini menunjukkan bahwa sebagian besar provinsi di Indonesia berada dalam kondisi yang cukup baik dalam hal sanitasi dasar dan kesejahteraan masyarakat.

Sedangkan cluster 2 hanya beranggotakan Provinsi Papua, yang memiliki karakteristik sangat berbeda, yaitu akses fasilitas buang air besar sendiri rendah (63,34%), akses sanitasi layak rendah (40,81%), serta tingkat kemiskinan yang jauh lebih tinggi (27,38%). Kondisi ini menempatkan Papua sebagai outlier dibandingkan provinsi lainnya, menunjukkan kesenjangan signifikan dalam pelayanan dasar dan kesejahteraan.

Secara keseluruhan, hasil analisis cluster menunjukkan bahwa kondisi sanitasi dan tingkat kemiskinan memiliki pola pengelompokan yang jelas antarprovinsi, di mana sebagian besar provinsi berada dalam kategori kondisi yang lebih baik, sementara Papua berada dalam kategori kondisi yang jauh tertinggal. Hasil ini sesuai dengan tujuan penelitian, yaitu mengelompokkan provinsi berdasarkan kemiripan karakteristik sanitasi dan kemiskinan, serta mengidentifikasi provinsi yang membutuhkan prioritas intervensi.

6 DAFTAR PUSTAKA

Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster Analysis (5th ed.). Wiley.

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate Data Analysis (7th ed.). Pearson.