- 1 PENDAHULUAN
- 2 TINJAUAN PUSTAKA
- 3 SOURCE CODE
- 4 HASIL DAN PEMBAHASAN
- 5 Kesimpulan
- 6 DAFTAR PUSTAKA
Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Akses terhadap pelayanan dasar merupakan salah satu indikator penting dalam menilai kualitas hidup masyarakat dan pembangunan suatu negara. Di Indonesia, yang merupakan negara kepulauan dengan keragaman sosial, ekonomi, dan budaya yang tinggi, akses terhadap pelayanan dasar seperti kesehatan, pendidikan, air bersih, dan sanitasi sangat bervariasi antar provinsi. Ketidakmerataan ini dapat mempengaruhi kesejahteraan masyarakat dan berkontribusi pada ketimpangan sosial.
Dari data Badan Pusat Statistik (BPS) menunjukkan bahwa beberapa provinsi di Indonesia masih memiliki proporsi rumah tangga dengan akses pelayanan dasar yang rendah. Ketimpangan ini dapat disebabkan oleh beberapa faktor, seperti tingkat ekonomi, infrastruktur, dan kebijakan daerah. Sehingga perlu dilakukan analisis untuk mengetaui pola ketimpangan ini agar kebijakan yang diterapkan lebih efektif dan terarah.
Analisis cluster adalah metode statistik yang berguna untuk mengelompokkan provinsi berdasarkan karakteristik yang serupa, termasuk proporsi rumah tangga yang memiliki akses terhadap pelayanan dasar. Melalui pendekatan ini, pemerintah dan pemangku kebijakan dapat mengenali kelompok provinsi dengan tantangan yang sejenis, sehingga kebijakan yang diterapkan dapat menjadi lebih efektif dan terarah.
Secara umum, analisis cluster dibagi menjadi dua metode utama, yaitu metode hierarki dan metode non-hierarki. Metode hierarki digunakan ketika jumlah cluster belum diketahui sebelumnya. Proses pada metode ini dapat dilakukan melalui penggabungan bertahap (agglomerative) atau pemisahan bertahap (divisive). Sebaliknya, pada metode non-hierarki, jumlah cluster sudah ditentukan lebih dahulu sesuai kebutuhan peneliti.
Dalam metode agglomerative, setiap objek pengamatan dianggap sebagai kelompok tersendiri dengan satu anggota, lalu dua kelompok atau objek yang memiliki jarak paling dekat digabungkan menjadi satu kelompok. Sementara itu, metode divisive dimulai dengan menganggap semua objek sebagai satu kelompok besar, yang kemudian dipecah secara bertahap hingga terbentuk kelompok-kelompok kecil dengan satu anggota setiap kelompok.
Hasil dari metode agglomerative dapat divisualisasikan menggunakan dendogram, yaitu diagram yang menggambarkan proses pembentukan cluster. Garis horizontal pada dendogram menunjukkan skala kemiripan, di mana nilai skala yang lebih kecil menandakan tingkat kemiripan yang lebih tinggi antar individu (Supranto, 2004).
1.2 Rumusan Masalah
- Bagaimana pola distribusi proporsi rumah tangga dengan akses pelayanan dasar di Indonesia menurut provinsi?
- Apakah terdapat perbedaan signifikan dalam akses pelayanan dasar antarprovinsi di Indonesia?
- Bagaimana pengelompokan provinsi berdasarkan kesamaan proporsi rumah tangga dengan akses pelayanan dasar menggunakan analisis cluster?
1.3 Tujuan
- Menganalisis pola distribusi proporsi rumah tangga dengan akses pelayanan dasar di Indonesia menurut provinsi.
- Mengidentifikasi perbedaan akses pelayanan dasar antarprovinsi di Indonesia.
- Mengelompokkan provinsi berdasarkan kesamaan proporsi rumah tangga dengan akses pelayanan dasar menggunakan metode analisis cluster.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif merupakan salah satu metode statistik yang berfokus pada pengumpulan dan penyajian data untuk menghasilkan informasi yang bermanfaat (Martias, 2021). Menurut Solikhah (2016), statistika deskriptif, yang juga dikenal sebagai statistik deduktif, statistik sederhana, atau statistik deskriptif, mencakup berbagai kegiatan seperti menghimpun, menyusun, mengatur, mengolah, menyajikan, dan menganalisis data numerik. Tujuannya adalah memberikan gambaran yang terstruktur, ringkas, dan jelas mengenai suatu fenomena, peristiwa, atau kondisi sehingga dapat diperoleh pemahaman atau makna tertentu dari data tersebut.
2.2 Analisis Cluster
Analisis cluster merupakan teknik statistik yang digunakan untuk mengelompokkan objek ke dalam kelompok-kelompok berdasarkan tingkat kesamaan, sehingga objek dalam satu kelompok memiliki kemiripan yang lebih tinggi dibandingkan dengan objek di kelompok lain (Silvi, 2018). Dengan kata lain, tujuan analisis cluster adalah untuk mengklasifikasikan objek-objek berdasarkan kemiripan di antara mereka dan mengelompokkan data ke dalam beberapa kategori.
Secara umum, analisis cluster terbagi menjadi dua metode utama: metode hierarki dan metode non-hierarki. Metode hierarki digunakan ketika jumlah cluster belum diketahui sebelumnya, dengan proses yang dilakukan melalui penggabungan bertahap (agglomerative) atau pemisahan bertahap (divisive). Sementara itu, pada metode non-hierarki, jumlah cluster ditentukan terlebih dahulu sesuai kebutuhan peneliti.
Tahapan dalam analisis cluster menurut Hemelia dan Bagus (2019) adalah sebagai berikut:
Proses Standarisasi Data
Langkah awal dalam analisis cluster adalah melakukan standarisasi data menggunakan z-score. Tujuannya adalah untuk memperkecil perbedaan satuan antar variabel dan menyamakan skala pada variabel yang memiliki satuan berbeda.Menentukan Ukuran Kemiripan
Analisis cluster melibatkan pengukuran kemiripan menggunakan ukuran asosiasi, korelasi, atau jarak antar objek. Salah satu metode yang sering digunakan untuk mengukur jarak antar objek adalah Euclidean Distance.Memilih Prosedur Pengelompokan
Proses pengelompokan dapat dilakukan dengan dua metode utama, yaitu metode hierarki dan metode non-hierarki.Menentukan Jumlah Cluster
Menentukan jumlah cluster yang optimal adalah tantangan utama dalam analisis cluster. Penentuan ini dapat didasarkan pada pertimbangan teoretis, konseptual, atau praktis. Selain itu, cluster yang terbentuk sebaiknya memiliki ukuran yang relevan dan bermanfaat.Menginterpretasikan Hasil Cluster
Tahap akhir adalah interpretasi cluster yang telah terbentuk. Interpretasi dilakukan dengan melihat rata-rata pada setiap variabel untuk memahami karakteristik masing-masing cluster.
2.3 Uji Asumsi
2.3.1 Uji Sampel Representatif
Sampel representatif adalah kondisi di mana sampel yang diambil mampu mencerminkan atau menggambarkan karakteristik populasi secara akurat. Untuk memastikan bahwa sampel bersifat representatif, dapat dilakukan uji Kaiser Meyer Olkin (KMO). Menurut Supranto (2004) rumus uji KMO didefinisikan sebagai berikut:
\[ KMO = \frac{\sum_{i=1}^{n}\sum_{j \neq 1} r_{ij}^2}{\sum_{i=1}^{n}\sum_{j \neq 1} r_{ij}^2 + \sum_{i=1}^{n} \sum_{j \neq 1} a_{ij}^2} \]
Keterangan: \(a_{ij}=-\frac{v_{ij}}{\sqrt{v_{ii}v_{jj}}}\)
\(n\) : banyaknya variabel
\(r_{ij}\) : korelasi antar variabel \(x_i\) dan \(x_j\)
\(a_{ij}\) : korelasi parsial antara \(x_i\) dan \(x_j\)
\(v_{ij}\) : invers matriks korelasi antara \(x_i\) dan \(x_j\)
Jika nilai KMO lebih dari 0.5, maka sampel dianggap cukup representatif untuk mewakili populasi.
2.3.2 Uji Non-Multikolinieritas
Masalah multikolinearitas terjadi apabila nilai absolut koefisien korelasi antara variabel independen melebihi 0.8. Sebaliknya, jika nilai koefisien korelasi berada di bawah 0.8, maka model dinyatakan bebas dari multikolinearitas dan memenuhi asumsi non-multikolinearitas (Gujarati,1995).
2.4 Standarisadi Data
Standarisasi variabel diterapkan ketika terdapat perbedaan satuan yang cukup besar di antara variabel-variabel dalam penelitian. Proses ini dilakukan dengan menyesuaikan nilai rata-rata menjadi nol dan menetapkan variansi sebesar 1 (satu). Dengan kata lain, data diubah menjadi Z-Score, yaitu transformasi data ke dalam bentuk distribusi normal standar N(0,1), yang dapat dihitung menggunakan:
\[ Z=\frac{X_i-\bar{x}}{\sigma} \]
Keterangan:
\(X_i\) : data ke-i
\(\bar{x}\) : rata-rata data
\(\sigma\) : simpangan baku
2.5 Jarak Euclidean
Jarak Euclidean adalah ukuran panjang garis lurus yang menghubungkan dua objek. Jarak ini merupakan salah satu jenis jarak yang paling sering digunakan dalam analisis cluster. Jarak Euclidean menghitung jarak antara dua titik dalam ruang Euclidean untuk menganalisis hubungan antara sudut dan jarak. Berikut adalah rumus untuk menghitung jarak Euclidean:
\[ d_{euc}(x,y)=\sqrt{\sum_{i=1}^{n}(x_i-y_i)^2} \]
Keterangan:
\(d_{euc}(x,y)\) : kuadrat jarak euclidean antar objek-\(x\) dan objek-\(y\)
\(x_i\) : nilai dari objek-\(x\) pada amatan ke-\(i\)
\(y_i\) : nilai dari objek-\(y\) pada amatan ke-\(i\)
2.6 Metode Cluster Hierarki
Metode hierarki merupakan salah satu pendekatan clustering yang digunakan ketika informasi awal mengenai karakteristik objek yang akan dikelompokkan masih terbatas, sehingga jumlah cluster belum dapat ditentukan. Pada metode ini, pembentukan cluster dimulai dengan mengelompokkan objek-objek yang memiliki kemiripan paling tinggi terlebih dahulu, kemudian dilanjutkan ke objek lain dengan tingkat kemiripan berikutnya. Proses ini berlanjut hingga terbentuk kelompok-kelompok yang tersusun dalam struktur hierarki, menyerupai pohon berjenjang.
Metode clustering hierarki terbagi menjadi dua teknik utama, yaitu agglomerative (penggabungan) dan divisive (pemecahan) (Johnson & Wichern, 2002). Pada teknik agglomerative, setiap objek awalnya dianggap sebagai cluster terpisah, kemudian objek-objek dengan jarak terdekat digabungkan menjadi satu cluster. Sebaliknya, pada teknik divisive, semua objek awalnya berada dalam satu cluster, lalu objek dengan perbedaan paling mencolok dipisahkan untuk membentuk cluster baru.
Salah satu algoritma hierarki yang sering digunakan adalah agglomerative, yang mencakup beberapa metode seperti single linkage, complete linkage, average linkage, ward, dan centroid (Supranto, 2004).
Hasil clustering menggunakan metode hierarki biasanya divisualisasikan dalam bentuk dendogram. Dendogram adalah representasi grafis yang menggambarkan langkah-langkah analisis clustering, menunjukkan proses pembentukan cluster dan nilai koefisien jarak pada setiap tahap. Garis vertikal pada dendogram menunjukkan jarak Euclidean antara dua objek, sementara garis horizontal menggambarkan objek-objek yang dikelompokkan.
2.7 Koefisien Korelasi Cophenetic
Setelah proses clustering selesai, langkah selanjutnya adalah melakukan uji validitas cluster untuk menilai kualitas hasil analisis cluster. Pada penelitian ini, validitas hasil clustering diuji menggunakan koefisien korelasi Cophenetic. Koefisien ini mengukur korelasi antara elemen-elemen asli dalam matriks ketidakmiripan (matriks jarak Euclidean kuadrat) dan elemen-elemen yang dihasilkan dari dendogram (matriks Cophenetic) (Silva & Dias, 2013).
Menurut Saracli et al. (2013), koefisien korelasi Cophenetic dihitung menggunakan rumus berikut:
\[ r_{coph}=\frac{\sum_{i<j}(d_{ij}-\bar{d})(d_{cij}-\bar{d}_c)}{\sqrt{[\sum_{i<j}(d_{ij}-\bar{d})^2][\sum_{i<j}(d_{cij}-\bar{d}_c)^2}} \]
Keterangan:
\(r_{coph}\) : koefisien korelasi Cophenetic
\(d_{ij}\) : jarak Squared Euclidean antar ojek \(i\) dan \(j\)
\(\bar{d}\) : rata-rata jarak Squared Euclidean antar ojek \(i\) dan \(j\)
2.8 Metode Average Linkage
Metode average linkage mengelompokkan objek dengan mendasarkan pada jarak rata-rata antara semua anggota dalam satu cluster dan semua anggota di cluster lainnya (Johnson & Wichern, 2007). Pada metode ini, jarak rata-rata antara sampel di satu kelompok dengan sampel di kelompok lain digunakan sebagai dasar pengelompokan. Perhitungan jarak antar kelompok dilakukan menggunakan persamaan berikut:
\[ d_{(ij)k}=average(d_{ik},d_{jk}) \]
Keterengan:
\(d_{(ij)k}\) : jarak antar kelompok \((i,j)\) dan \(k\)
\(d_{ik}\) : jarak rata-rata antara kelompok \(i\) dengan \(k\)
\(d_{jk}\) : jarak rata-rata antara kelompok \(j\) dengan \(k\)
2.9 Validasi Cluster
Validasi cluster adalah proses yang bertujuan untuk mengevaluasi hasil analisis cluster secara kuantitatif dan objektif. Hair et al. (2006) menyatakan bahwa validasi digunakan oleh peneliti untuk memastikan bahwa kelompok-kelompok cluster yang terbentuk dapat menjelaskan dan mewakili populasi secara keseluruhan. Validasi cluster juga digunakan untuk menyelesaikan masalah utama dalam analisis cluster, yaitu menentukan jumlah kelompok yang paling optimal. Kelompok yang optimal adalah kelompok dengan jarak antar individu atau objek di dalam cluster yang sangat rapat (terpendek), namun terpisah secara jelas atau memiliki jarak yang jauh dari cluster lainnya (Dubes & Jain, 1988). Dalam analisis ini, validitas cluster dinilai menggunakan indeks Connectivity, Dunn, dan indeks Silhouette.
Indeks Connectivity
\[ Conn(C)=\sum_{i=1}^{N}\sum_{j=1}^{L}X_{i,nni(j)} \]
Keterangan:
\(Conn(C)\) : indeks Connectivity
\(nni(j)\) : pengamatan tetangga terdekat \(i\) ke \(j\) dan \(L\)
\(N\) : banyak pengamatan
\(L\) : banyak cluster
Semakin rendah nilai indeks Connectivity, semakin baik atau optimal pembentukan jumlah cluster yang dihasilkan (Halim & Widodo, 2017).
Indeks Dunn
Indeks Dunn merupakan perbandingan antara jarak minimum antar observasi pada cluster yang berbeda dengan jarak maksimum di dalam masing-masing cluster. Rumus untuk menghitung indeks Dunn dinyatakan sebagai berikut:
\[ C=\frac{d_{min}}{d_{max}} \]
Keterangan :
\(d_{min}\) : jarak terkecil antara observasi pada cluster yang berbeda
\(d_{max}\) : jarak terbesar pada masing-masing cluster
Indeks Silhoutte
Indeks ini digunakan untuk menilai tingkat kepercayaan dalam proses clustering pada suatu pengamatan, di mana cluster dianggap terbentuk dengan baik jika nilai indeks mendekati 1, dan sebaliknya, jika nilai indeks mendekati -1. Rumus untuk menghitung indeks Silhoutte dinyatakan sebagai berikut:
\[ S(i)=\frac{b(i)-a(i)}{max[a(i),b(i)]} \]
Keterangan:
\(S(i)\) : indeks Silhoutte
\(a(i)\) : rata-rata kemiripan antara ojek ke \(i\) dengan objek lain di dalam cluster-nya
\(b(i)\) : nilai minimum dari ata-rata kemiripan antara ojek ke \(i\) dengan objek lain di dalam cluster-nya
2.10 Dendogram
Dendogram adalah representasi visual dari proses pembentukan cluster yang didasarkan pada nilai koefisien jarak di setiap tahap hingga menghasilkan cluster akhir, yaitu satu objek menjadi satu cluster (Dzikrullah, 2022). Secara matematis dan visual, dendogram menggambarkan prosedur clustering yang dilakukan melalui analisis cluster hierarki, dengan bentuk menyerupai diagram pohon. Titik-titik dalam dendogram mewakili cluster, sementara panjang batang menunjukkan jarak di mana objek-objek digabungkan dalam cluster. Struktur dendogram bervariasi tergantung pada metode jarak dan linkage yang digunakan dalam proses clustering. Untuk menentukan jumlah cluster yang terbentuk, dendogram dipotong pada selisih jarak penggabungan terbesar atau pada bagian yang menghasilkan cluster yang lebih bermakna. Pemotongan dilakukan pada selisih jarak penggabungan terbesar untuk mengidentifikasi kelompok-kelompok yang relevan.
2.11 Data
Data pada kasus ini menggunakan data skunder yang diperoleh dari Badan Pusat Statistik (BPS) mengenai Proporsi rumah tangga dengan akses terhadap pelayanan dasar menurut provinsi (Persen), 2022-2023, namun hanya digunakan data pada tahun 2023. Data tersebut berisi Proporsi rumah tangga dengan akses terhadap pelayanan dasar berdasarkan tiga akses, yaitu akses pada layanan air minum, akses pada layanan sanitasi dasar, dan akses pada fasilitas kesehatan dasar. Data tersebut dapat dilihat di bawah ini:
3 SOURCE CODE
3.1 Library
> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)Sebelum memulai analisis, perlu mengaktifkan packages yang diperlukan untuk mendukung proses analisis.
3.2 Impor Data
> data <- read_excel("D:/KULIAH/SEMESTER 5/ANALISIS MULTIVARIAT I/Proporsi rumah tangga dengan akses terhadap pelayanan dasar menurut provinsi.xlsx")
> data.frame(data)
Provinsi Akses.pada.layanan.air.minum
1 ACEH 39.36
2 SUMATERA UTARA 45.33
3 SUMATERA BARAT 40.98
4 RIAU 35.29
5 JAMBI 51.42
6 SUMATERA SELATAN 56.57
7 BENGKULU 48.85
8 LAMPUNG 56.07
9 KEP. BANGKA BELITUNG 23.01
10 KEP. RIAU 18.46
11 DKI JAKARTA 25.45
12 JAWA BARAT 40.74
13 JAWA TENGAH 53.88
14 DI YOGYAKARTA 68.16
15 JAWA TIMUR 53.04
16 BANTEN 37.60
17 BALI 44.62
18 NUSA TENGGARA BARAT 52.61
19 NUSA TENGGARA TIMUR 37.59
20 KALIMANTAN BARAT 56.53
21 KALIMANTAN TENGAH 27.98
22 KALIMANTAN SELATAN 41.28
23 KALIMANTAN TIMUR 16.51
24 KALIMANTAN UTARA 22.62
25 SULAWESI UTARA 37.10
26 SULAWESI TENGAH 36.95
27 SULAWESI SELATAN 45.07
28 SULAWESI TENGGARA 44.58
29 GORONTALO 26.66
30 SULAWESI BARAT 35.49
31 MALUKU 39.85
32 MALUKU UTARA 45.42
33 PAPUA BARAT 30.72
34 PAPUA 25.86
Akses.pada.layanan.sanitasi.dasar Akses.pada.fasilitas.kesehatan.dasar
1 78.85 72.59
2 84.18 73.92
3 70.97 88.77
4 84.58 72.29
5 83.04 73.41
6 80.54 75.24
7 80.28 81.41
8 84.58 79.39
9 93.21 88.17
10 91.10 85.97
11 93.50 76.83
12 74.88 82.03
13 85.20 86.15
14 96.42 84.29
15 83.72 83.37
16 86.41 82.79
17 95.70 90.54
18 85.11 75.48
19 75.67 43.50
20 79.89 77.59
21 76.31 75.67
22 82.89 83.31
23 91.21 78.87
24 84.22 76.24
25 85.91 86.48
26 75.80 78.81
27 93.69 85.52
28 88.99 84.74
29 81.72 82.44
30 80.73 77.18
31 78.17 74.11
32 80.64 83.62
33 76.30 65.38
34 43.00 31.78Mengimpor data dalam format xlsx dilakukan menggunakan fungsi
read_excel, kemudian hasilnya disimpan ke dalam variabel
data.
3.3 Analisis Cluster
3.3.1 Statistika Deskriptif
> statdes <- summary(data)
> statdes
Provinsi Akses pada layanan air minum
Length:34 Min. :16.51
Class :character 1st Qu.:31.86
Mode :character Median :40.30
Mean :40.05
3rd Qu.:47.99
Max. :68.16
Akses pada layanan sanitasi dasar Akses pada fasilitas kesehatan dasar
Min. :43.00 Min. :31.78
1st Qu.:79.11 1st Qu.:75.30
Median :83.38 Median :79.13
Mean :82.57 Mean :77.58
3rd Qu.:86.28 3rd Qu.:84.12
Max. :96.42 Max. :90.54 Menampilkan ringkasan statistik deskriptif dari data menggunakan
fungsi summary(), yang disimpan ke variabel
statdes.
3.4 Uji Asumsi
3.4.1 Uji Sampel Representatif
> kmo <- KMO(data[,2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA = 0.52
MSA for each item =
Akses pada layanan air minum Akses pada layanan sanitasi dasar
0.72 0.51
Akses pada fasilitas kesehatan dasar
0.51 Mengukur kecocokan sampel untuk merepresentifkan populasi dengan
fungsi KMO(). Nilai KMO menunjukkan seberapa baik sampel
merepresentatifkan populasi. Dengan argumen data[,2:4]
fungsi hanya akan menggunakan kolom ke-2 sampai ke-4 dari data untuk
perhitungan KMO.
3.4.2 Uji Non-Multikolinieritas
> korelasi <- cor(data[,2:4], method = 'pearson')
> korelasi
Akses pada layanan air minum
Akses pada layanan air minum 1.0000000
Akses pada layanan sanitasi dasar 0.1333828
Akses pada fasilitas kesehatan dasar 0.1977359
Akses pada layanan sanitasi dasar
Akses pada layanan air minum 0.1333828
Akses pada layanan sanitasi dasar 1.0000000
Akses pada fasilitas kesehatan dasar 0.7189668
Akses pada fasilitas kesehatan dasar
Akses pada layanan air minum 0.1977359
Akses pada layanan sanitasi dasar 0.7189668
Akses pada fasilitas kesehatan dasar 1.0000000Melakukan uji asumsi non-multikolinearitas dengan perhitungan
korelasi antar variabel menggunakan fungsi cor(), dengan
metode pearson yang disimpan ke variabel
korelasi.
3.5 Standarisasi
> datastand <- scale(data[,2:4])
> datastand
Akses pada layanan air minum Akses pada layanan sanitasi dasar
[1,] -0.05617695 -0.39337684
[2,] 0.43091394 0.17011815
[3,] 0.07599846 -1.22646137
[4,] -0.38824729 0.21240670
[5,] 0.92779559 0.04959577
[6,] 1.34798287 -0.21470770
[7,] 0.71810990 -0.24219526
[8,] 1.30718799 0.21240670
[9,] -1.39016958 1.12478227
[10,] -1.76140300 0.90171014
[11,] -1.19109056 1.15544147
[12,] 0.05641692 -0.81309075
[13,] 1.12850641 0.27795396
[14,] 2.29360823 1.46414792
[15,] 1.05997101 0.12148631
[16,] -0.19977494 0.40587684
[17,] 0.37298520 1.38802852
[18,] 1.02488741 0.26843904
[19,] -0.20059083 -0.72957085
[20,] 1.34471928 -0.28342660
[21,] -0.98466846 -0.66190916
[22,] 0.10047539 0.03373756
[23,] -1.92050304 0.91333950
[24,] -1.42198959 0.17434700
[25,] -0.24056982 0.35301615
[26,] -0.25280828 -0.71582707
[27,] 0.40970060 1.17552853
[28,] 0.36972161 0.67863802
[29,] -1.09236695 -0.08995646
[30,] -0.37192934 -0.19462063
[31,] -0.01619797 -0.46526738
[32,] 0.43825701 -0.20413556
[33,] -0.76111251 -0.66296638
[34,] -1.15763876 -4.18348854
Akses pada fasilitas kesehatan dasar
[1,] -0.4276298379
[2,] -0.3137597327
[3,] 0.9576470814
[4,] -0.4533148241
[5,] -0.3574242091
[6,] -0.2007457937
[7,] 0.3275087547
[8,] 0.1545631813
[9,] 0.9062771091
[10,] 0.7179205441
[11,] -0.0646153671
[12,] 0.3805910594
[13,] 0.7333315358
[14,] 0.5740846217
[15,] 0.4953173308
[16,] 0.4456596910
[17,] 1.1091884997
[18,] -0.1801978047
[19,] -2.9182173277
[20,] 0.0004532645
[21,] -0.1639306469
[22,] 0.4901803336
[23,] 0.1100425387
[24,] -0.1151291732
[25,] 0.7615850205
[26,] 0.1049055414
[27,] 0.6793930649
[28,] 0.6126121009
[29,] 0.4156938738
[30,] -0.0346495499
[31,] -0.2974925748
[32,] 0.5167214859
[33,] -1.0449256716
[34,] -3.9216441197
attr(,"scaled:center")
Akses pada layanan air minum Akses pada layanan sanitasi dasar
40.04853 82.57088
Akses pada fasilitas kesehatan dasar
77.58471
attr(,"scaled:scale")
Akses pada layanan air minum Akses pada layanan sanitasi dasar
12.256440 9.458824
Akses pada fasilitas kesehatan dasar
11.679975 Melakukan standarisasi data ke bentuk Zscore pada kolom ke-2 sampai
ke-4, yang kemudian disimpan ke variabel datastand .
3.6 Menghitung Jarak Euclidien
> jarak <- dist(datastand, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 0.7534922
3 1.6218793 1.9216854
4 0.6913061 0.8320391 2.0680133
5 1.0813674 0.5131507 2.0207159 1.3295380
6 1.4335494 1.0009388 1.9958617 1.8057444 0.5205399
7 1.0920670 0.8146835 1.3334771 1.4284168 0.7734619 0.8225256
8 1.6014638 0.9944702 2.0569669 1.8011153 0.6577059 0.5570776 0.7639281
9 2.4214977 2.3908615 2.7713957 1.9195749 2.8506016 3.2430251 2.5784574
10 2.4284423 2.5309770 2.8218127 1.9319648 3.0189823 3.4290840 2.7584280
11 1.9541358 1.9141143 2.8851337 1.2980598 2.4079681 2.8883792 2.3983736
12 0.9176373 1.2605835 0.7101073 1.3945502 1.4311518 1.5375817 0.8755438
13 1.7894108 1.2628000 1.8496908 1.9269063 1.1323340 1.0786037 0.7769637
14 3.1583731 2.4356541 3.5077474 3.1328509 2.1758012 2.0768066 2.3355089
15 1.5371083 1.0260037 1.7317372 1.7336394 0.8659138 0.8249128 0.5265862
16 1.1925022 1.0149229 1.7328330 0.9386734 1.4294388 1.7884405 1.1298096
17 2.3915258 1.8738845 2.6356637 2.0983275 2.0615940 2.2880804 1.8405879
18 1.2914809 0.6166930 2.1047110 1.4403757 0.2978731 0.5815872 0.7827041
19 2.5173216 2.8269131 3.9173622 2.6454264 2.9048267 3.1698290 3.4082670
20 1.4689637 1.0674609 1.8480225 1.8587440 0.6424995 0.2126358 0.7080287
21 1.0018699 1.6488152 1.6436758 1.0972191 2.0496824 2.3754172 1.8212981
22 1.0243740 0.8798346 1.3443309 1.0774765 1.1845436 1.4475424 0.6957538
23 2.3392971 2.5022286 3.0468343 1.7766502 3.0128696 3.4716106 2.8887420
24 1.5117576 1.8635245 2.3145369 1.0883204 2.3655359 2.7984712 2.2247386
25 1.4160986 1.2809014 1.6227769 1.2318934 1.6460022 1.9421356 1.2090350
26 0.6528644 1.1948454 1.0469142 1.0915913 1.4810288 1.7050149 1.1029784
27 1.9758557 1.4133834 2.4409707 1.6874097 1.6159013 1.8941422 1.4929433
28 1.5532896 1.0585375 1.9582457 1.3885563 1.2837878 1.5545458 1.0249840
29 1.3700177 1.7088376 1.7176829 1.1586130 2.1675431 2.5200929 1.8190051
30 0.5418829 0.9249293 1.4999957 0.5841388 1.3612898 1.7280305 1.1496119
31 0.1539554 0.7771026 1.4708134 0.7886339 1.0769400 1.3903703 0.9897454
32 1.0826249 0.9109439 1.1708103 1.3407413 1.0335174 1.1586510 0.3399524
33 0.9750214 1.6277471 2.2424493 1.1204061 1.9577573 2.3155688 2.0612432
34 5.2712713 5.8731781 5.8372385 5.6520055 5.9136877 5.9895280 6.0915947
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 2.9450367
10 3.1951153 0.4722855
11 2.6793189 0.9915668 1.0009987
12 1.6331448 2.4747344 2.5216666 2.3726784
13 0.6092589 2.6628476 2.9564989 2.6052320 1.5697708
14 1.6479925 3.7142617 4.0963571 3.5561725 3.1981683 1.6702928
15 0.4306926 2.6793058 2.9357201 2.5396587 1.3761240 0.2929676 1.8250494
16 1.5469664 1.4649344 1.6609211 1.3434785 1.2472971 1.3650827 2.7117135
17 1.7793625 1.7942091 2.2237826 1.9693261 2.3400846 1.3943982 1.9952251
18 0.4414727 2.7832089 2.9951733 2.3897052 1.5563181 0.9194364 1.8995563
19 3.5500280 4.4136698 4.2800363 3.5605344 3.3098588 4.0144009 4.8197099
20 0.5205854 3.2067407 3.4010740 2.9163173 1.4438739 0.9481596 2.0696521
21 2.4735546 2.1218016 1.9559866 1.8317306 1.1845753 2.4807116 3.9764159
22 1.2651944 1.8935516 2.0668414 1.7983772 0.8550258 1.0842564 2.6197224
23 3.3032224 0.9797710 0.6284614 0.7881379 2.6385546 3.1762655 4.2752145
24 2.7427345 1.3955682 1.1568191 1.0091642 1.8456591 2.6899163 3.9930276
25 1.6684726 1.3921704 1.6173760 1.4933128 1.2622055 1.3714235 2.7734146
26 1.8159494 2.3072993 2.2952281 2.1001802 0.4255384 1.8139874 3.3847684
27 1.4172275 1.8148235 2.1886415 1.7653567 2.0417391 1.1511869 1.9087952
28 1.1428139 1.8391576 2.1453539 1.7669503 1.5418328 0.8665306 2.0784249
29 2.4325864 1.3434837 1.2338366 1.3384541 1.3578880 2.2734402 3.7289618
30 1.7380759 1.9138914 1.9232629 1.5794273 0.8593082 1.7505511 3.1979933
31 1.5540100 2.4218004 2.4383257 2.0152671 0.7655400 1.7103580 3.1332882
32 1.0294208 2.2936695 2.4701984 2.2002672 0.7315461 0.8693529 2.4957541
33 2.5461576 2.7201012 2.5605508 2.1100940 1.6501484 2.7601068 4.0592029
34 6.4818772 7.1791805 6.9100895 6.5864986 5.5984587 6.8410326 8.0011549
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 1.2924023
17 1.5661789 1.3164143
18 0.6922042 1.3821666 1.8278332
19 3.7370487 3.5503395 4.5861982 3.1614192
20 0.6999475 1.7489455 2.2287492 0.6629351 3.3325165
21 2.2866716 1.4587067 2.7688085 2.2145264 2.8645158 2.3656539
22 0.9635134 0.4802291 1.5137823 1.1657741 3.5057746 1.3742520 1.4454490
23 3.1078439 1.8251198 2.5463132 3.0291023 3.8506636 3.4793585 1.8526349
24 2.5564756 1.3645142 2.4887569 2.4495498 3.1884456 2.8067052 0.9449633
25 1.3475574 0.3229045 1.2524091 1.5797121 3.8359534 1.8701664 1.5621573
26 1.6052740 1.1735185 2.4137958 1.6378553 3.0236050 1.6583048 0.7815365
27 1.2520944 1.0091855 0.4808621 1.3928972 4.1163892 1.8611204 2.4559392
28 0.8947739 0.6531448 0.8659294 1.1072728 3.8438347 1.5003090 2.0577798
29 2.1641642 1.0215034 2.1937710 2.2285197 3.5098910 2.4797671 0.8213972
30 1.5592072 0.7879920 2.0899860 1.4787514 2.9377699 1.7193025 0.7813587
31 1.4597832 1.1596845 2.3590085 1.2790395 2.6404650 1.4049675 0.9972171
32 0.7021510 0.8855787 1.7000777 1.0262351 3.5331308 1.0461806 1.6424253
33 2.5107887 1.9181685 3.1832319 2.1920461 1.9564872 2.3814691 0.9089173
34 6.5543993 6.4072709 7.6611937 6.2114008 3.7218750 6.0708423 5.1528488
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 2.2366399
24 1.6444057 0.9194171
25 0.5402880 1.8869673 1.4819930
26 0.9138343 2.3313978 1.4858701 1.2545133
27 1.1979601 2.4130379 2.2335440 1.0517289 2.0847494
28 0.7094925 2.3564359 1.9985359 0.7075862 1.6092987 0.5029495
29 1.2015495 1.3363513 0.6784398 1.0205017 1.0923196 1.9817155 1.6634955
30 0.7421321 1.9096052 1.1159035 0.9752696 0.5525591 1.7315054 1.3158930
31 0.9397059 2.3860049 1.5551891 1.3570468 0.5298008 1.9565036 1.5118677
32 0.4139861 2.6415691 2.0007503 0.9116919 0.9534106 1.3895145 0.8906073
33 1.8932196 2.2721968 1.4150526 2.1369759 1.2582843 2.7792341 2.4137356
34 6.2315361 6.5432496 5.7922507 6.5843394 5.3904078 7.2349955 6.8214796
29 30 31 32 33
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 0.8560340
31 1.3444824 0.5185373
32 1.5381980 0.9800523 0.9683304
33 1.6035833 1.1796055 1.0736102 2.0218197
34 5.9643748 5.6246896 5.3162515 6.1709985 4.5636409Menghitung matriks jarak antar baris data dalam
datastand menggunakan metode Euclidean distance.
Hasilnya disimpan dalam variabel jarak, yang
mempresentasikan jarak antar-pasangan data.
3.7 Koefisien Korelasi Cophenetic
> #Single Linkage
> hiers <- hclust(dist(data[,2:4]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
Error in hclust(d1, "single"): object 'd1' not found
> d2 <- cophenetic(hc1)
Error in cophenetic(hc1): object 'hc1' not found
> cors <- cor(d1,d2)
Error in is.data.frame(y): object 'd2' not found
> cors
Error in eval(expr, envir, enclos): object 'cors' not found
> #Average Linkage
> hierave <- hclust(dist(data[,2:4]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
Error in hclust(d1, "ave"): object 'd1' not found
> d3 <- cophenetic(hc2)
Error in cophenetic(hc2): object 'hc2' not found
> corave <- cor(d1,d3)
Error in is.data.frame(y): object 'd3' not found
> corave
Error in eval(expr, envir, enclos): object 'corave' not found
> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:4]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
Error in hclust(d1, "complete"): object 'd1' not found
> d4 <- cophenetic(hc3)
Error in cophenetic(hc3): object 'hc3' not found
> corcomp <- cor(d1,d4)
Error in is.data.frame(y): object 'd4' not found
> corcomp
Error in eval(expr, envir, enclos): object 'corcomp' not found
> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:4]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
Error in hclust(d1, "centroid"): object 'd1' not found
> d5 <- cophenetic(hc4)
Error in cophenetic(hc4): object 'hc4' not found
> corcen <- cor(d1,d5)
Error in is.data.frame(y): object 'd5' not found
> corcen
Error in eval(expr, envir, enclos): object 'corcen' not found
> #Ward
> hierward <- hclust(dist(data[,2:4]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
Error in hclust(d1, "ward.D"): object 'd1' not found
> d6 <- cophenetic(hc5)
Error in cophenetic(hc5): object 'hc5' not found
> corward <- cor(d1,d6)
Error in is.data.frame(y): object 'd6' not found
> corward
Error in eval(expr, envir, enclos): object 'corward' not found
>
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
Error in data.frame(cors, corave, corcomp, corcen, corward): object 'cors' not found
> KorCop
Error in eval(expr, envir, enclos): object 'KorCop' not foundMelakukan klasterisasi hierarki dengan berbagai metode (single
linkage, average linkage, complete linkage,
centroid linkage, dan Ward’s method), menghitung
korelasi Cophenetic untuk mengevaluasi kesesuaian struktur
klaster dengan data asli, lalu menyimpan hasil korelasi dari semua
metode dalam data frame KorCop.
3.8 Indeks Validitas
> inval <- clValid(datastand, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4
Validation Measures:
2 3 4
hierarchical Connectivity 2.9290 5.8579 8.7869
Dunn 0.7722 0.4576 0.4736
Silhouette 0.6774 0.4707 0.3255
Optimal Scores:
Score Method Clusters
Connectivity 2.9290 hierarchical 2
Dunn 0.7722 hierarchical 2
Silhouette 0.6774 hierarchical 2
> optimalScores(inval)
Score Method Clusters
Connectivity 2.9289683 hierarchical 2
Dunn 0.7722197 hierarchical 2
Silhouette 0.6774061 hierarchical 2
> plot(inval)Mengevaluasi performa klasterisasi hierarki dengan average linkage, menggunakan metrik internal untuk menentukan kualitas klaster terbaik (2 atau 3 klaster), lalu menampilkan ringkasan, skor optimal, dan grafik hasil evaluasi.
3.9 Metode Average Linkage
> hirave <- hclust(dist(scale(data[,2:4])), method = "average")
> hirave
Call:
hclust(d = dist(scale(data[, 2:4])), method = "average")
Cluster method : average
Distance : euclidean
Number of objects: 34
> plot(hirave, labels(data$Provinsi), hang = 1, col = "purple", main = "Cluster Dendogram", sub = " ", xlab = "PROVINSI", ylab = "Jarak")> anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = 2))
> anggotaave
id cutree.hirave..k...2.
1 ACEH 1
2 SUMATERA UTARA 1
3 SUMATERA BARAT 1
4 RIAU 1
5 JAMBI 1
6 SUMATERA SELATAN 1
7 BENGKULU 1
8 LAMPUNG 1
9 KEP. BANGKA BELITUNG 1
10 KEP. RIAU 1
11 DKI JAKARTA 1
12 JAWA BARAT 1
13 JAWA TENGAH 1
14 DI YOGYAKARTA 1
15 JAWA TIMUR 1
16 BANTEN 1
17 BALI 1
18 NUSA TENGGARA BARAT 1
19 NUSA TENGGARA TIMUR 1
20 KALIMANTAN BARAT 1
21 KALIMANTAN TENGAH 1
22 KALIMANTAN SELATAN 1
23 KALIMANTAN TIMUR 1
24 KALIMANTAN UTARA 1
25 SULAWESI UTARA 1
26 SULAWESI TENGAH 1
27 SULAWESI SELATAN 1
28 SULAWESI TENGGARA 1
29 GORONTALO 1
30 SULAWESI BARAT 1
31 MALUKU 1
32 MALUKU UTARA 1
33 PAPUA BARAT 1
34 PAPUA 2
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)> idclus = clus_hier$cluster
> idclus
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
> aggregate(data,list(idclus),mean)
Group.1 Provinsi Akses pada layanan air minum
1 1 NA 40.47848
2 2 NA 25.86000
Akses pada layanan sanitasi dasar Akses pada fasilitas kesehatan dasar
1 83.77 78.97273
2 43.00 31.78000Melakukan klasterisasi hierarki menggunakan metode average
linkage pada data yang distandardisasi (kolom 2-4) dan
divisualisasikan dalam bentuk dendogram dengan label provinsi. Dendogram
dipotong menjadi 2 klaster menggunakan cutree, dan hasil
anggota klaster disimpan dalam anggotaave. Dengan fungsi
eclust, klasterisasi ulang dilakukan untuk mempermudah
analisis dan divisualisasikan menggunakan fviz_dend, yang
menampilkan batas klaster. Hasil klaster disimpan dalam
idclus, lalu aggregate digunakan untuk
menghitung rata-rata nilai variabel tiap klaster, memberikan gambaran
karakteristik masing-masing klaster.
4 HASIL DAN PEMBAHASAN
4.1 Statistika Deskriptif
Dari Data yang digunakan, didapatkan hasil analisis statistik deskriptif sebagai berikut:
| Akses pada layanan air minum | Akses pada layanan sanitasi dasar | Akses pada fasilitas kesehatan dasar | |
|---|---|---|---|
| Min | 16.51 | 43 | 31.78 |
| Mean | 40.05 | 82.57 | 77.58 |
| Max | 68.16 | 96.42 | 90.54 |
Pada layanan air minum, akses terendah tercatat sebesar 16,51%, dengan rata-rata 40,05%, dan akses tertinggi mencapai 68,16%. Layanan sanitasi dasar memiliki cakupan lebih baik, dengan akses minimum 43%, rata-rata 82,57%, dan maksimum 96,42%. Sementara itu, fasilitas kesehatan dasar mencatat akses minimum 31,78%, rata-rata 77,58%, dan maksimum 90,54%. Secara keseluruhan, layanan sanitasi dasar memiliki cakupan yang relatif lebih tinggi dibandingkan layanan lainnya, sedangkan layanan air minum memiliki cakupan terendah. Terdapat disparitas signifikan antara wilayah dengan akses terendah dan tertinggi, terutama pada layanan air minum dengan selisih sebesar 51,65%.
4.2 Uji Asumsi
4.2.1 Uji Sampel Representatif
Menggunakan Kaiser Mayer Olkin (KMO) menguji seberapa baik variabel cocok untuk dianalisis dengan analisis faktor. Berikut hasil uji KMO:
Overall MSA = 0.52
| Akses pada layanan air minum | Akses pada layanan sanitasi dasar | Akses pada fasilitas kesehatan dasar | |
|---|---|---|---|
| Nilai KMO | 0.72 | 0.51 | 0.51 |
Dari hasil uji KMO, nilai KMO pada persentase Akses pada layanan air minum sebesar 0.72, nilai KMO pada persentase Akses pada layanan sanitasi dasar dan Akses pada fasilitas kesehatandasar sebesar 0.51. Nilai KMO pada tiap variabel lebih dari 0.5, sehingga menunjukkan bahwa sampel dapat merepresentatifkan populasi.
4.2.2 Uji Non-Multikolinieritas
Uji asumsi Non-Multikolinieritas dengan melihat nilai korelasi antar variabel. Jika nilai korelasi kurang dari 0.8 maka dapat dikatakan bahwa tidak terjadi multikolinieritas tiap variabelnya. Berikut merupakan hasil korelasi antar variabel:
| Akses pada layanan air minum | Akses pada layanan sanitasi dasar | Akses pada fasilitas kesehatan dasar | |
|---|---|---|---|
| Akses pada layanan air minum | 1.0000000 | 0.1333828 | 0.1977359 |
| Akses pada layanan sanitasi dasar | 1.0000000 | 0.7189668 | |
| Akses pada fasilitas kesehatandasar | 1.0000000 |
Dari hasil nilai korelasi di atas tiap variabel nilai korelasinya kurang dari 0.8, sehingga antar variabel dapat dikatan tidak terjadi multikolinieritas.
4.3 Standarisasi
Setelah uji asumsi dilakukan dan hasilnya memenuhi persyaratan, langkah selanjutnya adalah menstandarisasi variabel ke dalam bentuk Z-score. Hasil dari standarisasi ini kemudian digunakan untuk mengelompokkan provinsi-provinsi di Indonesia berdasarkan proporsi rumah tangga dengan akses pelayanan dasar di Indonesia.
4.4 Koefisien Korelasi Cophenetic
Koefisien korelasi Cophenetic dijadikan acuan untuk memilih metode terbaik dalam analisis cluster. Metode yang memiliki nilai korelasi paling mendekati 1 akan dipilih sebagai metode yang paling sesuai untuk data ini. Berikut hasil koefisien korelasi Cophenetic:
| Metode | Single Linkage | Average Linkage | CompleteLinkage | Centroid Linkage | Ward’s Methode |
|---|---|---|---|---|---|
| Nilai Korelasi | 0.7527467 | 0.8460337 | 0.5398191 | 0.8298467 | 0.6264126 |
Dari hasil di atas, nilai korelasi Cophenetic yang paling mendekati 1 adalah metode average linkage dan dipilih menjadi metode terbaik. Sehingga akan melakukan analisis cluster dengan menggunakan metode average linkage.
4.5 Analisis Cluster Metode Average Linkage
Dengan metode average linkage merupakan teknik analisis yang menggunakan rata-rata jarak antara seluruh objek dalam satu klaster dengan seluruh objek di klaster lainnya. Jarak yang digunakan dalam analisis ini adalah jarak Euclidean, sebagaimana diperhitungkan pada subbab Jarak Euclidean.
Pada analisis ini, ditetapkan aturan penghentian (stopping rule) sebanyak 2 hingga 4 klaster. Stopping rule merupakan jumlah klaster awal yang dipertimbangkan sebelum menentukan klaster optimal yang sebenarnya. Penentuan jumlah klaster optimal dilakukan dengan menggunakan tiga indeks validitas klaster, yaitu Connectivity Index, Dunn Index, dan Silhouette Index. Hasil penentuan jumlah klaster optimal menggunakan metode average linkage berdasarkan indeks validitas klaster ditampilkan pada tabel berikut:
| Score | Cluster | |
|---|---|---|
| Connectivity | 2.9290 | 2 |
| Dunn | 0.7722 | 2 |
| Silhouette | 0.6774 | 2 |
Berdasarkan hasil di atas, dapat dilihat bahwa jumlah klaster optimal menurut Connectivity Index, Dunn Index, dan Silhouette Index adalah 2 klaster. Oleh karena itu, berdasarkan ketiga indeks validitas klaster, yaitu Connectivity Index, Dunn Index, dan Silhouette Index, ditetapkan bahwa jumlah klaster optimal pada metode Average Linkage adalah 2 klaster, berdasarkan proporsi rumah tangga dengan akses pelayanan dasar di Indonesia.
Hasil analisis klaster divisualisasikan dalam bentuk dendogram, seperti yang ditampilkan pada subbab 3.9. Dendogram tersebut menunjukkan bahwa pengelompokan provinsi di Indonesia berdasarkan faktor-faktor penyebab kekerasan seksual membentuk 2 klaster. Garis horizontal pada dendogram mewakili provinsi yang dikelompokkan, sedangkan garis vertikal menunjukkan jarak Euclidean antar provinsi.
Klaster pertama, yang ditandai dengan warna biru, mencakup 33 provinsi, yaitu Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, DKI Jakarta, Jawa Barat, Jawa Tengah, DI Yogyakarta, Jawa Timur, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat. Klaster kedua, yang ditandai dengan warna merah, terdiri dari satu provinsi, yaitu Papua. Rincian pengelompokan ini dapat dilihat pada tabel anggota klaster di subbab 3.9.
Setelah jumlah klaster dan anggota yang terbentuk ditentukan, langkah berikutnya adalah mendeskripsikan ciri khas dari masing-masing klaster untuk menggambarkan karakteristiknya. Setiap klaster memiliki sifat yang berbeda berdasarkan proporsi rumah tangga dengan akses pelayanan dasar di Indonesia. Karakteristik akses-akses tersebut dapat dianalisis melalui nilai rata-rata dari masing-masing variabel. Tinggi atau rendahnya nilai rata-rata variabel dalam setiap klaster yang dihasilkan menggunakan metode Average Linkage disajikan dalam tabel berikut:
| Variabe | Cluster | Nilai Rata-rata |
|---|---|---|
| Akses pada layanan air minum | Cluster 1 | 40.47848 |
| Cluster 2 | 25.86000 | |
| Akses pada layanan sanitasi dasar | Cluster 1 | 83.77 |
| Cluster 2 | 43.00 | |
| Akses pada fasilitas kesehatan dasar | Cluster 1 | 78.97273 |
| Cluster 2 | 31.78000 |
Dari hasil tersebut, pada akses layanan air minum klaster 1 memiliki rata-rata sebesar 40.47, yang menunjukkan bahwa akses terhadap layanan air minum relatif lebih tinggi dibandingkan dengan klaster 2, yang memiliki rata-rata 25.86. Artinya, provinsi dalam klaster 1 umumnya memiliki akses yang lebih baik terhadap layanan air minum dibandingkan dengan klaster 2.
Pada akses layanan sanitasi dasar nilai rata-rata akses sanitasi dasar pada klaster 1 adalah 83.77, lebih tinggi daripada klaster 2, yang memiliki rata-rata 43.00. Perbedaan ini cukup besar, sehingga akses terhadap layanan sanitasi dasar di kedua klaster menunjukkan perbedaan yang signifikan.
Pada akses fasilitas kesehatan dasar klaster 1 memiliki rata-rata akses sebesar 78.97, lebih tinggi dibandingkan dengan klaster 2, yang rata-ratanya adalah 31.78. Hal ini menunjukkan bahwa provinsi dalam klaster 1 memiliki akses yang lebih baik terhadap fasilitas kesehatan dasar dibandingkan dengan klaster 2.
5 Kesimpulan
Dari hasil analisis klaster di atas, dapat disimpulkan bahwa pengelompokan pada Proporsi Rumah Tangga dengan Akses Pelayanan Dasar di Indonesia Menurut Provinsi dengan menggunakan metode Average Linkage akan dikelompokkan menjadi 2 klaster. Dimana klaster pertama berisikan 33 provinsi dan klaster kedua berisikan 1 provinsi.
Yang kemudian dianalisis ciri khas dari masing-masing klaster untuk menggambarkan karakteristiknya, dengan menggunakan nilai rata-rata variabel dalam setiap klaster yang dihasilkan menggunakan metode Average Linkage dapat disimpulkan bahwa secara keseluruhan, Klaster 1 cenderung memiliki akses yang lebih baik terhadap layanan dasar seperti air minum, sanitasi, dan fasilitas kesehatan, dibandingkan dengan Klaster 2 yang memiliki rata-rata lebih rendah pada semua variabel tersebut.
Hasil ini dapat digunakan untuk memahami perbedaan akses antar kelompok atau wilayah yang tergabung dalam dua klaster tersebut, dan mungkin untuk menentukan kebijakan atau tindakan peningkatan akses di wilayah yang masuk dalam Klaster 2.
6 DAFTAR PUSTAKA
Supranto & Johanes. (2004). Analisis Multivariat Arti &
Interpretasi. Jakarta: PT. Rineka Cipta.
Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.
Martias, L. D.(2021).Statistika Deskriptif Sebagai Kumpulan Informasi. FIHRIS: Jurnal Ilmu Perpustakaan dan Informasi, 16(1), 40-59.
Sholikhah, A., (2016). Statistik deskriptif dalam penelitian kualitatif. KOMUNIKA: Jurnal Dakwah Dan Komunikasi, 10(2), 342-362.
Silvi, R. (2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K-Means Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. Jurnal Matematika “MANTIK”, 4(1), 22-31.
Hemelia, & Sumargo, B. (2019). Pengklasifikasian Pengguna Internet Lingkungan Pedesaan Menurut Jenjang Pendidikan di Indonesia Menggunakan Metode Cluster Average Linkage. Jurnal Statistika dan Aplikasinya (JSA), 3(1), 22-29.
Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.
Badan Pusat Statistik (BPS). Proporsi rumah tangga dengan akses terhadap pelayanan dasar menurut provinsi (Persen), 2022-2023. Diakses pada 23 November 2024 di https://www.bps.go.id/id/statistics-table/2/MjAxNiMy/proporsi-rumah-tangga-dengan-akses-terhadap-pelayanan-dasar-menurut-provinsi--persen-.html
Johnson, N. & Wichern, D. (2002). Applied Multivariate Statistical Analysis. Prentice-Hall.
Englewood Cliffs, N. J. Silva, A. R. & Dias C. T. (2013). A Chopenetic Correlation Coefficient for Tocher’s Method. Pesq Agropee. Brasilia.
Hair, J. F., dkk. (2006). Multivariate Data Analysis Sixth Edition. New Jersey: Pearson Education Inc.
Dzikrullah, A. A. (2022). Pengelompokan Provinsi Berdasarkan Kualitas Jaringan Internet Dengan Metode Centroid Linkage. Journal of Mathematics, Computations, and Statistics, 5(1), 48-57.