1 PENDAHULUAN

1.1 Latar Belakang

Tingkat literasi masyarakat merupakan indikator penting dalam menilai kualitas sumber daya manusia suatu daerah. Literasi tidak hanya mencakup kemampuan membaca dan menulis, tetapi juga melibatkan kemampuan berpikir kritis, memahami informasi, serta menerapkannya dalam kehidupan sehari-hari. Di Indonesia, disparitas tingkat literasi di antara provinsi-provinsi masih menjadi tantangan besar. Faktor-faktor yang memengaruhi tingkat literasi, seperti akses pendidikan, infrastruktur perpustakaan, dan kesadaran masyarakat akan pentingnya literasi, sangat bervariasi antar daerah. Oleh karena itu, analisis yang lebih mendalam diperlukan untuk memahami pola pengelompokan provinsi berdasarkan tingkat literasi dan faktor-faktor penyusunnya. Dengan menggunakan metode analisis cluster, penelitian ini bertujuan untuk mengidentifikasi kelompok provinsi dengan karakteristik literasi yang serupa. Hasil dari pengelompokan ini diharapkan dapat menjadi dasar untuk merancang kebijakan pendidikan yang lebih efektif dan berbasis data.

1.2 Tujuan

Penelitian ini bertujuan untuk mengelompokkan provinsi-provinsi di Indonesia berdasarkan tingkat literasi masyarakat dan fasilitas perpustakaan menggunakan metode analisis cluster. Selain itu, untuk mengevaluasi tingkat literasi dan penyediaan fasilitas perpustakaan di tiap provinsi, serta bagaimana variabel-variabel ini saling berhubungan untuk mengidentifikasi provinsi yang membutuhkan perhatian lebih dalam hal peningkatan literasi dan kualitas fasilitas pendidikan.

1.3 Manfaat

Penelitian ini dapat memberikan gambaran yang lebih jelas mengenai ketimpangan tingkat literasi antara provinsi-provinsi di Indonesia, serta mengidentifikasi daerah-daerah yang memerlukan perhatian lebih dalam hal pengembangan literasi.

1.4 Tinjauan Pustaka

1.4.1 Analisis Cluster

Analisis cluster adalah metode statistika yang bertujuan untuk mengelompokkan data ke dalam beberapa kelompok (cluster) berdasarkan kemiripan karakteristik. Objek-objek yang memiliki karakteristik yang mirip akan ditempatkan kedalam satu kelompok yang sama, sedangkan objek-objek yang berbeda akan ditempatkan dikelompok yang berbeda. Teknik ini membantu dalam menemukan pola atau struktur tersembunyi di dalam data yang kompleks. Analisis cluster yang baik memiliki homogenitas (kesamaan) dalam satu cluster dan heterogenitas (perbedaan) antar cluster. Cara menentukan cluster yang baik dengan ukuran jarak :

  • Sifat variabel (diskrit, kontinu, biner)
  • Skala pengukuran (nominal, ordinal, Interval, rasio)
  • Karakteristik masalah yang diteliti

1.4.2 Standarisasi Variabel

Standarisasi variabel dilakukan apabila terdapat perbedaan satuan yang signifikan diantara variabel-variabel yang diteliti. Proses standarisasi dilakukan dengan mengenolkan rata-rata dan varian menjadi 1 (satu) atau dengan kata lain mengubah data ZScore yaitu transformasi data dalam bentuk normal baku N(0,1), yang dapat dicari dengan: \[ Z= \frac{{X_i}-\bar{x}}{\sigma} \]

1.4.3 Jarak Euclidean

Jarak euclidean adalah jarak Lurus antara dua titik dalam ruang dimensi. Jarak ini dihitung menggunakan rumus Pythagoras dan sering dianggap sebagai jarak terpendek antara dua titik. Sederhananya, ini seperti mengukur jarak dalam garis lurus dari satu titik ke titik lain.

Jarak yang paling sering digunakan adalah jarak euclidean karena jarak ini mudah dipahami dan menggunakan prinsip pythaforas. Jarak euclidean adalah perhitungan jarak dua objek dalam euclidean space untuk mempelajari hubungan antara sudut dan jarak dengan syarat :

  • Variabel-variabel tidak berkorelasi satu sama lain
  • Skala data interval atau rasio
  • Variabel kontinu \[ d = \sqrt{(x_{2}-x_{1})^2 + (y_{2}-y_{1})^2} \]

1.4.4 Jarak Mahalanobis

Jarak Mahalanobis mengukur jarak antara dua titik dengan mempertimbangkan kerolasi antar variabel. Ini berguna saat data memiliki variabilitas atau skala yang berbeda, karena memperhitungkan distribusi dan hubungan antar variabel, sehingga jarak ini lebih akurat pada data multidimensi. Jarak Mahalanobis juga bersifat unitless dan scale invariant. Jarak mahalanobis dapat digunakan ketika terdapat korelasi, karena memperhitungkan adanya korelasi dalam data.

\[ d = \sqrt{(x-y')S^{-1}(x-y)} \]

1.4.5 Jarak Manhattan

Jarak Manhattan, juga dikenal sebagai jarak blok kota, menghitung jarak antara dua titik dengan menjumlahkan perbedaan absolut setiap dimensi. Ini seperti menghitung jarak dengan cara bergerak secara vertikal dan horizontal, mirip dengan berjalan mengikuti jalan-jalan di kota

\[ d(x,y) = \sum_{}^{}\left| x_{i} - y_{i}\right| \]

1.4.6 Single Linkage

Pada metode single lankage, jarak antar dua cluster Ci dan Cj dihitung berdasarkan jarak minimum antara setiap pasangan titik dari kedua cluster tersebut

\[ d_{ij} = min ( d_{pj}; d_{qj}) \]

Di sini, d(x,y) adalah jarak antara titik x di cluster Ci, dan titik y di cluster Cj.

1.4.7 Complete Linkage

Complete linkage menghitung jarak antar cluster dengan jarak maksimum antara dua titik dari masing-masing cluster

\[ d_{ij} = max ( d_{pj}; d_{qj}) \] Jarak ini mempertimbangkan duat titik terjauh di masing-masing cluster, sehingga hasilnya cenderung membentuk cluster kompak

1.4.8 Average Linkage

Pada average linkage, jarak antar dua cluster Ci dan Cj dihitung sebagai rata- rata jarak antara semua pasangan titik dari kedua cluster tersebut

\[ d_{ij} = \frac{1}{n_{i}.n_{j}}\sum_{i=1}^{n_{i}}\sum_{j=1}^{n_{j}}\sqrt{\sum_{k=1}^{p}(x_{ik}-y_{jk})^2} \]

1.4.9 Ward’s Method

Jarak antara dua kluster yang terbentuk merupakan jumlah kuadrat diantara dua kluster tersebut

\[ ESS =\sum_{k=1}^{K}\left[ \sum_{i=1}^{nk}\sum_{j=1}^{p} X^2_{ijk} - \frac{1}{nk}\sum_{j=1}^{0}(\sum_{i=1}^{nk}X_{ijk})^2 \right] \]

1.4.10 Centroid Method

Jarak antara dua cluster merupakan jarak di antara dua Centroid kluster-kluster tersebut

\[ C_{i} = \frac{1}{M}\sum_{j=1}^{M}X_{j} \]

1.4.11 Validitas cluster

Permasalahan utama dalam Analisis Cluster adalah jumlah kelompok yang harus ditentukan oleh peneliti karena belum ada dasar yang kuat mengenai jumlah kelompok terbaik yang harus di pilih oleh peneliti. Langkah selanjutnya yaitu melakukan uji validitas cluster untuk mengevaluasi hasil dari Analisis Cluster secara kuantitatif sehingga dihasilkan kelompok yang optimum

1.4.11.1 Indeks Dunn

Indeks dunn adalah rasio jarak terkecil antara observasi pada cluster yang berbeda dengan jarak terbesar pada masing cluster data. Rumus perhitungan indeks dunn didefinisikan sebagai berikut: \[ C = \frac{d_{min}}{d_{max}} \] Indeks ini cenderung lebih tinggi jika cluster lebih terpisah dan kompak, sehingga semakin besar nilai Dunn, semakin baik kualitas cluster.

1.4.11.2 Indeks Global Silhoutte (GSu)

Indeks Silhouette mengevaluasi seberapa mirip objek dalam cluster mereka dibandingkan dengan objek di cluster lain. Nilai Silhouette berkisar dari -1 hingga 1; nilai mendekati 1 menunjukkan bahwa titik-titik berada di cluster yang benar, nilai mendekati 0 menunjukkan overlap antar cluster, dan nilai negatif menunjukkan bahwa titik lebih mirip ke cluster lain.

\[ GS_{u}= \frac{1}{c}\sum_{i=1}^{c}S(i) \]

1.4.11.3 Indeks Connectivity

Rumus perhitungan indeks connectivity didefinisikan sebagai berikut: \[ Conn(C)=\sum_{i=1}^N\sum_{i=1}^LX_{i,nni(j)} \] Semakin kecil nilai indeks Connectivity maka diindikasikan banyak cluster yang terbentuk lebih baik atau optimal (Halim & Widodo, 2017).

1.5 Data

Data yang digunakan adalah data Provinsi, Indeks Pembangunan Literasi Masyarakat, Pemerataan Layanan Perpustakaan, dan Ketercukupan Koleksi Perpustakaan yang diambil dari BPS. Berikut adalah link dari data yang diambi.

https://www.bps.go.id/id/statistics-table/3/VEd0V05FTjBaRVJuYzA1bVkwcHlhVk5KUjJGTlVUMDkjMw==/indeks-pembangunan-literasi-masyarakat-dan-unsur-penyusunnya-menurut-provinsi.html?year=2023

Data disajikan dalam tabel berikut.

Provinsi I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
Aceh 66.23 0.2841 0.2736
Sumatera Utara 56.10 0.3318 0.2081
Sumatera Barat 77.31 0.5838 0.4689
Riau 66.88 0.3518 0.2753
Jambi 62.84 0.4393 0.6077
Sumatera Selatan 68.64 0.4196 0.2924
Bengkulu 59.83 0.5833 0.2664
Lampung 59.25 0.4248 0.3058
Kepulauan Bangka Belitung 77.50 0.7599 0.5657
Kepulauan Riau 62.52 0.6337 0.1514
DKI Jakarta 70.99 0.5952 0.0898
Jawa Barat 60.02 0.4907 0.2331
Jawa Tengah 64.40 0.6030 0.3020
DI Yogyakarta 85.09 0.7841 0.8447
Jawa Timur 75.18 0.3668 0.4366
Banten 52.50 0.3092 0.1438
Bali 62.70 0.6738 0.2948
Nusa Tenggara Barat 66.32 0.3554 0.1971
Nusa Tenggara Timur 60.53 0.4108 0.4232
Kalimantan Barat 67.08 0.5111 0.3371
Kalimantan Tengah 66.68 0.3326 0.2723
Kalimantan Selatan 71.29 0.6050 0.4652
Kalimantan Timur 68.77 0.5637 0.4035
Kalimantan Utara 65.39 0.2829 0.2322
Sulawesi Utara 59.15 0.3427 0.2607
Sulawesi Tengah 63.94 0.4114 0.3691
Sulawesi Selatan 86.74 0.5259 0.5459
Sulawesi Tenggara 67.53 0.4731 0.4993
Gorontalo 70.39 0.4323 0.4305
Sulawesi Barat 62.73 0.3323 0.4918
Maluku 63.97 0.3390 0.2541
Maluku Utara 57.00 0.2872 0.2251
Papua Barat 64.29 0.2071 0.6058
Papua 47.57 0.1912 0.1234

2 SOURCE CODE

2.1 Library

> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)
> library(dplyr)
> library(cluster)
> library(fpc)

2.2 Impor Data

> #input data
> data <- read_excel("C:/Users/User/Downloads/Indeks Pembangunan Literasi Masyarakat dan Unsur Penyusunnya Menurut Provinsi, 2023.xlsx")
> data<-data.frame(data)

2.3 Statistika Deskriptif

> statdes <- summary(data[,2:4])
> statdes
 I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
 Min.   :47.57     Min.   :0.1912   Min.   :0.0898   
 1st Qu.:61.03     1st Qu.:0.3342   1st Qu.:0.2384   
 Median :64.89     Median :0.4222   Median :0.2984   
 Mean   :65.80     Mean   :0.4482   Mean   :0.3499   
 3rd Qu.:68.74     3rd Qu.:0.5784   3rd Qu.:0.4581   
 Max.   :86.74     Max.   :0.7841   Max.   :0.8447   

Menghitung statistika deskriptif dengan perintah “summary” yang disimpan dalam statdes. Hasil dari perintah tersebut menunjukkan rangkuman ukuran pemusatan dan persebaran data pada masing-masing variabel.

2.4 Uji Asumsi

> # Uji Sampel Representatif
> kmo <- KMO(data[,2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA =  0.62
MSA for each item = 
I.P.L..Masyarakat  P.L.Perpustakaan K.K..Perpustakaan 
             0.58              0.68              0.63 

Melakukan uji sampel representatif menggunakan fungsi KMO() dengan argumen didalamnya adalah data[,2:4] yang disimpan dalam kmo. argumen dalam data [,2:4] menunjukkan data yang dianalisis pada kolom kedua sampai keempat.

2.5 Uji Non-Multikolinearitas

> korelasi <- cor(data[,2:4], method = 'pearson')
> korelasi
                  I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
I.P.L..Masyarakat         1.0000000        0.5655766         0.6447545
P.L.Perpustakaan          0.5655766        1.0000000         0.3641717
K.K..Perpustakaan         0.6447545        0.3641717         1.0000000

Melakukan uji asumsi non-multikolinearitas menggunakan korelasi antar variabel dengan fungsi cor() dengan argumen didalamnya data dan metode yang digunakan adalah pearson yang disimpan dalam korelasi.

2.6 Standarisasi

> datastand <- scale(data[,2:4])
> datastand
      I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
 [1,]        0.05230864      -1.09292825       -0.46355304
 [2,]       -1.19275982      -0.77522840       -0.86152244
 [3,]        1.41414067       0.90318594        0.72306412
 [4,]        0.13219950      -0.64202091       -0.45322407
 [5,]       -0.36435297      -0.05923815        1.56639470
 [6,]        0.34851939      -0.19044753       -0.34932671
 [7,]       -0.73430914       0.89985575       -0.50729930
 [8,]       -0.80559638      -0.15581358       -0.26791007
 [9,]        1.43749338       2.07607787        1.31120821
[10,]       -0.40368386       1.23553862       -1.20602420
[11,]        0.63735561       0.97911421       -1.58029771
[12,]       -0.71095643       0.28310509       -0.70962573
[13,]       -0.17261489       1.03106513       -0.29099837
[14,]        2.37037291       2.23725893        3.00637558
[15,]        1.15234444      -0.54211529        0.52681356
[16,]       -1.63523232      -0.92575286       -1.25220080
[17,]       -0.38156023       1.50261963       -0.33474463
[18,]        0.06337045      -0.61804356       -0.92835700
[19,]       -0.64827282      -0.24905882        0.44539692
[20,]        0.15678131       0.41897673       -0.07773538
[21,]        0.10761770      -0.76990010       -0.47145167
[22,]        0.67422832       1.04438588        0.70058340
[23,]        0.36449757       0.76931242        0.32570230
[24,]       -0.05093495      -1.10092070       -0.71509401
[25,]       -0.81788728      -0.70263032       -0.54193175
[26,]       -0.22915304      -0.24506260        0.11669242
[27,]        2.57317280       0.51755027        1.19090601
[28,]        0.21209037       0.16588250        0.90777053
[29,]        0.56361019      -0.10586077        0.48975076
[30,]       -0.37787296      -0.77189821        0.86220151
[31,]       -0.22546577      -0.72727370       -0.58203248
[32,]       -1.08214169      -1.07228109       -0.75823268
[33,]       -0.18613488      -1.60577708        1.55485055
[34,]       -2.24117383      -1.71167703       -1.37614852
attr(,"scaled:center")
I.P.L..Masyarakat  P.L.Perpustakaan K.K..Perpustakaan 
       65.8044118         0.4481941         0.3498941 
attr(,"scaled:scale")
I.P.L..Masyarakat  P.L.Perpustakaan K.K..Perpustakaan 
        8.1360988         0.1501417         0.1645855 
> rownames(datastand) <- 1:nrow(datastand)

Melakukan standarisasi ke dalam bentuk Zscore dengan fungsi scale() dengan argumen data didalamnya yang disimpan dalam datastand.

2.7 Jarak Euclidean

> jarak <- dist(datastand, method = "euclidean")
> jarak
           1         2         3         4         5         6         7
2  1.3451797                                                            
3  2.6920473 3.4819419                                                  
4  0.4580466 1.3928277 2.3269489                                        
5  2.3157742 2.6633966 2.1910058 2.1598750                              
6  0.9566922 1.7262256 1.8659059 0.5113780 2.0482655                    
7  2.1428648 1.7724441 2.4758113 1.7695042 2.3145054 1.5447441          
8  1.2854809 0.9412470 2.6515547 1.0724738 1.8890994 1.1575022 1.0848165
9  3.8873016 4.4462274 1.3123011 3.4935762 2.8055917 3.0133665 3.0671150
10 2.4861518 2.1873514 2.6713903 2.0926320 3.0601144 1.8256990 0.8427411
11 2.4254399 2.6350860 2.4320024 2.0380277 3.4616858 1.7223794 1.7432933
12 1.5926685 1.1727220 2.6368804 1.2776979 2.3275742 1.2151364 0.6495096
13 2.1428284 2.1514855 1.8874504 1.7083459 2.1622751 1.3293142 0.6160377
14 5.3389112 6.0606625 2.8120530 5.0267785 3.8504765 4.6089465 4.8758188
15 1.5793352 2.7352025 1.4818729 1.4181504 1.9011234 1.2399301 2.5900061
16 1.8702159 0.6091544 4.0675993 1.9602762 3.2109909 2.3002449 2.1678071
17 2.6347111 2.4746982 2.1685990 2.2084994 2.4604932 1.8438290 0.7193964
18 0.6645905 1.2676897 2.6202884 0.4806908 2.5921028 0.7742250 1.7656729
19 1.4244718 1.5104167 2.3787216 1.2534257 1.1718696 1.2761723 1.4950040
20 1.5638499 1.9651232 1.5673835 1.1257495 1.7898140 0.6942069 1.0999145
21 0.3278241 1.3576322 2.4357929 0.1314899 2.2092113 0.6393070 1.8703504
22 2.5119931 3.0392130 0.7536001 2.1140092 1.7453556 1.6532426 1.8611414
23 2.0465401 2.4940248 1.1302961 1.6286652 1.6604327 1.1734814 1.3850305
24 0.2720220 1.1963615 2.8690048 0.5591986 2.5275530 1.0593918 2.1244494
25 0.9569308 0.4979338 3.0266829 0.9561420 2.2504860 1.2883837 1.6050378
26 1.0652613 1.4719097 2.0944153 0.7829153 1.4678033 0.7442191 1.3983513
27 3.4184254 4.4795075 1.3080315 3.1632451 3.0170738 2.7969019 3.7375788
28 1.8683316 2.4473846 1.4222017 1.5847387 0.9037433 1.3137265 1.8538639
29 1.4644178 2.3149142 1.3401539 1.1673836 1.4221292 0.8703275 1.9209813
30 1.4302942 1.9066400 2.4569450 1.4168227 1.0019756 1.5275901 2.1902832
31 0.4742354 1.0080040 2.6551808 0.3895948 2.2541740 0.8196300 1.7064750
32 1.1722798 0.3333848 3.5111445 1.3239255 2.6354068 1.7296317 2.0182366
33 2.0961446 2.7462635 3.0899265 2.2500059 1.5568165 2.4320576 3.2910717
34 2.5447480 1.4969796 4.9603958 2.7620382 3.8615504 3.1741161 3.1377769
           8         9        10        11        12        13        14
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9  3.5364397                                                            
10 1.7255297 3.2299998                                                  
11 2.2566641 3.1944258 1.1356044                                        
12 0.6298564 3.4517181 1.1171202 1.7494124                              
13 1.3453177 2.5003132 0.9656472 1.5234973 1.0121782                    
14 5.1511672 1.9416065 5.1422900 5.0620005 5.2078761 4.3352469          
15 2.1481031 2.7480030 2.9298471 2.6493906 2.3836235 2.2134205 3.9187679
16 1.4999768 5.0023691 2.4879760 2.9834245 1.6155529 2.6253184 6.6471791
17 1.7130891 2.5193196 0.9115645 1.6922322 1.3176697 0.5176249 4.3904345
18 1.1853059 3.7632641 1.9315811 1.8180755 1.2080953 1.7836689 5.3811832
19 0.7363778 3.2413439 2.2340647 2.6953086 1.2732655 1.5515302 4.6746775
20 1.1369789 2.5130404 1.5013095 1.6740368 1.0819960 0.7270730 4.2092610
21 1.1191476 3.6119297 2.1960898 2.1375717 1.3548470 1.8315484 5.1242901
22 2.1373674 1.4212053 2.1985419 2.2821128 2.1182481 1.3040534 3.1010531
23 1.6054138 1.9570840 1.7758535 1.9368284 1.5700010 0.8586757 3.6557369
24 1.2894630 4.0514984 2.4133973 2.3556032 1.5333576 2.1771602 5.5547737
25 0.6117577 4.0301475 2.0902349 2.4544247 1.0055992 1.8668272 5.6034308
26 0.6986926 3.0971392 1.9930430 2.2647785 1.0926561 1.3408618 4.6119111
27 3.7413426 1.9321617 3.8887604 3.4117444 3.8016431 3.1621335 2.5088753
28 1.5878915 2.3050425 2.4477480 2.6519200 1.8659387 1.5276079 3.6541657
29 1.5656538 2.4898434 2.3686838 2.3383134 1.7928520 1.5633928 3.8843277
30 1.3563406 3.4070705 2.8823647 3.1721501 1.9221388 2.1500413 4.6049283
31 0.8728064 3.7694261 2.0673073 2.1570243 1.1282050 1.7830450 5.3294938
32 1.0755493 4.5324729 2.4468049 2.8001222 1.4061340 2.3387202 6.0864758
33 2.4101002 4.0313256 3.9677238 4.1459564 2.9951905 3.2187385 4.8385517
34 2.3895159 5.9246574 3.4772679 3.9456262 2.6009563 3.6026548 7.4877885
          15        16        17        18        19        20        21
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16 3.3290620                                                            
17 2.6974223 2.8827786                                                  
18 1.8191071 1.7563631 2.2466756                                        
19 1.8261252 2.0769790 1.9360098 1.5905300                              
20 1.5100739 2.5296204 1.2369912 1.3445050 1.1696371                    
21 1.4628306 1.9160860 2.3285897 0.4835087 1.2974041 1.2533386          
22 1.6660663 3.6094904 1.5480865 2.4062971 1.8673855 1.1245746 2.2330131
23 1.5430460 3.0597294 1.2371467 1.8942278 1.4412185 0.5732740 1.7523176
24 1.8172725 1.6820124 2.6518675 0.5401085 1.5585956 1.6611623 0.4405396
25 2.2471748 1.1055852 2.2575285 0.9659682 1.0996882 1.5567464 0.9306192
26 1.4713854 2.0770813 1.8114681 1.1475248 0.5326575 0.7922725 0.8571945
27 1.8927924 5.0756840 3.4682011 3.4756232 3.3942871 2.7309551 3.2403585
28 1.2371204 3.0446256 1.9191485 2.0020045 1.0612212 1.0189886 1.6699873
29 0.7336891 2.9225890 2.0396934 1.5885845 1.2211197 0.8735014 1.2541082
30 1.5833037 2.4648166 2.5702383 1.8505315 0.7212511 1.6085769 1.4192731
31 1.7782531 1.5735188 2.2489867 0.4640024 1.2095728 1.3093198 0.3535389
32 2.6316056 0.7558996 2.7019012 1.2439743 1.5214011 2.0547157 1.2606368
33 1.9949344 3.2313857 3.6429234 2.6840622 1.8124964 2.6234627 2.2115338
34 4.0626476 1.0001025 3.8567328 2.5898795 2.8274747 3.4605998 2.6874229
          22        23        24        25        26        27        28
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23 0.5586899                                                            
24 2.6706450 2.1802782                                                  
25 2.6119568 2.0778446 0.8813832                                        
26 1.6791974 1.1937600 1.2066994 0.9948678                              
27 2.0307541 2.3854157 3.6246691 3.9988568 3.0965373                    
28 1.0140346 0.8521497 2.0754908 1.9790920 0.9946739 2.4038607          
29 1.1746294 0.9124066 1.6791250 1.8245651 0.8871433 2.2177921 0.6100419
30 2.1052139 1.7928401 1.6440819 1.4730923 0.9249093 3.2371894 1.1088579
31 2.3650223 1.8471083 0.4333341 0.5942883 0.8489745 3.5391066 1.7912834
32 3.1133999 2.5805323 1.0325059 0.5032476 1.4755928 4.4371195 2.4461505
33 2.9143371 2.7303940 2.3293362 2.3688143 1.9803266 3.5006790 1.9277120
34 4.5175511 3.9800915 2.3679448 1.9338659 2.9030604 5.8938236 3.8418773
          29        30        31        32        33
2                                                   
3                                                   
4                                                   
5                                                   
6                                                   
7                                                   
8                                                   
9                                                   
10                                                  
11                                                  
12                                                  
13                                                  
14                                                  
15                                                  
16                                                  
17                                                  
18                                                  
19                                                  
20                                                  
21                                                  
22                                                  
23                                                  
24                                                  
25                                                  
26                                                  
27                                                  
28                                                  
29                                                  
30 1.2119059                                        
31 1.4688479 1.4529388                              
32 2.2803355 1.7922141 0.9401969                    
33 1.9865307 1.1008543 2.3107540 2.5372820          
34 3.7318949 3.0602754 2.3796532 1.4608226 3.5812226

Menghitung jarak euclidean dengan fungsi dist() dengan argumen didalamnya datastand yang merupakan data hasil dtandarisasi dan metode euclidean yang disimpan dalam jarak.

2.8 Koefisien Korelasi Cophenetic

> d1 <- dist(data[,2:4])
> hiers <- hclust(dist(data[,2:4]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.8444636
> hierave <- hclust(dist(data[,2:4]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.8074621
> hiercomp <- hclust(dist(data[,2:4]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.7572603
> hiercen <- hclust(dist(data[,2:4]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.8062371
> hierward <- hclust(dist(data[,2:4]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.7316515
> 
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
       cors    corave   corcomp    corcen   corward
1 0.8444636 0.8074621 0.7572603 0.8062371 0.7316515

Menganalisis dengan metode hierarki clustering dengan fungsi hclust() dengan argumen data pada fungsi dist dan argumen single/average/complete/centroid/ward.D pada parameter method. Menghitung jarak antar observasi dengan fungsi dist() dengan argumen data yang disimpan dalam d1, menjalankan fungsi hclust() dengan argumen d1 dan single/average/complete/centroid/ward.D yang disimpan dalam hc, menjalankan fungsi cophenetic() dengan argumen hc yang disimpan dalam d2, lalu menghitung korelasi cophenetic dengan fungsi cor() dengan argumen d1 dan d2 yang disimpan dalam cors/corave/corcomp/corcen/corward.

2.9 Indeks Validitas

> library(clValid)
> library(ggplot2)
> inval <- clValid(datastand, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "single")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 

Validation Measures:
                                2      3      4
                                               
hierarchical Connectivity  3.3040 6.7091 9.5131
             Dunn          0.3277 0.2227 0.2637
             Silhouette    0.5173 0.3386 0.3391

Optimal Scores:

             Score  Method       Clusters
Connectivity 3.3040 hierarchical 2       
Dunn         0.3277 hierarchical 2       
Silhouette   0.5173 hierarchical 2       
> optimalScores(inval)
                 Score       Method Clusters
Connectivity 3.3039683 hierarchical        2
Dunn         0.3277163 hierarchical        2
Silhouette   0.5173288 hierarchical        2
> plot(inval)

Memanggil packages clValid dan ggplot2 dengan fungsi library(). Melakukan validasi cluster dengan fungsi clvalid() dengan argumen data standarisasi, argumen hierarchical pada parameter clMethods, argumen internal pada parameter validation, argumen euclidean pada parameter metric, argumen average pada parameter method yang disimpan dalam inval. Menampilkan rangkuman ukuran persebaran dan pemusatan data validasi dengan fungsi summary(), menghitung optimal scores dengan fungsi optimalScores(), menampilkan plot dengan fungsi plot().

2.10 Analisis Cluster Metode Single Linkage

> hirave <- hclust(dist(scale(data[,2:4])), method = "single")
> hirave

Call:
hclust(d = dist(scale(data[, 2:4])), method = "single")

Cluster method   : single 
Distance         : euclidean 
Number of objects: 34 
> plot(hirave, labels(data$Provinsi), hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "PROVINSI", ylab = "Jarak")

> anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = 2))
> anggotaave
                          id cutree.hirave..k...2.
1                       Aceh                     1
2             Sumatera Utara                     1
3             Sumatera Barat                     1
4                       Riau                     1
5                      Jambi                     1
6           Sumatera Selatan                     1
7                   Bengkulu                     1
8                    Lampung                     1
9  Kepulauan Bangka Belitung                     1
10            Kepulauan Riau                     1
11               DKI Jakarta                     1
12                Jawa Barat                     1
13               Jawa Tengah                     1
14             DI Yogyakarta                     2
15                Jawa Timur                     1
16                    Banten                     1
17                      Bali                     1
18       Nusa Tenggara Barat                     1
19       Nusa Tenggara Timur                     1
20          Kalimantan Barat                     1
21         Kalimantan Tengah                     1
22        Kalimantan Selatan                     1
23          Kalimantan Timur                     1
24          Kalimantan Utara                     1
25            Sulawesi Utara                     1
26           Sulawesi Tengah                     1
27          Sulawesi Selatan                     1
28         Sulawesi Tenggara                     1
29                 Gorontalo                     1
30            Sulawesi Barat                     1
31                    Maluku                     1
32              Maluku Utara                     1
33               Papua Barat                     1
34                     Papua                     1
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "single", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

> 
> idclus = clus_hier$cluster
> idclus
 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
 1  1  1  1  1  1  1  1  1  1  1  1  1  2  1  1  1  1  1  1  1  1  1  1  1  1 
27 28 29 30 31 32 33 34 
 1  1  1  1  1  1  1  1 
> aggregate(data[,2:4],list(idclus),mean)
  Group.1 I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
1       1             65.22        0.4380152            0.3349
2       2             85.09        0.7841000            0.8447

Memanggil packages cluster, factoextra, tidyverse dan car dengan fungsi library(). Melakukan hierarical clustering dengan fungsi hclust() dan argumen data standarisasi pada fungsi dist(), argumen average pada paramter method yang disimpan dalam hirave. Menampilkan plot dari hirave dengan fungsi plot() dengan argumen didalamnya mengenai labels, warna dan yang lain. Menampilkan anggota pengelompokan dengan fungsi data.frame() yang disimpan dalam anggotaave. Menerapkan metode k-means dengan fungsi eclust() yang disimpan dalam clus_hier. Menampilkan visualisasi dendogram dengan fungsi fviz_dend(). Menampilkan data rata-rata menggunakan fungsi aggregate().

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

Statistik Deskriptif Variabel
I.P.L.Masyarakat P.L.Perpustakaan K.K.Perpustakaan
Min 47.57 0.1912 0.0898
Rata-Rata 65.80 0.4222 0.3499
Maks 86.74 0.7841 0.8477

Indeks Pembangunan Literasi (I.P.L.Masyarakat):

  • Min (47.57): Nilai terendah dari Indeks Pembangunan Literasi menunjukkan tingkat literasi paling rendah pada suatu wilayah atau provinsi.
  • Rata-Rata (65.80): Nilai rata-rata menunjukkan bahwa, secara umum, tingkat literasi masyarakat berada pada angka ini. Artinya, ada wilayah yang memiliki tingkat literasi lebih tinggi dan lebih rendah dari nilai rata-rata ini.
  • Maks (86.74): Nilai tertinggi menunjukkan provinsi atau wilayah dengan tingkat pembangunan literasi tertinggi.

Pemerataan Layanan Perpustakaan (P.L.Perpustakaan):

  • Min (0.1912): Nilai terendah ini menunjukkan bahwa layanan perpustakaan di beberapa wilayah sangat terbatas dan belum merata.
  • Rata-Rata (0.4222): Nilai rata-rata ini menggambarkan bahwa ketersediaan layanan perpustakaan di wilayah-wilayah umumnya belum optimal, meskipun ada perbedaan yang signifikan antar wilayah.
  • Maks (0.7841): Nilai tertinggi menunjukkan bahwa ada wilayah dengan pemerataan layanan perpustakaan yang sangat baik, hampir mencapai 80%.

Kecukupan Koleksi Perpustakaan (K.K.Perpustakaan):

  • Min (0.0898): Nilai terendah ini menunjukkan bahwa ada wilayah yang memiliki sangat sedikit koleksi perpustakaan yang cukup memadai untuk memenuhi kebutuhan pembacanya.
  • Rata-Rata (0.3499): Nilai ini menunjukkan bahwa secara rata-rata, kecukupan koleksi perpustakaan di berbagai wilayah masih dalam tingkat yang moderat atau cukup rendah.
  • Maks (0.8477): Nilai tertinggi menunjukkan bahwa di beberapa wilayah atau provinsi, perpustakaan memiliki koleksi yang hampir sepenuhnya mencukupi kebutuhan pembacanya.

3.2 Uji Sampel Representatif

Uji asumsi pertama ialah uji sampel representatif menggunakan uji Kaiser Mayer Olkin (KMO) yang dilakukan untuk menguji apakah sampel telah representatif atau mewakili populasi. Berikut disajikan tabel uji KMO.

I.P.L.Masyarakat P.L.Perpustakaan K.K.Perpustakaan
Uji KMO 0.58 0.68 0.63

MSA (Measure of Sampling Adequacy) Nilai MSA keseluruhan adalah 0.62, yang berada di kisaran yang dapat diterima tetapi tidak ideal (biasanya nilai di atas 0,7 dianggap baik untuk analisis faktor). Secara umum, KMO 0.62 menunjukkan bahwa data ini “cukup” untuk analisis faktor, tetapi tidak kuat. MSAi (Individual MSA): - Indek Pembangunan Literasi Masyarakat (I.P.L.Masyarakat) sebesar 0.58 nilai ini mendekati 0.6, menunjukkan kecukupan yang cukup untuk analisis. - Pemerataan Layanan Perpustakaan (P.L.Perpustakaan) sebesar 0.68, nilai ini di atas 0.6, yang lebih baik, menunjukkan variabel ini lebih sesuai untuk analisis. - Kecukuoan Koleksi Perpustakaan (K.K.Perpustakaan) sebesar 0.63, nilai ini di atas 0.6, menunjukkan variabel ini juga cukup memadai untuk analisis . Uji KMO pada masing masing variabel tersebut bernilai lebih dari 0.5 sehingga dapat disimpulkan bahwa sampel telah representatif atau mewakili populasi.

3.3 Uji Non-Multikoliniertias

Uji asumsi analisis cluster yang kedua adalah uji asumsi Non-Multikolinearitas yang dapat dilihat dari korelasi antar variabel. Apabila nilai mutlak dari korelasi lebih dari 0.8 maka dapat dikatakan terjadi multikolinearitas. Berikut disajikan tabel korelasi antar variabel:

Tabel Korelasi Antar Variabel
I.P.L.Masyarakat P.L.Perpustakaan K.K.Perpustakaan
I.P.L.Masyarakat 1.0000000 0.5655766 0.6447545
P.L.Perpustakaan 0.5655766 1.0000000 0.3641717
K.K.Perpustakaan 0.6447545 0.3641717 1.0000000
  • Variabel Indeks Pembangunan Literasi Masyarakat (I.P.L. Masyarakat) dan Ketercukupan Koleksi Perpustakaan (K.K. Perpustakaan) memiliki korelasi yang kuat sebesar 0.645. Ini menegaskan pentingnya kecukupan koleksi perpustakaan dapat meningkatkan literasi masyarakat.
  • Pemerataan Layanan Perpustakaan (P.L. Perpustakaan) menunjukkan korelasi yang moderat dengan Indeks Pembangunan Literasi Masyarakat (I.P.L. Masyarakat) sebesar 0.566.
  • Pemerataan Layanan Perpustakaan (P.L. Perpustakaan) dengan Ketercukupan Koleksi Perpustakaan (K.K. Perpustakaan) memiliki korelasi yang lemah sebesar 0.364 . Hal ini mungkin menunjukkan adanya faktor lain yang memengaruhi pemerataan layanan perpustakaan selain Ketercukupan Koleksi Perpustakaan. Berdasarkan tabel tersebut dapat dilihat bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel.

3.4 Standarisasi

Setelah dilakukan uji asumsi dan mendapatkan hasil yang telah memenuhi asumsi maka dilanjutkan dengan standarisasi variabel ke bentuk Zscore yang tertera pada hasil analisis di 2.6. Hasil standarisasi digunakan dalam pengelompokan provins-provinsi di Indonesia berdasarkan tingkat literasi masyarakat dan unsur penyedianya.

3.5 Jarak Euclidean

Setelah dilakukan standarisasi, penghitungan jarak Euclidean dapat dilakukan untuk mengukur seberapa jauh satu jarak antar provinsi yang dapat dilihat di hasil analisis 2.7. Secara umum, analisis jarak ini membantu untuk menentukan kemiripan antara titik data dan dapat menjadi dasar untuk klasterisasi atau pemetaan hubungan dalam analisis lanjutan.

3.6 Koefisien Korelasi Cophenetic

Metode Nilai.Korelasi
Single Linkage 0.8444636
Average Linkage 0.8074621
Complete Linkage 0.7572603
Centroid Linkage 0.8062371
Ward’s Method 0.7316515

3.7 Indeks Validitas

Pada analisis ini menetapkan stopping rule sebanyak 2 hingga 5 cluster. Stopping rule adalah jumlah cluster yang dijadikan pertimbangan sebelum menentukan jumlah cluster optimal yang sesungguhnya. Dalam memilih dan menentukan jumlah cluster optimal pada analisis ini mengggunakan 3 aturan indeks validitas cluster, yaitu Indeks Connectivity, Indeks Dunn dan Indeks Silhoutte. Hasil penentuan jumlah cluster optimal metode Average Linkage berdasarkan indeks validitas cluster disajikan pada tabel berikut:

Tabel Evaluasi Klastering
Indeks Nilai Jumlah.Cluster
Connectivity 6.9714286 2
Dunn 0.2636950 2
Silhoutte 0.4863401 2

Berdasarkan tabel menunjukkan bahwa hasil dari ketiga indeks menunjukkan jumlah cluster optimum ialah sebanyak 2 cluster. Sehingga berdasarkan indeks connectivity, indeks dunn dan indeks silhouette terpilih jumlah cluster sebanyak dua sebagai cluster optimal pada metode pengelompokkan Single Linkage berdasarkan tingkat literasi dan unsur penyusunnya.

3.8 Analisis Cluster Metode Single Linkage

Hasil analisis cluster akan membentuk dendogram seperti gambar di atas. Berdasarkan gambar dapat diketahui bahwa hasil pengelompokan metode Single Linkage Provinsi di Indonesia berdasarkan tingkat literasi danunsur penyusunnya terbentuk 2 cluster. Garis horizontal menunjukkan menunjukkan provinsi yang dikelompokkan dan garis vertical menunjukkan jarak Euclidean antar provinsi. Cluster yang pertama pada dendogram berwarna merah yang terdiri dari Provinsi DI Yogyakarta. Cluster yang kedua pada dendogram berwarna biru yang terdiri dari 32 Provinsi yaitu Sumatera Utara, Sumatera Barat, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kep. Bangka Belitung, Aceh, Riau, Kep. Riau, DKI Jakarta, Jawa Barat, Jawa Tengah , Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat dan Papua.

3.9 Interpretasi

Setelah menentukan jumlah cluster beserta anggota yang terbentuk, maka selanjutnya ialah memberikan ciri spesifik untuk menggambarkan isi cluster tersebut. Setiap cluster memiliki karakteristik yang berbeda berdasarkan tingkat literasi dan unsur penyusunnya di setiap Provinsi. Karakteristik faktor-faktor dari setiap cluster dapat dilihat melalui nilai rata-rata masing masing variabel. Tinggi rendahnya nilai rata-rata setiap variabel pada masing-masing cluster dengan metode Single Linkage disajikan pada tabel berikut:

Tabel Evaluasi Klastering
Variabel Cluster1 Cluster2
I.P.L.Masyarakat 65.2200000 85.0900
P.L.Perpustakaan 0.4380152 0.7841
K.K.Perpustakaan 0.3349000 0.8447

Berdasarkan tabel dapat dilihat bahwa pada cluster 1 variabel Indeks Pembangunan Literasi Masyarakat, Pemerataan Layanan Perspustakaan dan Ketercukupan koleksi Perpustakaan yang rendah. Dari karakteristik ini, dapat disimpulkan bahwa Cluster 1 merupakan kelompok provinsi dengan tingkat literasi dan fasilitas perpustakaan yang relatif rendah. Pada cluster 2 dapat diketahui bahwa vvariabel Indeks Pembangunan Literasi Masyarakat, Pemerataan Layanan Perspustakaan dan Ketercukupan koleksi Perpustakaan yang tinggi dibandingkan dengan cluster 1. Oleh karena itu, Cluster 2 merupakan kelompok provinsi dengan tingkat literasi yang lebih tinggi serta fasilitas perpustakaan yang lebih memadai. Berdasarkan hasil ini, Provinsi yang tergabung dalam Cluster 1 yaitu Provinsi DI Yogyakarta, perlu mendapatkan perhatian khusus dari pemerintah. Upaya peningkatan kualitas literasi masyarakat dan fasilitas perpustakaan di provinsi-provinsi ini perlu diperkuat, melalui peningkatan akses pendidikan, penyediaan fasilitas perpustakaan yang lebih lengkap, dan pemerataan layanan literasi untuk mendukung perkembangan sumber daya manusia di wilayah tersebut.

4 KESIMPULAN

Berdasarkan hasil analisis cluster, dua kelompok provinsi di Indonesia teridentifikasi berdasarkan tingkat literasi masyarakat dan fasilitas pendukung perpustakaan. Cluster 1, yang mencakup Provinsi DI Yogyakarta, menunjukkan tingkat literasi dan fasilitas perpustakaan yang rendah. Sementara itu, Cluster 2 berisi provinsi dengan tingkat literasi dan fasilitas perpustakaan yang lebih baik. Perbedaan ini menggambarkan adanya ketimpangan dalam akses dan kualitas layanan pendidikan serta fasilitas perpustakaan di Indonesia.

5 SARAN

6 DAFTAR PUSTAKA

https://www.bps.go.id/id/statistics-table/3/VEd0V05FTjBaRVJuYzA1bVkwcHlhVk5KUjJGTlVUMDkjMw==/indeks-pembangunan-literasi-masyarakat-dan-unsur-penyusunnya-menurut-provinsi.html?year=2023

Afira, N. & Wijayanto, A. (2021). Analisis Cluster Kemiskinan Provinsi di Indonesia Tahun 2019 dengan Metode Partitioning dan Hierarki. Jakarta: Jurnal Sistem Komputer Vol 10 No 2.

Cahyoningtyas, R. (2019). Metode Ward dan Average Linkage Clustering untuk Segmentasi Objek Wisata di Malang Raya. Malang: Universitas Brawijaya.

Fatmawati, E. (2023). Perencanaan Dasar Dalam Mengukur Kajian Indeks Pembangunan Literasi Masyarakat (IPLM) Dan Indeks Literasi Masyarakat (ILM). IQRA: Jurnal Perpustakaan dan Informasi, 17(1), 172-205.

Abidin, M. A. H., Nugroho, S. R., & Wulandari, S. P. (2024). Pengelompokan Kabupaten/Kota Berdasarkan Indeks Pembangunan Manusia Provinsi Jawa Timur Tahun 2023. Jurnal Cakrawala Akademika, 1(4), 1143-1157.

Asyfani, Y., Nur, I. M., Amri, I. F., Yunanita, N., Lestari, F. A., Hisani, Z. A., & Rohim, F. H. N. (2024). A Pengelompokan Kabupaten/Kota di Jawa Tengah Berdasarkan Kepadatan Penduduk Menggunakan Metode Hierarchical Clustering. Journal of Data Insights, 2(1), 1-8.