1 PENDAHULUAN
1.1 Latar Belakang
Tingkat literasi masyarakat merupakan indikator penting dalam menilai kualitas sumber daya manusia suatu daerah. Literasi tidak hanya mencakup kemampuan membaca dan menulis, tetapi juga melibatkan kemampuan berpikir kritis, memahami informasi, serta menerapkannya dalam kehidupan sehari-hari. Di Indonesia, disparitas tingkat literasi di antara provinsi-provinsi masih menjadi tantangan besar. Faktor-faktor yang memengaruhi tingkat literasi, seperti akses pendidikan, infrastruktur perpustakaan, dan kesadaran masyarakat akan pentingnya literasi, sangat bervariasi antar daerah. Oleh karena itu, analisis yang lebih mendalam diperlukan untuk memahami pola pengelompokan provinsi berdasarkan tingkat literasi dan faktor-faktor penyusunnya. Dengan menggunakan metode analisis cluster, penelitian ini bertujuan untuk mengidentifikasi kelompok provinsi dengan karakteristik literasi yang serupa. Hasil dari pengelompokan ini diharapkan dapat menjadi dasar untuk merancang kebijakan pendidikan yang lebih efektif dan berbasis data.
1.2 Tujuan
Penelitian ini bertujuan untuk mengelompokkan provinsi-provinsi di Indonesia berdasarkan tingkat literasi masyarakat dan fasilitas perpustakaan menggunakan metode analisis cluster. Selain itu, untuk mengevaluasi tingkat literasi dan penyediaan fasilitas perpustakaan di tiap provinsi, serta bagaimana variabel-variabel ini saling berhubungan untuk mengidentifikasi provinsi yang membutuhkan perhatian lebih dalam hal peningkatan literasi dan kualitas fasilitas pendidikan.
1.3 Manfaat
Penelitian ini dapat memberikan gambaran yang lebih jelas mengenai ketimpangan tingkat literasi antara provinsi-provinsi di Indonesia, serta mengidentifikasi daerah-daerah yang memerlukan perhatian lebih dalam hal pengembangan literasi.
1.4 Tinjauan Pustaka
1.4.1 Analisis Cluster
Analisis cluster adalah metode statistika yang bertujuan untuk mengelompokkan data ke dalam beberapa kelompok (cluster) berdasarkan kemiripan karakteristik. Objek-objek yang memiliki karakteristik yang mirip akan ditempatkan kedalam satu kelompok yang sama, sedangkan objek-objek yang berbeda akan ditempatkan dikelompok yang berbeda. Teknik ini membantu dalam menemukan pola atau struktur tersembunyi di dalam data yang kompleks. Analisis cluster yang baik memiliki homogenitas (kesamaan) dalam satu cluster dan heterogenitas (perbedaan) antar cluster. Cara menentukan cluster yang baik dengan ukuran jarak :
- Sifat variabel (diskrit, kontinu, biner)
- Skala pengukuran (nominal, ordinal, Interval, rasio)
- Karakteristik masalah yang diteliti
1.4.2 Standarisasi Variabel
Standarisasi variabel dilakukan apabila terdapat perbedaan satuan yang signifikan diantara variabel-variabel yang diteliti. Proses standarisasi dilakukan dengan mengenolkan rata-rata dan varian menjadi 1 (satu) atau dengan kata lain mengubah data ZScore yaitu transformasi data dalam bentuk normal baku N(0,1), yang dapat dicari dengan: \[ Z= \frac{{X_i}-\bar{x}}{\sigma} \]
1.4.3 Jarak Euclidean
Jarak euclidean adalah jarak Lurus antara dua titik dalam ruang dimensi. Jarak ini dihitung menggunakan rumus Pythagoras dan sering dianggap sebagai jarak terpendek antara dua titik. Sederhananya, ini seperti mengukur jarak dalam garis lurus dari satu titik ke titik lain.
Jarak yang paling sering digunakan adalah jarak euclidean karena jarak ini mudah dipahami dan menggunakan prinsip pythaforas. Jarak euclidean adalah perhitungan jarak dua objek dalam euclidean space untuk mempelajari hubungan antara sudut dan jarak dengan syarat :
- Variabel-variabel tidak berkorelasi satu sama lain
- Skala data interval atau rasio
- Variabel kontinu \[ d = \sqrt{(x_{2}-x_{1})^2 + (y_{2}-y_{1})^2} \]
1.4.4 Jarak Mahalanobis
Jarak Mahalanobis mengukur jarak antara dua titik dengan mempertimbangkan kerolasi antar variabel. Ini berguna saat data memiliki variabilitas atau skala yang berbeda, karena memperhitungkan distribusi dan hubungan antar variabel, sehingga jarak ini lebih akurat pada data multidimensi. Jarak Mahalanobis juga bersifat unitless dan scale invariant. Jarak mahalanobis dapat digunakan ketika terdapat korelasi, karena memperhitungkan adanya korelasi dalam data.
\[ d = \sqrt{(x-y')S^{-1}(x-y)} \]
1.4.5 Jarak Manhattan
Jarak Manhattan, juga dikenal sebagai jarak blok kota, menghitung jarak antara dua titik dengan menjumlahkan perbedaan absolut setiap dimensi. Ini seperti menghitung jarak dengan cara bergerak secara vertikal dan horizontal, mirip dengan berjalan mengikuti jalan-jalan di kota
\[ d(x,y) = \sum_{}^{}\left| x_{i} - y_{i}\right| \]
1.4.6 Single Linkage
Pada metode single lankage, jarak antar dua cluster Ci dan Cj dihitung berdasarkan jarak minimum antara setiap pasangan titik dari kedua cluster tersebut
\[ d_{ij} = min ( d_{pj}; d_{qj}) \]
Di sini, d(x,y) adalah jarak antara titik x di cluster Ci, dan titik y di cluster Cj.
1.4.7 Complete Linkage
Complete linkage menghitung jarak antar cluster dengan jarak maksimum antara dua titik dari masing-masing cluster
\[ d_{ij} = max ( d_{pj}; d_{qj}) \] Jarak ini mempertimbangkan duat titik terjauh di masing-masing cluster, sehingga hasilnya cenderung membentuk cluster kompak
1.4.8 Average Linkage
Pada average linkage, jarak antar dua cluster Ci dan Cj dihitung sebagai rata- rata jarak antara semua pasangan titik dari kedua cluster tersebut
\[ d_{ij} = \frac{1}{n_{i}.n_{j}}\sum_{i=1}^{n_{i}}\sum_{j=1}^{n_{j}}\sqrt{\sum_{k=1}^{p}(x_{ik}-y_{jk})^2} \]
1.4.9 Ward’s Method
Jarak antara dua kluster yang terbentuk merupakan jumlah kuadrat diantara dua kluster tersebut
\[ ESS =\sum_{k=1}^{K}\left[ \sum_{i=1}^{nk}\sum_{j=1}^{p} X^2_{ijk} - \frac{1}{nk}\sum_{j=1}^{0}(\sum_{i=1}^{nk}X_{ijk})^2 \right] \]
1.4.10 Centroid Method
Jarak antara dua cluster merupakan jarak di antara dua Centroid kluster-kluster tersebut
\[ C_{i} = \frac{1}{M}\sum_{j=1}^{M}X_{j} \]
1.4.11 Validitas cluster
Permasalahan utama dalam Analisis Cluster adalah jumlah kelompok yang harus ditentukan oleh peneliti karena belum ada dasar yang kuat mengenai jumlah kelompok terbaik yang harus di pilih oleh peneliti. Langkah selanjutnya yaitu melakukan uji validitas cluster untuk mengevaluasi hasil dari Analisis Cluster secara kuantitatif sehingga dihasilkan kelompok yang optimum
1.4.11.1 Indeks Dunn
Indeks dunn adalah rasio jarak terkecil antara observasi pada cluster yang berbeda dengan jarak terbesar pada masing cluster data. Rumus perhitungan indeks dunn didefinisikan sebagai berikut: \[ C = \frac{d_{min}}{d_{max}} \] Indeks ini cenderung lebih tinggi jika cluster lebih terpisah dan kompak, sehingga semakin besar nilai Dunn, semakin baik kualitas cluster.
1.4.11.2 Indeks Global Silhoutte (GSu)
Indeks Silhouette mengevaluasi seberapa mirip objek dalam cluster mereka dibandingkan dengan objek di cluster lain. Nilai Silhouette berkisar dari -1 hingga 1; nilai mendekati 1 menunjukkan bahwa titik-titik berada di cluster yang benar, nilai mendekati 0 menunjukkan overlap antar cluster, dan nilai negatif menunjukkan bahwa titik lebih mirip ke cluster lain.
\[ GS_{u}= \frac{1}{c}\sum_{i=1}^{c}S(i) \]
1.4.11.3 Indeks Connectivity
Rumus perhitungan indeks connectivity didefinisikan sebagai berikut: \[ Conn(C)=\sum_{i=1}^N\sum_{i=1}^LX_{i,nni(j)} \] Semakin kecil nilai indeks Connectivity maka diindikasikan banyak cluster yang terbentuk lebih baik atau optimal (Halim & Widodo, 2017).
1.5 Data
Data yang digunakan adalah data Provinsi, Indeks Pembangunan Literasi Masyarakat, Pemerataan Layanan Perpustakaan, dan Ketercukupan Koleksi Perpustakaan yang diambil dari BPS. Berikut adalah link dari data yang diambi.
Data disajikan dalam tabel berikut.
| Provinsi | I.P.L..Masyarakat | P.L.Perpustakaan | K.K..Perpustakaan |
|---|---|---|---|
| Aceh | 66.23 | 0.2841 | 0.2736 |
| Sumatera Utara | 56.10 | 0.3318 | 0.2081 |
| Sumatera Barat | 77.31 | 0.5838 | 0.4689 |
| Riau | 66.88 | 0.3518 | 0.2753 |
| Jambi | 62.84 | 0.4393 | 0.6077 |
| Sumatera Selatan | 68.64 | 0.4196 | 0.2924 |
| Bengkulu | 59.83 | 0.5833 | 0.2664 |
| Lampung | 59.25 | 0.4248 | 0.3058 |
| Kepulauan Bangka Belitung | 77.50 | 0.7599 | 0.5657 |
| Kepulauan Riau | 62.52 | 0.6337 | 0.1514 |
| DKI Jakarta | 70.99 | 0.5952 | 0.0898 |
| Jawa Barat | 60.02 | 0.4907 | 0.2331 |
| Jawa Tengah | 64.40 | 0.6030 | 0.3020 |
| DI Yogyakarta | 85.09 | 0.7841 | 0.8447 |
| Jawa Timur | 75.18 | 0.3668 | 0.4366 |
| Banten | 52.50 | 0.3092 | 0.1438 |
| Bali | 62.70 | 0.6738 | 0.2948 |
| Nusa Tenggara Barat | 66.32 | 0.3554 | 0.1971 |
| Nusa Tenggara Timur | 60.53 | 0.4108 | 0.4232 |
| Kalimantan Barat | 67.08 | 0.5111 | 0.3371 |
| Kalimantan Tengah | 66.68 | 0.3326 | 0.2723 |
| Kalimantan Selatan | 71.29 | 0.6050 | 0.4652 |
| Kalimantan Timur | 68.77 | 0.5637 | 0.4035 |
| Kalimantan Utara | 65.39 | 0.2829 | 0.2322 |
| Sulawesi Utara | 59.15 | 0.3427 | 0.2607 |
| Sulawesi Tengah | 63.94 | 0.4114 | 0.3691 |
| Sulawesi Selatan | 86.74 | 0.5259 | 0.5459 |
| Sulawesi Tenggara | 67.53 | 0.4731 | 0.4993 |
| Gorontalo | 70.39 | 0.4323 | 0.4305 |
| Sulawesi Barat | 62.73 | 0.3323 | 0.4918 |
| Maluku | 63.97 | 0.3390 | 0.2541 |
| Maluku Utara | 57.00 | 0.2872 | 0.2251 |
| Papua Barat | 64.29 | 0.2071 | 0.6058 |
| Papua | 47.57 | 0.1912 | 0.1234 |
2 SOURCE CODE
2.1 Library
2.2 Impor Data
2.3 Statistika Deskriptif
> statdes <- summary(data[,2:4])
> statdes
I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
Min. :47.57 Min. :0.1912 Min. :0.0898
1st Qu.:61.03 1st Qu.:0.3342 1st Qu.:0.2384
Median :64.89 Median :0.4222 Median :0.2984
Mean :65.80 Mean :0.4482 Mean :0.3499
3rd Qu.:68.74 3rd Qu.:0.5784 3rd Qu.:0.4581
Max. :86.74 Max. :0.7841 Max. :0.8447 Menghitung statistika deskriptif dengan perintah “summary” yang disimpan dalam statdes. Hasil dari perintah tersebut menunjukkan rangkuman ukuran pemusatan dan persebaran data pada masing-masing variabel.
2.4 Uji Asumsi
> # Uji Sampel Representatif
> kmo <- KMO(data[,2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA = 0.62
MSA for each item =
I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
0.58 0.68 0.63 Melakukan uji sampel representatif menggunakan fungsi KMO() dengan argumen didalamnya adalah data[,2:4] yang disimpan dalam kmo. argumen dalam data [,2:4] menunjukkan data yang dianalisis pada kolom kedua sampai keempat.
2.5 Uji Non-Multikolinearitas
> korelasi <- cor(data[,2:4], method = 'pearson')
> korelasi
I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
I.P.L..Masyarakat 1.0000000 0.5655766 0.6447545
P.L.Perpustakaan 0.5655766 1.0000000 0.3641717
K.K..Perpustakaan 0.6447545 0.3641717 1.0000000Melakukan uji asumsi non-multikolinearitas menggunakan korelasi antar variabel dengan fungsi cor() dengan argumen didalamnya data dan metode yang digunakan adalah pearson yang disimpan dalam korelasi.
2.6 Standarisasi
> datastand <- scale(data[,2:4])
> datastand
I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
[1,] 0.05230864 -1.09292825 -0.46355304
[2,] -1.19275982 -0.77522840 -0.86152244
[3,] 1.41414067 0.90318594 0.72306412
[4,] 0.13219950 -0.64202091 -0.45322407
[5,] -0.36435297 -0.05923815 1.56639470
[6,] 0.34851939 -0.19044753 -0.34932671
[7,] -0.73430914 0.89985575 -0.50729930
[8,] -0.80559638 -0.15581358 -0.26791007
[9,] 1.43749338 2.07607787 1.31120821
[10,] -0.40368386 1.23553862 -1.20602420
[11,] 0.63735561 0.97911421 -1.58029771
[12,] -0.71095643 0.28310509 -0.70962573
[13,] -0.17261489 1.03106513 -0.29099837
[14,] 2.37037291 2.23725893 3.00637558
[15,] 1.15234444 -0.54211529 0.52681356
[16,] -1.63523232 -0.92575286 -1.25220080
[17,] -0.38156023 1.50261963 -0.33474463
[18,] 0.06337045 -0.61804356 -0.92835700
[19,] -0.64827282 -0.24905882 0.44539692
[20,] 0.15678131 0.41897673 -0.07773538
[21,] 0.10761770 -0.76990010 -0.47145167
[22,] 0.67422832 1.04438588 0.70058340
[23,] 0.36449757 0.76931242 0.32570230
[24,] -0.05093495 -1.10092070 -0.71509401
[25,] -0.81788728 -0.70263032 -0.54193175
[26,] -0.22915304 -0.24506260 0.11669242
[27,] 2.57317280 0.51755027 1.19090601
[28,] 0.21209037 0.16588250 0.90777053
[29,] 0.56361019 -0.10586077 0.48975076
[30,] -0.37787296 -0.77189821 0.86220151
[31,] -0.22546577 -0.72727370 -0.58203248
[32,] -1.08214169 -1.07228109 -0.75823268
[33,] -0.18613488 -1.60577708 1.55485055
[34,] -2.24117383 -1.71167703 -1.37614852
attr(,"scaled:center")
I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
65.8044118 0.4481941 0.3498941
attr(,"scaled:scale")
I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
8.1360988 0.1501417 0.1645855
> rownames(datastand) <- 1:nrow(datastand)Melakukan standarisasi ke dalam bentuk Zscore dengan fungsi scale() dengan argumen data didalamnya yang disimpan dalam datastand.
2.7 Jarak Euclidean
> jarak <- dist(datastand, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 1.3451797
3 2.6920473 3.4819419
4 0.4580466 1.3928277 2.3269489
5 2.3157742 2.6633966 2.1910058 2.1598750
6 0.9566922 1.7262256 1.8659059 0.5113780 2.0482655
7 2.1428648 1.7724441 2.4758113 1.7695042 2.3145054 1.5447441
8 1.2854809 0.9412470 2.6515547 1.0724738 1.8890994 1.1575022 1.0848165
9 3.8873016 4.4462274 1.3123011 3.4935762 2.8055917 3.0133665 3.0671150
10 2.4861518 2.1873514 2.6713903 2.0926320 3.0601144 1.8256990 0.8427411
11 2.4254399 2.6350860 2.4320024 2.0380277 3.4616858 1.7223794 1.7432933
12 1.5926685 1.1727220 2.6368804 1.2776979 2.3275742 1.2151364 0.6495096
13 2.1428284 2.1514855 1.8874504 1.7083459 2.1622751 1.3293142 0.6160377
14 5.3389112 6.0606625 2.8120530 5.0267785 3.8504765 4.6089465 4.8758188
15 1.5793352 2.7352025 1.4818729 1.4181504 1.9011234 1.2399301 2.5900061
16 1.8702159 0.6091544 4.0675993 1.9602762 3.2109909 2.3002449 2.1678071
17 2.6347111 2.4746982 2.1685990 2.2084994 2.4604932 1.8438290 0.7193964
18 0.6645905 1.2676897 2.6202884 0.4806908 2.5921028 0.7742250 1.7656729
19 1.4244718 1.5104167 2.3787216 1.2534257 1.1718696 1.2761723 1.4950040
20 1.5638499 1.9651232 1.5673835 1.1257495 1.7898140 0.6942069 1.0999145
21 0.3278241 1.3576322 2.4357929 0.1314899 2.2092113 0.6393070 1.8703504
22 2.5119931 3.0392130 0.7536001 2.1140092 1.7453556 1.6532426 1.8611414
23 2.0465401 2.4940248 1.1302961 1.6286652 1.6604327 1.1734814 1.3850305
24 0.2720220 1.1963615 2.8690048 0.5591986 2.5275530 1.0593918 2.1244494
25 0.9569308 0.4979338 3.0266829 0.9561420 2.2504860 1.2883837 1.6050378
26 1.0652613 1.4719097 2.0944153 0.7829153 1.4678033 0.7442191 1.3983513
27 3.4184254 4.4795075 1.3080315 3.1632451 3.0170738 2.7969019 3.7375788
28 1.8683316 2.4473846 1.4222017 1.5847387 0.9037433 1.3137265 1.8538639
29 1.4644178 2.3149142 1.3401539 1.1673836 1.4221292 0.8703275 1.9209813
30 1.4302942 1.9066400 2.4569450 1.4168227 1.0019756 1.5275901 2.1902832
31 0.4742354 1.0080040 2.6551808 0.3895948 2.2541740 0.8196300 1.7064750
32 1.1722798 0.3333848 3.5111445 1.3239255 2.6354068 1.7296317 2.0182366
33 2.0961446 2.7462635 3.0899265 2.2500059 1.5568165 2.4320576 3.2910717
34 2.5447480 1.4969796 4.9603958 2.7620382 3.8615504 3.1741161 3.1377769
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 3.5364397
10 1.7255297 3.2299998
11 2.2566641 3.1944258 1.1356044
12 0.6298564 3.4517181 1.1171202 1.7494124
13 1.3453177 2.5003132 0.9656472 1.5234973 1.0121782
14 5.1511672 1.9416065 5.1422900 5.0620005 5.2078761 4.3352469
15 2.1481031 2.7480030 2.9298471 2.6493906 2.3836235 2.2134205 3.9187679
16 1.4999768 5.0023691 2.4879760 2.9834245 1.6155529 2.6253184 6.6471791
17 1.7130891 2.5193196 0.9115645 1.6922322 1.3176697 0.5176249 4.3904345
18 1.1853059 3.7632641 1.9315811 1.8180755 1.2080953 1.7836689 5.3811832
19 0.7363778 3.2413439 2.2340647 2.6953086 1.2732655 1.5515302 4.6746775
20 1.1369789 2.5130404 1.5013095 1.6740368 1.0819960 0.7270730 4.2092610
21 1.1191476 3.6119297 2.1960898 2.1375717 1.3548470 1.8315484 5.1242901
22 2.1373674 1.4212053 2.1985419 2.2821128 2.1182481 1.3040534 3.1010531
23 1.6054138 1.9570840 1.7758535 1.9368284 1.5700010 0.8586757 3.6557369
24 1.2894630 4.0514984 2.4133973 2.3556032 1.5333576 2.1771602 5.5547737
25 0.6117577 4.0301475 2.0902349 2.4544247 1.0055992 1.8668272 5.6034308
26 0.6986926 3.0971392 1.9930430 2.2647785 1.0926561 1.3408618 4.6119111
27 3.7413426 1.9321617 3.8887604 3.4117444 3.8016431 3.1621335 2.5088753
28 1.5878915 2.3050425 2.4477480 2.6519200 1.8659387 1.5276079 3.6541657
29 1.5656538 2.4898434 2.3686838 2.3383134 1.7928520 1.5633928 3.8843277
30 1.3563406 3.4070705 2.8823647 3.1721501 1.9221388 2.1500413 4.6049283
31 0.8728064 3.7694261 2.0673073 2.1570243 1.1282050 1.7830450 5.3294938
32 1.0755493 4.5324729 2.4468049 2.8001222 1.4061340 2.3387202 6.0864758
33 2.4101002 4.0313256 3.9677238 4.1459564 2.9951905 3.2187385 4.8385517
34 2.3895159 5.9246574 3.4772679 3.9456262 2.6009563 3.6026548 7.4877885
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 3.3290620
17 2.6974223 2.8827786
18 1.8191071 1.7563631 2.2466756
19 1.8261252 2.0769790 1.9360098 1.5905300
20 1.5100739 2.5296204 1.2369912 1.3445050 1.1696371
21 1.4628306 1.9160860 2.3285897 0.4835087 1.2974041 1.2533386
22 1.6660663 3.6094904 1.5480865 2.4062971 1.8673855 1.1245746 2.2330131
23 1.5430460 3.0597294 1.2371467 1.8942278 1.4412185 0.5732740 1.7523176
24 1.8172725 1.6820124 2.6518675 0.5401085 1.5585956 1.6611623 0.4405396
25 2.2471748 1.1055852 2.2575285 0.9659682 1.0996882 1.5567464 0.9306192
26 1.4713854 2.0770813 1.8114681 1.1475248 0.5326575 0.7922725 0.8571945
27 1.8927924 5.0756840 3.4682011 3.4756232 3.3942871 2.7309551 3.2403585
28 1.2371204 3.0446256 1.9191485 2.0020045 1.0612212 1.0189886 1.6699873
29 0.7336891 2.9225890 2.0396934 1.5885845 1.2211197 0.8735014 1.2541082
30 1.5833037 2.4648166 2.5702383 1.8505315 0.7212511 1.6085769 1.4192731
31 1.7782531 1.5735188 2.2489867 0.4640024 1.2095728 1.3093198 0.3535389
32 2.6316056 0.7558996 2.7019012 1.2439743 1.5214011 2.0547157 1.2606368
33 1.9949344 3.2313857 3.6429234 2.6840622 1.8124964 2.6234627 2.2115338
34 4.0626476 1.0001025 3.8567328 2.5898795 2.8274747 3.4605998 2.6874229
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 0.5586899
24 2.6706450 2.1802782
25 2.6119568 2.0778446 0.8813832
26 1.6791974 1.1937600 1.2066994 0.9948678
27 2.0307541 2.3854157 3.6246691 3.9988568 3.0965373
28 1.0140346 0.8521497 2.0754908 1.9790920 0.9946739 2.4038607
29 1.1746294 0.9124066 1.6791250 1.8245651 0.8871433 2.2177921 0.6100419
30 2.1052139 1.7928401 1.6440819 1.4730923 0.9249093 3.2371894 1.1088579
31 2.3650223 1.8471083 0.4333341 0.5942883 0.8489745 3.5391066 1.7912834
32 3.1133999 2.5805323 1.0325059 0.5032476 1.4755928 4.4371195 2.4461505
33 2.9143371 2.7303940 2.3293362 2.3688143 1.9803266 3.5006790 1.9277120
34 4.5175511 3.9800915 2.3679448 1.9338659 2.9030604 5.8938236 3.8418773
29 30 31 32 33
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 1.2119059
31 1.4688479 1.4529388
32 2.2803355 1.7922141 0.9401969
33 1.9865307 1.1008543 2.3107540 2.5372820
34 3.7318949 3.0602754 2.3796532 1.4608226 3.5812226Menghitung jarak euclidean dengan fungsi dist() dengan argumen didalamnya datastand yang merupakan data hasil dtandarisasi dan metode euclidean yang disimpan dalam jarak.
2.8 Koefisien Korelasi Cophenetic
> d1 <- dist(data[,2:4])
> hiers <- hclust(dist(data[,2:4]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.8444636
> hierave <- hclust(dist(data[,2:4]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.8074621
> hiercomp <- hclust(dist(data[,2:4]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.7572603
> hiercen <- hclust(dist(data[,2:4]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.8062371
> hierward <- hclust(dist(data[,2:4]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.7316515
>
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
cors corave corcomp corcen corward
1 0.8444636 0.8074621 0.7572603 0.8062371 0.7316515Menganalisis dengan metode hierarki clustering dengan fungsi hclust() dengan argumen data pada fungsi dist dan argumen single/average/complete/centroid/ward.D pada parameter method. Menghitung jarak antar observasi dengan fungsi dist() dengan argumen data yang disimpan dalam d1, menjalankan fungsi hclust() dengan argumen d1 dan single/average/complete/centroid/ward.D yang disimpan dalam hc, menjalankan fungsi cophenetic() dengan argumen hc yang disimpan dalam d2, lalu menghitung korelasi cophenetic dengan fungsi cor() dengan argumen d1 dan d2 yang disimpan dalam cors/corave/corcomp/corcen/corward.
2.9 Indeks Validitas
> library(clValid)
> library(ggplot2)
> inval <- clValid(datastand, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "single")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4
Validation Measures:
2 3 4
hierarchical Connectivity 3.3040 6.7091 9.5131
Dunn 0.3277 0.2227 0.2637
Silhouette 0.5173 0.3386 0.3391
Optimal Scores:
Score Method Clusters
Connectivity 3.3040 hierarchical 2
Dunn 0.3277 hierarchical 2
Silhouette 0.5173 hierarchical 2
> optimalScores(inval)
Score Method Clusters
Connectivity 3.3039683 hierarchical 2
Dunn 0.3277163 hierarchical 2
Silhouette 0.5173288 hierarchical 2
> plot(inval)Memanggil packages clValid dan ggplot2 dengan fungsi library(). Melakukan validasi cluster dengan fungsi clvalid() dengan argumen data standarisasi, argumen hierarchical pada parameter clMethods, argumen internal pada parameter validation, argumen euclidean pada parameter metric, argumen average pada parameter method yang disimpan dalam inval. Menampilkan rangkuman ukuran persebaran dan pemusatan data validasi dengan fungsi summary(), menghitung optimal scores dengan fungsi optimalScores(), menampilkan plot dengan fungsi plot().
2.10 Analisis Cluster Metode Single Linkage
> hirave <- hclust(dist(scale(data[,2:4])), method = "single")
> hirave
Call:
hclust(d = dist(scale(data[, 2:4])), method = "single")
Cluster method : single
Distance : euclidean
Number of objects: 34
> plot(hirave, labels(data$Provinsi), hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "PROVINSI", ylab = "Jarak")> anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = 2))
> anggotaave
id cutree.hirave..k...2.
1 Aceh 1
2 Sumatera Utara 1
3 Sumatera Barat 1
4 Riau 1
5 Jambi 1
6 Sumatera Selatan 1
7 Bengkulu 1
8 Lampung 1
9 Kepulauan Bangka Belitung 1
10 Kepulauan Riau 1
11 DKI Jakarta 1
12 Jawa Barat 1
13 Jawa Tengah 1
14 DI Yogyakarta 2
15 Jawa Timur 1
16 Banten 1
17 Bali 1
18 Nusa Tenggara Barat 1
19 Nusa Tenggara Timur 1
20 Kalimantan Barat 1
21 Kalimantan Tengah 1
22 Kalimantan Selatan 1
23 Kalimantan Timur 1
24 Kalimantan Utara 1
25 Sulawesi Utara 1
26 Sulawesi Tengah 1
27 Sulawesi Selatan 1
28 Sulawesi Tenggara 1
29 Gorontalo 1
30 Sulawesi Barat 1
31 Maluku 1
32 Maluku Utara 1
33 Papua Barat 1
34 Papua 1
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "single", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)>
> idclus = clus_hier$cluster
> idclus
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1
27 28 29 30 31 32 33 34
1 1 1 1 1 1 1 1
> aggregate(data[,2:4],list(idclus),mean)
Group.1 I.P.L..Masyarakat P.L.Perpustakaan K.K..Perpustakaan
1 1 65.22 0.4380152 0.3349
2 2 85.09 0.7841000 0.8447Memanggil packages cluster, factoextra, tidyverse dan car dengan fungsi library(). Melakukan hierarical clustering dengan fungsi hclust() dan argumen data standarisasi pada fungsi dist(), argumen average pada paramter method yang disimpan dalam hirave. Menampilkan plot dari hirave dengan fungsi plot() dengan argumen didalamnya mengenai labels, warna dan yang lain. Menampilkan anggota pengelompokan dengan fungsi data.frame() yang disimpan dalam anggotaave. Menerapkan metode k-means dengan fungsi eclust() yang disimpan dalam clus_hier. Menampilkan visualisasi dendogram dengan fungsi fviz_dend(). Menampilkan data rata-rata menggunakan fungsi aggregate().
3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
| I.P.L.Masyarakat | P.L.Perpustakaan | K.K.Perpustakaan | |
|---|---|---|---|
| Min | 47.57 | 0.1912 | 0.0898 |
| Rata-Rata | 65.80 | 0.4222 | 0.3499 |
| Maks | 86.74 | 0.7841 | 0.8477 |
Indeks Pembangunan Literasi (I.P.L.Masyarakat):
- Min (47.57): Nilai terendah dari Indeks Pembangunan Literasi menunjukkan tingkat literasi paling rendah pada suatu wilayah atau provinsi.
- Rata-Rata (65.80): Nilai rata-rata menunjukkan bahwa, secara umum, tingkat literasi masyarakat berada pada angka ini. Artinya, ada wilayah yang memiliki tingkat literasi lebih tinggi dan lebih rendah dari nilai rata-rata ini.
- Maks (86.74): Nilai tertinggi menunjukkan provinsi atau wilayah dengan tingkat pembangunan literasi tertinggi.
Pemerataan Layanan Perpustakaan (P.L.Perpustakaan):
- Min (0.1912): Nilai terendah ini menunjukkan bahwa layanan perpustakaan di beberapa wilayah sangat terbatas dan belum merata.
- Rata-Rata (0.4222): Nilai rata-rata ini menggambarkan bahwa ketersediaan layanan perpustakaan di wilayah-wilayah umumnya belum optimal, meskipun ada perbedaan yang signifikan antar wilayah.
- Maks (0.7841): Nilai tertinggi menunjukkan bahwa ada wilayah dengan pemerataan layanan perpustakaan yang sangat baik, hampir mencapai 80%.
Kecukupan Koleksi Perpustakaan (K.K.Perpustakaan):
- Min (0.0898): Nilai terendah ini menunjukkan bahwa ada wilayah yang memiliki sangat sedikit koleksi perpustakaan yang cukup memadai untuk memenuhi kebutuhan pembacanya.
- Rata-Rata (0.3499): Nilai ini menunjukkan bahwa secara rata-rata, kecukupan koleksi perpustakaan di berbagai wilayah masih dalam tingkat yang moderat atau cukup rendah.
- Maks (0.8477): Nilai tertinggi menunjukkan bahwa di beberapa wilayah atau provinsi, perpustakaan memiliki koleksi yang hampir sepenuhnya mencukupi kebutuhan pembacanya.
3.2 Uji Sampel Representatif
Uji asumsi pertama ialah uji sampel representatif menggunakan uji Kaiser Mayer Olkin (KMO) yang dilakukan untuk menguji apakah sampel telah representatif atau mewakili populasi. Berikut disajikan tabel uji KMO.
| I.P.L.Masyarakat | P.L.Perpustakaan | K.K.Perpustakaan | |
|---|---|---|---|
| Uji KMO | 0.58 | 0.68 | 0.63 |
MSA (Measure of Sampling Adequacy) Nilai
MSA keseluruhan adalah 0.62, yang berada di
kisaran yang dapat diterima tetapi tidak ideal (biasanya nilai di atas
0,7 dianggap baik untuk analisis faktor). Secara umum, KMO
0.62 menunjukkan bahwa data ini “cukup” untuk analisis
faktor, tetapi tidak kuat. MSAi (Individual MSA): -
Indek Pembangunan Literasi Masyarakat
(I.P.L.Masyarakat) sebesar 0.58 nilai ini
mendekati 0.6, menunjukkan kecukupan yang cukup untuk analisis. -
Pemerataan Layanan Perpustakaan (P.L.Perpustakaan)
sebesar 0.68, nilai ini di atas 0.6, yang lebih baik,
menunjukkan variabel ini lebih sesuai untuk analisis. -
Kecukuoan Koleksi Perpustakaan (K.K.Perpustakaan)
sebesar 0.63, nilai ini di atas 0.6, menunjukkan variabel
ini juga cukup memadai untuk analisis . Uji KMO pada masing masing
variabel tersebut bernilai lebih dari 0.5 sehingga dapat disimpulkan
bahwa sampel telah representatif atau mewakili populasi.
3.3 Uji Non-Multikoliniertias
Uji asumsi analisis cluster yang kedua adalah uji asumsi Non-Multikolinearitas yang dapat dilihat dari korelasi antar variabel. Apabila nilai mutlak dari korelasi lebih dari 0.8 maka dapat dikatakan terjadi multikolinearitas. Berikut disajikan tabel korelasi antar variabel:
| I.P.L.Masyarakat | P.L.Perpustakaan | K.K.Perpustakaan | |
|---|---|---|---|
| I.P.L.Masyarakat | 1.0000000 | 0.5655766 | 0.6447545 |
| P.L.Perpustakaan | 0.5655766 | 1.0000000 | 0.3641717 |
| K.K.Perpustakaan | 0.6447545 | 0.3641717 | 1.0000000 |
- Variabel Indeks Pembangunan Literasi Masyarakat (I.P.L. Masyarakat) dan Ketercukupan Koleksi Perpustakaan (K.K. Perpustakaan) memiliki korelasi yang kuat sebesar 0.645. Ini menegaskan pentingnya kecukupan koleksi perpustakaan dapat meningkatkan literasi masyarakat.
- Pemerataan Layanan Perpustakaan (P.L. Perpustakaan) menunjukkan korelasi yang moderat dengan Indeks Pembangunan Literasi Masyarakat (I.P.L. Masyarakat) sebesar 0.566.
- Pemerataan Layanan Perpustakaan (P.L. Perpustakaan) dengan Ketercukupan Koleksi Perpustakaan (K.K. Perpustakaan) memiliki korelasi yang lemah sebesar 0.364 . Hal ini mungkin menunjukkan adanya faktor lain yang memengaruhi pemerataan layanan perpustakaan selain Ketercukupan Koleksi Perpustakaan. Berdasarkan tabel tersebut dapat dilihat bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel.
3.4 Standarisasi
Setelah dilakukan uji asumsi dan mendapatkan hasil yang telah memenuhi asumsi maka dilanjutkan dengan standarisasi variabel ke bentuk Zscore yang tertera pada hasil analisis di 2.6. Hasil standarisasi digunakan dalam pengelompokan provins-provinsi di Indonesia berdasarkan tingkat literasi masyarakat dan unsur penyedianya.
3.5 Jarak Euclidean
Setelah dilakukan standarisasi, penghitungan jarak Euclidean dapat dilakukan untuk mengukur seberapa jauh satu jarak antar provinsi yang dapat dilihat di hasil analisis 2.7. Secara umum, analisis jarak ini membantu untuk menentukan kemiripan antara titik data dan dapat menjadi dasar untuk klasterisasi atau pemetaan hubungan dalam analisis lanjutan.
3.6 Koefisien Korelasi Cophenetic
| Metode | Nilai.Korelasi |
|---|---|
| Single Linkage | 0.8444636 |
| Average Linkage | 0.8074621 |
| Complete Linkage | 0.7572603 |
| Centroid Linkage | 0.8062371 |
| Ward’s Method | 0.7316515 |
3.7 Indeks Validitas
Pada analisis ini menetapkan stopping rule sebanyak 2 hingga 5 cluster. Stopping rule adalah jumlah cluster yang dijadikan pertimbangan sebelum menentukan jumlah cluster optimal yang sesungguhnya. Dalam memilih dan menentukan jumlah cluster optimal pada analisis ini mengggunakan 3 aturan indeks validitas cluster, yaitu Indeks Connectivity, Indeks Dunn dan Indeks Silhoutte. Hasil penentuan jumlah cluster optimal metode Average Linkage berdasarkan indeks validitas cluster disajikan pada tabel berikut:
| Indeks | Nilai | Jumlah.Cluster |
|---|---|---|
| Connectivity | 6.9714286 | 2 |
| Dunn | 0.2636950 | 2 |
| Silhoutte | 0.4863401 | 2 |
Berdasarkan tabel menunjukkan bahwa hasil dari ketiga indeks menunjukkan jumlah cluster optimum ialah sebanyak 2 cluster. Sehingga berdasarkan indeks connectivity, indeks dunn dan indeks silhouette terpilih jumlah cluster sebanyak dua sebagai cluster optimal pada metode pengelompokkan Single Linkage berdasarkan tingkat literasi dan unsur penyusunnya.
3.8 Analisis Cluster Metode Single Linkage
Hasil analisis cluster akan membentuk dendogram seperti gambar di atas. Berdasarkan gambar dapat diketahui bahwa hasil pengelompokan metode Single Linkage Provinsi di Indonesia berdasarkan tingkat literasi danunsur penyusunnya terbentuk 2 cluster. Garis horizontal menunjukkan menunjukkan provinsi yang dikelompokkan dan garis vertical menunjukkan jarak Euclidean antar provinsi. Cluster yang pertama pada dendogram berwarna merah yang terdiri dari Provinsi DI Yogyakarta. Cluster yang kedua pada dendogram berwarna biru yang terdiri dari 32 Provinsi yaitu Sumatera Utara, Sumatera Barat, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kep. Bangka Belitung, Aceh, Riau, Kep. Riau, DKI Jakarta, Jawa Barat, Jawa Tengah , Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat dan Papua.
3.9 Interpretasi
Setelah menentukan jumlah cluster beserta anggota yang terbentuk, maka selanjutnya ialah memberikan ciri spesifik untuk menggambarkan isi cluster tersebut. Setiap cluster memiliki karakteristik yang berbeda berdasarkan tingkat literasi dan unsur penyusunnya di setiap Provinsi. Karakteristik faktor-faktor dari setiap cluster dapat dilihat melalui nilai rata-rata masing masing variabel. Tinggi rendahnya nilai rata-rata setiap variabel pada masing-masing cluster dengan metode Single Linkage disajikan pada tabel berikut:
| Variabel | Cluster1 | Cluster2 |
|---|---|---|
| I.P.L.Masyarakat | 65.2200000 | 85.0900 |
| P.L.Perpustakaan | 0.4380152 | 0.7841 |
| K.K.Perpustakaan | 0.3349000 | 0.8447 |
Berdasarkan tabel dapat dilihat bahwa pada cluster 1 variabel Indeks Pembangunan Literasi Masyarakat, Pemerataan Layanan Perspustakaan dan Ketercukupan koleksi Perpustakaan yang rendah. Dari karakteristik ini, dapat disimpulkan bahwa Cluster 1 merupakan kelompok provinsi dengan tingkat literasi dan fasilitas perpustakaan yang relatif rendah. Pada cluster 2 dapat diketahui bahwa vvariabel Indeks Pembangunan Literasi Masyarakat, Pemerataan Layanan Perspustakaan dan Ketercukupan koleksi Perpustakaan yang tinggi dibandingkan dengan cluster 1. Oleh karena itu, Cluster 2 merupakan kelompok provinsi dengan tingkat literasi yang lebih tinggi serta fasilitas perpustakaan yang lebih memadai. Berdasarkan hasil ini, Provinsi yang tergabung dalam Cluster 1 yaitu Provinsi DI Yogyakarta, perlu mendapatkan perhatian khusus dari pemerintah. Upaya peningkatan kualitas literasi masyarakat dan fasilitas perpustakaan di provinsi-provinsi ini perlu diperkuat, melalui peningkatan akses pendidikan, penyediaan fasilitas perpustakaan yang lebih lengkap, dan pemerataan layanan literasi untuk mendukung perkembangan sumber daya manusia di wilayah tersebut.
4 KESIMPULAN
Berdasarkan hasil analisis cluster, dua kelompok provinsi di Indonesia teridentifikasi berdasarkan tingkat literasi masyarakat dan fasilitas pendukung perpustakaan. Cluster 1, yang mencakup Provinsi DI Yogyakarta, menunjukkan tingkat literasi dan fasilitas perpustakaan yang rendah. Sementara itu, Cluster 2 berisi provinsi dengan tingkat literasi dan fasilitas perpustakaan yang lebih baik. Perbedaan ini menggambarkan adanya ketimpangan dalam akses dan kualitas layanan pendidikan serta fasilitas perpustakaan di Indonesia.
5 SARAN
Peningkatan Infrastruktur Pendidikan dan Perpustakaan Pemerintah daerah di provinsi yang tergabung dalam Cluster 1, seperti DI Yogyakarta, perlu meningkatkan kualitas dan distribusi perpustakaan serta infrastruktur pendidikan. Pembenahan fasilitas ini akan membantu meningkatkan literasi masyarakat di wilayah tersebut.
Pemerataan Akses Layanan Perpustakaan Pemerataan layanan perpustakaan, terutama di daerah terpencil, dapat membantu meningkatkan akses masyarakat terhadap bahan bacaan dan sumber daya pendidikan. Diperlukan pembangunan atau renovasi perpustakaan di daerah yang membutuhkan.
Penguatan Program Peningkatan Literasi Program-program yang fokus pada peningkatan literasi masyarakat, seperti pelatihan keterampilan membaca dan menulis, serta program literasi digital, harus diperluas ke daerah-daerah yang termasuk dalam Cluster 1.
Kolaborasi Antar Instansi Kerjasama antara pemerintah pusat, daerah, dan organisasi non-pemerintah dapat mempercepat proses peningkatan literasi dan fasilitas pendidikan. Sinergi ini akan mendukung tercapainya tujuan peningkatan kualitas literasi di seluruh provinsi Indonesia.
6 DAFTAR PUSTAKA
Afira, N. & Wijayanto, A. (2021). Analisis Cluster Kemiskinan Provinsi di Indonesia Tahun 2019 dengan Metode Partitioning dan Hierarki. Jakarta: Jurnal Sistem Komputer Vol 10 No 2.
Cahyoningtyas, R. (2019). Metode Ward dan Average Linkage Clustering untuk Segmentasi Objek Wisata di Malang Raya. Malang: Universitas Brawijaya.
Fatmawati, E. (2023). Perencanaan Dasar Dalam Mengukur Kajian Indeks Pembangunan Literasi Masyarakat (IPLM) Dan Indeks Literasi Masyarakat (ILM). IQRA: Jurnal Perpustakaan dan Informasi, 17(1), 172-205.
Abidin, M. A. H., Nugroho, S. R., & Wulandari, S. P. (2024). Pengelompokan Kabupaten/Kota Berdasarkan Indeks Pembangunan Manusia Provinsi Jawa Timur Tahun 2023. Jurnal Cakrawala Akademika, 1(4), 1143-1157.
Asyfani, Y., Nur, I. M., Amri, I. F., Yunanita, N., Lestari, F. A., Hisani, Z. A., & Rohim, F. H. N. (2024). A Pengelompokan Kabupaten/Kota di Jawa Tengah Berdasarkan Kepadatan Penduduk Menggunakan Metode Hierarchical Clustering. Journal of Data Insights, 2(1), 1-8.