1 PENDAHULUAN
1.1 Latar Belakang
Pendidikan adalah salah satu indikator utama dalam menilai kualitas pembangunan suatu daerah, karena berperan penting dalam meningkatkan kualitas sumber daya manusia (SDM). Di Indonesia, Provinsi Jawa Timur merupakan salah satu wilayah dengan populasi terbesar dan tingkat keragaman sosial yang tinggi, sehingga upaya untuk meningkatkan kualitas pendidikan perlu dilakukan secara menyeluruh dan merata. Namun, setiap kabupaten/kota di Jawa Timur memiliki kondisi pendidikan yang beragam, baik dari segi infrastruktur, tingkat partisipasi masyarakat, maupun akses terhadap layanan pendidikan. Perbedaan ini mencerminkan perlunya strategi kebijakan pendidikan yang spesifik dan sesuai dengan karakteristik masing-masing daerah. Untuk memahami kondisi pendidikan di setiap kabupaten/kota secara lebih mendalam, diperlukan analisis yang mampu mengelompokkan daerah-daerah tersebut berdasarkan kesamaan kondisi pendidikannya. Salah satu metode yang efektif untuk tujuan ini adalah Analisis Cluster Hierarki, yang memungkinkan pengelompokan berdasarkan karakteristik serupa dalam berbagai dimensi pendidikan. Penelitian ini berfokus pada kondisi pendidikan masyarakat yang diukur melalui tiga variabel utama, yaitu: 1. Indeks Pembangunan Literasi Masyarakat, sebagai indikator kemampuan dasar membaca dan menulis, yang menjadi fondasi proses pembelajaran. 2. Rata-rata Lama Waktu Sekolah, mewakili tingkat partisipasi dan akses masyarakat terhadap pendidikan formal. 3. Banyaknya Perpustakaan Terakreditasi, sebagai indikator infrastruktur pendukung literasi dan akses terhadap sumber belajar. Dengan menganalisis ketiga variabel tersebut, penelitian ini bertujuan untuk mengelompokkan kabupaten/kota di Jawa Timur berdasarkan kondisi pendidikan masyarakatnya pada tahun 2023. Hasil klaster diharapkan dapat memberikan pemahaman yang lebih jelas mengenai distribusi kondisi pendidikan di Jawa Timur dan menjadi acuan dalam merancang kebijakan pendidikan yang tepat sasaran. Selain itu, hasil ini dapat membantu pemerintah dan pemangku kepentingan dalam menentukan prioritas intervensi pendidikan di daerah-daerah yang membutuhkan perhatian lebih, sehingga tercipta pemerataan pendidikan yang berkelanjutan di seluruh wilayah Jawa Timur.
1.2 Rumusan Masalah
- Bagaimana pengelompokan kabupaten/kota di Jawa Timur berdasarkan kualitas pendidikan?
- Bagaimana karakteristik kelompok yang terbentuk dari hasil pengelompokan tersebut?
- Bagaimana hasil pengelompokan tersebut dapat digunakan sebagai acuan dalam pengambilan kebijakan untuk meningkatkan kualitas pendidikan di Jawa Timur?
1.3 Tujuan
- Mengetahui hasil pengelompokan kabupaten/kota di Jawa Timur berdasarkan kualitas pendidikan.
- Mengetahui karakteristik kelompok yang terbentuk dari hasil pengelompokan kabupaten/kota di Jawa Timur berdasarkan kualitas pendidikan.
- Mengetahui rekomendasi yang dapat diberikan kepada pihak terkait dari hasil pengelompokan untuk meningkatkan kualitas pendidikan di Jawa Timur.
2 Tinjauan Pustaka
2.1 Analisis Cluster
Analisis cluster atau clustering adalah analisis untuk menemukan subkelompok atau cluster pada suatu data. Analisis cluster bertujuan untuk membagi data menjadi kelompok-kelompok di mana pengamatan dalam setiap kelompok cukup mirip satu sama lain, sementara pengamatan di kelompok yang berbeda cukup berbeda satu sama lain.
2.2 Jarak Euclidean
Jarak euclidean digunakan untuk mengukur jarak antara dua buah objek. Berikut ini rumus untuk menghitung jarak euclidean. \[ d\left ( x,y \right )=\sqrt{\left ( \mathbf{x}-\mathbf{y} \right )'\left ( \mathbf{x}-\mathbf{y} \right )} \] Keterangan:
\(\mathbf{x}'=\left [ x_{1},x_{2},...,x_{p} \right ]\): Vektor dengan \(p\) variabel untuk objek ke-\(x\).
\(\mathbf{y}'=\left [ y_{1},y_{2},...,y_{p} \right ]\): Vektor \(p\) variabel untuk objek ke-\(y\).
2.3 Indeks Validitas: Indeks Global Silhouette
Indeks validitas digunakan untuk menentukan jumlah cluster yang paling optimal. Berikut ini merupakan rumus Indeks Global Silhouette. \[ GS_{u}=\frac{1}{c}\sum_{i=1}^{c}S\left ( i \right ) \] Keterangan:
\(S\left ( i \right)\): Silhouette kelompok ke-\(i\).
\(c\): jumlah kelompok.
2.4 Analisis Cluster dengan Centroid Method
Analisis cluster dengan metode ini menggunakan jarak antara dua centroid pada tiap cluster sebagai jarak antara dua cluster. Rumus yang digunakan pada metode ini adalah sebagai berikut. \[ C_{i}=\frac{1}{M}\sum_{j=1}^{M}x_{j} \] Keterangan:
\(M\): jumlah data pada suatu kelompok.
\(i\): variabel ke-\(i\) pada suatu kelompok
2.5 Data
Data yang digunakan pada penelitian ini adalah Indeks Pembangunan Literasi Masyarakat Menurut Kabupaten/Kota di Provinsi Jawa Timur Tahun 2023, Rata-Rata Lama Sekolah Menurut Kabupaten/Kota di Indonesia Tahun 2023, dan Banyaknya Perpustakaan Terakreditasi Menurut Kabupaten/Kota di Jawa Timur Tahun 2023. Ketiga data ini dapat menggambarkan kondisi pendidikan di setiap kabupaten/kota di Jawa Timur. Data ini didapatkan dari situs resmi Badan Pusat Statistik (BPS) pusat dan Jawa Timur. Berikut ini merupakan data yang digunakan dalam penelitian ini.Tabel 1.1. Data
| Kabupaten.Kota | x1 | x2 | x3 |
|---|---|---|---|
| Pacitan | 65.16 | 7.88 | 52 |
| Ponorogo | 58.06 | 7.78 | 42 |
| Trenggalek | 84.17 | 7.90 | 134 |
| Tulungagung | 58.40 | 8.66 | 60 |
| Blitar | 69.95 | 7.83 | 119 |
| Kediri | 66.53 | 8.24 | 56 |
| Malang | 48.83 | 7.75 | 90 |
| Lumajang | 53.87 | 7.14 | 49 |
| Jember | 37.67 | 6.52 | 7 |
| Banyuwangi | 65.58 | 7.76 | 190 |
| Bondowoso | 64.28 | 6.36 | 52 |
| Situbondo | 62.81 | 6.90 | 39 |
| Probolinggo | 35.92 | 6.29 | 36 |
| Pasuruan | 47.66 | 7.44 | 21 |
| Sidoarjo | 54.83 | 10.78 | 45 |
| Mojokerto | 72.12 | 9.11 | 22 |
| Jombang | 49.18 | 8.77 | 53 |
| Nganjuk | 75.83 | 8.24 | 15 |
| Madiun | 48.87 | 7.95 | 38 |
| Magetan | 55.12 | 8.67 | 48 |
| Ngawi | 65.31 | 7.78 | 36 |
| Bojonegoro | 52.66 | 7.45 | 76 |
| Tuban | 55.44 | 7.40 | 40 |
| Lamongan | 63.86 | 8.34 | 61 |
| Gresik | 54.51 | 10.01 | 36 |
| Bangkalan | 53.92 | 5.99 | 17 |
| Sampang | 79.66 | 5.07 | 12 |
| Pamekasan | 75.02 | 7.15 | 42 |
| Sumenep | 47.09 | 5.94 | 9 |
| Kota Kediri | 63.16 | 10.69 | 11 |
| Kota Blitar | 80.75 | 10.78 | 67 |
| Kota Malang | 94.22 | 10.94 | 420 |
| Kota Probolinggo | 82.90 | 9.56 | 54 |
| Kota Pasuruan | 84.38 | 9.78 | 107 |
| Kota Mojokerto | 80.03 | 11.05 | 39 |
| Kota Madiun | 93.94 | 11.82 | 82 |
| Kota Surabaya | 84.32 | 10.70 | 331 |
| Kota Batu | 83.00 | 9.85 | 74 |
Keterangan:
\(X_{1}\): Indeks Pembangunan Literasi Masyarakat
\(X_{2}\): Rata-Rata Lama Sekolah (Tahun)
\(X_{3}\): Banyaknya Perpustakaan Terakreditasi
3 SOURCE CODE
3.1 Library yang Dibutuhkan
3.2 Impor Data
3.3 Statistika Deskriptif
> statdes <- summary(data)
> statdes
Kabupaten.Kota x1 x2 x3
Length:38 Min. :35.92 Min. : 5.070 Min. : 7.00
Class :character 1st Qu.:54.07 1st Qu.: 7.410 1st Qu.: 36.00
Mode :character Median :64.07 Median : 7.925 Median : 48.50
Mean :64.97 Mean : 8.376 Mean : 70.58
3rd Qu.:78.70 3rd Qu.: 9.725 3rd Qu.: 72.25
Max. :94.22 Max. :11.820 Max. :420.00 3.4 Analisis Cluster
3.4.1 Uji Asumsi Analisis Cluster
3.4.1.1 Asumsi Kecukupan Sampel
3.4.2 Standarisasi
> datastand <- scale(data[,2:4])
> rownames(datastand) <- 1:nrow(datastand)
> datastand
x1 x2 x3
1 0.01240301 -0.29879726 -0.22577206
2 -0.46091121 -0.35909622 -0.34729244
3 1.27968516 -0.28673746 0.77069500
4 -0.43824546 0.17153470 -0.12855576
5 0.33172344 -0.32894674 0.58841444
6 0.10373265 -0.08172097 -0.17716391
7 -1.07621969 -0.37718591 0.23600536
8 -0.74023326 -0.74500962 -0.26222818
9 -1.82018964 -1.11886322 -0.77261375
10 0.04040188 -0.37115602 1.45120910
11 -0.04626129 -1.21534157 -0.22577206
12 -0.14425733 -0.88972715 -0.38374855
13 -1.93685160 -1.25755085 -0.42020466
14 -1.15421654 -0.56411272 -0.60248522
15 -0.67623584 1.44987282 -0.31083632
16 0.47638427 0.44288005 -0.59033318
17 -1.05288730 0.23786356 -0.21362003
18 0.72370761 -0.08172097 -0.67539745
19 -1.07355313 -0.25658798 -0.39590059
20 -0.65690329 0.17756459 -0.27438021
21 0.02240260 -0.35909622 -0.42020466
22 -0.82089667 -0.55808282 0.06587683
23 -0.63557082 -0.58823230 -0.37159651
24 -0.07426016 -0.02142200 -0.11640373
25 -0.69756832 0.98557077 -0.42020466
26 -0.73690006 -1.43844776 -0.65109337
27 0.97903063 -1.99319826 -0.71185356
28 0.66970979 -0.73897972 -0.34729244
29 -1.19221500 -1.46859724 -0.74830967
30 -0.12092494 1.39560375 -0.72400560
31 1.05169436 1.44987282 -0.04349150
32 1.94965810 1.54635117 4.24617770
33 1.19502191 0.71422541 -0.20146799
34 1.29368459 0.84688314 0.44258999
35 1.00369630 1.61268004 -0.38374855
36 1.93099218 2.07698209 0.13878906
37 1.28968475 1.40163365 3.16464637
38 1.20168831 0.88909242 0.04157276
attr(,"scaled:center")
x1 x2 x3
64.973947 8.375526 70.578947
attr(,"scaled:scale")
x1 x2 x3
15.000606 1.658403 82.290728 3.4.3 Menghitung Jarak Euclidean
> jarak <- dist(datastand, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 0.4923713
3 1.6121712 2.0699776
4 0.6585949 0.5743942 1.9924736
5 0.8750853 1.2266728 0.9662501 1.1650665
6 0.2404703 0.6516927 1.5242482 0.6002012 0.8361881
7 1.1851087 0.8480378 2.4175114 0.9170661 1.4521787 1.2846384
8 0.8757259 0.4839276 2.3145224 0.9742271 1.4303120 1.0767851 0.7045692
9 2.0808507 1.6142435 3.5613844 1.9974251 2.6659137 2.2653259 1.4563272
10 1.6787750 1.8671015 1.4163506 1.7376057 0.9116274 1.6551079 1.6503334
11 0.9184198 0.9590922 1.9008909 1.4444820 1.2615340 1.1445334 1.4059010
12 0.6314247 0.6190056 1.9297535 1.1304110 1.2190706 0.8700863 1.2309944
13 2.1809645 1.7294325 3.5646640 2.0912114 2.6506699 2.3676209 1.3951134
14 1.2543151 0.7666990 2.8082803 1.1306639 1.9187399 1.4128114 0.8626074
15 1.8813045 1.8221039 2.8303979 1.3130171 2.2335695 1.7239486 1.9486320
16 0.9477704 1.2572818 1.7406986 1.0599124 1.4163648 0.7647119 1.9405985
17 1.1928939 0.8512726 2.5855322 0.6240353 1.6975512 1.2005137 0.7622291
18 0.8690451 1.2601237 1.5627943 1.3089344 1.3461028 0.7953651 2.0390422
19 1.1000119 0.6230576 2.6267061 0.8114050 1.7172403 1.2101347 0.6433165
20 0.8229546 0.5759635 2.2490294 0.2628923 1.4065387 0.8094733 0.8625936
21 0.2038136 0.4887826 1.7332736 0.7608054 1.0554150 0.3776512 1.2798085
22 0.9201502 0.5830043 2.2322278 0.8465032 1.2861112 1.0681427 0.3561703
23 0.7245050 0.2891367 2.2503188 0.8217372 1.3872665 0.9170209 0.7796743
24 0.3104979 0.5628788 1.6402757 0.4121471 0.8695762 0.1975075 1.1201263
25 1.4803596 1.3672791 2.6356292 0.9027525 1.9505667 1.3565632 1.5591967
26 1.4286905 1.1547574 2.7229643 1.7188030 1.9772021 1.6649264 1.4242046
27 2.0103828 2.2083086 2.2804280 2.6523530 2.2089447 2.1692821 2.7810046
28 0.8003624 1.1927344 1.3514766 1.4506713 1.0760619 0.8838908 1.8760066
29 1.7585739 1.3880247 3.1328036 1.9085591 2.3255156 1.9821992 1.4742828
30 1.7711600 1.8266022 2.6506811 1.3977117 2.2139131 1.5912244 2.2309174
31 2.0423515 2.3775281 1.9315006 1.9650203 2.0203619 1.8061781 2.8185600
32 5.2111289 5.5264403 3.9859826 5.1701544 4.4174299 5.0620165 5.3793507
33 1.5573674 1.9787366 1.3979254 1.7226119 1.5676118 1.3509380 2.5575574
34 1.8441730 2.2708824 1.1802307 1.9447068 1.5261749 1.6316820 2.6753446
35 2.1590193 2.4564824 2.2397983 2.0545606 2.2730075 1.9296649 2.9444375
36 3.0754214 3.4484713 2.5319313 3.0521288 2.9237505 2.8458220 3.8827458
37 4.0022308 4.3009848 2.9294539 3.9171503 3.2480101 3.8437637 4.1639694
38 1.7020443 2.1150480 1.3857412 1.7981144 1.5935790 1.4818337 2.6134517
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 1.2516252
10 1.9196419 2.9943705
11 0.8391295 1.8588076 1.8794748
12 0.6252181 1.7356464 1.9157465 0.3749461
13 1.3113163 0.3962782 2.8631131 1.9010306 1.8303053
14 0.5655800 0.8832961 2.3836958 1.3392448 1.0834612 1.0614143
15 2.1963532 2.8496094 2.6333476 2.7399766 2.4004261 2.9885208 2.0903737
16 1.7317312 2.7832571 2.2406763 1.7764465 1.4844915 2.9570452 1.9165180
17 1.0325478 1.6558788 2.0827487 1.7678373 1.4580854 1.7493811 0.8970227
18 1.6594528 2.7489140 2.2523620 1.4422589 1.2211864 2.9199785 1.9402621
19 0.6062394 1.2012067 2.1600546 1.4154436 1.1245459 1.3220445 0.3791507
20 0.9264096 1.8116834 1.9403575 1.5216550 1.1890664 1.9284939 0.9513457
21 0.8691946 2.0240020 1.8715392 0.8807241 0.5573812 2.1554345 1.2081765
22 0.3861361 1.4199041 1.6419264 1.0569334 0.8774917 1.4038825 0.7468911
23 0.2179330 1.3585675 1.9561906 0.8728210 0.5765724 1.4641317 0.5682295
24 0.9941650 2.1640838 1.6102395 1.1992453 0.9112226 2.2560045 1.3027257
25 1.7382996 2.4110399 2.4264165 2.3034800 1.9555624 2.5626973 1.6258145
26 0.7950369 1.1359656 2.4825361 0.8412232 0.8507602 1.2352801 0.9700400
27 2.1716368 2.9332214 2.8619722 1.3757034 1.6084394 3.0213582 2.5700176
28 1.4125196 2.5543705 1.9406006 0.8685058 0.8286111 2.6586452 1.8499754
29 0.9819072 0.7192056 2.7498372 1.2846766 1.2514834 0.8406409 0.9169520
30 2.2757431 3.0351948 2.8069602 2.6591064 2.3106399 3.2294139 2.2187716
31 2.8418936 3.9214464 2.5637840 2.8882695 2.6494911 4.0501189 3.0388575
32 5.7281387 6.8193392 3.8902368 5.6221860 5.6351731 6.6889423 6.1316904
33 2.4245146 3.5746220 2.2896598 2.2944724 2.0975125 3.7073412 2.7044194
34 2.6772585 3.8777689 2.0178329 2.5485160 2.4013179 3.9508760 3.0125258
35 2.9350908 3.9480219 2.8689042 3.0207737 2.7531508 4.1093036 3.0729237
36 3.9063919 5.0115314 3.3600831 3.8576977 3.6580145 5.1372950 4.1283631
37 4.5246120 5.6148233 2.7639389 4.4864516 4.4606760 5.5075363 4.9018458
38 2.5560993 3.7184045 2.2189833 2.4611977 2.2708296 3.8303718 2.8419894
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 1.5558554
17 1.2729037 1.5882746
18 2.1067810 0.5861834 1.8632397
19 1.7541680 1.7115389 0.5273856 1.8272502
20 1.2729772 1.2060511 0.4051310 1.4608663 0.6138833
21 1.9422734 0.9371281 1.2471113 0.7961715 1.1010075 0.8779101
22 2.0481029 1.7650711 0.8749107 1.7782605 0.6066076 0.8269497 0.9934911
23 2.0394161 1.5321496 0.9389057 1.4820549 0.5499156 0.7722376 0.6984233
24 1.6015265 0.8622035 1.0170502 0.9761468 1.0639586 0.6356298 0.4643949
25 0.4774860 1.3044622 0.8532261 1.7956225 1.2980422 0.8220659 1.5252827
26 2.9089261 2.2394519 1.7610368 1.9936582 1.2550901 1.6612670 1.3397201
27 3.8412837 2.4903610 3.0585232 1.9287987 2.7071649 2.7531571 1.9158512
28 2.5698199 1.2219804 1.9848002 0.7365852 1.8094281 1.6140855 0.7540784
29 2.9958446 2.5422285 1.7936872 2.3663266 1.2677694 1.7947191 1.6774807
30 0.6942796 1.1323997 1.5714355 1.7024263 1.9351721 1.4046548 1.7865637
31 1.7484897 1.2822059 2.4345788 1.6889819 2.7482499 2.1427515 2.1151178
32 5.2603235 5.1749417 5.5332824 5.3268636 5.8257434 5.3947366 5.3963106
33 2.0136395 0.8609788 2.2978608 1.0393637 2.4752203 1.9294942 1.6046498
34 2.1935894 1.3777259 2.5115565 1.5611135 2.7430876 2.1833064 1.9531919
35 1.6893769 1.2996797 2.4796371 1.7419666 2.7945081 2.1975233 2.2027637
36 2.7190195 2.3060340 3.5227952 2.6039268 3.8417099 3.2366184 3.1447839
37 3.9932632 3.9598659 4.2725506 4.1553108 4.5838943 4.1369619 4.1901469
38 1.9912976 1.0604134 2.3605791 1.2980718 2.5847031 2.0150585 1.7781811
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 0.4760647
24 0.9373885 0.8375362
25 1.6230685 1.5757736 1.2226375
26 1.1384833 0.9006955 1.6531626 2.4353075
27 2.4298476 2.1671737 2.3134138 3.4306134 1.8043996
28 1.5573504 1.3141815 1.0590987 2.2020082 1.6000318 1.3422549
29 1.2766415 1.1076136 1.9347983 2.5249295 0.4665530 2.2340194 2.0395883
30 2.2205328 2.0795812 1.5425043 0.7700257 2.9011359 3.5628681 2.3072630
31 2.7478072 2.6661563 1.8541301 1.8486236 3.4511804 3.5080944 2.2426062
32 5.4387068 5.7064607 5.0582877 5.3942012 6.3332364 6.1686791 5.2878136
33 2.3987849 2.2530889 1.4695203 1.9244147 2.9271978 2.7635645 1.5521027
34 2.5665728 2.5385985 1.7139722 2.1745659 3.2468684 3.0818516 1.8783556
35 2.8711520 2.7443323 1.9757917 1.8135315 3.5228582 3.6208590 2.3755378
36 3.8107447 3.7351181 2.9136678 2.9005143 4.4832812 4.2656995 3.1235796
37 4.2305337 4.4912347 3.8276263 4.1198835 5.1703944 5.1622322 4.1593640
38 2.4871182 2.3934741 1.5754484 1.9569676 3.1073066 2.9874449 1.7563702
29 30 31 32 33 34 35
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 3.0580877
31 3.7482483 1.3568643
32 6.6261742 5.3863495 4.3837095
33 3.2806479 1.5713173 0.7659481 4.5873152
34 3.5999150 1.9139383 0.8114376 3.9226058 0.6649384
35 3.8012105 1.1948514 0.3802432 4.7260407 0.9365108 1.1633458
36 4.8075462 2.3278864 1.0952885 4.1415648 1.5857279 1.4183086 1.1612492
37 5.4506217 4.1366013 3.2173149 1.2752325 3.4368906 2.7780128 3.5661515
38 3.4515776 1.6099595 0.5866931 4.3208970 0.2994858 0.4135937 0.8623677
36 37
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37 3.1659411
38 1.3972892 3.16607503.4.4 Koefisien Korelasi Cophenetic
> d1 <- dist(data[,2:4])
>
> #Single Linkage
> hiers <- hclust(dist(data[,2:4]), method = "single")
> #Korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.9609682
>
> #Average Linkage
> hierave <- hclust(dist(data[,2:4]), method = "ave")
> #Korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.9617085
>
> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:4]), method = "complete")
> #Korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.9393147
>
> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:4]), method = "centroid")
> #Korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.964328
>
> #Ward
> hierward <- hclust(dist(data[,2:4]), method = "ward.D")
> #Korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.9321021
>
> #Menampilkan Hasil Koefisien Korelasi Cophenetic dari Beberapa Metode
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
cors corave corcomp corcen corward
1 0.9609682 0.9617085 0.9393147 0.964328 0.93210213.4.5 Analisis Cluster Metode Centroid Linkage
3.4.5.1 Membuat Dendogram
> #Metode Centroid Linkage
> hc <- hclust(dist(scale(data[,2:4])), method = "centroid")
> hc
Call:
hclust(d = dist(scale(data[, 2:4])), method = "centroid")
Cluster method : centroid
Distance : euclidean
Number of objects: 38
> plot(hc, labels(data$Kabupaten.Kota), hang = 1, main = "Cluster Dendogram", sub = " ", xlab = "Kabupaten/Kota", ylab = "Jarak")3.4.5.2 Penentuan Jumlah Cluster
3.4.5.3 Anggota Tiap Cluster
> anggota <- data.frame(id = data$Kabupaten.Kota, cutree(hiercen, k = 2))
> colnames(anggota) <- c("Kabupaten/Kota", "Cluster")
> anggota
Kabupaten/Kota Cluster
1 Pacitan 1
2 Ponorogo 1
3 Trenggalek 1
4 Tulungagung 1
5 Blitar 1
6 Kediri 1
7 Malang 1
8 Lumajang 1
9 Jember 1
10 Banyuwangi 1
11 Bondowoso 1
12 Situbondo 1
13 Probolinggo 1
14 Pasuruan 1
15 Sidoarjo 1
16 Mojokerto 1
17 Jombang 1
18 Nganjuk 1
19 Madiun 1
20 Magetan 1
21 Ngawi 1
22 Bojonegoro 1
23 Tuban 1
24 Lamongan 1
25 Gresik 1
26 Bangkalan 1
27 Sampang 1
28 Pamekasan 1
29 Sumenep 1
30 Kota Kediri 1
31 Kota Blitar 1
32 Kota Malang 2
33 Kota Probolinggo 1
34 Kota Pasuruan 1
35 Kota Mojokerto 1
36 Kota Madiun 1
37 Kota Surabaya 2
38 Kota Batu 1
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "centroid", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)3.4.5.4 Karakteristik Setiap Cluster
> idclus = clus_hier$cluster
> idclus
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
27 28 29 30 31 32 33 34 35 36 37 38
1 1 1 1 1 2 1 1 1 1 2 1
> aggregate(data[,2:4],list(idclus),mean)
Group.1 x1 x2 x3
1 1 63.62417 8.239722 53.63889
2 2 89.27000 10.820000 375.500004 HASIL DAN PEMBAHASAN
4.1 Statistika Deskriptif
Tabel 3.1. Statistik Deskriptif
| Statistik | x1 | x2 | x3 |
|---|---|---|---|
| Min | 35.92 | 5.070 | 7.00 |
| 1st Qu. | 54.07 | 7.410 | 36.00 |
| Median | 64.07 | 7.925 | 48.50 |
| Mean | 64.97 | 8.376 | 70.58 |
| 3rd Qu. | 78.70 | 9.725 | 72.25 |
| Max | 94.22 | 11.820 | 420.00 |
- Pada variabel Indeks Pembangunan Literasi Masyarakat (X1), didapatkan nilai terendah yaitu 35.92 dan nilai tertinggi yaitu 94.22. Hal ini menunjukkan rentang yang cukup jauh, menunjukkan bahwa pembangunan literasi masyarakat belum merata di 38 kabupaten/ kota di Jawa Timur. Didapatkan juga rata-rata sebesar 64.97 dengan median sebesar 64.07, rata-rata yang tidak terlalu jauh dengan median menunjukkan data relatif simetris.
- Pada variabel Rata-Rata Lama Sekolah (X2), didapatkan nilai terendah yaitu 5.07 tahun dan nilai tertinggi yaitu 11.82 tahun. Didapatkan juga rata-rata sebesar 8.376 dengan median sebesar 7.925. Nilai rata-rata sedikit lebih tinggi dari median, menunjukkan adanya beberapa kabupaten/kota dengan pencapaian pendidikan yang lebih tinggi yang menarik rata-rata ke atas.
- Pada variabel Banyaknya Perpustakaan Terakreditasi (X3), didapatkan nilai terendah yaitu 7 tahun dan nilai tertinggi yaitu 420 tahun. Terlihat rentang yang sangat jauh dalam hal pembangunan perpustakaan, namun hal ini dapat disebabkan oleh banyak faktor termasuk luas wilayah dan jumlah penduduk di setiap kabupaten/kota di Jawa Timur yang berbeda sehingga kebutuhan perpustakaan setiap kabupaten/kota juga mungkin berbeda. Didapatkan perbedaan yang cukup jauh antara rata-rata (70.58) dan median (48.5), menunjukkan distribusi yang lebih condong ke kanan (positif skewed), menunjukkan adanya beberapa kabupaten/kota dengan jumlah perpustakaan yang jauh lebih banyak dibandingkan yang lainnya.
4.2 Uji Asumsi
4.2.1 Asumsi Kecukupan Sampel
Asumsi Kecukupan Sampel dapat diuji menggunakan Uji KMO (Kaiser Meyer Olkin). Hasil uji ini akan menunjukkan apakah sampel cukup untuk merepresentasikan populasi.Tabel 3.2. Hasil Uji KMO
| x1 | x2 | x3 | |
|---|---|---|---|
| MSA | 0.62 | 0.67 | 0.71 |
Berdasarkan Uji KMO (Kaiser Mayer Olkin), didapatkan nilai MSA (Measure of Sampling Adequancy) untuk variabel Indeks Pembangunan Literasi Masyarakat (X1), variabel Rata-Rata Lama Sekolah (X2), serta variabel Banyaknya Perpustakaan Terakreditasi (X3) bernilai lebih dari 0.5. Sehingga, dapat disimpulkan bahwa banyak sampel sudah cukup untuk dilakukan analisis cluster.
4.2.2 Asumsi Non Multikolinieritas
Asumsi analisis cluster yang kedua yaitu asumsi non multikolinieritas. Untuk melakukan pengecekan terhadap asumsi ini, dapat digunakan korelasi antar variabel. Jika nilai mutlak dari korelasi bernilai lebih dari 0.8, maka dapat dikatakan terjadi multikolinieritas.Tabel 3.3. Korelasi Antar Variabel
| x1 | x2 | x3 | |
|---|---|---|---|
| x1 | 1.0000000 | 0.5475726 | 0.4921741 |
| x2 | 0.5475726 | 1.0000000 | 0.3926793 |
| x3 | 0.4921741 | 0.3926793 | 1.0000000 |
Berdasarkan hasil tersebut, didapatkan semua korelasi antar variabel bernilai kurang dari 0.8. Sehingga, dapat disimpulkan bahwa tidak terjadi multikolinieritas.
4.3 Standarisasi Data
Sebelum melakukan analisis cluster, dilakukan standarisasi menggunakan Z-score. Standarisasi ini dilakukan karena tiap variabel memiliki satuan yang berbeda. Standarisasi ini dilakukan agar hasil cluster tidak bias karena adanya variabel tertentu yang mendominasi proses pengelompokan. Berikut ini merupakan data hasil standarisasi.Tabel 3.4. Data Hasil Standarisasi
| x1 | x2 | x3 |
|---|---|---|
| 0.0124030 | -0.2987973 | -0.2257721 |
| -0.4609112 | -0.3590962 | -0.3472924 |
| 1.2796852 | -0.2867375 | 0.7706950 |
| -0.4382455 | 0.1715347 | -0.1285558 |
| 0.3317234 | -0.3289467 | 0.5884144 |
| 0.1037327 | -0.0817210 | -0.1771639 |
| -1.0762197 | -0.3771859 | 0.2360054 |
| -0.7402333 | -0.7450096 | -0.2622282 |
| -1.8201896 | -1.1188632 | -0.7726137 |
| 0.0404019 | -0.3711560 | 1.4512091 |
| -0.0462613 | -1.2153416 | -0.2257721 |
| -0.1442573 | -0.8897271 | -0.3837485 |
| -1.9368516 | -1.2575509 | -0.4202047 |
| -1.1542165 | -0.5641127 | -0.6024852 |
| -0.6762358 | 1.4498728 | -0.3108363 |
| 0.4763843 | 0.4428801 | -0.5903332 |
| -1.0528873 | 0.2378636 | -0.2136200 |
| 0.7237076 | -0.0817210 | -0.6753974 |
| -1.0735531 | -0.2565880 | -0.3959006 |
| -0.6569033 | 0.1775646 | -0.2743802 |
| 0.0224026 | -0.3590962 | -0.4202047 |
| -0.8208967 | -0.5580828 | 0.0658768 |
| -0.6355708 | -0.5882323 | -0.3715965 |
| -0.0742602 | -0.0214220 | -0.1164037 |
| -0.6975683 | 0.9855708 | -0.4202047 |
| -0.7369001 | -1.4384478 | -0.6510934 |
| 0.9790306 | -1.9931983 | -0.7118536 |
| 0.6697098 | -0.7389797 | -0.3472924 |
| -1.1922150 | -1.4685972 | -0.7483097 |
| -0.1209249 | 1.3956038 | -0.7240056 |
| 1.0516944 | 1.4498728 | -0.0434915 |
| 1.9496581 | 1.5463512 | 4.2461777 |
| 1.1950219 | 0.7142254 | -0.2014680 |
| 1.2936846 | 0.8468831 | 0.4425900 |
| 1.0036963 | 1.6126800 | -0.3837485 |
| 1.9309922 | 2.0769821 | 0.1387891 |
| 1.2896848 | 1.4016336 | 3.1646464 |
| 1.2016883 | 0.8890924 | 0.0415728 |
4.4 Koefisien Korelasi Cophenetic
Koefisien korelasi cophenetic digunakan sebagai dasar dalam penentuan metode terbaik untuk analisis cluster. Nilai korelasi mendekati 1 menunjukkan metode tersebut adalah metode yang terbaik.Tabel 3.5. Koefisien Korelasi Cophenetic
| Metode | Koefisien Korelasi |
|---|---|
| Single Linkage | 0.9609682 |
| Average Linkage | 0.9617085 |
| Complete Linkage | 0.9393147 |
| Centroid Linkage | 0.9643280 |
| Ward’s Method | 0.9321021 |
Dari hasil di atas, didapatkan koefisien korelasi cophenetic yang terbesar yaitu pada metode centroid linkage yang bernilai 0.9643. Sehingga, analisis cluster akan dilakukan dengan metode centroid linkage.
4.5 Analisis Cluster dengan Metode Centroid Linkage
Setelah dilakukan analisis cluster dengan metode centroid linkage, didapatkan hasil dendogram sebagai berikut.Gambar 3.1. Dendogram Analisis Cluster
Gambar 3.2. Plot Jumlah Cluster yang Optimal
Dari plot di atas, didapatkan jumlah cluster yang optimal yaitu dua cluster. Maka, 38 kabupaten/kota di Jawa Timur dapat dikelompokkan menjadi dua seperti dalam tabel berikut.
Tabel 3.6. Hasil Analisis Cluster
| Kabupaten/Kota | Cluster |
|---|---|
| Pacitan | 1 |
| Ponorogo | 1 |
| Trenggalek | 1 |
| Tulungagung | 1 |
| Blitar | 1 |
| Kediri | 1 |
| Malang | 1 |
| Lumajang | 1 |
| Jember | 1 |
| Banyuwangi | 1 |
| Bondowoso | 1 |
| Situbondo | 1 |
| Probolinggo | 1 |
| Pasuruan | 1 |
| Sidoarjo | 1 |
| Mojokerto | 1 |
| Jombang | 1 |
| Nganjuk | 1 |
| Madiun | 1 |
| Magetan | 1 |
| Ngawi | 1 |
| Bojonegoro | 1 |
| Tuban | 1 |
| Lamongan | 1 |
| Gresik | 1 |
| Bangkalan | 1 |
| Sampang | 1 |
| Pamekasan | 1 |
| Sumenep | 1 |
| Kota Kediri | 1 |
| Kota Blitar | 1 |
| Kota Malang | 2 |
| Kota Probolinggo | 1 |
| Kota Pasuruan | 1 |
| Kota Mojokerto | 1 |
| Kota Madiun | 1 |
| Kota Surabaya | 2 |
| Kota Batu | 1 |
Berdasarkan hasil tersebut, didapatkan dua cluster untuk pengelompokan kabupaten/kota di Jawa Timur berdasarkan kondisi pendidikan dan anggota setiap cluster sebagai berikut. Cluster 1: Pacitan, Ponorogo, Trenggalek, Tulungagung, Blitar, Kediri, Malang, Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo, Pasururan, Sidoarjo, Mojokerto, Jombang, Nganjuk, Madiun, Magetan, Ngawi, Bojonegoro, Tuban, Lamongan, Gresik, Bangkalan, Sampang, Pamekasan, Sumenep, Kota Kediri, Kota Blitar, Kota Probolinggo, Kota Mojokerto, Kota Madiun, dan Kota Batu Cluster 2: Kota Malang dan Kota Surabaya
4.6 Karakteristik Setiap Cluster
Setelah menentukan jumlah cluster dan anggota setiap cluster, maka perlu ada karakteristik untuk setiap cluster yang dapat merepresentasikan anggota di dalam cluster tersebut. Berikut ini adalah hasil perhitungan rata-rata untuk menggambarkan karakteristik setiap cluster.Tabel 3.7. Karakteristik Setiap Cluster
| Cluster | x1 | x2 | x3 |
|---|---|---|---|
| 1 | 63.62417 | 8.239722 | 53.63889 |
| 2 | 89.27000 | 10.820000 | 375.50000 |
Dari hasil di atas, didapatkan untuk cluster 1 yang terdiri dari 36 kabupaten/kota memiliki rata-rata indeks pembangunan literasi masyarakat sebesar 63.62, rata-rata lama sekolah sebesar 8.24 tahun, serta rata-rata banyak perpustakaan terakreditasi sebanyak 53.64 perpustakaan. Sementara itu, cluster 2 yang terdiri dari 2 kota memiliki rata-rata indeks pembangunan literasi masyarakat sebesar 89.27, rata-rata lama sekolah sebesar 10.82 tahun, serta rata-rata banyak perpustakaan terakreditasi sebanyak 375.5 perpustakaan. Maka, diketahui bahwa cluster 2 memiliki karakteristik variabel dengan nilai yang lebih tinggi daripada cluster 1. Artinya, cluster 2 merupakan kelompok kota dengan kondisi pendidikan yang lebih baik dibandingkan cluster 1.
5 KESIMPULAN
- Dari hasil analisis yang telah dilakukan, dapat disimpulkan bahwa kabupaten/kota di Jawa Timur dapat dikelompokkan menjadi dua berdasarkan kondisi pendidikan. Kota Malang dan Kota Surabaya berada dalam satu cluster yang memiliki karakteristik tiap variabel bernilai lebih tinggi dibandingkan dengan cluster yang lain. Hal ini menunjukkan bahwa Kota Malang dan Kota Surabaya memiliki kondisi pendidikan yang lebih baik dan berbeda dengan 36 kabupaten/kota lainnya di Jawa Timur.
- Pemerintah dan pihak terkait lainnya perlu memberikan perhatian lebih di bidang pendidikan terutama pada 36 kabupaten/kota di Jawa Timur kecuali Kota Malang dan Kota Surabaya. Hal ini perlu dilakukan agar terjadi pemerataan kondisi pendidikan di Jawa Timur. Kendati demikian, kondisi pendidikan yang sudah baik di dua kota tersebut juga perlu dipertahankan.
6 DAFTAR PUSTAKA
Badan Pusat Statistik Provinsi Jawa Timur. (2023). Indeks Pembangunan Literasi Masyarakat dan Unsur Penyusunnya Menurut Kabupaten/Kota di Provinsi Jawa Timur. Diakses dari https://jatim.bps.go.id. Badan Pusat Statistik. (2024). Rata-rata Lama Sekolah 2022-2024. Diakses dari https://www.bps.go.id. Badan Pusat Statistik Provinsi Jawa Timur. (2023). Banyaknya Perpustakaan Terakreditasi Menurut Kabupaten/Kota di Provinsi Jawa Timur. Diakses dari https://jatim.bps.go.id. Johnson, R. A., & Wichern, D. W. (2007). Statistical analysis (6th ed.). Pearson Prentice Hall.