Pemanfaatan Teknologi Informasi dan Komunikasi (TIK), khususnya akses internet, merupakan indikator krusial dalam mengukur kemajuan digitalisasi suatu wilayah. Akses ini tidak hanya mendukung komunikasi, tetapi juga berpengaruh pada kualitas pendidikan dan kesiapan sumber daya manusia (SDM) di era digital.
Penelitian ini memfokuskan analisis pada persentase penduduk yang mengakses internet pada tiga jenjang pendidikan kunci—SMA/Sederajat, Diploma (D1–D3), serta Sarjana dan Pascasarjana (S1 ke atas)—yang merepresentasikan kelompok usia produktif dan terdidik. Ketiga jenjang ini mencerminkan potensi SDM yang tengah atau akan memasuki pasar kerja.
Data BPS tahun 2024 menunjukkan variabilitas signifikan antar provinsi dalam persentase akses internet pada ketiga jenjang pendidikan tersebut. Fenomena ini menegaskan adanya disparitas multidimensional, di mana profil akses internet suatu provinsi tidak dapat digambarkan hanya dari satu jenjang pendidikan.
Kondisi tersebut menimbulkan kebutuhan untuk memahami pola pengelompokan alami antar provinsi. Mengidentifikasi provinsi dengan karakteristik akses internet yang serupa menjadi penting agar kebijakan yang dihasilkan lebih terarah, efisien, dan tepat sasaran. Analisis cluster hierarki dipilih karena mampu memetakan struktur internal data multivariat, sehingga pembentukan tipologi provinsi dapat dilakukan secara objektif.
Dengan demikian, studi ini berupaya menjawab tantangan disparitas digital melalui identifikasi kelompok provinsi berdasarkan profil akses internet tahun 2024 pada jenjang SMA hingga S1 ke atas.
Tujuan dari penelitian ini adalah sebagai berikut:
Mengidentifikasi dan mengelompokkan provinsi di Indonesia menjadi beberapa cluster yang homogen berdasarkan indikator persentase penduduk usia 5 tahun ke atas yang mengakses internet pada jenjang SMA/Sederajat, D1-D3, dan S1 ke atas (Tahun 2024).
Menjelaskan karakteristik profil akses internet dari masing-masing cluster provinsi yang terbentuk dari hasil analisis cluster hierarki.
Hasil penelitian ini diharapkan memberikan manfaat sebagai berikut:
Memperkaya studi penerapan analisis cluster (khususnya Hierarchical Clustering) dalam bidang statistik regional, dengan fokus pada pengujian efektivitas metode linkage terbaik pada data multi-variabel yang melibatkan persentase akses internet pada berbagai jenjang pendidikan.
Memberikan informasi yang jelas mengenai tipologi provinsi yang menunjukkan adanya kesenjangan digital berdasarkan profil akses internet pada jenjang SMA, D1-D3, dan S1 ke atas (Tahun 2024). Tipologi ini berfungsi sebagai pemetaan komprehensif atas kondisi digitalisasi masyarakat terdidik di setiap provinsi.
Analisis cluster adalah teknik statistika multivariat yang bertujuan untuk mengelompokkan objek-objek (kasus, individu, atau variabel) ke dalam kelompok-kelompok (Cluster) sehingga objek dalam satu kelompok memiliki kemiripan yang lebih besar satu sama lain dibandingkan objek di kelompok lain (Hair, dkk., 2014). Tujuannya adalah untuk mengungkap struktur pengelompokan tersembunyi dalam data, yang tidak dapat dilihat secara langsung (Johnson & Wichern, 2007). Metode ini sangat penting dalam riset eksploratori karena tidak memerlukan asumsi awal mengenai keanggotaan kelompok (Rencher, 2002).
Metode cluster hierarki adalah prosedur pengelompokan yang membangun struktur hierarki cluster atau pohon cluster, yang disebut Dendrogram. Metode ini dibagi menjadi dua jenis utama (Kaufman & Rousseeuw, 1990):
Agnes (Agglomerative Nesting) Pendekatan “bottom-up” yang dimulai dari setiap objek sebagai cluster individu, lalu menggabungkan cluster terdekat secara bertahap hingga semua objek berada dalam satu cluster besar.
Diana (Divisive Analysis) Pendekatan “top-down” yang dimulai dengan satu cluster besar yang berisi semua objek, lalu membaginya secara bertahap menjadi cluster-cluster yang lebih kecil.
Beberapa algoritma pengukuran jarak yang umum digunakan dalam cluster hierarki meliputi single linkage, complete linkage, average linkage, dan ward (Everitt, dkk., 2011).
Metode cluster non-hierarki (Non-Hierarchical Clustering) memerlukan penentuan jumlah Cluster di awal analisis (Timm, 2002). Objek-objek kemudian dialokasikan ke salah satu cluster berdasarkan kedekatannya dengan pusat cluster tersebut. Metode yang paling populer adalah k-Means clustering (MacQueen, 1967). Algoritma ini bekerja dengan menginisiasi pusat cluster awal dan kemudian mengalokasikan objek ke pusat terdekat, lalu menghitung kembali pusat baru, dan mengulang proses ini hingga pusat cluster tidak lagi bergeser atau kriterium konvergensi terpenuhi (Hartigan & Wong, 1979). Meskipun k-Means cepat dan efisien untuk data besar, hasilnya sangat sensitif terhadap inisiasi pusat cluster awal (Peña, dkk., 1999).
Data yang digunakan dalam penelitian ini adalah data kuantitatif yang bersumber dari Badan Pusat Statistik (BPS) Republik Indonesia, khususnya dari tabel resmi ” Persentase Penduduk Usia 5 Tahun ke Atas yang Pernah Mengakses Internet dalam 3 Bulan Terakhir menurut Provinsi dan Jenjang Pendidikan yang Sedang Diduduki (Persen), 2024”.
Data ini diakses melalui laman resmi BPS (https://www.bps.go.id/id/statistics-table/2/MTY5OCMy/persentase-penduduk-usia-5-tahun-ke-atas--yang-pernah-mengakses-internet-dalam-3-bulan-terakhir-menurut-provinsi-dan-jenjang-pendidikan-yang-sedang-diduduki--persen-.html).
Data tersebut meliputi 38 Provinsi di Indonesia dan berfokus pada tiga variabel utama yang akan digunakan sebagai dasar perhitungan jarak dan pembentukan cluster.
| Provinsi | SMA | D1-D3 | S1 ke atas |
|---|---|---|---|
| Aceh | 40.60 | 3.60 | 18.82 |
| Sumatera Utara | 45.34 | 2.51 | 13.49 |
| Sumatera Barat | 37.00 | 3.13 | 15.66 |
| Riau | 36.52 | 1.81 | 13.14 |
| Jambi | 35.13 | 1.90 | 13.54 |
| Sumatera Selatan | 36.46 | 2.29 | 10.59 |
| Bengkulu | 34.64 | 2.35 | 17.50 |
| Lampung | 34.91 | 1.71 | 9.36 |
| Kep. Bangka Belitung | 38.55 | 2.53 | 9.79 |
| Kep. Riau | 44.11 | 2.36 | 13.68 |
| Dki Jakarta | 46.99 | 3.85 | 17.99 |
| Jawa Barat | 35.44 | 2.14 | 10.76 |
| Jawa Tengah | 32.08 | 1.83 | 10.01 |
| Di Yogyakarta | 35.95 | 3.86 | 21.18 |
| Jawa Timur | 35.66 | 1.68 | 13.26 |
| Banten | 38.91 | 2.08 | 11.16 |
| Bali | 37.34 | 5.81 | 15.80 |
| Nusa Tenggara Barat | 35.23 | 1.84 | 14.33 |
| Nusa Tenggara Timur | 29.22 | 2.99 | 16.72 |
| Kalimantan Barat | 33.42 | 2.37 | 10.35 |
| Kalimantan Tengah | 29.73 | 1.83 | 12.67 |
| Kalimantan Selatan | 31.75 | 1.93 | 12.41 |
| Kalimantan Timur | 40.03 | 3.10 | 13.69 |
| Kalimantan Utara | 36.13 | 1.78 | 13.96 |
| Sulawesi Utara | 43.33 | 2.05 | 16.62 |
| Sulawesi Tengah | 30.07 | 2.42 | 18.23 |
| Sulawesi Selatan | 35.21 | 2.34 | 17.59 |
| Sulawesi Tenggara | 30.77 | 2.30 | 20.34 |
| Gorontalo | 28.61 | 2.32 | 18.35 |
| Sulawesi Barat | 29.80 | 2.11 | 16.95 |
| Maluku | 40.92 | 2.96 | 22.96 |
| Maluku Utara | 37.51 | 2.82 | 19.39 |
| Papua Barat | 39.72 | 3.06 | 17.57 |
| Papua Barat Daya | 43.45 | 2.29 | 21.54 |
| Papua | 43.43 | 3.50 | 23.06 |
| Papua Selatan | 43.98 | 2.69 | 19.54 |
| Papua Tengah | 45.31 | 3.52 | 18.06 |
| Papua Pegunungan | 44.85 | 7.27 | 18.87 |
library(psych)
library(clValid)
library(ggplot2)
library(cluster)
library(factoextra)
library(readxl)
library(corrplot)
library(colorspace)
library(dendextend)
Berikut adalah penjelasan kegunaan masing-masing library yang digunakan dalam analisis:
library(psych)
Digunakan untuk berbagai analisis statistik, termasuk uji KMO dan
pengujian kelayakan sampel dalam analisis multivariat.
library(clValid)
Mengaktifkan fungsi untuk melakukan validasi cluster secara internal,
termasuk pemilihan metode linkage dan jumlah cluster optimal.
library(ggplot2)
Paket visualisasi yang digunakan untuk membuat grafik eksplorasi data
tambahan dalam proses analisis.
library(cluster)
Menyediakan fungsi untuk melakukan hierarchical clustering, perhitungan
jarak, dan menghitung nilai cophenetic correlation.
library(factoextra)
Membantu dalam menampilkan dan mengekstrak hasil clustering secara
visual, seperti dendrogram dan plot pembentukan cluster.
library(readxl)
Digunakan untuk membaca file Excel yang berisi data penelitian dari
BPS.
library(corrplot)
Digunakan untuk memvisualisasikan matriks korelasi guna mendukung
analisis asumsi multikolinieritas antarvariabel.
library(colorspace)
Berfungsi dalam pengaturan palet warna dan manipulasi warna pada
visualisasi grafik.
library(dendextend)
Paket yang digunakan untuk memodifikasi, memperindah, dan mewarnai
dendrogram hasil analisis cluster hierarki sehingga lebih
informatif.
data <- read_excel("C:/Users/Downloads/Persentase Penduduk Usia 5 Tahun ke Atas yang Pernah Mengakses Internet dalam 3 Bulan Terakhir menurut Provinsi dan Jenjang Pendidikan yang Sedang Diduduki, 2024.xlsx")
data <- data.frame(data)
read_excel() untuk membaca file excel dari lokasi yang ditentukan ke dalam variabel yang diberi nama data.
data.frame() digunakan untuk tabel data 2 dimensi di R.
statdes <- summary(data)
statdes
kmo <- KMO(data[,2:4])
kmo
Mengukur Kaiser-Meyer-Olkin (KMO) untuk melihat apakah variabel memiliki kecukupan sampel yang memadai untuk analisis cluster.
korelasi <- cor(data[,2:4], method = 'pearson')
korelasi
corrplot(korelasi, method="number")
cor() untuk menghitung matriks korelasi Pearson antarvariabel.
corplot() sebagai visualisasi dari matriks korelasi
datastand <- scale(data[,2:4])
datastand
rownames(datastand) <- 1:nrow(datastand)
scale() untu menstandarisasi data agar setiap variabel memiliki skala yang sama sebelum dilakukan Clustering.
rownames() <- 1:nrow() agar lebih mudah dibaca.
jarak <- dist(datastand, method = "euclidean")
print(jarak, max = 100)
d1 <- dist(data[,2:4])
hiers <- hclust(dist(data[,2:4]), method = "single")
hc1 <- hclust(d1, "single")
d2 <- cophenetic(hc1)
cors <- cor(d1,d2)
cors
hierave <- hclust(dist(data[,2:4]), method = "ave")
hc2 <- hclust(d1, "ave")
d3 <- cophenetic(hc2)
corave <- cor(d1,d3)
corave
hiercomp <- hclust(dist(data[,2:4]), method = "complete")
hc3 <- hclust(d1, "complete")
d4 <- cophenetic(hc3)
corcomp <- cor(d1,d4)
corcomp
hiercen <- hclust(dist(data[,2:4]), method = "centroid")
hc4 <- hclust(d1, "centroid")
d5 <- cophenetic(hc4)
corcen <- cor(d1,d5)
corcen
hierward <- hclust(dist(data[,2:4]), method = "ward.D")
hc5 <- hclust(d1,"ward.D")
d6 <- cophenetic(hc5)
corward <- cor(d1,d6)
corward
Perbandingan Nilai Korelasi Cophenetic
KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
KorCop
Analisis ini membantu memilih metode linkage yang paling sesuai berdasarkan korelasi cophenetic tertinggi, sehingga hasil klasterisasi lebih akurat dalam merepresentasikan struktur jarak data.
inval <- clValid(datastand, 2:4, clMethods = "hierarchical",
validation = "internal", metric = "euclidean", method = "average")
summary(inval)
optimalScores(inval)
plot(inval)
Melakukan validasi internal untuk menentukan jumlah cluster optimal dan metode terbaik.
hirave <- hclust(dist(scale(data[,2:4])), method = "average")
hirave
anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = 2))
anggotaave
Melakukan analisis hierarchical clustering menggunakan metode single linkage.
hc <- hclust(dist(datastand), method = "average")
dend <- as.dendrogram(hc)
dend <- color_branches(dend, k = 2)
plot(dend, main = "Cluster Dendogram")
Memvisualisasikan dendogram berdasarkan klaster yang sudah ditentukan.
clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2,
hc_method = "average", graph = TRUE)
idclus = clus_hier$cluster
idclus
aggregate(data[,2:4],list(idclus),mean)
Mengidentifikasikan karateristik setiap klaster yang terbentuk serta membandingkan setiap klasternya.
Provinsi SMA D1.D3 S1.ke.atas
Length:38 Min. :28.61 Min. :1.680 Min. : 9.36
Class :character 1st Qu.:34.71 1st Qu.:2.058 1st Qu.:13.17
Mode :character Median :36.49 Median :2.355 Median :16.21
Mean :37.32 Mean :2.709 Mean :15.76
3rd Qu.:40.84 3rd Qu.:3.042 3rd Qu.:18.32
Max. :46.99 Max. :7.270 Max. :23.06
Berdasarkan hasil statistik deskriptif, variabel persentase akses internet pada jenjang SMA memiliki nilai minimum sebesar 28.61% dan maksimum 46.99%, dengan rata-rata 37.32%. Nilai ini menunjukkan adanya variasi yang cukup besar antarprovinsi dalam pemanfaatan internet oleh pelajar SMA. Pada jenjang D1–D3, nilai minimum tercatat 1.68% dan maksimum 7.27%, dengan rata-rata hanya 2.71%, yang mengindikasikan bahwa akses internet pada kelompok ini relatif rendah dan lebih homogen dibandingkan jenjang lainnya. Sementara itu, pada jenjang S1 ke atas, persentase akses internet berada pada rentang 9.36% hingga 23.06%, dengan rata-rata 15.76%. Rentang yang cukup lebar pada jenjang S1 ke atas menunjukkan adanya ketimpangan pemanfaatan internet di antara provinsi dengan tingkat pendidikan tinggi. Secara keseluruhan, ketiga variabel menunjukkan variasi yang berbeda, sehingga memberikan gambaran yang komprehensif mengenai disparitas akses internet antarprovinsi di Indonesia.
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA = 0.62
MSA for each item =
SMA D1.D3 S1.ke.atas
0.65 0.59 0.65
Kriteria umum dalam analisis multivariat menetapkan bahwa nilai KMO harus berada di atas 0.5 agar data dianggap layak dan memadai untuk dilakukan analisis lebih lanjut. Karena uji KMO masing-masing variabel bernilai > 0.5, sehingga sampel telah cukup dan dapat dilakukan analisis cluster.
SMA D1.D3 S1.ke.atas
SMA 1.0000000 0.4190227 0.2713391
D1.D3 0.4190227 1.0000000 0.4155717
S1.ke.atas 0.2713391 0.4155717 1.0000000
Berdasarkan matriks korelasi dan plot korelasi, seluruh pasangan variabel memiliki nilai korelasi di bawah 0.8, yaitu 0.42 untuk hubungan SMA–D1/D3, 0.27 untuk SMA–S1 ke atas, dan 0.42 untuk D1/D3–S1 ke atas. Karena tidak ada nilai korelasi yang mendekati 1 ataupun melampaui batas 0.8, maka dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel. Hal ini menunjukkan bahwa ketiga variabel akses internet pada jenjang pendidikan tersebut tidak saling mendominasi, sehingga masing-masing memberikan informasi yang unik dan layak digunakan secara bersamaan dalam analisis cluster.
SMA D1.D3 S1.ke.atas
[1,] 0.636587588 0.80060117 0.79998465
[2,] 1.556091650 -0.17846291 -0.59405210
[3,] -0.061769926 0.37843592 -0.02649867
[4,] -0.154884262 -0.80721966 -0.68559297
[5,] -0.424527858 -0.72637951 -0.58097483
[6,] -0.166523554 -0.37607218 -1.35253363
[7,] -0.519582075 -0.32217874 0.45474478
[8,] -0.467205261 -0.89704206 -1.67423442
[9,] 0.238911781 -0.16049843 -1.56176992
[10,] 1.317486165 -0.31319650 -0.54435848
[11,] 1.876172177 1.02515716 0.58290201
[12,] -0.364391516 -0.51080577 -1.30807092
[13,] -1.016191863 -0.78925519 -1.50422994
[14,] -0.265457535 1.03413939 1.41723170
[15,] -0.321714112 -0.92398878 -0.65420753
[16,] 0.308747533 -0.56469920 -1.20345278
[17,] 0.004186061 2.78567606 0.01011768
[18,] -0.405129038 -0.78027295 -0.37435400
[19,] -1.570998111 0.25268457 0.25073940
[20,] -0.756247677 -0.30421426 -1.41530452
[21,] -1.472064130 -0.78925519 -0.80851929
[22,] -1.080207969 -0.69943279 -0.87652108
[23,] 0.526014315 0.35148921 -0.54174303
[24,] -0.230539659 -0.83416638 -0.47112578
[25,] 1.166175371 -0.59164592 0.22458487
[26,] -1.406108142 -0.25930307 0.64567289
[27,] -0.409008802 -0.33116098 0.47828386
[28,] -1.270316403 -0.36708994 1.19753360
[29,] -1.689330912 -0.34912546 0.67705834
[30,] -1.458484956 -0.53775249 0.31089484
[31,] 0.698663812 0.22573786 1.88278243
[32,] 0.037164055 0.09998651 0.94906551
[33,] 0.465877974 0.31556025 0.47305296
[34,] 1.189453954 -0.37607218 1.51138802
[35,] 1.185574190 0.71077878 1.90893697
[36,] 1.292267700 -0.01678261 0.98829731
[37,] 1.550272004 0.72874326 0.60121018
[38,] 1.461037432 4.09708300 0.81306192
attr(,"scaled:center")
SMA D1.D3 S1.ke.atas
37.318421 2.708684 15.761316
attr(,"scaled:scale")
SMA D1.D3 S1.ke.atas
5.154953 1.113308 3.823429
Hasil standarisasi pada ketiga variabel menunjukkan bahwa seluruh data telah dikonversi ke dalam bentuk z-score, yaitu nilai dengan rata-rata 0 dan simpangan baku 1. Nilai positif pada hasil standarisasi menandakan bahwa provinsi tersebut memiliki nilai akses internet di atas rata-rata nasional, sedangkan nilai negatif menunjukkan nilai di bawah rata-rata nasional untuk variabel terkait
Matriks Jarak
1 2 3 4 5 6 7
2 1.9358183
3 1.1614652 1.8027006
4 2.3277578 1.8251447 1.3597260
5 2.3161790 2.0550516 1.2882757 0.3003128
6 2.5812560 1.8925503 1.5292562 0.7942503 0.8857677
7 1.6481971 2.3300323 0.9654264 1.2917583 1.1158533 1.8422297
8 3.1972037 2.4035141 2.1227941 1.0406846 1.1073227 0.6821367 2.2058476
9 2.5806478 1.6345529 1.6546654 1.1580197 1.3123767 0.5046084 2.1605057
10 1.8738801 0.2784873 1.6275385 1.5594489 1.7907188 1.6909717 2.0911977
11 1.2783271 1.7135851 2.1319562 3.0152736 3.1170035 3.1435586 2.7516135
12 2.6768724 2.0756999 1.5889487 0.7205784 0.7607609 0.2434785 1.7796582
13 3.2509580 2.7960925 2.1114245 1.1884191 1.0983714 0.9569055 2.0742140
14 1.1176848 2.9721555 1.5986848 2.7972667 2.6678755 3.1096760 1.6824266
15 2.4509646 2.0212823 1.4689791 0.2060395 0.2344848 0.9010860 1.2771461
16 2.4464844 1.4409771 1.5530641 0.7361721 0.9753523 0.5326236 1.8693756
17 2.2280808 3.3999341 2.4084219 3.6630884 3.5871605 3.4471165 3.1828899
18 2.2278707 2.0632085 1.2575790 0.4002727 0.2144131 1.0849637 0.9541250
19 2.3399396 3.2677594 1.5396247 2.0013730 1.7218331 2.2222440 1.2155500
20 2.8404425 2.4570678 1.6961994 1.0710422 0.9921530 0.5973929 1.8850511
21 3.0921417 3.0965773 1.9909768 1.3230255 1.0738073 1.4734680 1.6496116
22 2.8298693 2.7020870 1.7092557 0.9509445 0.7197153 1.0798006 1.4929470
23 1.4192115 1.1595882 0.7821082 1.3516368 1.4376615 1.2908662 1.5937654
24 2.2450159 1.9071207 1.3025286 0.2290110 0.2476212 0.9954035 1.0967740
25 1.5968407 0.9964544 1.5849137 1.6186705 1.7881321 2.0760205 1.7226039
26 2.3064724 3.2121770 1.6327189 1.9073654 1.6390012 2.3543649 0.9090299
27 1.5740549 2.2438451 0.9375009 1.2828953 1.1306934 1.8473518 0.1134073
28 2.2710858 3.3517073 1.8747396 2.2325028 2.0018840 2.7787195 1.0570498
29 2.5974755 3.4896440 1.9165836 2.1026639 1.8233746 2.5375011 1.1909919
30 2.5337183 3.1679157 1.7041269 1.6628215 1.3784335 2.1124155 0.9740141
31 1.2275065 2.6520313 2.0608082 2.8969118 2.8702242 3.4026452 1.9554097
32 0.9340207 2.1830912 1.0193368 1.8793653 1.7991842 2.3591268 0.8558871
33 0.6093364 1.6035392 0.7293267 1.7287108 1.7289984 2.0520852 1.1739581
34 1.4819974 2.1462411 2.1213060 2.6114860 2.6656397 3.1687099 2.0100258
35 1.2406569 2.6819747 2.3264200 3.2913119 3.2950741 3.6941310 2.4676373
36 1.0646569 1.6123192 1.7376497 2.3496698 2.4317750 2.7814835 1.9133073
37 0.9378134 1.5005695 1.7650532 2.6310839 2.7230090 2.8257953 2.3259805
38 3.3980408 4.5021437 4.1051358 5.3767420 5.3632533 5.2295197 4.8560395
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 1.0265213
10 2.1914878 1.4905588
11 3.7790121 2.9472052 1.8368551
12 0.5420561 0.7423296 1.8576918 3.3098469
13 0.5847271 1.4049666 2.5678859 4.0017473 0.7354292
14 3.6506611 3.2489996 2.8581219 2.2984265 3.1343130 3.5246713
15 1.0307030 1.3118264 1.7527440 3.1875247 0.7746476 1.1058890 2.8510158
16 0.9665350 0.5446526 1.2309397 2.8592878 0.6833488 1.3770827 3.1231368
17 4.0769676 3.3475171 3.4110427 2.6328389 3.5693505 4.0142936 2.2628650
18 1.3065901 1.4862253 1.7928929 3.0627197 0.9726764 1.2845614 2.5536992
19 2.4991507 2.5945489 3.0488922 3.5482431 2.1139316 2.1150333 1.9172408
20 0.7085443 1.0160948 2.2492220 3.5622594 0.4557744 0.5574436 3.1710135
21 1.3307224 1.9723489 2.8421829 4.0544829 1.2466052 0.8317649 3.1200376
22 1.0252650 1.5811683 2.4512135 3.7207942 0.8568597 0.6373261 2.9883763
23 1.9564898 1.1768662 1.0335577 1.8819089 1.4572692 2.1461777 2.2203650
24 1.2277762 1.3651805 1.6349791 3.0010487 0.9071690 1.2986803 2.6566294
25 2.5232348 2.0583414 0.8316868 1.8018154 2.1675341 2.7911605 2.4728844
26 2.5826768 2.7547517 2.9727168 3.5252152 2.2283496 2.2483252 1.8892803
27 2.2264194 2.1472648 2.0067150 2.6594353 1.7959194 2.1234130 1.6632123
28 3.0286776 3.1518575 3.1199062 3.4952131 2.6682219 2.7463301 1.7382325
29 2.7059899 2.9607519 3.2456277 3.8223462 2.3921419 2.3248331 2.1186537
30 2.2477684 2.5554549 2.9134000 3.6927784 1.9541793 1.8850875 2.2623306
31 3.9079732 3.4964970 2.5621094 1.9275078 3.4429825 3.9297320 1.3415590
32 2.8513430 2.5323604 2.0100398 2.0909250 2.3725469 2.8140661 1.0878424
33 2.6366440 2.1020584 1.4682294 1.5825689 2.1318139 2.7068055 1.3938010
34 3.6282392 3.2240196 2.0606890 1.8157951 3.2221014 3.7589288 2.0283810
35 4.2609723 3.7014997 2.6616883 1.5277853 3.7740962 4.3298480 1.5658318
36 3.3105403 2.7627985 1.5612594 1.2613200 2.8743496 3.4840195 1.9274153
37 3.4483388 2.6812123 1.5659359 0.4409164 2.9745206 3.6501965 2.0139592
38 5.9030541 5.0259742 4.6166831 3.1083820 5.3911070 5.9483449 3.5675523
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 0.9100776
17 3.7827440 3.5763844
18 0.3254693 1.1151218 3.6098961
19 1.9401545 2.5132121 2.9925156 1.6783902
20 1.0734097 1.1166684 3.4867621 1.1972862 1.9364031
21 1.1684479 1.8378488 3.9534307 1.1519248 1.4891123 1.0563362
22 0.8216822 1.4332602 3.7560648 0.8452446 1.5550301 0.7425871 0.4077298
23 1.5356223 1.1508544 2.5499256 1.4751043 2.2439367 1.6844146 2.3162005
24 0.2233826 0.9485495 3.6592282 0.2067625 1.8706050 1.2036161 1.2873362
25 1.7596997 1.6658932 3.5780608 1.6921305 2.8645587 2.5431407 2.8401868
26 1.8186277 2.5403273 3.4153709 1.5211258 0.6673024 2.1614725 1.5491528
27 1.2812501 1.8433536 3.1787706 0.9636949 1.3201785 1.9253514 1.7308377
28 2.1538170 2.8804909 3.6019781 1.8412224 1.1708754 2.6636710 2.0598966
29 1.9932668 2.7522921 3.6248848 1.7147975 0.7469443 2.2914283 1.5645638
30 1.5404055 2.3274633 3.6434943 1.2798206 0.8006676 1.8781484 1.1473997
31 2.9663716 3.2096220 3.2469149 2.7064887 2.7956494 3.6434865 3.6035227
32 1.9359244 2.2691187 2.8452836 1.6498240 1.7598754 2.5264849 2.4814562
33 1.8513507 1.9000574 2.5551792 1.6363380 2.0499368 2.3331536 2.5726765
34 2.6969697 2.8603469 3.6953112 2.5024181 3.0991395 3.5151739 3.5547670
35 3.3932422 3.4760091 3.0506379 3.1570539 3.2493323 3.9813898 4.0862834
36 2.4750318 2.4639994 3.2357015 2.3067058 2.9689889 3.1711723 3.3862655
37 2.7949828 2.5438524 2.6402168 2.6556447 3.1767576 3.2331665 3.6641741
38 5.5265038 5.2082931 2.1182360 5.3554771 4.9283715 5.4086401 5.9252773
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 1.9484515
24 0.9510177 1.4082400
25 2.5040548 1.3735241 1.5791271
26 1.6177143 2.3486424 1.7203687 2.6276243
27 1.5561584 1.5429629 1.0891484 1.6166078 1.0136024
28 2.1090983 2.6015847 2.0208217 2.6331629 0.5784528 1.1227029
29 1.7050968 2.6237554 1.9187661 2.9012867 0.2987779 1.2957850 0.6684238
30 1.2566585 2.3358038 1.4856874 2.6266320 0.4385815 1.0826354 0.9223131
31 3.4108769 2.4339156 2.7436654 1.9069091 2.4891303 1.8734170 2.1674625
32 2.2848102 1.5889425 1.7208283 1.5092694 1.5179495 0.7788413 1.4104616
33 2.2895289 1.0172110 1.6426632 1.1726789 1.9658580 1.0879810 2.0013132
34 3.3102926 2.2770254 2.4812483 1.3049430 2.7386201 1.9037869 2.4797289
35 3.8576213 2.5631895 3.1712667 2.1292554 3.0419915 2.3822472 2.7747602
36 3.0938972 1.7503690 2.2620730 0.9641700 2.7308313 1.8036877 2.5948665
37 3.3380835 1.5804324 2.6007463 1.4257645 3.1174342 2.2309839 3.0841808
38 5.6849963 4.0913613 5.3691519 4.7347046 5.2179155 4.8185573 5.2475663
29 30 31 32 33 34 35
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 0.4721713
31 2.7361939 2.7761554
32 1.8045704 1.7466937 1.1511831
33 2.2645862 2.1113054 1.4316405 0.6759109
34 2.9973713 2.9118559 0.8608043 1.3677026 1.4422404
35 3.3024236 3.3322091 0.6877721 1.6165600 1.6540626 1.1572836
36 3.0161651 2.8804381 1.1005841 1.2611341 1.0290036 0.6428713 1.1782642
37 3.4150521 3.2773332 1.6188509 1.6750624 1.1674994 1.4762217 1.3577469
38 5.4508795 5.5006802 4.0881327 4.2453142 3.9250303 4.5354751 3.5698569
36 37
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37 0.8787556
38 4.1210534 3.3761748
Matriks jarak Euclidean menunjukkan besarnya perbedaan atau kedekatan antarprovinsi berdasarkan tiga variabel akses internet yang telah distandarisasi. Nilai jarak yang kecil menandakan bahwa dua provinsi memiliki karakteristik akses internet yang mirip, sedangkan nilai jarak yang besar menunjukkan perbedaan yang lebih jauh.
Perbandingan Koefisien Korelasi Cophenetic
cors corave corcomp corcen corward
1 0.6448668 0.7477576 0.7354316 0.7359059 0.7242906
Koefisien korelasi cophenetic digunakan untuk menentukan metode linkage yang paling mampu merepresentasikan struktur jarak asli antar objek. Semakin mendekati nilai 1, semakin baik metode tersebut mencerminkan pola kedekatan data sebenarnya. Berdasarkan hasil perhitungan, metode average linkage memiliki nilai korelasi cophenetic tertinggi yaitu 0.7478, lebih tinggi dibandingkan single, complete, centroid, maupun ward. Dengan demikian, metode average linkage dinilai sebagai metode yang paling optimal untuk digunakan dalam proses pengelompokan pada penelitian ini.
Hasil Uji
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4
Validation Measures:
2 3 4
hierarchical Connectivity 3.8579 11.3063 13.3063
Dunn 0.5146 0.2471 0.2471
Silhouette 0.4903 0.3950 0.3664
Optimal Scores:
Score Method Clusters
Connectivity 3.8579 hierarchical 2
Dunn 0.5146 hierarchical 2
Silhouette 0.4903 hierarchical 2
Score Method Clusters
Connectivity 3.8579365 hierarchical 2
Dunn 0.5145864 hierarchical 2
Silhouette 0.4903424 hierarchical 2
Plot Indeks Validitas
Berdasarkan hasil validasi internal dan plot menggunakan indeks Connectivity, Dunn, dan Silhouette, seluruh ukuran menunjukkan bahwa jumlah cluster yang paling optimal adalah dua cluster. Hal ini terlihat dari nilai Connectivity terendah, nilai Dunn tertinggi, serta nilai Silhouette tertinggi yang semuanya diperoleh pada jumlah cluster 2. Dengan demikian, konfigurasi dua cluster merupakan hasil pengelompokan terbaik untuk data akses internet pada berbagai jenjang pendidikan.
Terlihat bahwa pemisahan utama terjadi pada ketinggian sekitar 4, yang membagi provinsi menjadi dua cluster besar. Kelompok pertama (di sisi kiri) berisi beberapa provinsi yang memiliki karakteristik akses internet yang paling berbeda dibandingkan provinsi lainnya, terlihat dari cabang yang terpisah lebih tinggi. Kelompok kedua (di sisi kanan) berisi mayoritas provinsi yang memiliki pola akses internet yang relatif lebih mirip satu sama lain, ditandai dengan cabang-cabang yang bergabung pada ketinggian yang lebih rendah.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1
27 28 29 30 31 32 33 34 35 36 37 38
1 1 1 1 1 1 1 1 1 1 1 2
Group.1 SMA D1.D3 S1.ke.atas
1 1 37.10861 2.495833 15.67389
2 2 41.09500 6.540000 17.33500
Cluster 1 menunjukkan nilai rata-rata persentase akses internet sebesar 37.11% pada jenjang SMA, 2.50% pada jenjang D1–D3, dan 15.67% pada jenjang S1 ke atas. Nilai-nilai tersebut mengindikasikan bahwa provinsi yang masuk dalam cluster ini memiliki tingkat pemanfaatan internet yang relatif lebih rendah pada seluruh jenjang pendidikan dibandingkan cluster lainnya.
Cluster 2 memiliki rata-rata akses internet yang lebih tinggi, yaitu 41.10% pada jenjang SMA, 6.54% pada jenjang D1–D3, dan 17.34% pada jenjang S1 ke atas. Hal ini menunjukkan bahwa provinsi dalam cluster 2 berada pada kategori pemanfaatan internet yang lebih baik, terutama pada jenjang D1–D3 yang memiliki perbedaan paling mencolok antara kedua cluster.
Berdasarkan analisis cluster menggunakan metode average linkage, provinsi di Indonesia terbagi menjadi dua kelompok dengan karakteristik yang berbeda.
Cluster 1 memiliki rata-rata persentase akses internet yang lebih rendah pada seluruh jenjang pendidikan, yaitu 37.11% untuk SMA, 2.50% untuk D1–D3, dan 15.67% untuk S1 ke atas. Hal ini menunjukkan bahwa provinsi dalam cluster ini masih memiliki tingkat pemanfaatan internet yang relatif rendah, terutama pada jenjang pendidikan D1–D3. Kondisi ini dapat mencerminkan keterbatasan infrastruktur digital, akses teknologi, mapun tingkat literasi digital di wilayah tersebut
Cluster 2 memiliki rata-rata akses internet yang lebih tinggi pada ketiga jenjang pendidikan, yaitu 41.10% pada SMA, 6.54% pada D1–D3, dan 17.34% pada S1 ke atas. Provinsi dalam cluster ini menunjukkan tingkat pemanfaatan internet yang lebih baik dan lebih merata, terutama pada jenjang D1–D3 yang memiliki perbedaan paling mencolok dibandingkan cluster 1. Kondisi ini menggambarkan wilayah yang relatif lebih siap dalam aspek digital, baik dari segi infrastruktur maupun kemampuan masyarakat dalam mengakses teknologi informasi.
Secara keseluruhan, hasil pengelompokan ini mengindikasikan adanya kesenjangan digital antarprovinsi di Indonesia. Perbedaan akses internet pada berbagai jenjang pendidikan menunjukkan bahwa sebagian wilayah masih memerlukan penguatan fasilitas dan pemerataan pemanfaatan teknologi informasi untuk mendukung transformasi digital nasional.
Pemerintah dan pemangku kebijakan perlu memprioritaskan peningkatan infrastruktur dan pemerataan akses internet pada provinsi yang termasuk dalam cluster 1, karena wilayah ini memiliki tingkat pemanfaatan internet yang lebih rendah pada semua jenjang pendidikan. Intervensi yang dapat dilakukan meliputi penyediaan jaringan internet yang lebih stabil, perluasan akses Wi-Fi publik, serta program literasi digital bagi pelajar.
Untuk provinsi dalam cluster 2, pemerintah dapat fokus pada pemeliharaan dan peningkatan kualitas layanan internet agar pemanfaatannya tetap optimal. Selain itu, provinsi dalam cluster ini dapat dijadikan model dalam pengembangan kebijakan digital nasional.
Badan Pusat Statistik. (2024). Persentase Penduduk Usia 5 Tahun ke Atas yang Pernah Mengakses Internet dalam 3 Bulan Terakhir menurut Provinsi dan Jenjang Pendidikan yang Sedang Diduduki (Persen). Diakses dari https://www.bps.go.id/
Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster Analysis (5th ed.). Wiley.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2014). Multivariate Data Analysis (7th ed.). Pearson.
Hartigan, J. A., & Wong, M. A. (1979). Algorithm AS 136: A K-Means Clustering Algorithm. Applied Statistics, 28(1), 100–108.
Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis (6th ed.). Pearson.
Kaufman, L., & Rousseeuw, P. J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.
MacQueen, J. (1967). Some Methods for Classification and Analysis of Multivariate Observations. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1, 281–297.
Peña, D., Rodríguez, J., & Prieto, F. (1999). Clustering Based on Multivariate Normal Mixtures. Journal of Multivariate Analysis, 72(2), 299–324.
Rencher, A. C. (2002). Methods of Multivariate Analysis (2nd ed.). Wiley. Timm, N. H. (2002). Applied Multivariate Analysis. Springer.