Daftar Isi

1. Pendahuluan


1.1 Latar Belakang

Pemanfaatan Teknologi Informasi dan Komunikasi (TIK), khususnya akses internet, merupakan indikator krusial dalam mengukur kemajuan digitalisasi suatu wilayah. Akses ini tidak hanya mendukung komunikasi, tetapi juga berpengaruh pada kualitas pendidikan dan kesiapan sumber daya manusia (SDM) di era digital.

Penelitian ini memfokuskan analisis pada persentase penduduk yang mengakses internet pada tiga jenjang pendidikan kunci—SMA/Sederajat, Diploma (D1–D3), serta Sarjana dan Pascasarjana (S1 ke atas)—yang merepresentasikan kelompok usia produktif dan terdidik. Ketiga jenjang ini mencerminkan potensi SDM yang tengah atau akan memasuki pasar kerja.

Data BPS tahun 2024 menunjukkan variabilitas signifikan antar provinsi dalam persentase akses internet pada ketiga jenjang pendidikan tersebut. Fenomena ini menegaskan adanya disparitas multidimensional, di mana profil akses internet suatu provinsi tidak dapat digambarkan hanya dari satu jenjang pendidikan.

Kondisi tersebut menimbulkan kebutuhan untuk memahami pola pengelompokan alami antar provinsi. Mengidentifikasi provinsi dengan karakteristik akses internet yang serupa menjadi penting agar kebijakan yang dihasilkan lebih terarah, efisien, dan tepat sasaran. Analisis cluster hierarki dipilih karena mampu memetakan struktur internal data multivariat, sehingga pembentukan tipologi provinsi dapat dilakukan secara objektif.

Dengan demikian, studi ini berupaya menjawab tantangan disparitas digital melalui identifikasi kelompok provinsi berdasarkan profil akses internet tahun 2024 pada jenjang SMA hingga S1 ke atas.

1.2 Tujuan

Tujuan dari penelitian ini adalah sebagai berikut:

  1. Mengidentifikasi dan mengelompokkan provinsi di Indonesia menjadi beberapa cluster yang homogen berdasarkan indikator persentase penduduk usia 5 tahun ke atas yang mengakses internet pada jenjang SMA/Sederajat, D1-D3, dan S1 ke atas (Tahun 2024).

  2. Menjelaskan karakteristik profil akses internet dari masing-masing cluster provinsi yang terbentuk dari hasil analisis cluster hierarki.

1.3 Manfaat

Hasil penelitian ini diharapkan memberikan manfaat sebagai berikut:

  1. Memperkaya studi penerapan analisis cluster (khususnya Hierarchical Clustering) dalam bidang statistik regional, dengan fokus pada pengujian efektivitas metode linkage terbaik pada data multi-variabel yang melibatkan persentase akses internet pada berbagai jenjang pendidikan.

  2. Memberikan informasi yang jelas mengenai tipologi provinsi yang menunjukkan adanya kesenjangan digital berdasarkan profil akses internet pada jenjang SMA, D1-D3, dan S1 ke atas (Tahun 2024). Tipologi ini berfungsi sebagai pemetaan komprehensif atas kondisi digitalisasi masyarakat terdidik di setiap provinsi.

1.4 Tinjauan Pustaka

1.4.1 Analisis Cluster

Analisis cluster adalah teknik statistika multivariat yang bertujuan untuk mengelompokkan objek-objek (kasus, individu, atau variabel) ke dalam kelompok-kelompok (Cluster) sehingga objek dalam satu kelompok memiliki kemiripan yang lebih besar satu sama lain dibandingkan objek di kelompok lain (Hair, dkk., 2014). Tujuannya adalah untuk mengungkap struktur pengelompokan tersembunyi dalam data, yang tidak dapat dilihat secara langsung (Johnson & Wichern, 2007). Metode ini sangat penting dalam riset eksploratori karena tidak memerlukan asumsi awal mengenai keanggotaan kelompok (Rencher, 2002).

1.4.2 Metode Cluster Hierarki

Metode cluster hierarki adalah prosedur pengelompokan yang membangun struktur hierarki cluster atau pohon cluster, yang disebut Dendrogram. Metode ini dibagi menjadi dua jenis utama (Kaufman & Rousseeuw, 1990):

  1. Agnes (Agglomerative Nesting) Pendekatan “bottom-up” yang dimulai dari setiap objek sebagai cluster individu, lalu menggabungkan cluster terdekat secara bertahap hingga semua objek berada dalam satu cluster besar.

  2. Diana (Divisive Analysis) Pendekatan “top-down” yang dimulai dengan satu cluster besar yang berisi semua objek, lalu membaginya secara bertahap menjadi cluster-cluster yang lebih kecil.

Beberapa algoritma pengukuran jarak yang umum digunakan dalam cluster hierarki meliputi single linkage, complete linkage, average linkage, dan ward (Everitt, dkk., 2011).

1.4.3 Metode Cluster Non-Hierarki

Metode cluster non-hierarki (Non-Hierarchical Clustering) memerlukan penentuan jumlah Cluster di awal analisis (Timm, 2002). Objek-objek kemudian dialokasikan ke salah satu cluster berdasarkan kedekatannya dengan pusat cluster tersebut. Metode yang paling populer adalah k-Means clustering (MacQueen, 1967). Algoritma ini bekerja dengan menginisiasi pusat cluster awal dan kemudian mengalokasikan objek ke pusat terdekat, lalu menghitung kembali pusat baru, dan mengulang proses ini hingga pusat cluster tidak lagi bergeser atau kriterium konvergensi terpenuhi (Hartigan & Wong, 1979). Meskipun k-Means cepat dan efisien untuk data besar, hasilnya sangat sensitif terhadap inisiasi pusat cluster awal (Peña, dkk., 1999).

1.5 Data

Data yang digunakan dalam penelitian ini adalah data kuantitatif yang bersumber dari Badan Pusat Statistik (BPS) Republik Indonesia, khususnya dari tabel resmi ” Persentase Penduduk Usia 5 Tahun ke Atas yang Pernah Mengakses Internet dalam 3 Bulan Terakhir menurut Provinsi dan Jenjang Pendidikan yang Sedang Diduduki (Persen), 2024”.

Data ini diakses melalui laman resmi BPS (https://www.bps.go.id/id/statistics-table/2/MTY5OCMy/persentase-penduduk-usia-5-tahun-ke-atas--yang-pernah-mengakses-internet-dalam-3-bulan-terakhir-menurut-provinsi-dan-jenjang-pendidikan-yang-sedang-diduduki--persen-.html).

Data tersebut meliputi 38 Provinsi di Indonesia dan berfokus pada tiga variabel utama yang akan digunakan sebagai dasar perhitungan jarak dan pembentukan cluster.

Tabel Lengkap Data Pendidikan Provinsi 2024
Provinsi SMA D1-D3 S1 ke atas
Aceh 40.60 3.60 18.82
Sumatera Utara 45.34 2.51 13.49
Sumatera Barat 37.00 3.13 15.66
Riau 36.52 1.81 13.14
Jambi 35.13 1.90 13.54
Sumatera Selatan 36.46 2.29 10.59
Bengkulu 34.64 2.35 17.50
Lampung 34.91 1.71 9.36
Kep. Bangka Belitung 38.55 2.53 9.79
Kep. Riau 44.11 2.36 13.68
Dki Jakarta 46.99 3.85 17.99
Jawa Barat 35.44 2.14 10.76
Jawa Tengah 32.08 1.83 10.01
Di Yogyakarta 35.95 3.86 21.18
Jawa Timur 35.66 1.68 13.26
Banten 38.91 2.08 11.16
Bali 37.34 5.81 15.80
Nusa Tenggara Barat 35.23 1.84 14.33
Nusa Tenggara Timur 29.22 2.99 16.72
Kalimantan Barat 33.42 2.37 10.35
Kalimantan Tengah 29.73 1.83 12.67
Kalimantan Selatan 31.75 1.93 12.41
Kalimantan Timur 40.03 3.10 13.69
Kalimantan Utara 36.13 1.78 13.96
Sulawesi Utara 43.33 2.05 16.62
Sulawesi Tengah 30.07 2.42 18.23
Sulawesi Selatan 35.21 2.34 17.59
Sulawesi Tenggara 30.77 2.30 20.34
Gorontalo 28.61 2.32 18.35
Sulawesi Barat 29.80 2.11 16.95
Maluku 40.92 2.96 22.96
Maluku Utara 37.51 2.82 19.39
Papua Barat 39.72 3.06 17.57
Papua Barat Daya 43.45 2.29 21.54
Papua 43.43 3.50 23.06
Papua Selatan 43.98 2.69 19.54
Papua Tengah 45.31 3.52 18.06
Papua Pegunungan 44.85 7.27 18.87

2. Source Code


2.1 Library

library(psych)
library(clValid)
library(ggplot2)
library(cluster)
library(factoextra)
library(readxl)
library(corrplot)
library(colorspace)
library(dendextend)

Berikut adalah penjelasan kegunaan masing-masing library yang digunakan dalam analisis:

  • library(psych)
    Digunakan untuk berbagai analisis statistik, termasuk uji KMO dan pengujian kelayakan sampel dalam analisis multivariat.

  • library(clValid)
    Mengaktifkan fungsi untuk melakukan validasi cluster secara internal, termasuk pemilihan metode linkage dan jumlah cluster optimal.

  • library(ggplot2)
    Paket visualisasi yang digunakan untuk membuat grafik eksplorasi data tambahan dalam proses analisis.

  • library(cluster)
    Menyediakan fungsi untuk melakukan hierarchical clustering, perhitungan jarak, dan menghitung nilai cophenetic correlation.

  • library(factoextra)
    Membantu dalam menampilkan dan mengekstrak hasil clustering secara visual, seperti dendrogram dan plot pembentukan cluster.

  • library(readxl)
    Digunakan untuk membaca file Excel yang berisi data penelitian dari BPS.

  • library(corrplot)
    Digunakan untuk memvisualisasikan matriks korelasi guna mendukung analisis asumsi multikolinieritas antarvariabel.

  • library(colorspace)
    Berfungsi dalam pengaturan palet warna dan manipulasi warna pada visualisasi grafik.

  • library(dendextend)
    Paket yang digunakan untuk memodifikasi, memperindah, dan mewarnai dendrogram hasil analisis cluster hierarki sehingga lebih informatif.

2.2 Impor Data

data <- read_excel("C:/Users/Downloads/Persentase Penduduk Usia 5 Tahun ke Atas  yang Pernah Mengakses Internet dalam 3 Bulan Terakhir menurut Provinsi dan Jenjang Pendidikan yang Sedang Diduduki, 2024.xlsx")
data <- data.frame(data)
  • read_excel() untuk membaca file excel dari lokasi yang ditentukan ke dalam variabel yang diberi nama data.

  • data.frame() digunakan untuk tabel data 2 dimensi di R.

2.3 Statistika Deskriptif

statdes <- summary(data)
statdes
  • summary() untuk memberikan ringkasan statistik deskriptif dari dataset data.

2.4 Uji Asumsi

  1. Uji Uji Sampel Representatif
kmo <- KMO(data[,2:4])
kmo

Mengukur Kaiser-Meyer-Olkin (KMO) untuk melihat apakah variabel memiliki kecukupan sampel yang memadai untuk analisis cluster.

  1. Uji Non-Multikolinieritas
korelasi <- cor(data[,2:4], method = 'pearson')
korelasi
corrplot(korelasi, method="number")
  • cor() untuk menghitung matriks korelasi Pearson antarvariabel.

  • corplot() sebagai visualisasi dari matriks korelasi

2.5 Standarisasi

datastand <- scale(data[,2:4])
datastand
rownames(datastand) <- 1:nrow(datastand)
  • scale() untu menstandarisasi data agar setiap variabel memiliki skala yang sama sebelum dilakukan Clustering.

  • rownames() <- 1:nrow() agar lebih mudah dibaca.

2.6 Jarak Ecludian

jarak <- dist(datastand, method = "euclidean")
print(jarak, max = 100)

2.7 Koefisien Korelasi Cophenetic

d1 <- dist(data[,2:4])
  1. Metode Single Linkage
hiers <- hclust(dist(data[,2:4]), method = "single")
hc1 <- hclust(d1, "single")
d2 <- cophenetic(hc1)
cors <- cor(d1,d2)
cors
  1. Metode Average Linkage
hierave <- hclust(dist(data[,2:4]), method = "ave")
hc2 <- hclust(d1, "ave")
d3 <- cophenetic(hc2)
corave <- cor(d1,d3)
corave
  1. Metode Complete Linkage
hiercomp <- hclust(dist(data[,2:4]), method = "complete")
hc3 <- hclust(d1, "complete")
d4 <- cophenetic(hc3)
corcomp <- cor(d1,d4)
corcomp
  1. Metode Centroid Linkage
hiercen <- hclust(dist(data[,2:4]), method = "centroid")
hc4 <- hclust(d1, "centroid")
d5 <- cophenetic(hc4)
corcen <- cor(d1,d5)
corcen
  1. Metode Ward
hierward <- hclust(dist(data[,2:4]), method = "ward.D")
hc5 <- hclust(d1,"ward.D")
d6 <- cophenetic(hc5)
corward <- cor(d1,d6)
corward

Perbandingan Nilai Korelasi Cophenetic

KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
KorCop

Analisis ini membantu memilih metode linkage yang paling sesuai berdasarkan korelasi cophenetic tertinggi, sehingga hasil klasterisasi lebih akurat dalam merepresentasikan struktur jarak data.

2.8 Indeks Validitas

inval <- clValid(datastand, 2:4, clMethods = "hierarchical", 
                 validation = "internal", metric = "euclidean", method = "average")
summary(inval)
optimalScores(inval)
plot(inval)

Melakukan validasi internal untuk menentukan jumlah cluster optimal dan metode terbaik.

2.10 Dendogram

hc <- hclust(dist(datastand), method = "average")
dend <- as.dendrogram(hc)
dend <- color_branches(dend, k = 2) 
plot(dend, main = "Cluster Dendogram")

Memvisualisasikan dendogram berdasarkan klaster yang sudah ditentukan.

2.11 Karateristik Masing-Masing Cluster

clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, 
                    hc_method = "average", graph = TRUE)
idclus = clus_hier$cluster
idclus
aggregate(data[,2:4],list(idclus),mean)

Mengidentifikasikan karateristik setiap klaster yang terbentuk serta membandingkan setiap klasternya.

3. Hasil dan Pembahasan


3.1 Statistika Deskriptif

   Provinsi              SMA            D1.D3         S1.ke.atas   
 Length:38          Min.   :28.61   Min.   :1.680   Min.   : 9.36  
 Class :character   1st Qu.:34.71   1st Qu.:2.058   1st Qu.:13.17  
 Mode  :character   Median :36.49   Median :2.355   Median :16.21  
                    Mean   :37.32   Mean   :2.709   Mean   :15.76  
                    3rd Qu.:40.84   3rd Qu.:3.042   3rd Qu.:18.32  
                    Max.   :46.99   Max.   :7.270   Max.   :23.06  

Berdasarkan hasil statistik deskriptif, variabel persentase akses internet pada jenjang SMA memiliki nilai minimum sebesar 28.61% dan maksimum 46.99%, dengan rata-rata 37.32%. Nilai ini menunjukkan adanya variasi yang cukup besar antarprovinsi dalam pemanfaatan internet oleh pelajar SMA. Pada jenjang D1–D3, nilai minimum tercatat 1.68% dan maksimum 7.27%, dengan rata-rata hanya 2.71%, yang mengindikasikan bahwa akses internet pada kelompok ini relatif rendah dan lebih homogen dibandingkan jenjang lainnya. Sementara itu, pada jenjang S1 ke atas, persentase akses internet berada pada rentang 9.36% hingga 23.06%, dengan rata-rata 15.76%. Rentang yang cukup lebar pada jenjang S1 ke atas menunjukkan adanya ketimpangan pemanfaatan internet di antara provinsi dengan tingkat pendidikan tinggi. Secara keseluruhan, ketiga variabel menunjukkan variasi yang berbeda, sehingga memberikan gambaran yang komprehensif mengenai disparitas akses internet antarprovinsi di Indonesia.

3.2 Uji Asumsi

  1. Uji Sampel Representatif
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA =  0.62
MSA for each item = 
       SMA      D1.D3 S1.ke.atas 
      0.65       0.59       0.65 

Kriteria umum dalam analisis multivariat menetapkan bahwa nilai KMO harus berada di atas 0.5 agar data dianggap layak dan memadai untuk dilakukan analisis lebih lanjut. Karena uji KMO masing-masing variabel bernilai > 0.5, sehingga sampel telah cukup dan dapat dilakukan analisis cluster.

  1. Uji Non-Multikolinieritas
                 SMA     D1.D3 S1.ke.atas
SMA        1.0000000 0.4190227  0.2713391
D1.D3      0.4190227 1.0000000  0.4155717
S1.ke.atas 0.2713391 0.4155717  1.0000000

Berdasarkan matriks korelasi dan plot korelasi, seluruh pasangan variabel memiliki nilai korelasi di bawah 0.8, yaitu 0.42 untuk hubungan SMA–D1/D3, 0.27 untuk SMA–S1 ke atas, dan 0.42 untuk D1/D3–S1 ke atas. Karena tidak ada nilai korelasi yang mendekati 1 ataupun melampaui batas 0.8, maka dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel. Hal ini menunjukkan bahwa ketiga variabel akses internet pada jenjang pendidikan tersebut tidak saling mendominasi, sehingga masing-masing memberikan informasi yang unik dan layak digunakan secara bersamaan dalam analisis cluster.

3.3 Standarisasi

               SMA       D1.D3  S1.ke.atas
 [1,]  0.636587588  0.80060117  0.79998465
 [2,]  1.556091650 -0.17846291 -0.59405210
 [3,] -0.061769926  0.37843592 -0.02649867
 [4,] -0.154884262 -0.80721966 -0.68559297
 [5,] -0.424527858 -0.72637951 -0.58097483
 [6,] -0.166523554 -0.37607218 -1.35253363
 [7,] -0.519582075 -0.32217874  0.45474478
 [8,] -0.467205261 -0.89704206 -1.67423442
 [9,]  0.238911781 -0.16049843 -1.56176992
[10,]  1.317486165 -0.31319650 -0.54435848
[11,]  1.876172177  1.02515716  0.58290201
[12,] -0.364391516 -0.51080577 -1.30807092
[13,] -1.016191863 -0.78925519 -1.50422994
[14,] -0.265457535  1.03413939  1.41723170
[15,] -0.321714112 -0.92398878 -0.65420753
[16,]  0.308747533 -0.56469920 -1.20345278
[17,]  0.004186061  2.78567606  0.01011768
[18,] -0.405129038 -0.78027295 -0.37435400
[19,] -1.570998111  0.25268457  0.25073940
[20,] -0.756247677 -0.30421426 -1.41530452
[21,] -1.472064130 -0.78925519 -0.80851929
[22,] -1.080207969 -0.69943279 -0.87652108
[23,]  0.526014315  0.35148921 -0.54174303
[24,] -0.230539659 -0.83416638 -0.47112578
[25,]  1.166175371 -0.59164592  0.22458487
[26,] -1.406108142 -0.25930307  0.64567289
[27,] -0.409008802 -0.33116098  0.47828386
[28,] -1.270316403 -0.36708994  1.19753360
[29,] -1.689330912 -0.34912546  0.67705834
[30,] -1.458484956 -0.53775249  0.31089484
[31,]  0.698663812  0.22573786  1.88278243
[32,]  0.037164055  0.09998651  0.94906551
[33,]  0.465877974  0.31556025  0.47305296
[34,]  1.189453954 -0.37607218  1.51138802
[35,]  1.185574190  0.71077878  1.90893697
[36,]  1.292267700 -0.01678261  0.98829731
[37,]  1.550272004  0.72874326  0.60121018
[38,]  1.461037432  4.09708300  0.81306192
attr(,"scaled:center")
       SMA      D1.D3 S1.ke.atas 
 37.318421   2.708684  15.761316 
attr(,"scaled:scale")
       SMA      D1.D3 S1.ke.atas 
  5.154953   1.113308   3.823429 

Hasil standarisasi pada ketiga variabel menunjukkan bahwa seluruh data telah dikonversi ke dalam bentuk z-score, yaitu nilai dengan rata-rata 0 dan simpangan baku 1. Nilai positif pada hasil standarisasi menandakan bahwa provinsi tersebut memiliki nilai akses internet di atas rata-rata nasional, sedangkan nilai negatif menunjukkan nilai di bawah rata-rata nasional untuk variabel terkait

3.4 Jarak Ecludian

Matriks Jarak

           1         2         3         4         5         6         7
2  1.9358183                                                            
3  1.1614652 1.8027006                                                  
4  2.3277578 1.8251447 1.3597260                                        
5  2.3161790 2.0550516 1.2882757 0.3003128                              
6  2.5812560 1.8925503 1.5292562 0.7942503 0.8857677                    
7  1.6481971 2.3300323 0.9654264 1.2917583 1.1158533 1.8422297          
8  3.1972037 2.4035141 2.1227941 1.0406846 1.1073227 0.6821367 2.2058476
9  2.5806478 1.6345529 1.6546654 1.1580197 1.3123767 0.5046084 2.1605057
10 1.8738801 0.2784873 1.6275385 1.5594489 1.7907188 1.6909717 2.0911977
11 1.2783271 1.7135851 2.1319562 3.0152736 3.1170035 3.1435586 2.7516135
12 2.6768724 2.0756999 1.5889487 0.7205784 0.7607609 0.2434785 1.7796582
13 3.2509580 2.7960925 2.1114245 1.1884191 1.0983714 0.9569055 2.0742140
14 1.1176848 2.9721555 1.5986848 2.7972667 2.6678755 3.1096760 1.6824266
15 2.4509646 2.0212823 1.4689791 0.2060395 0.2344848 0.9010860 1.2771461
16 2.4464844 1.4409771 1.5530641 0.7361721 0.9753523 0.5326236 1.8693756
17 2.2280808 3.3999341 2.4084219 3.6630884 3.5871605 3.4471165 3.1828899
18 2.2278707 2.0632085 1.2575790 0.4002727 0.2144131 1.0849637 0.9541250
19 2.3399396 3.2677594 1.5396247 2.0013730 1.7218331 2.2222440 1.2155500
20 2.8404425 2.4570678 1.6961994 1.0710422 0.9921530 0.5973929 1.8850511
21 3.0921417 3.0965773 1.9909768 1.3230255 1.0738073 1.4734680 1.6496116
22 2.8298693 2.7020870 1.7092557 0.9509445 0.7197153 1.0798006 1.4929470
23 1.4192115 1.1595882 0.7821082 1.3516368 1.4376615 1.2908662 1.5937654
24 2.2450159 1.9071207 1.3025286 0.2290110 0.2476212 0.9954035 1.0967740
25 1.5968407 0.9964544 1.5849137 1.6186705 1.7881321 2.0760205 1.7226039
26 2.3064724 3.2121770 1.6327189 1.9073654 1.6390012 2.3543649 0.9090299
27 1.5740549 2.2438451 0.9375009 1.2828953 1.1306934 1.8473518 0.1134073
28 2.2710858 3.3517073 1.8747396 2.2325028 2.0018840 2.7787195 1.0570498
29 2.5974755 3.4896440 1.9165836 2.1026639 1.8233746 2.5375011 1.1909919
30 2.5337183 3.1679157 1.7041269 1.6628215 1.3784335 2.1124155 0.9740141
31 1.2275065 2.6520313 2.0608082 2.8969118 2.8702242 3.4026452 1.9554097
32 0.9340207 2.1830912 1.0193368 1.8793653 1.7991842 2.3591268 0.8558871
33 0.6093364 1.6035392 0.7293267 1.7287108 1.7289984 2.0520852 1.1739581
34 1.4819974 2.1462411 2.1213060 2.6114860 2.6656397 3.1687099 2.0100258
35 1.2406569 2.6819747 2.3264200 3.2913119 3.2950741 3.6941310 2.4676373
36 1.0646569 1.6123192 1.7376497 2.3496698 2.4317750 2.7814835 1.9133073
37 0.9378134 1.5005695 1.7650532 2.6310839 2.7230090 2.8257953 2.3259805
38 3.3980408 4.5021437 4.1051358 5.3767420 5.3632533 5.2295197 4.8560395
           8         9        10        11        12        13        14
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9  1.0265213                                                            
10 2.1914878 1.4905588                                                  
11 3.7790121 2.9472052 1.8368551                                        
12 0.5420561 0.7423296 1.8576918 3.3098469                              
13 0.5847271 1.4049666 2.5678859 4.0017473 0.7354292                    
14 3.6506611 3.2489996 2.8581219 2.2984265 3.1343130 3.5246713          
15 1.0307030 1.3118264 1.7527440 3.1875247 0.7746476 1.1058890 2.8510158
16 0.9665350 0.5446526 1.2309397 2.8592878 0.6833488 1.3770827 3.1231368
17 4.0769676 3.3475171 3.4110427 2.6328389 3.5693505 4.0142936 2.2628650
18 1.3065901 1.4862253 1.7928929 3.0627197 0.9726764 1.2845614 2.5536992
19 2.4991507 2.5945489 3.0488922 3.5482431 2.1139316 2.1150333 1.9172408
20 0.7085443 1.0160948 2.2492220 3.5622594 0.4557744 0.5574436 3.1710135
21 1.3307224 1.9723489 2.8421829 4.0544829 1.2466052 0.8317649 3.1200376
22 1.0252650 1.5811683 2.4512135 3.7207942 0.8568597 0.6373261 2.9883763
23 1.9564898 1.1768662 1.0335577 1.8819089 1.4572692 2.1461777 2.2203650
24 1.2277762 1.3651805 1.6349791 3.0010487 0.9071690 1.2986803 2.6566294
25 2.5232348 2.0583414 0.8316868 1.8018154 2.1675341 2.7911605 2.4728844
26 2.5826768 2.7547517 2.9727168 3.5252152 2.2283496 2.2483252 1.8892803
27 2.2264194 2.1472648 2.0067150 2.6594353 1.7959194 2.1234130 1.6632123
28 3.0286776 3.1518575 3.1199062 3.4952131 2.6682219 2.7463301 1.7382325
29 2.7059899 2.9607519 3.2456277 3.8223462 2.3921419 2.3248331 2.1186537
30 2.2477684 2.5554549 2.9134000 3.6927784 1.9541793 1.8850875 2.2623306
31 3.9079732 3.4964970 2.5621094 1.9275078 3.4429825 3.9297320 1.3415590
32 2.8513430 2.5323604 2.0100398 2.0909250 2.3725469 2.8140661 1.0878424
33 2.6366440 2.1020584 1.4682294 1.5825689 2.1318139 2.7068055 1.3938010
34 3.6282392 3.2240196 2.0606890 1.8157951 3.2221014 3.7589288 2.0283810
35 4.2609723 3.7014997 2.6616883 1.5277853 3.7740962 4.3298480 1.5658318
36 3.3105403 2.7627985 1.5612594 1.2613200 2.8743496 3.4840195 1.9274153
37 3.4483388 2.6812123 1.5659359 0.4409164 2.9745206 3.6501965 2.0139592
38 5.9030541 5.0259742 4.6166831 3.1083820 5.3911070 5.9483449 3.5675523
          15        16        17        18        19        20        21
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16 0.9100776                                                            
17 3.7827440 3.5763844                                                  
18 0.3254693 1.1151218 3.6098961                                        
19 1.9401545 2.5132121 2.9925156 1.6783902                              
20 1.0734097 1.1166684 3.4867621 1.1972862 1.9364031                    
21 1.1684479 1.8378488 3.9534307 1.1519248 1.4891123 1.0563362          
22 0.8216822 1.4332602 3.7560648 0.8452446 1.5550301 0.7425871 0.4077298
23 1.5356223 1.1508544 2.5499256 1.4751043 2.2439367 1.6844146 2.3162005
24 0.2233826 0.9485495 3.6592282 0.2067625 1.8706050 1.2036161 1.2873362
25 1.7596997 1.6658932 3.5780608 1.6921305 2.8645587 2.5431407 2.8401868
26 1.8186277 2.5403273 3.4153709 1.5211258 0.6673024 2.1614725 1.5491528
27 1.2812501 1.8433536 3.1787706 0.9636949 1.3201785 1.9253514 1.7308377
28 2.1538170 2.8804909 3.6019781 1.8412224 1.1708754 2.6636710 2.0598966
29 1.9932668 2.7522921 3.6248848 1.7147975 0.7469443 2.2914283 1.5645638
30 1.5404055 2.3274633 3.6434943 1.2798206 0.8006676 1.8781484 1.1473997
31 2.9663716 3.2096220 3.2469149 2.7064887 2.7956494 3.6434865 3.6035227
32 1.9359244 2.2691187 2.8452836 1.6498240 1.7598754 2.5264849 2.4814562
33 1.8513507 1.9000574 2.5551792 1.6363380 2.0499368 2.3331536 2.5726765
34 2.6969697 2.8603469 3.6953112 2.5024181 3.0991395 3.5151739 3.5547670
35 3.3932422 3.4760091 3.0506379 3.1570539 3.2493323 3.9813898 4.0862834
36 2.4750318 2.4639994 3.2357015 2.3067058 2.9689889 3.1711723 3.3862655
37 2.7949828 2.5438524 2.6402168 2.6556447 3.1767576 3.2331665 3.6641741
38 5.5265038 5.2082931 2.1182360 5.3554771 4.9283715 5.4086401 5.9252773
          22        23        24        25        26        27        28
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23 1.9484515                                                            
24 0.9510177 1.4082400                                                  
25 2.5040548 1.3735241 1.5791271                                        
26 1.6177143 2.3486424 1.7203687 2.6276243                              
27 1.5561584 1.5429629 1.0891484 1.6166078 1.0136024                    
28 2.1090983 2.6015847 2.0208217 2.6331629 0.5784528 1.1227029          
29 1.7050968 2.6237554 1.9187661 2.9012867 0.2987779 1.2957850 0.6684238
30 1.2566585 2.3358038 1.4856874 2.6266320 0.4385815 1.0826354 0.9223131
31 3.4108769 2.4339156 2.7436654 1.9069091 2.4891303 1.8734170 2.1674625
32 2.2848102 1.5889425 1.7208283 1.5092694 1.5179495 0.7788413 1.4104616
33 2.2895289 1.0172110 1.6426632 1.1726789 1.9658580 1.0879810 2.0013132
34 3.3102926 2.2770254 2.4812483 1.3049430 2.7386201 1.9037869 2.4797289
35 3.8576213 2.5631895 3.1712667 2.1292554 3.0419915 2.3822472 2.7747602
36 3.0938972 1.7503690 2.2620730 0.9641700 2.7308313 1.8036877 2.5948665
37 3.3380835 1.5804324 2.6007463 1.4257645 3.1174342 2.2309839 3.0841808
38 5.6849963 4.0913613 5.3691519 4.7347046 5.2179155 4.8185573 5.2475663
          29        30        31        32        33        34        35
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23                                                                      
24                                                                      
25                                                                      
26                                                                      
27                                                                      
28                                                                      
29                                                                      
30 0.4721713                                                            
31 2.7361939 2.7761554                                                  
32 1.8045704 1.7466937 1.1511831                                        
33 2.2645862 2.1113054 1.4316405 0.6759109                              
34 2.9973713 2.9118559 0.8608043 1.3677026 1.4422404                    
35 3.3024236 3.3322091 0.6877721 1.6165600 1.6540626 1.1572836          
36 3.0161651 2.8804381 1.1005841 1.2611341 1.0290036 0.6428713 1.1782642
37 3.4150521 3.2773332 1.6188509 1.6750624 1.1674994 1.4762217 1.3577469
38 5.4508795 5.5006802 4.0881327 4.2453142 3.9250303 4.5354751 3.5698569
          36        37
2                     
3                     
4                     
5                     
6                     
7                     
8                     
9                     
10                    
11                    
12                    
13                    
14                    
15                    
16                    
17                    
18                    
19                    
20                    
21                    
22                    
23                    
24                    
25                    
26                    
27                    
28                    
29                    
30                    
31                    
32                    
33                    
34                    
35                    
36                    
37 0.8787556          
38 4.1210534 3.3761748

Matriks jarak Euclidean menunjukkan besarnya perbedaan atau kedekatan antarprovinsi berdasarkan tiga variabel akses internet yang telah distandarisasi. Nilai jarak yang kecil menandakan bahwa dua provinsi memiliki karakteristik akses internet yang mirip, sedangkan nilai jarak yang besar menunjukkan perbedaan yang lebih jauh.

3.5 Koefisien Korelasi Cophenetic

Perbandingan Koefisien Korelasi Cophenetic

       cors    corave   corcomp    corcen   corward
1 0.6448668 0.7477576 0.7354316 0.7359059 0.7242906

Koefisien korelasi cophenetic digunakan untuk menentukan metode linkage yang paling mampu merepresentasikan struktur jarak asli antar objek. Semakin mendekati nilai 1, semakin baik metode tersebut mencerminkan pola kedekatan data sebenarnya. Berdasarkan hasil perhitungan, metode average linkage memiliki nilai korelasi cophenetic tertinggi yaitu 0.7478, lebih tinggi dibandingkan single, complete, centroid, maupun ward. Dengan demikian, metode average linkage dinilai sebagai metode yang paling optimal untuk digunakan dalam proses pengelompokan pada penelitian ini.

3.6 Indeks Validitas

Hasil Uji


Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 

Validation Measures:
                                 2       3       4
                                                  
hierarchical Connectivity   3.8579 11.3063 13.3063
             Dunn           0.5146  0.2471  0.2471
             Silhouette     0.4903  0.3950  0.3664

Optimal Scores:

             Score  Method       Clusters
Connectivity 3.8579 hierarchical 2       
Dunn         0.5146 hierarchical 2       
Silhouette   0.4903 hierarchical 2       
                 Score       Method Clusters
Connectivity 3.8579365 hierarchical        2
Dunn         0.5145864 hierarchical        2
Silhouette   0.4903424 hierarchical        2

Plot Indeks Validitas

Berdasarkan hasil validasi internal dan plot menggunakan indeks Connectivity, Dunn, dan Silhouette, seluruh ukuran menunjukkan bahwa jumlah cluster yang paling optimal adalah dua cluster. Hal ini terlihat dari nilai Connectivity terendah, nilai Dunn tertinggi, serta nilai Silhouette tertinggi yang semuanya diperoleh pada jumlah cluster 2. Dengan demikian, konfigurasi dua cluster merupakan hasil pengelompokan terbaik untuk data akses internet pada berbagai jenjang pendidikan.

3.7 Dendogram

Terlihat bahwa pemisahan utama terjadi pada ketinggian sekitar 4, yang membagi provinsi menjadi dua cluster besar. Kelompok pertama (di sisi kiri) berisi beberapa provinsi yang memiliki karakteristik akses internet yang paling berbeda dibandingkan provinsi lainnya, terlihat dari cabang yang terpisah lebih tinggi. Kelompok kedua (di sisi kanan) berisi mayoritas provinsi yang memiliki pola akses internet yang relatif lebih mirip satu sama lain, ditandai dengan cabang-cabang yang bergabung pada ketinggian yang lebih rendah.

3.8 Karateristik Masing-Masing Cluster

 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
 1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  2  1  1  1  1  1  1  1  1  1 
27 28 29 30 31 32 33 34 35 36 37 38 
 1  1  1  1  1  1  1  1  1  1  1  2 
  Group.1      SMA    D1.D3 S1.ke.atas
1       1 37.10861 2.495833   15.67389
2       2 41.09500 6.540000   17.33500
  • Cluster 1 menunjukkan nilai rata-rata persentase akses internet sebesar 37.11% pada jenjang SMA, 2.50% pada jenjang D1–D3, dan 15.67% pada jenjang S1 ke atas. Nilai-nilai tersebut mengindikasikan bahwa provinsi yang masuk dalam cluster ini memiliki tingkat pemanfaatan internet yang relatif lebih rendah pada seluruh jenjang pendidikan dibandingkan cluster lainnya.

  • Cluster 2 memiliki rata-rata akses internet yang lebih tinggi, yaitu 41.10% pada jenjang SMA, 6.54% pada jenjang D1–D3, dan 17.34% pada jenjang S1 ke atas. Hal ini menunjukkan bahwa provinsi dalam cluster 2 berada pada kategori pemanfaatan internet yang lebih baik, terutama pada jenjang D1–D3 yang memiliki perbedaan paling mencolok antara kedua cluster.

4. Penutup


4.1 Kesimpulan

Berdasarkan analisis cluster menggunakan metode average linkage, provinsi di Indonesia terbagi menjadi dua kelompok dengan karakteristik yang berbeda.

  1. Cluster 1 memiliki rata-rata persentase akses internet yang lebih rendah pada seluruh jenjang pendidikan, yaitu 37.11% untuk SMA, 2.50% untuk D1–D3, dan 15.67% untuk S1 ke atas. Hal ini menunjukkan bahwa provinsi dalam cluster ini masih memiliki tingkat pemanfaatan internet yang relatif rendah, terutama pada jenjang pendidikan D1–D3. Kondisi ini dapat mencerminkan keterbatasan infrastruktur digital, akses teknologi, mapun tingkat literasi digital di wilayah tersebut

  2. Cluster 2 memiliki rata-rata akses internet yang lebih tinggi pada ketiga jenjang pendidikan, yaitu 41.10% pada SMA, 6.54% pada D1–D3, dan 17.34% pada S1 ke atas. Provinsi dalam cluster ini menunjukkan tingkat pemanfaatan internet yang lebih baik dan lebih merata, terutama pada jenjang D1–D3 yang memiliki perbedaan paling mencolok dibandingkan cluster 1. Kondisi ini menggambarkan wilayah yang relatif lebih siap dalam aspek digital, baik dari segi infrastruktur maupun kemampuan masyarakat dalam mengakses teknologi informasi.

    Secara keseluruhan, hasil pengelompokan ini mengindikasikan adanya kesenjangan digital antarprovinsi di Indonesia. Perbedaan akses internet pada berbagai jenjang pendidikan menunjukkan bahwa sebagian wilayah masih memerlukan penguatan fasilitas dan pemerataan pemanfaatan teknologi informasi untuk mendukung transformasi digital nasional.

4.2 Saran

  1. Pemerintah dan pemangku kebijakan perlu memprioritaskan peningkatan infrastruktur dan pemerataan akses internet pada provinsi yang termasuk dalam cluster 1, karena wilayah ini memiliki tingkat pemanfaatan internet yang lebih rendah pada semua jenjang pendidikan. Intervensi yang dapat dilakukan meliputi penyediaan jaringan internet yang lebih stabil, perluasan akses Wi-Fi publik, serta program literasi digital bagi pelajar.

  2. Untuk provinsi dalam cluster 2, pemerintah dapat fokus pada pemeliharaan dan peningkatan kualitas layanan internet agar pemanfaatannya tetap optimal. Selain itu, provinsi dalam cluster ini dapat dijadikan model dalam pengembangan kebijakan digital nasional.

5. Daftar Pustaka


Badan Pusat Statistik. (2024). Persentase Penduduk Usia 5 Tahun ke Atas yang Pernah Mengakses Internet dalam 3 Bulan Terakhir menurut Provinsi dan Jenjang Pendidikan yang Sedang Diduduki (Persen). Diakses dari https://www.bps.go.id/

Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster Analysis (5th ed.). Wiley.

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2014). Multivariate Data Analysis (7th ed.). Pearson.

Hartigan, J. A., & Wong, M. A. (1979). Algorithm AS 136: A K-Means Clustering Algorithm. Applied Statistics, 28(1), 100–108.

Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis (6th ed.). Pearson.

Kaufman, L., & Rousseeuw, P. J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.

MacQueen, J. (1967). Some Methods for Classification and Analysis of Multivariate Observations. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1, 281–297.

Peña, D., Rodríguez, J., & Prieto, F. (1999). Clustering Based on Multivariate Normal Mixtures. Journal of Multivariate Analysis, 72(2), 299–324.

Rencher, A. C. (2002). Methods of Multivariate Analysis (2nd ed.). Wiley. Timm, N. H. (2002). Applied Multivariate Analysis. Springer.