ANALISIS CLUSTERING MENGGUNAKAN METODE K-MEANS DAN HIERARCHICAL CLUSTERING BERDASARKAN KELANCARAN INTERNET PRIBADI DAN EFEKTIVITAS BELAJAR MAHASISWA S-1 STATISTIKA UNIVERSITAS RIAU ANGKATAN 2024
PENDAHULUAN
Dalam dunia pendidikan tinggi, internet memiliki peran penting sebagai sumber belajar bagi mahasiswa. Internet memungkinkan mahasiswa untuk memperoleh berbagai informasi akademik, mengakses materi pembelajaran, serta mendukung penyelesaian tugas-tugas perkuliahan. Selain itu, internet juga berfungsi sebagai media komunikasi yang efektif untuk menunjang interaksi antara mahasiswa dan dosen maupun sesama mahasiswa dalam kegiatan akademik (Ikram & Muktaruddin, 2024). Meskipun demikian, kondisi dan pemanfaatan internet oleh mahasiswa tidak selalu sama. Sebagian mahasiswa memiliki akses internet yang lancar dan stabil sehingga dapat mendukung proses belajar secara optimal, sementara sebagian lainnya menghadapi kendala akses yang berpotensi memengaruhi aktivitas belajar. Perbedaan kondisi internet tersebut dapat menyebabkan variasi dalam efektivitas belajar mahasiswa. Perbedaan karakteristik mahasiswa dalam hal kelancaran internet pribadi dan efektivitas belajar menarik untuk dianalisis lebih lanjut. Salah satu pendekatan yang dapat digunakan adalah analisis Clustering, yaitu teknik pengelompokan data yang bertujuan untuk mengidentifikasi kelompok-kelompok mahasiswa yang memiliki karakteristik serupa berdasarkan variabel yang diamati. Melalui Clustering, dapat diperoleh gambaran mengenai profil mahasiswa berdasarkan kondisi internet pribadi dan efektivitas belajar tanpa harus mengasumsikan adanya hubungan sebab-akibat antarvariabel. Dalam penelitian ini digunakan dua metode Clustering, yaitu K-Means Clustering dan Hierarchical Clustering. Kedua metode tersebut memiliki pendekatan yang berbeda dalam membentuk kelompok data sehingga memungkinkan diperolehnya hasil pengelompokan yang berbeda pula. Oleh karena itu, diperlukan perbandingan hasil kedua metode untuk menentukan metode yang mampu menghasilkan pengelompokan yang lebih baik berdasarkan ukuran evaluasi Clustering yang digunakan. Berdasarkan uraian tersebut, penelitian ini bertujuan untuk mengelompokkan mahasiswa S-1 Statistika Universitas Riau Angkatan 2024 berdasarkan karakteristik kelancaran internet pribadi dan efektivitas belajar, serta membandingkan hasil pengelompokan yang diperoleh dari metode K-Means Clustering dan Hierarchical Clustering.
DATA
Data yang digunakan dalam penelitian ini merupakan data hasil penyebaran kuesioner kepada 60 mahasiswa S-1 Statistika Universitas Riau Angkatan 2024. Variabel yang dianalisis terdiri atas kualitas internet pribadi (Variabel A) dan efektivitas belajar (Variabel B). Pemilihan populasi ini didasarkan pada kesesuaian karakteristik responden dengan tujuan penelitian, yaitu mengidentifikasi pola kelompok mahasiswa berdasarkan persepsi terhadap kelancaran internet pribadi dan efektivitas belajar. Mahasiswa Statistika angkatan 2024 dipilih karena seluruh mahasiswa memiliki aktivitas akademik yang relatif serupa dan menggunakan internet sebagai sarana utama dalam menunjang proses pembelajaran, baik untuk mengakses materi kuliah, mengerjakan tugas, maupun berkomunikasi dengan dosen dan sesama mahasiswa. Dalam penelitian ini diperoleh data primer melalui penyebaran kuesioner secara daring menggunakan Google Form. Kuesioner disebarkan kepada responden terpilih melalui aplikasi WhatsApp. Dari target sampel yang telah ditentukan, diperoleh sebanyak 60 responden yang bersedia mengisi kuesioner dan datanya digunakan dalam proses analisis lebih lanjut.
library(readxl)
library(dplyr)
library(ggplot2)
library(psych)
library(cluster)
library(factoextra)
library(corrplot)
library(mclust)## [1] 60 29
## # A tibble: 6 × 29
## Timestamp Username Nama Kelas Usia `Jenis Kelamin` `Tempat Tinggal`
## <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 2026/03/26 4:15:5… nailana… ila A 19-2… Perempuan Kos/Kontrakan
## 2 2026/03/26 4:21:1… tiwi.ap… tiwi A 19-2… Perempuan Kos/Kontrakan
## 3 2026/03/26 4:28:0… yosephi… Yo B 19-2… Perempuan Kos/Kontrakan
## 4 2026/03/26 4:30:0… atikaha… tiqah A 19-2… Perempuan Bersama Keluarga
## 5 2026/03/26 4:39:4… uci.mar… uci B 19-2… Perempuan Kos/Kontrakan
## 6 2026/03/26 4:43:2… alfatih… syifa B 19-2… Perempuan Kos/Kontrakan
## # ℹ 22 more variables: `Jenis Kartu SIM` <chr>,
## # `Penggunaan Internet di Kampus` <chr>, A1 <dbl>, A2 <dbl>, A3 <dbl>,
## # A4 <dbl>, A5 <dbl>, A6 <dbl>, A7 <dbl>, A8 <dbl>, A9 <dbl>, A10 <dbl>,
## # B1 <dbl>, B2 <dbl>, B3 <dbl>, B4 <dbl>, B5 <dbl>, B6 <dbl>, B7 <dbl>,
## # B8 <dbl>, B9 <dbl>, B10 <dbl>
## tibble [60 × 29] (S3: tbl_df/tbl/data.frame)
## $ Timestamp : chr [1:60] "2026/03/26 4:15:53 PM GMT+7" "2026/03/26 4:21:10 PM GMT+7" "2026/03/26 4:28:01 PM GMT+7" "2026/03/26 4:30:08 PM GMT+7" ...
## $ Username : chr [1:60] "nailanafisademul@gmail.com" "tiwi.aprista1369@student.unri.ac.id" "yosephine.lamria7296@student.unri.ac.id" "atikahadawiyah06@gmail.com" ...
## $ Nama : chr [1:60] "ila" "tiwi" "Yo" "tiqah" ...
## $ Kelas : chr [1:60] "A" "A" "B" "A" ...
## $ Usia : chr [1:60] "19-20 Tahun" "19-20 Tahun" "19-20 Tahun" "19-20 Tahun" ...
## $ Jenis Kelamin : chr [1:60] "Perempuan" "Perempuan" "Perempuan" "Perempuan" ...
## $ Tempat Tinggal : chr [1:60] "Kos/Kontrakan" "Kos/Kontrakan" "Kos/Kontrakan" "Bersama Keluarga" ...
## $ Jenis Kartu SIM : chr [1:60] "Telkomsel" "Tri(3)" "Tri(3)" "Indosat" ...
## $ Penggunaan Internet di Kampus: chr [1:60] "Lebih sering menggunakan internet pribadi (SIM card)" "Lebih sering menggunakan internet pribadi (SIM card)" "Lebih sering menggunakan internet pribadi (SIM card)" "Lebih sering menggunakan internet pribadi (SIM card)" ...
## $ A1 : num [1:60] 3 4 5 5 4 5 4 5 4 5 ...
## $ A2 : num [1:60] 3 2 3 2 3 2 2 4 2 2 ...
## $ A3 : num [1:60] 3 3 5 4 4 4 4 4 4 5 ...
## $ A4 : num [1:60] 2 2 1 1 3 2 2 4 2 2 ...
## $ A5 : num [1:60] 4 4 5 4 4 4 4 4 4 5 ...
## $ A6 : num [1:60] 2 2 2 2 4 2 2 4 2 2 ...
## $ A7 : num [1:60] 3 4 5 5 4 5 4 4 4 4 ...
## $ A8 : num [1:60] 3 2 2 2 2 2 2 4 3 2 ...
## $ A9 : num [1:60] 3 5 4 5 4 2 5 4 5 4 ...
## $ A10 : num [1:60] 4 4 5 5 4 4 5 5 4 4 ...
## $ B1 : num [1:60] 3 4 5 3 4 4 4 5 4 5 ...
## $ B2 : num [1:60] 3 2 2 4 3 1 4 1 2 3 ...
## $ B3 : num [1:60] 4 4 5 4 4 5 4 4 4 5 ...
## $ B4 : num [1:60] 3 4 5 2 3 4 2 4 4 4 ...
## $ B5 : num [1:60] 4 4 1 5 3 1 4 4 4 4 ...
## $ B6 : num [1:60] 4 4 5 4 4 4 4 4 4 4 ...
## $ B7 : num [1:60] 3 1 2 2 4 2 3 3 1 3 ...
## $ B8 : num [1:60] 3 4 5 4 4 4 4 5 4 4 ...
## $ B9 : num [1:60] 4 4 5 4 4 4 4 4 4 4 ...
## $ B10 : num [1:60] 3 2 3 2 4 4 2 4 3 3 ...
## Timestamp Username Nama Kelas
## Length:60 Length:60 Length:60 Length:60
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Usia Jenis Kelamin Tempat Tinggal Jenis Kartu SIM
## Length:60 Length:60 Length:60 Length:60
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Penggunaan Internet di Kampus A1 A2 A3
## Length:60 Min. :1.00 Min. :1.000 Min. :1.00
## Class :character 1st Qu.:4.00 1st Qu.:2.000 1st Qu.:3.75
## Mode :character Median :4.00 Median :3.000 Median :4.00
## Mean :4.25 Mean :2.617 Mean :4.00
## 3rd Qu.:5.00 3rd Qu.:3.000 3rd Qu.:5.00
## Max. :5.00 Max. :5.000 Max. :5.00
## A4 A5 A6 A7 A8
## Min. :1.00 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.0
## 1st Qu.:2.00 1st Qu.:4.000 1st Qu.:2.000 1st Qu.:4.000 1st Qu.:2.0
## Median :2.00 Median :4.000 Median :2.000 Median :4.000 Median :2.0
## Mean :2.15 Mean :4.067 Mean :2.133 Mean :4.083 Mean :2.2
## 3rd Qu.:2.25 3rd Qu.:5.000 3rd Qu.:2.000 3rd Qu.:5.000 3rd Qu.:3.0
## Max. :5.00 Max. :5.000 Max. :5.000 Max. :5.000 Max. :5.0
## A9 A10 B1 B2 B3
## Min. :1.000 Min. :1.00 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:3.000 1st Qu.:4.00 1st Qu.:4.000 1st Qu.:2.000 1st Qu.:4.000
## Median :4.000 Median :4.00 Median :4.000 Median :2.500 Median :4.000
## Mean :3.833 Mean :4.15 Mean :3.883 Mean :2.517 Mean :3.933
## 3rd Qu.:5.000 3rd Qu.:5.00 3rd Qu.:4.000 3rd Qu.:3.000 3rd Qu.:4.000
## Max. :5.000 Max. :5.00 Max. :5.000 Max. :4.000 Max. :5.000
## B4 B5 B6 B7 B8
## Min. :1.000 Min. :1.0 Min. :1.0 Min. :1.00 Min. :1.000
## 1st Qu.:3.000 1st Qu.:2.0 1st Qu.:3.0 1st Qu.:2.00 1st Qu.:3.000
## Median :4.000 Median :3.0 Median :4.0 Median :3.00 Median :4.000
## Mean :3.567 Mean :2.9 Mean :3.8 Mean :2.95 Mean :3.633
## 3rd Qu.:4.000 3rd Qu.:4.0 3rd Qu.:4.0 3rd Qu.:4.00 3rd Qu.:4.000
## Max. :5.000 Max. :5.0 Max. :5.0 Max. :5.00 Max. :5.000
## B9 B10
## Min. :1.000 Min. :1.00
## 1st Qu.:3.000 1st Qu.:3.00
## Median :4.000 Median :3.00
## Mean :3.667 Mean :3.35
## 3rd Qu.:4.000 3rd Qu.:4.00
## Max. :5.000 Max. :5.00
Reverse Coding
Sebelum dilakukan pengujian, nilai dari pernyataan yang bersifat negatif (agar semua pernyataan bersifat positif) dilakukan Reverse Coding, atau membalikkan nilai misalnya yaitu pada pernyataan 2, 4, 6, dan 8 pada variable “Kualitas Internet Pribadi” dan peryataan 2, 5, 7, dan 10 pada variabel “Efektivitas Belajar”.
Visualisasi Rata-Rata Variabel
a_cols <- paste0("A",1:10)
b_cols <- paste0("B",1:10)
data$A_total <- rowSums(data[a_cols])
data$B_total <- rowSums(data[b_cols])
rata2 <- data.frame(
Variabel=c("Kualitas Internet","Efektivitas Belajar"),
Mean=c(mean(data$A_total),mean(data$B_total))
)
ggplot(rata2,
aes(x=Variabel,y=Mean,fill=Variabel))+
geom_col()+
labs(
title="Rata-rata Variabel Penelitian",
x="Variabel",
y="Rata-rata"
)Diagram batang menunjukkan rata-rata skor kualitas internet dan efektivitas belajar mahasiswa.
UJI VALIDITAS DAN UJI RELIABILITAS
Uji Validitas
Uji validitas dilakukan menggunakan korelasi Pearson antara skor item dengan skor total terkoreksi. Untuk data sampel n=60 dilakukan uji validitas sebagai berikut dengan nilai rtabel = 0,254 untuk α=0,05
Variabel A
hasil_validitas_A <- data.frame()
for(item in a_cols){
total_koreksi <- rowSums(data[a_cols]) - data[[item]]
hasil <- cor.test(
data[[item]],
total_koreksi
)
hasil_validitas_A <- rbind(
hasil_validitas_A,
data.frame(
Item=item,
r_hitung=round(hasil$estimate,3),
p_value=round(hasil$p.value,4)
)
)
}
hasil_validitas_A## Item r_hitung p_value
## cor A1 0.654 0.0000
## cor1 A2 0.316 0.0139
## cor2 A3 0.604 0.0000
## cor3 A4 0.382 0.0026
## cor4 A5 0.728 0.0000
## cor5 A6 0.565 0.0000
## cor6 A7 0.623 0.0000
## cor7 A8 0.338 0.0082
## cor8 A9 0.145 0.2693
## cor9 A10 0.656 0.0000
Visualisasi Validitas Variabel A
ggplot(
hasil_validitas_A,
aes(Item,r_hitung)
)+
geom_bar(stat="identity")+
geom_hline(
yintercept=0.254,
linetype="dashed",
color="red"
)+
labs(
title="Validitas Variabel A",
y="r hitung"
)Variabel B
hasil_validitas_B <- data.frame()
for(item in b_cols){
total_koreksi <- rowSums(data[b_cols]) - data[[item]]
hasil <- cor.test(
data[[item]],
total_koreksi
)
hasil_validitas_B <- rbind(
hasil_validitas_B,
data.frame(
Item=item,
r_hitung=round(hasil$estimate,3),
p_value=round(hasil$p.value,4)
)
)
}
hasil_validitas_B## Item r_hitung p_value
## cor B1 0.575 0.0000
## cor1 B2 0.075 0.5674
## cor2 B3 0.491 0.0001
## cor3 B4 0.605 0.0000
## cor4 B5 0.143 0.2743
## cor5 B6 0.595 0.0000
## cor6 B7 0.191 0.1447
## cor7 B8 0.620 0.0000
## cor8 B9 0.578 0.0000
## cor9 B10 -0.094 0.4771
Visualisasi Validitas Variabel B
ggplot(
hasil_validitas_B,
aes(Item,r_hitung)
)+
geom_bar(stat="identity")+
geom_hline(
yintercept=0.254,
linetype="dashed",
color="red"
)+
labs(
title="Validitas Variabel B",
y="r hitung"
)Hasil uji validitas menunjukkan bahwa hanya enam item yang memenuhi kriteria validitas, yaitu B1, B3, B4, B6, B8, dan B9. Empat item lainnya tidak digunakan pada tahap klasifikasi. Secara keseluruhan, dari 20 item awal diperoleh 15 item valid yang digunakan sebagai dasar pemodelan.
Uji Reliabilitas
Menggunakan Item Valid
Cronbach Alpha
## [1] 0.8311001
## [1] 0.8957431
Visualisasi Reliabilitas
alpha_df <- data.frame(
Variabel=c("Internet","Efektivitas"),
Alpha=c(
alpha_A$total$raw_alpha,
alpha_B$total$raw_alpha
)
)
ggplot(alpha_df,
aes(Variabel,Alpha,fill=Variabel))+
geom_col()+
ylim(0,1)+
labs(
title="Cronbach Alpha"
)Nilai Alpha lebih besar dari 0,70 menunjukkan instrumen reliabel. Nilai Cronbach’s Alpha kedua variabel berada di atas 0,70 sehingga instrumen memiliki tingkat konsistensi internal yang tinggi. Dengan demikian, item-item yang valid dapat digunakan pada analisis.
Analisis Deskriptif
Skor Rata-Rata Variabel
data$A_mean <- rowMeans(data[a_valid])
data$B_mean <- rowMeans(data[b_valid])
summary(data[,c("A_mean","B_mean")])## A_mean B_mean
## Min. :2.556 Min. :1.333
## 1st Qu.:3.556 1st Qu.:3.333
## Median :4.000 Median :3.833
## Mean :3.939 Mean :3.747
## 3rd Qu.:4.333 3rd Qu.:4.167
## Max. :5.000 Max. :5.000
Boxplot
boxplot(
data$A_mean,
data$B_mean,
names=c("Internet","Efektivitas"),
main="Boxplot Variabel Penelitian"
)Nilai rata-rata kualitas internet sebesar 3,928 menunjukkan bahwa sebagian besar mahasiswa menilai kualitas internet pribadi yang digunakan berada pada kategori baik. Sementara itu, rata-rata efektivitas belajar sebesar 3,477 menunjukkan bahwa efektivitas belajar mahasiswa berada pada kategori cukup baik hingga baik. Meskipun demikian, rata-rata efektivitas belajar lebih rendah dibandingkan kualitas internet. Hal ini mengindikasikan bahwa efektivitas belajar tidak hanya dipengaruhi oleh kualitas internet, tetapi juga faktor-faktor lain seperti motivasi belajar, metode pembelajaran, lingkungan belajar, dan kemampuan manajemen waktu.
HUBUNGAN KUALITAS INTERNET PRIBADI DENGAN EFEKTIVITAS BELAJAR
PERSIAPAN SEBELUM KLASTER
Standarisasi
cluster_data <- data[,c(a_valid,b_valid)]
cluster_scaled <- scale(cluster_data)
head(cluster_scaled)## A1 A2 A3 A4 A5 A6
## [1,] -1.5325554 -0.3928247 -1.108678 0.1635150 -0.08816681 0.1407668
## [2,] -0.3065111 0.6319355 -1.108678 0.1635150 -0.08816681 0.1407668
## [3,] 0.9195333 -0.3928247 1.108678 1.2536151 1.23433531 0.1407668
## [4,] 0.9195333 0.6319355 0.000000 1.2536151 -0.08816681 0.1407668
## [5,] -0.3065111 -0.3928247 0.000000 -0.9265851 -0.08816681 -1.9707347
## [6,] 0.9195333 0.6319355 0.000000 0.1635150 -0.08816681 0.1407668
## A7 A8 A10 B1 B3 B4
## [1,] -1.3396404 -0.9306208 -0.1785294 -1.0446725 0.07926714 -0.6110925
## [2,] -0.1030493 0.2326552 -0.1785294 0.1379756 0.07926714 0.4673061
## [3,] 1.1335419 0.2326552 1.0116666 1.3206238 1.26827430 1.5457046
## [4,] 1.1335419 0.2326552 1.0116666 -1.0446725 0.07926714 -1.6894911
## [5,] -0.1030493 0.2326552 -0.1785294 0.1379756 0.07926714 -0.6110925
## [6,] 1.1335419 0.2326552 -0.1785294 0.1379756 1.26827430 0.4673061
## B6 B8 B9
## [1,] 0.2226653 -0.7026508 0.4082483
## [2,] 0.2226653 0.4067978 0.4082483
## [3,] 1.3359917 1.5162464 1.6329932
## [4,] 0.2226653 0.4067978 0.4082483
## [5,] 0.2226653 0.4067978 0.4082483
## [6,] 0.2226653 0.4067978 0.4082483
MENENTUKAN JUMLAH KLASTER
Sebelum membentuk model Clustering, dilakukan penentuan jumlah Cluster optimal menggunakan Elbow Method dan Silhouette Score.
Elbow Method
Grafik Elbow
Hasil Elbow Method menunjukkan adanya penurunan nilai Within Cluster Sum of Squares (WCSS) yang cukup tajam hingga k = 2 dan mulai melandai setelahnya. Pola ini mengindikasikan bahwa jumlah Cluster yang layak dipertimbangkan adalah 2 atau 3 Cluster.
Silhouette Method
Grafik Silhouette
plot(
2:10,
silhouette_values[2:10],
type="b",
pch=19,
xlab="Jumlah Cluster",
ylab="Silhouette Score"
)Nilai Silhouette Score tertinggi diperoleh pada k = 2 yaitu sebesar 0,311. Oleh karena itu, jumlah Cluster optimal yang digunakan dalam penelitian ini adalah dua Cluster. Nilai 0,311 termasuk kategori fair Clustering, yang menunjukkan bahwa pemisahan antar kelompok sudah terbentuk meskipun belum sangat kuat.
K-MEANS CLUSTERING
set.seed(123)
km_final <- kmeans(
cluster_scaled,
centers=2,
nstart=20
)
data$Cluster <- km_final$cluster
table(data$Cluster)##
## 1 2
## 50 10
Sebagian besar responden berada pada Cluster 1 sebanyak 50 mahasiswa (83,3%), sedangkan Cluster 0 hanya terdiri atas 10 mahasiswa (16,7%). Hal ini menunjukkan bahwa mayoritas mahasiswa memiliki karakteristik yang relatif serupa terkait kualitas internet dan efektivitas belajar.
Profil Cluster
## Cluster A1 A2 A3 A4 A5 A6 A7 A8 A10 B1 B3 B4 B6 B8 B9
## 1 1 4.48 3.42 4.26 3.9 4.3 4.0 4.34 3.86 4.38 4.12 4.1 3.7 4.0 3.8 3.8
## 2 2 3.10 3.20 2.70 3.6 2.9 3.2 2.80 3.50 3.00 2.70 3.1 2.9 2.8 2.8 3.0
Visualisasi Cluster
Dari hasil tersebut diketahuilah dua kelompok mahasiswa sebagai berikut. a. Cluster 0 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Rendah) Cluster 0 terdiri atas 10 mahasiswa atau sekitar 16,7% dari total responden. Berdasarkan nilai rata-rata setiap indikator, mahasiswa pada Cluster ini memiliki persepsi yang relatif rendah terhadap kualitas internet pribadi maupun efektivitas belajar. Pada aspek kualitas internet, skor rata-rata kecepatan internet (A1) sebesar 3,10 menunjukkan bahwa internet yang digunakan belum sepenuhnya memadai untuk mendukung aktivitas akademik. Kestabilan sinyal (A3) memperoleh nilai 2,70 yang merupakan salah satu nilai terendah dalam Cluster ini, mengindikasikan bahwa mahasiswa masih sering mengalami gangguan sinyal saat mengakses internet. Selain itu, akses terhadap materi pembelajaran (A5) hanya memperoleh skor 2,90 dan kestabilan koneksi dalam penggunaan jangka panjang (A7) sebesar 2,80, yang menunjukkan bahwa internet belum mampu memberikan pengalaman penggunaan yang optimal untuk kegiatan belajar. Penilaian umum terhadap kualitas internet (A10) juga hanya mencapai 3,00, yang mengindikasikan bahwa kualitas internet berada pada kategori sedang hingga rendah. Kondisi kualitas internet yang kurang optimal tersebut diikuti oleh tingkat efektivitas belajar yang juga relatif rendah. Hal ini terlihat dari skor kemampuan internet dalam membantu memahami materi pembelajaran (B1) yang hanya sebesar 2,70. Selain itu, kemampuan internet dalam membantu mahasiswa menyelesaikan tugas lebih cepat (B6) dan memanfaatkan waktu belajar secara lebih efektif (B8) masing-masing memperoleh skor 2,80. Nilai fokus belajar (B4) sebesar 2,90 menunjukkan bahwa internet belum mampu memberikan dukungan yang signifikan dalam meningkatkan konsentrasi belajar mahasiswa. Secara keseluruhan, mahasiswa pada Cluster ini masih menghadapi berbagai hambatan dalam pemanfaatan internet untuk menunjang kegiatan akademik sehingga efektivitas belajar yang dirasakan juga relatif lebih rendah dibandingkan kelompok lainnya. Oleh karena itu, Cluster 0 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar rendah. b. Cluster 1 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Tinggi) Cluster 1 merupakan kelompok mayoritas yang terdiri atas 50 mahasiswa atau sekitar 83,3% dari total responden. Mahasiswa pada Cluster ini menunjukkan nilai rata-rata yang tinggi pada hampir seluruh indikator kualitas internet dan efektivitas belajar. Pada aspek kualitas internet, kecepatan internet (A1) memperoleh skor rata-rata sebesar 4,48 yang menunjukkan bahwa mahasiswa merasa internet yang digunakan telah memadai untuk mendukung kebutuhan akademik. Kestabilan sinyal (A3) sebesar 4,26 dan kelancaran akses materi pembelajaran (A5) sebesar 4,30 mengindikasikan bahwa mahasiswa jarang mengalami kendala ketika mengakses sumber belajar secara daring. Selain itu, kestabilan koneksi dalam penggunaan jangka panjang (A7) memperoleh nilai 4,34 dan penilaian umum terhadap kualitas internet (A10) sebesar 4,38. Nilai-nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini memiliki pengalaman penggunaan internet yang relatif baik dan mendukung aktivitas pembelajaran. Tingginya kualitas internet tersebut diikuti oleh tingkat efektivitas belajar yang juga tinggi. Kemampuan internet dalam membantu memahami materi pembelajaran (B1) memperoleh skor rata-rata 4,12, sedangkan kemudahan mencari referensi akademik (B3) memperoleh skor 4,10. Selain itu, internet dinilai mampu membantu mahasiswa menyelesaikan tugas lebih cepat (B6) dengan skor 4,00, serta membantu pemanfaatan waktu belajar secara lebih efektif (B8) dan mendukung proses pembelajaran (B9) dengan skor masing-masing sebesar 3,80. Hasil ini menunjukkan bahwa mahasiswa pada Cluster ini merasakan manfaat internet secara nyata dalam menunjang aktivitas akademik sehari-hari. Dengan demikian, Cluster 1 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar tinggi.
Analisis Centroid
## A1 A2 A3 A4 A5 A6 A7
## 1 0.2819902 0.03757454 0.2882563 0.054505 0.3085838 0.1407668 0.3173917
## 2 -1.4099510 -0.18787271 -1.4412813 -0.272525 -1.5429191 -0.7038338 -1.5869586
## A8 A10 B1 B3 B4 B6 B8
## 1 0.06979656 0.2737451 0.2798934 0.1981679 0.1437865 0.2226653 0.1849081
## 2 -0.34898279 -1.3687255 -1.3994670 -0.9908393 -0.7189324 -1.1133265 -0.9245405
## B9
## 1 0.1632993
## 2 -0.8164966
Visualisasi Centroid
centroid <- as.data.frame(km_final$centers)
matplot(
t(centroid),
type="b",
pch=19,
lty=1,
xlab="Variabel",
ylab="Nilai Centroid"
)
legend(
"topright",
legend=c("Cluster 1","Cluster 2"),
lty=1,
pch=19
)Centroid merupakan titik pusat (pusat Cluster) yang diperoleh dari rata-rata nilai seluruh anggota dalam suatu Cluster. Nilai centroid digunakan untuk menggambarkan karakteristik umum setiap kelompok yang terbentuk. Berdasarkan hasil analisis K-Means, diperoleh dua Cluster dengan karakteristik yang berbeda. Cluster 0 memiliki nilai centroid sebesar 3,11 untuk variabel kualitas internet pribadi dan 2,88 untuk variabel efektivitas belajar. Nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini cenderung memiliki kualitas internet yang relatif lebih rendah dibandingkan kelompok lainnya. Selain itu, tingkat efektivitas belajar yang dirasakan juga relatif rendah. Kondisi ini mengindikasikan bahwa mahasiswa dalam Cluster tersebut masih mengalami berbagai kendala dalam penggunaan internet, seperti kestabilan koneksi, kelancaran akses materi pembelajaran, maupun pemanfaatan internet untuk menunjang kegiatan akademik. Oleh karena itu, Cluster 0 dapat diinterpretasikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar rendah. Sebaliknya, Cluster 1 memiliki nilai centroid sebesar 4,10 untuk kualitas internet pribadi dan 3,92 untuk efektivitas belajar. Nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini memiliki kualitas internet yang baik, ditandai dengan kecepatan akses yang memadai, sinyal yang lebih stabil, serta kemudahan dalam mengakses materi pembelajaran dan referensi akademik. Kondisi tersebut diikuti oleh tingkat efektivitas belajar yang lebih tinggi, yang terlihat dari kemudahan memahami materi, menyelesaikan tugas, dan mengikuti proses pembelajaran. Oleh karena itu, Cluster 1 dapat diinterpretasikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar tinggi. Perbedaan centroid antara kedua Cluster menunjukkan adanya pemisahan kelompok yang cukup jelas. Selisih rata-rata kualitas internet antara Cluster 0 dan Cluster 1 sebesar 0,99 poin, sedangkan selisih rata-rata efektivitas belajar sebesar 1,04 poin. Perbedaan tersebut menunjukkan bahwa mahasiswa yang memiliki kualitas internet yang lebih baik cenderung memiliki efektivitas belajar yang lebih tinggi. Dengan demikian, hasil Clustering mengindikasikan adanya kecenderungan hubungan positif antara kualitas internet pribadi dan efektivitas belajar mahasiswa. Temuan ini juga sejalan dengan tujuan penelitian yang ingin mengelompokkan mahasiswa berdasarkan persepsi terhadap kualitas internet dan efektivitas belajar yang mereka rasakan.
HIERARCHICAL CLUSTERING
Metode Hierarchical Clustering menghasilkan distribusi Cluster yang sama dengan metode K-Means, yaitu Cluster 0 = 50 mahasiswa (83,3%) dan Cluster 1 = 10 mahasiswa (16,7%). Perbedaan hanya terletak pada penomoran label Cluster. Sebagian besar responden berada pada Cluster 0 sebanyak 50 mahasiswa (83,3%), sedangkan Cluster 1 hanya terdiri atas 10 mahasiswa (16,7%). Hal ini menunjukkan bahwa mayoritas mahasiswa memiliki karakteristik yang relatif serupa terkait kualitas internet dan efektivitas belajar.
Dendrogram
Dendrogram menunjukkan bahwa responden secara alami membentuk dua kelompok besar. Jika dilakukan pemotongan pada jarak tertentu, akan terbentuk dua cabang utama yang sesuai dengan hasil K-Means.Temuan ini memperkuat bahwa struktur data memang cenderung membentuk dua kelompok utama.
Hasil Hierarchical Clustering
##
## 1 2
## 10 50
Visualisasi
plot(
data$A_mean,
data$B_mean,
col=data$HC_Cluster,
pch=19,
xlab="Kualitas Internet",
ylab="Efektivitas Belajar"
)
Berdasarkan metode Hierarchical Clustering dengan Ward Linkage,
diperoleh dua kelompok mahasiswa yang memiliki karakteristik berbeda
terkait kualitas internet pribadi dan efektivitas belajar. Distribusi
anggota Cluster menunjukkan bahwa Cluster 0 terdiri dari 50 mahasiswa
(83,3%), sedangkan Cluster 1 terdiri dari 10 mahasiswa (16,7%). Kemudian
didapatlah sebaran sebagai berikut.
- Cluster 0 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Tinggi) Cluster 0 merupakan kelompok mayoritas yang terdiri dari 50 mahasiswa. Berdasarkan nilai rata-rata setiap indikator, mahasiswa pada Cluster ini memiliki kualitas internet pribadi yang relatif baik. Hal tersebut terlihat dari skor kecepatan internet (A1) sebesar 4,48, kestabilan sinyal (A3) sebesar 4,26, kelancaran akses materi pembelajaran (A5) sebesar 4,30, serta kestabilan koneksi dalam penggunaan jangka panjang (A7) sebesar 4,34. Selain itu, penilaian umum terhadap kualitas internet (A10) memperoleh skor sebesar 4,38. Nilai-nilai tersebut menunjukkan bahwa sebagian besar mahasiswa dalam Cluster ini merasa internet yang mereka gunakan mampu mendukung aktivitas akademik dengan baik. Kondisi kualitas internet yang baik tersebut diikuti oleh tingginya efektivitas belajar yang dirasakan mahasiswa. Hal ini terlihat dari skor kemampuan internet dalam membantu memahami materi pembelajaran (B1) sebesar 4,12, memudahkan pencarian referensi akademik (B3) sebesar 4,10, membantu menyelesaikan tugas lebih cepat (B6) sebesar 4,00, serta mendukung proses pembelajaran (B9) sebesar 3,80. Hasil tersebut menunjukkan bahwa mahasiswa dalam Cluster ini merasakan manfaat internet secara nyata dalam menunjang kegiatan belajar. Oleh karena itu, Cluster 0 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet tinggi dan efektivitas belajar tinggi.
- Cluster 1 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Rendah) Cluster 1 terdiri dari 10 mahasiswa atau sekitar 16,7% dari total responden. Dibandingkan dengan Cluster 0, kelompok ini memiliki skor yang lebih rendah pada hampir seluruh indikator. Pada aspek kualitas internet, skor kestabilan sinyal (A3) hanya sebesar 2,70, kelancaran akses materi pembelajaran (A5) sebesar 2,90, kestabilan koneksi dalam penggunaan jangka panjang (A7) sebesar 2,80, dan penilaian umum terhadap kualitas internet (A10) sebesar 3,00. Nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini masih mengalami berbagai kendala dalam penggunaan internet, baik dari segi kecepatan maupun kestabilan koneksi. Rendahnya kualitas internet juga diikuti oleh rendahnya efektivitas belajar. Skor kemampuan internet dalam membantu memahami materi pembelajaran (B1) hanya sebesar 2,70, membantu menyelesaikan tugas lebih cepat (B6) sebesar 2,80, meningkatkan efektivitas penggunaan waktu belajar (B8) sebesar 2,80, dan mendukung proses pembelajaran (B9) sebesar 3,00. Hasil ini menunjukkan bahwa manfaat internet yang dirasakan mahasiswa dalam mendukung proses belajar masih relatif terbatas. Oleh karena itu, Cluster 1 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet rendah dan efektivitas belajar rendah.
Perbandingan Metode
## [1] 1
Visualisasi ARI
Nilai Silhouette Score kedua metode identik. Selain itu diperoleh Adjusted Rand Index (ARI) = 1,000 dan Normalized Mutual Information (NMI) = 1,000. Nilai ARI dan NMI yang sama dengan satu menunjukkan bahwa hasil pengelompokan dari kedua metode sepenuhnya identik. Seluruh responden ditempatkan pada kelompok yang sama, hanya berbeda pada penomoran label Cluster. Dengan demikian, struktur Cluster yang terbentuk dapat dikatakan sangat stabil dan tidak bergantung pada metode Clustering yang digunakan. Untuk membuktikan secara statistik bahwa Cluster yang terbentuk memang berbeda secara signifikan, digunakanlah kruskal-wallis method.Hasil uji Kruskal-Wallis dilakukan pada Cluster yang terbentuk untuk menguji apakah terdapat perbedaan karakteristik antar kelompok. Nilai p-value pada variabel kualitas internet dan efektivitas belajar menunjukkan hasil yang signifikan (p-value < 0,05). Mengingat hasil K-Means dan Hierarchical Clustering menghasilkan anggota Cluster yang identik, maka kesimpulan pengujian ini berlaku untuk kedua metode Clustering. Dengan demikian, kedua metode mampu membedakan kelompok mahasiswa berdasarkan kualitas internet pribadi dan efektivitas belajar secara signifikan.
KESIMPULAN
Berdasarkan hasil pengolahan dan analisis data menggunakan metode K-Means Clustering dan Hierarchical Clustering terhadap data mahasiswa Program Studi S-1 Statistika Universitas Riau Angkatan 2024, dapat disimpulkan bahwa instrumen penelitian yang digunakan telah memenuhi kriteria kualitas yang baik. Hasil uji validitas menunjukkan bahwa dari 20 item pernyataan yang digunakan, terdapat 15 item yang dinyatakan valid dan layak digunakan dalam analisis. Selain itu, hasil uji reliabilitas menunjukkan nilai Cronbach’s Alpha sebesar 0,831 untuk variabel kualitas internet pribadi dan 0,896 untuk variabel efektivitas belajar. Nilai tersebut lebih besar dari 0,70 sehingga instrumen penelitian dapat dinyatakan reliabel dan memiliki konsistensi yang baik. Hasil analisis deskriptif menunjukkan bahwa mahasiswa memiliki rata-rata skor kualitas internet pribadi sebesar 3,928 dan rata-rata skor efektivitas belajar sebesar 3,477. Nilai tersebut mengindikasikan bahwa secara umum mahasiswa memiliki kualitas internet yang tergolong baik dan efektivitas belajar yang cukup baik. Berdasarkan penentuan jumlah Cluster menggunakan Elbow Method dan Silhouette Score, diperoleh jumlah Cluster optimal sebanyak dua Cluster dengan nilai Silhouette Score sebesar 0,311 yang termasuk dalam kategori cukup baik (fair Clustering). Hasil K-Means Clustering menunjukkan bahwa terdapat dua kelompok mahasiswa yang memiliki karakteristik berbeda. Cluster pertama terdiri atas 10 mahasiswa (16,7%) dengan rata-rata kualitas internet sebesar 3,11 dan efektivitas belajar sebesar 2,88 sehingga dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar rendah. Sementara itu, Cluster kedua terdiri atas 50 mahasiswa (83,3%) dengan rata-rata kualitas internet sebesar 4,10 dan efektivitas belajar sebesar 3,92 sehingga dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar tinggi. Hasil Hierarchical Clustering juga menghasilkan dua kelompok dengan jumlah anggota dan karakteristik yang sama, meskipun terdapat perbedaan pada penomoran label Cluster. Perbandingan antara K-Means dan Hierarchical Clustering menunjukkan bahwa kedua metode menghasilkan struktur Cluster yang identik. Hal ini dibuktikan oleh nilai Adjusted Rand Index (ARI) sebesar 1,000 dan Normalized Mutual Information (NMI) sebesar 1,000. Dengan demikian, hasil segmentasi yang diperoleh dapat dikatakan sangat stabil dan tidak dipengaruhi oleh metode Clustering yang digunakan. Secara keseluruhan, hasil penelitian menunjukkan adanya kecenderungan bahwa mahasiswa yang memiliki kualitas internet pribadi yang lebih baik juga memiliki efektivitas belajar yang lebih tinggi. Sebaliknya, mahasiswa dengan kualitas internet yang lebih rendah cenderung memiliki efektivitas belajar yang lebih rendah.