ANALISIS CLUSTERING MENGGUNAKAN METODE K-MEANS DAN HIERARCHICAL CLUSTERING BERDASARKAN KELANCARAN INTERNET PRIBADI DAN EFEKTIVITAS BELAJAR MAHASISWA S-1 STATISTIKA UNIVERSITAS RIAU ANGKATAN 2024

install.packages<

PENDAHULUAN

Dalam dunia pendidikan tinggi, internet memiliki peran penting sebagai sumber belajar bagi mahasiswa. Internet memungkinkan mahasiswa untuk memperoleh berbagai informasi akademik, mengakses materi pembelajaran, serta mendukung penyelesaian tugas-tugas perkuliahan. Selain itu, internet juga berfungsi sebagai media komunikasi yang efektif untuk menunjang interaksi antara mahasiswa dan dosen maupun sesama mahasiswa dalam kegiatan akademik (Ikram & Muktaruddin, 2024). Meskipun demikian, kondisi dan pemanfaatan internet oleh mahasiswa tidak selalu sama. Sebagian mahasiswa memiliki akses internet yang lancar dan stabil sehingga dapat mendukung proses belajar secara optimal, sementara sebagian lainnya menghadapi kendala akses yang berpotensi memengaruhi aktivitas belajar. Perbedaan kondisi internet tersebut dapat menyebabkan variasi dalam efektivitas belajar mahasiswa. Perbedaan karakteristik mahasiswa dalam hal kelancaran internet pribadi dan efektivitas belajar menarik untuk dianalisis lebih lanjut. Salah satu pendekatan yang dapat digunakan adalah analisis Clustering, yaitu teknik pengelompokan data yang bertujuan untuk mengidentifikasi kelompok-kelompok mahasiswa yang memiliki karakteristik serupa berdasarkan variabel yang diamati. Melalui Clustering, dapat diperoleh gambaran mengenai profil mahasiswa berdasarkan kondisi internet pribadi dan efektivitas belajar tanpa harus mengasumsikan adanya hubungan sebab-akibat antarvariabel. Dalam penelitian ini digunakan dua metode Clustering, yaitu K-Means Clustering dan Hierarchical Clustering. Kedua metode tersebut memiliki pendekatan yang berbeda dalam membentuk kelompok data sehingga memungkinkan diperolehnya hasil pengelompokan yang berbeda pula. Oleh karena itu, diperlukan perbandingan hasil kedua metode untuk menentukan metode yang mampu menghasilkan pengelompokan yang lebih baik berdasarkan ukuran evaluasi Clustering yang digunakan. Berdasarkan uraian tersebut, penelitian ini bertujuan untuk mengelompokkan mahasiswa S-1 Statistika Universitas Riau Angkatan 2024 berdasarkan karakteristik kelancaran internet pribadi dan efektivitas belajar, serta membandingkan hasil pengelompokan yang diperoleh dari metode K-Means Clustering dan Hierarchical Clustering.

DATA

Data yang digunakan dalam penelitian ini merupakan data hasil penyebaran kuesioner kepada 60 mahasiswa S-1 Statistika Universitas Riau Angkatan 2024. Variabel yang dianalisis terdiri atas kualitas internet pribadi (Variabel A) dan efektivitas belajar (Variabel B). Pemilihan populasi ini didasarkan pada kesesuaian karakteristik responden dengan tujuan penelitian, yaitu mengidentifikasi pola kelompok mahasiswa berdasarkan persepsi terhadap kelancaran internet pribadi dan efektivitas belajar. Mahasiswa Statistika angkatan 2024 dipilih karena seluruh mahasiswa memiliki aktivitas akademik yang relatif serupa dan menggunakan internet sebagai sarana utama dalam menunjang proses pembelajaran, baik untuk mengakses materi kuliah, mengerjakan tugas, maupun berkomunikasi dengan dosen dan sesama mahasiswa. Dalam penelitian ini diperoleh data primer melalui penyebaran kuesioner secara daring menggunakan Google Form. Kuesioner disebarkan kepada responden terpilih melalui aplikasi WhatsApp. Dari target sampel yang telah ditentukan, diperoleh sebanyak 60 responden yang bersedia mengisi kuesioner dan datanya digunakan dalam proses analisis lebih lanjut.

library(readxl)
library(dplyr)
library(ggplot2)
library(psych)
library(cluster)
library(factoextra)
library(corrplot)
library(mclust)
data <- read_excel("C:/Users/LENOVO/Downloads/data_psd.xlsx")


dim(data)
## [1] 60 29
head(data)
## # A tibble: 6 × 29
##   Timestamp          Username Nama  Kelas Usia  `Jenis Kelamin` `Tempat Tinggal`
##   <chr>              <chr>    <chr> <chr> <chr> <chr>           <chr>           
## 1 2026/03/26 4:15:5… nailana… ila   A     19-2… Perempuan       Kos/Kontrakan   
## 2 2026/03/26 4:21:1… tiwi.ap… tiwi  A     19-2… Perempuan       Kos/Kontrakan   
## 3 2026/03/26 4:28:0… yosephi… Yo    B     19-2… Perempuan       Kos/Kontrakan   
## 4 2026/03/26 4:30:0… atikaha… tiqah A     19-2… Perempuan       Bersama Keluarga
## 5 2026/03/26 4:39:4… uci.mar… uci   B     19-2… Perempuan       Kos/Kontrakan   
## 6 2026/03/26 4:43:2… alfatih… syifa B     19-2… Perempuan       Kos/Kontrakan   
## # ℹ 22 more variables: `Jenis Kartu SIM` <chr>,
## #   `Penggunaan Internet di Kampus` <chr>, A1 <dbl>, A2 <dbl>, A3 <dbl>,
## #   A4 <dbl>, A5 <dbl>, A6 <dbl>, A7 <dbl>, A8 <dbl>, A9 <dbl>, A10 <dbl>,
## #   B1 <dbl>, B2 <dbl>, B3 <dbl>, B4 <dbl>, B5 <dbl>, B6 <dbl>, B7 <dbl>,
## #   B8 <dbl>, B9 <dbl>, B10 <dbl>
str(data)
## tibble [60 × 29] (S3: tbl_df/tbl/data.frame)
##  $ Timestamp                    : chr [1:60] "2026/03/26 4:15:53 PM GMT+7" "2026/03/26 4:21:10 PM GMT+7" "2026/03/26 4:28:01 PM GMT+7" "2026/03/26 4:30:08 PM GMT+7" ...
##  $ Username                     : chr [1:60] "nailanafisademul@gmail.com" "tiwi.aprista1369@student.unri.ac.id" "yosephine.lamria7296@student.unri.ac.id" "atikahadawiyah06@gmail.com" ...
##  $ Nama                         : chr [1:60] "ila" "tiwi" "Yo" "tiqah" ...
##  $ Kelas                        : chr [1:60] "A" "A" "B" "A" ...
##  $ Usia                         : chr [1:60] "19-20 Tahun" "19-20 Tahun" "19-20 Tahun" "19-20 Tahun" ...
##  $ Jenis Kelamin                : chr [1:60] "Perempuan" "Perempuan" "Perempuan" "Perempuan" ...
##  $ Tempat Tinggal               : chr [1:60] "Kos/Kontrakan" "Kos/Kontrakan" "Kos/Kontrakan" "Bersama Keluarga" ...
##  $ Jenis Kartu SIM              : chr [1:60] "Telkomsel" "Tri(3)" "Tri(3)" "Indosat" ...
##  $ Penggunaan Internet di Kampus: chr [1:60] "Lebih sering menggunakan internet pribadi (SIM card)" "Lebih sering menggunakan internet pribadi (SIM card)" "Lebih sering menggunakan internet pribadi (SIM card)" "Lebih sering menggunakan internet pribadi (SIM card)" ...
##  $ A1                           : num [1:60] 3 4 5 5 4 5 4 5 4 5 ...
##  $ A2                           : num [1:60] 3 2 3 2 3 2 2 4 2 2 ...
##  $ A3                           : num [1:60] 3 3 5 4 4 4 4 4 4 5 ...
##  $ A4                           : num [1:60] 2 2 1 1 3 2 2 4 2 2 ...
##  $ A5                           : num [1:60] 4 4 5 4 4 4 4 4 4 5 ...
##  $ A6                           : num [1:60] 2 2 2 2 4 2 2 4 2 2 ...
##  $ A7                           : num [1:60] 3 4 5 5 4 5 4 4 4 4 ...
##  $ A8                           : num [1:60] 3 2 2 2 2 2 2 4 3 2 ...
##  $ A9                           : num [1:60] 3 5 4 5 4 2 5 4 5 4 ...
##  $ A10                          : num [1:60] 4 4 5 5 4 4 5 5 4 4 ...
##  $ B1                           : num [1:60] 3 4 5 3 4 4 4 5 4 5 ...
##  $ B2                           : num [1:60] 3 2 2 4 3 1 4 1 2 3 ...
##  $ B3                           : num [1:60] 4 4 5 4 4 5 4 4 4 5 ...
##  $ B4                           : num [1:60] 3 4 5 2 3 4 2 4 4 4 ...
##  $ B5                           : num [1:60] 4 4 1 5 3 1 4 4 4 4 ...
##  $ B6                           : num [1:60] 4 4 5 4 4 4 4 4 4 4 ...
##  $ B7                           : num [1:60] 3 1 2 2 4 2 3 3 1 3 ...
##  $ B8                           : num [1:60] 3 4 5 4 4 4 4 5 4 4 ...
##  $ B9                           : num [1:60] 4 4 5 4 4 4 4 4 4 4 ...
##  $ B10                          : num [1:60] 3 2 3 2 4 4 2 4 3 3 ...
summary(data)
##   Timestamp           Username             Nama              Kelas          
##  Length:60          Length:60          Length:60          Length:60         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##      Usia           Jenis Kelamin      Tempat Tinggal     Jenis Kartu SIM   
##  Length:60          Length:60          Length:60          Length:60         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##  Penggunaan Internet di Kampus       A1             A2              A3      
##  Length:60                     Min.   :1.00   Min.   :1.000   Min.   :1.00  
##  Class :character              1st Qu.:4.00   1st Qu.:2.000   1st Qu.:3.75  
##  Mode  :character              Median :4.00   Median :3.000   Median :4.00  
##                                Mean   :4.25   Mean   :2.617   Mean   :4.00  
##                                3rd Qu.:5.00   3rd Qu.:3.000   3rd Qu.:5.00  
##                                Max.   :5.00   Max.   :5.000   Max.   :5.00  
##        A4             A5              A6              A7              A8     
##  Min.   :1.00   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.0  
##  1st Qu.:2.00   1st Qu.:4.000   1st Qu.:2.000   1st Qu.:4.000   1st Qu.:2.0  
##  Median :2.00   Median :4.000   Median :2.000   Median :4.000   Median :2.0  
##  Mean   :2.15   Mean   :4.067   Mean   :2.133   Mean   :4.083   Mean   :2.2  
##  3rd Qu.:2.25   3rd Qu.:5.000   3rd Qu.:2.000   3rd Qu.:5.000   3rd Qu.:3.0  
##  Max.   :5.00   Max.   :5.000   Max.   :5.000   Max.   :5.000   Max.   :5.0  
##        A9             A10             B1              B2              B3       
##  Min.   :1.000   Min.   :1.00   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:3.000   1st Qu.:4.00   1st Qu.:4.000   1st Qu.:2.000   1st Qu.:4.000  
##  Median :4.000   Median :4.00   Median :4.000   Median :2.500   Median :4.000  
##  Mean   :3.833   Mean   :4.15   Mean   :3.883   Mean   :2.517   Mean   :3.933  
##  3rd Qu.:5.000   3rd Qu.:5.00   3rd Qu.:4.000   3rd Qu.:3.000   3rd Qu.:4.000  
##  Max.   :5.000   Max.   :5.00   Max.   :5.000   Max.   :4.000   Max.   :5.000  
##        B4              B5            B6            B7             B8       
##  Min.   :1.000   Min.   :1.0   Min.   :1.0   Min.   :1.00   Min.   :1.000  
##  1st Qu.:3.000   1st Qu.:2.0   1st Qu.:3.0   1st Qu.:2.00   1st Qu.:3.000  
##  Median :4.000   Median :3.0   Median :4.0   Median :3.00   Median :4.000  
##  Mean   :3.567   Mean   :2.9   Mean   :3.8   Mean   :2.95   Mean   :3.633  
##  3rd Qu.:4.000   3rd Qu.:4.0   3rd Qu.:4.0   3rd Qu.:4.00   3rd Qu.:4.000  
##  Max.   :5.000   Max.   :5.0   Max.   :5.0   Max.   :5.00   Max.   :5.000  
##        B9             B10      
##  Min.   :1.000   Min.   :1.00  
##  1st Qu.:3.000   1st Qu.:3.00  
##  Median :4.000   Median :3.00  
##  Mean   :3.667   Mean   :3.35  
##  3rd Qu.:4.000   3rd Qu.:4.00  
##  Max.   :5.000   Max.   :5.00

Reverse Coding

Sebelum dilakukan pengujian, nilai dari pernyataan yang bersifat negatif (agar semua pernyataan bersifat positif) dilakukan Reverse Coding, atau membalikkan nilai misalnya yaitu pada pernyataan 2, 4, 6, dan 8 pada variable “Kualitas Internet Pribadi” dan peryataan 2, 5, 7, dan 10 pada variabel “Efektivitas Belajar”.

reverse_items <- c(
"A2","A4","A6","A8",
"B2","B5","B7","B10"
)

for(i in reverse_items){
  data[[i]] <- 6 - data[[i]]
}

Visualisasi Rata-Rata Variabel

a_cols <- paste0("A",1:10)
b_cols <- paste0("B",1:10)

data$A_total <- rowSums(data[a_cols])
data$B_total <- rowSums(data[b_cols])

rata2 <- data.frame(
Variabel=c("Kualitas Internet","Efektivitas Belajar"),
Mean=c(mean(data$A_total),mean(data$B_total))
)

ggplot(rata2,
aes(x=Variabel,y=Mean,fill=Variabel))+
geom_col()+
labs(
title="Rata-rata Variabel Penelitian",
x="Variabel",
y="Rata-rata"
)

Diagram batang menunjukkan rata-rata skor kualitas internet dan efektivitas belajar mahasiswa.

UJI VALIDITAS DAN UJI RELIABILITAS

Uji Validitas

Uji validitas dilakukan menggunakan korelasi Pearson antara skor item dengan skor total terkoreksi. Untuk data sampel n=60 dilakukan uji validitas sebagai berikut dengan nilai rtabel = 0,254 untuk α=0,05

Variabel A

hasil_validitas_A <- data.frame()

for(item in a_cols){

 total_koreksi <- rowSums(data[a_cols]) - data[[item]]

 hasil <- cor.test(
 data[[item]],
 total_koreksi
 )

 hasil_validitas_A <- rbind(
 hasil_validitas_A,
 data.frame(
 Item=item,
 r_hitung=round(hasil$estimate,3),
 p_value=round(hasil$p.value,4)
 )
 )
}

hasil_validitas_A
##      Item r_hitung p_value
## cor    A1    0.654  0.0000
## cor1   A2    0.316  0.0139
## cor2   A3    0.604  0.0000
## cor3   A4    0.382  0.0026
## cor4   A5    0.728  0.0000
## cor5   A6    0.565  0.0000
## cor6   A7    0.623  0.0000
## cor7   A8    0.338  0.0082
## cor8   A9    0.145  0.2693
## cor9  A10    0.656  0.0000

Visualisasi Validitas Variabel A

ggplot(
hasil_validitas_A,
aes(Item,r_hitung)
)+
geom_bar(stat="identity")+
geom_hline(
yintercept=0.254,
linetype="dashed",
color="red"
)+
labs(
title="Validitas Variabel A",
y="r hitung"
)

Variabel B

hasil_validitas_B <- data.frame()

for(item in b_cols){

 total_koreksi <- rowSums(data[b_cols]) - data[[item]]

 hasil <- cor.test(
 data[[item]],
 total_koreksi
 )

 hasil_validitas_B <- rbind(
 hasil_validitas_B,
 data.frame(
 Item=item,
 r_hitung=round(hasil$estimate,3),
 p_value=round(hasil$p.value,4)
 )
 )
}

hasil_validitas_B
##      Item r_hitung p_value
## cor    B1    0.575  0.0000
## cor1   B2    0.075  0.5674
## cor2   B3    0.491  0.0001
## cor3   B4    0.605  0.0000
## cor4   B5    0.143  0.2743
## cor5   B6    0.595  0.0000
## cor6   B7    0.191  0.1447
## cor7   B8    0.620  0.0000
## cor8   B9    0.578  0.0000
## cor9  B10   -0.094  0.4771

Visualisasi Validitas Variabel B

ggplot(
hasil_validitas_B,
aes(Item,r_hitung)
)+
geom_bar(stat="identity")+
geom_hline(
yintercept=0.254,
linetype="dashed",
color="red"
)+
labs(
title="Validitas Variabel B",
y="r hitung"
)

Hasil uji validitas menunjukkan bahwa hanya enam item yang memenuhi kriteria validitas, yaitu B1, B3, B4, B6, B8, dan B9. Empat item lainnya tidak digunakan pada tahap klasifikasi. Secara keseluruhan, dari 20 item awal diperoleh 15 item valid yang digunakan sebagai dasar pemodelan.

Uji Reliabilitas

Menggunakan Item Valid

a_valid <- c(
"A1","A2","A3","A4",
"A5","A6","A7","A8","A10"
)

b_valid <- c(
"B1","B3","B4",
"B6","B8","B9"
)

Cronbach Alpha

alpha_A <- alpha(data[a_valid])
alpha_B <- alpha(data[b_valid])

alpha_A$total$raw_alpha
## [1] 0.8311001
alpha_B$total$raw_alpha
## [1] 0.8957431

Visualisasi Reliabilitas

alpha_df <- data.frame(
Variabel=c("Internet","Efektivitas"),
Alpha=c(
alpha_A$total$raw_alpha,
alpha_B$total$raw_alpha
)
)

ggplot(alpha_df,
aes(Variabel,Alpha,fill=Variabel))+
geom_col()+
ylim(0,1)+
labs(
title="Cronbach Alpha"
)

Nilai Alpha lebih besar dari 0,70 menunjukkan instrumen reliabel. Nilai Cronbach’s Alpha kedua variabel berada di atas 0,70 sehingga instrumen memiliki tingkat konsistensi internal yang tinggi. Dengan demikian, item-item yang valid dapat digunakan pada analisis.

Analisis Deskriptif

Skor Rata-Rata Variabel

data$A_mean <- rowMeans(data[a_valid])
data$B_mean <- rowMeans(data[b_valid])

summary(data[,c("A_mean","B_mean")])
##      A_mean          B_mean     
##  Min.   :2.556   Min.   :1.333  
##  1st Qu.:3.556   1st Qu.:3.333  
##  Median :4.000   Median :3.833  
##  Mean   :3.939   Mean   :3.747  
##  3rd Qu.:4.333   3rd Qu.:4.167  
##  Max.   :5.000   Max.   :5.000

Boxplot

boxplot(
data$A_mean,
data$B_mean,
names=c("Internet","Efektivitas"),
main="Boxplot Variabel Penelitian"
)

Nilai rata-rata kualitas internet sebesar 3,928 menunjukkan bahwa sebagian besar mahasiswa menilai kualitas internet pribadi yang digunakan berada pada kategori baik. Sementara itu, rata-rata efektivitas belajar sebesar 3,477 menunjukkan bahwa efektivitas belajar mahasiswa berada pada kategori cukup baik hingga baik. Meskipun demikian, rata-rata efektivitas belajar lebih rendah dibandingkan kualitas internet. Hal ini mengindikasikan bahwa efektivitas belajar tidak hanya dipengaruhi oleh kualitas internet, tetapi juga faktor-faktor lain seperti motivasi belajar, metode pembelajaran, lingkungan belajar, dan kemampuan manajemen waktu.

HUBUNGAN KUALITAS INTERNET PRIBADI DENGAN EFEKTIVITAS BELAJAR

Korelasi

cor(
data$A_mean,
data$B_mean
)
## [1] 0.4525683

Scatter Plot

ggplot(
data,
aes(A_mean,B_mean)
)+
geom_point(size=3)+
geom_smooth(
method="lm",
se=FALSE
)+
labs(
x="Kualitas Internet",
y="Efektivitas Belajar"
)
## `geom_smooth()` using formula = 'y ~ x'

Scatter plot menunjukkan pola hubungan antara kualitas internet dan efektivitas belajar.

PERSIAPAN SEBELUM KLASTER

Standarisasi

cluster_data <- data[,c(a_valid,b_valid)]

cluster_scaled <- scale(cluster_data)

head(cluster_scaled)
##              A1         A2        A3         A4          A5         A6
## [1,] -1.5325554 -0.3928247 -1.108678  0.1635150 -0.08816681  0.1407668
## [2,] -0.3065111  0.6319355 -1.108678  0.1635150 -0.08816681  0.1407668
## [3,]  0.9195333 -0.3928247  1.108678  1.2536151  1.23433531  0.1407668
## [4,]  0.9195333  0.6319355  0.000000  1.2536151 -0.08816681  0.1407668
## [5,] -0.3065111 -0.3928247  0.000000 -0.9265851 -0.08816681 -1.9707347
## [6,]  0.9195333  0.6319355  0.000000  0.1635150 -0.08816681  0.1407668
##              A7         A8        A10         B1         B3         B4
## [1,] -1.3396404 -0.9306208 -0.1785294 -1.0446725 0.07926714 -0.6110925
## [2,] -0.1030493  0.2326552 -0.1785294  0.1379756 0.07926714  0.4673061
## [3,]  1.1335419  0.2326552  1.0116666  1.3206238 1.26827430  1.5457046
## [4,]  1.1335419  0.2326552  1.0116666 -1.0446725 0.07926714 -1.6894911
## [5,] -0.1030493  0.2326552 -0.1785294  0.1379756 0.07926714 -0.6110925
## [6,]  1.1335419  0.2326552 -0.1785294  0.1379756 1.26827430  0.4673061
##             B6         B8        B9
## [1,] 0.2226653 -0.7026508 0.4082483
## [2,] 0.2226653  0.4067978 0.4082483
## [3,] 1.3359917  1.5162464 1.6329932
## [4,] 0.2226653  0.4067978 0.4082483
## [5,] 0.2226653  0.4067978 0.4082483
## [6,] 0.2226653  0.4067978 0.4082483

Visualisasi

boxplot(
cluster_scaled,
main="Data Setelah Standardisasi"
)

Standarisasi dilakukan agar seluruh variabel memiliki kontribusi yang seimbang.

MENENTUKAN JUMLAH KLASTER

Sebelum membentuk model Clustering, dilakukan penentuan jumlah Cluster optimal menggunakan Elbow Method dan Silhouette Score.

Elbow Method

wcss <- c()

for(k in 1:10){

 km <- kmeans(
 cluster_scaled,
 centers=k,
 nstart=20
 )

 wcss[k] <- km$tot.withinss
}

Grafik Elbow

plot(
1:10,
wcss,
type="b",
pch=19,
xlab="Jumlah Cluster",
ylab="WCSS",
main="Elbow Method"
)

Hasil Elbow Method menunjukkan adanya penurunan nilai Within Cluster Sum of Squares (WCSS) yang cukup tajam hingga k = 2 dan mulai melandai setelahnya. Pola ini mengindikasikan bahwa jumlah Cluster yang layak dipertimbangkan adalah 2 atau 3 Cluster.

Silhouette Method

silhouette_values <- c()

for(k in 2:10){

 km <- kmeans(
 cluster_scaled,
 centers=k,
 nstart=20
 )

 sil <- silhouette(
 km$cluster,
 dist(cluster_scaled)
 )

 silhouette_values[k] <- mean(sil[,3])
}

Grafik Silhouette

plot(
2:10,
silhouette_values[2:10],
type="b",
pch=19,
xlab="Jumlah Cluster",
ylab="Silhouette Score"
)

Nilai Silhouette Score tertinggi diperoleh pada k = 2 yaitu sebesar 0,311. Oleh karena itu, jumlah Cluster optimal yang digunakan dalam penelitian ini adalah dua Cluster. Nilai 0,311 termasuk kategori fair Clustering, yang menunjukkan bahwa pemisahan antar kelompok sudah terbentuk meskipun belum sangat kuat.

K-MEANS CLUSTERING

set.seed(123)

km_final <- kmeans(
cluster_scaled,
centers=2,
nstart=20
)

data$Cluster <- km_final$cluster

table(data$Cluster)
## 
##  1  2 
## 50 10

Sebagian besar responden berada pada Cluster 1 sebanyak 50 mahasiswa (83,3%), sedangkan Cluster 0 hanya terdiri atas 10 mahasiswa (16,7%). Hal ini menunjukkan bahwa mayoritas mahasiswa memiliki karakteristik yang relatif serupa terkait kualitas internet dan efektivitas belajar.

Profil Cluster

aggregate(
cluster_data,
list(Cluster=data$Cluster),
mean
)
##   Cluster   A1   A2   A3  A4  A5  A6   A7   A8  A10   B1  B3  B4  B6  B8  B9
## 1       1 4.48 3.42 4.26 3.9 4.3 4.0 4.34 3.86 4.38 4.12 4.1 3.7 4.0 3.8 3.8
## 2       2 3.10 3.20 2.70 3.6 2.9 3.2 2.80 3.50 3.00 2.70 3.1 2.9 2.8 2.8 3.0

Visualisasi Cluster

fviz_cluster(
km_final,
data=cluster_scaled
)

Dari hasil tersebut diketahuilah dua kelompok mahasiswa sebagai berikut. a. Cluster 0 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Rendah) Cluster 0 terdiri atas 10 mahasiswa atau sekitar 16,7% dari total responden. Berdasarkan nilai rata-rata setiap indikator, mahasiswa pada Cluster ini memiliki persepsi yang relatif rendah terhadap kualitas internet pribadi maupun efektivitas belajar. Pada aspek kualitas internet, skor rata-rata kecepatan internet (A1) sebesar 3,10 menunjukkan bahwa internet yang digunakan belum sepenuhnya memadai untuk mendukung aktivitas akademik. Kestabilan sinyal (A3) memperoleh nilai 2,70 yang merupakan salah satu nilai terendah dalam Cluster ini, mengindikasikan bahwa mahasiswa masih sering mengalami gangguan sinyal saat mengakses internet. Selain itu, akses terhadap materi pembelajaran (A5) hanya memperoleh skor 2,90 dan kestabilan koneksi dalam penggunaan jangka panjang (A7) sebesar 2,80, yang menunjukkan bahwa internet belum mampu memberikan pengalaman penggunaan yang optimal untuk kegiatan belajar. Penilaian umum terhadap kualitas internet (A10) juga hanya mencapai 3,00, yang mengindikasikan bahwa kualitas internet berada pada kategori sedang hingga rendah. Kondisi kualitas internet yang kurang optimal tersebut diikuti oleh tingkat efektivitas belajar yang juga relatif rendah. Hal ini terlihat dari skor kemampuan internet dalam membantu memahami materi pembelajaran (B1) yang hanya sebesar 2,70. Selain itu, kemampuan internet dalam membantu mahasiswa menyelesaikan tugas lebih cepat (B6) dan memanfaatkan waktu belajar secara lebih efektif (B8) masing-masing memperoleh skor 2,80. Nilai fokus belajar (B4) sebesar 2,90 menunjukkan bahwa internet belum mampu memberikan dukungan yang signifikan dalam meningkatkan konsentrasi belajar mahasiswa. Secara keseluruhan, mahasiswa pada Cluster ini masih menghadapi berbagai hambatan dalam pemanfaatan internet untuk menunjang kegiatan akademik sehingga efektivitas belajar yang dirasakan juga relatif lebih rendah dibandingkan kelompok lainnya. Oleh karena itu, Cluster 0 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar rendah. b. Cluster 1 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Tinggi) Cluster 1 merupakan kelompok mayoritas yang terdiri atas 50 mahasiswa atau sekitar 83,3% dari total responden. Mahasiswa pada Cluster ini menunjukkan nilai rata-rata yang tinggi pada hampir seluruh indikator kualitas internet dan efektivitas belajar. Pada aspek kualitas internet, kecepatan internet (A1) memperoleh skor rata-rata sebesar 4,48 yang menunjukkan bahwa mahasiswa merasa internet yang digunakan telah memadai untuk mendukung kebutuhan akademik. Kestabilan sinyal (A3) sebesar 4,26 dan kelancaran akses materi pembelajaran (A5) sebesar 4,30 mengindikasikan bahwa mahasiswa jarang mengalami kendala ketika mengakses sumber belajar secara daring. Selain itu, kestabilan koneksi dalam penggunaan jangka panjang (A7) memperoleh nilai 4,34 dan penilaian umum terhadap kualitas internet (A10) sebesar 4,38. Nilai-nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini memiliki pengalaman penggunaan internet yang relatif baik dan mendukung aktivitas pembelajaran. Tingginya kualitas internet tersebut diikuti oleh tingkat efektivitas belajar yang juga tinggi. Kemampuan internet dalam membantu memahami materi pembelajaran (B1) memperoleh skor rata-rata 4,12, sedangkan kemudahan mencari referensi akademik (B3) memperoleh skor 4,10. Selain itu, internet dinilai mampu membantu mahasiswa menyelesaikan tugas lebih cepat (B6) dengan skor 4,00, serta membantu pemanfaatan waktu belajar secara lebih efektif (B8) dan mendukung proses pembelajaran (B9) dengan skor masing-masing sebesar 3,80. Hasil ini menunjukkan bahwa mahasiswa pada Cluster ini merasakan manfaat internet secara nyata dalam menunjang aktivitas akademik sehari-hari. Dengan demikian, Cluster 1 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar tinggi.

Analisis Centroid

km_final$centers
##           A1          A2         A3        A4         A5         A6         A7
## 1  0.2819902  0.03757454  0.2882563  0.054505  0.3085838  0.1407668  0.3173917
## 2 -1.4099510 -0.18787271 -1.4412813 -0.272525 -1.5429191 -0.7038338 -1.5869586
##            A8        A10         B1         B3         B4         B6         B8
## 1  0.06979656  0.2737451  0.2798934  0.1981679  0.1437865  0.2226653  0.1849081
## 2 -0.34898279 -1.3687255 -1.3994670 -0.9908393 -0.7189324 -1.1133265 -0.9245405
##           B9
## 1  0.1632993
## 2 -0.8164966

Visualisasi Centroid

centroid <- as.data.frame(km_final$centers)

matplot(
t(centroid),
type="b",
pch=19,
lty=1,
xlab="Variabel",
ylab="Nilai Centroid"
)

legend(
"topright",
legend=c("Cluster 1","Cluster 2"),
lty=1,
pch=19
)

Centroid merupakan titik pusat (pusat Cluster) yang diperoleh dari rata-rata nilai seluruh anggota dalam suatu Cluster. Nilai centroid digunakan untuk menggambarkan karakteristik umum setiap kelompok yang terbentuk. Berdasarkan hasil analisis K-Means, diperoleh dua Cluster dengan karakteristik yang berbeda. Cluster 0 memiliki nilai centroid sebesar 3,11 untuk variabel kualitas internet pribadi dan 2,88 untuk variabel efektivitas belajar. Nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini cenderung memiliki kualitas internet yang relatif lebih rendah dibandingkan kelompok lainnya. Selain itu, tingkat efektivitas belajar yang dirasakan juga relatif rendah. Kondisi ini mengindikasikan bahwa mahasiswa dalam Cluster tersebut masih mengalami berbagai kendala dalam penggunaan internet, seperti kestabilan koneksi, kelancaran akses materi pembelajaran, maupun pemanfaatan internet untuk menunjang kegiatan akademik. Oleh karena itu, Cluster 0 dapat diinterpretasikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar rendah. Sebaliknya, Cluster 1 memiliki nilai centroid sebesar 4,10 untuk kualitas internet pribadi dan 3,92 untuk efektivitas belajar. Nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini memiliki kualitas internet yang baik, ditandai dengan kecepatan akses yang memadai, sinyal yang lebih stabil, serta kemudahan dalam mengakses materi pembelajaran dan referensi akademik. Kondisi tersebut diikuti oleh tingkat efektivitas belajar yang lebih tinggi, yang terlihat dari kemudahan memahami materi, menyelesaikan tugas, dan mengikuti proses pembelajaran. Oleh karena itu, Cluster 1 dapat diinterpretasikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar tinggi. Perbedaan centroid antara kedua Cluster menunjukkan adanya pemisahan kelompok yang cukup jelas. Selisih rata-rata kualitas internet antara Cluster 0 dan Cluster 1 sebesar 0,99 poin, sedangkan selisih rata-rata efektivitas belajar sebesar 1,04 poin. Perbedaan tersebut menunjukkan bahwa mahasiswa yang memiliki kualitas internet yang lebih baik cenderung memiliki efektivitas belajar yang lebih tinggi. Dengan demikian, hasil Clustering mengindikasikan adanya kecenderungan hubungan positif antara kualitas internet pribadi dan efektivitas belajar mahasiswa. Temuan ini juga sejalan dengan tujuan penelitian yang ingin mengelompokkan mahasiswa berdasarkan persepsi terhadap kualitas internet dan efektivitas belajar yang mereka rasakan.

HIERARCHICAL CLUSTERING

hc <- hclust(
dist(cluster_scaled),
method="ward.D2"
)

Metode Hierarchical Clustering menghasilkan distribusi Cluster yang sama dengan metode K-Means, yaitu Cluster 0 = 50 mahasiswa (83,3%) dan Cluster 1 = 10 mahasiswa (16,7%). Perbedaan hanya terletak pada penomoran label Cluster. Sebagian besar responden berada pada Cluster 0 sebanyak 50 mahasiswa (83,3%), sedangkan Cluster 1 hanya terdiri atas 10 mahasiswa (16,7%). Hal ini menunjukkan bahwa mayoritas mahasiswa memiliki karakteristik yang relatif serupa terkait kualitas internet dan efektivitas belajar.

Dendrogram

plot(hc)

rect.hclust(
hc,
k=2,
border="red"
)

Dendrogram menunjukkan bahwa responden secara alami membentuk dua kelompok besar. Jika dilakukan pemotongan pada jarak tertentu, akan terbentuk dua cabang utama yang sesuai dengan hasil K-Means.Temuan ini memperkuat bahwa struktur data memang cenderung membentuk dua kelompok utama.

Hasil Hierarchical Clustering

data$HC_Cluster <- cutree(
hc,
k=2
)

table(data$HC_Cluster)
## 
##  1  2 
## 10 50

Visualisasi

plot(
data$A_mean,
data$B_mean,
col=data$HC_Cluster,
pch=19,
xlab="Kualitas Internet",
ylab="Efektivitas Belajar"
)

Berdasarkan metode Hierarchical Clustering dengan Ward Linkage, diperoleh dua kelompok mahasiswa yang memiliki karakteristik berbeda terkait kualitas internet pribadi dan efektivitas belajar. Distribusi anggota Cluster menunjukkan bahwa Cluster 0 terdiri dari 50 mahasiswa (83,3%), sedangkan Cluster 1 terdiri dari 10 mahasiswa (16,7%). Kemudian didapatlah sebaran sebagai berikut.

  1. Cluster 0 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Tinggi) Cluster 0 merupakan kelompok mayoritas yang terdiri dari 50 mahasiswa. Berdasarkan nilai rata-rata setiap indikator, mahasiswa pada Cluster ini memiliki kualitas internet pribadi yang relatif baik. Hal tersebut terlihat dari skor kecepatan internet (A1) sebesar 4,48, kestabilan sinyal (A3) sebesar 4,26, kelancaran akses materi pembelajaran (A5) sebesar 4,30, serta kestabilan koneksi dalam penggunaan jangka panjang (A7) sebesar 4,34. Selain itu, penilaian umum terhadap kualitas internet (A10) memperoleh skor sebesar 4,38. Nilai-nilai tersebut menunjukkan bahwa sebagian besar mahasiswa dalam Cluster ini merasa internet yang mereka gunakan mampu mendukung aktivitas akademik dengan baik. Kondisi kualitas internet yang baik tersebut diikuti oleh tingginya efektivitas belajar yang dirasakan mahasiswa. Hal ini terlihat dari skor kemampuan internet dalam membantu memahami materi pembelajaran (B1) sebesar 4,12, memudahkan pencarian referensi akademik (B3) sebesar 4,10, membantu menyelesaikan tugas lebih cepat (B6) sebesar 4,00, serta mendukung proses pembelajaran (B9) sebesar 3,80. Hasil tersebut menunjukkan bahwa mahasiswa dalam Cluster ini merasakan manfaat internet secara nyata dalam menunjang kegiatan belajar. Oleh karena itu, Cluster 0 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet tinggi dan efektivitas belajar tinggi.
  2. Cluster 1 (Mahasiswa dengan Kualitas Internet dan Efektivitas Belajar Rendah) Cluster 1 terdiri dari 10 mahasiswa atau sekitar 16,7% dari total responden. Dibandingkan dengan Cluster 0, kelompok ini memiliki skor yang lebih rendah pada hampir seluruh indikator. Pada aspek kualitas internet, skor kestabilan sinyal (A3) hanya sebesar 2,70, kelancaran akses materi pembelajaran (A5) sebesar 2,90, kestabilan koneksi dalam penggunaan jangka panjang (A7) sebesar 2,80, dan penilaian umum terhadap kualitas internet (A10) sebesar 3,00. Nilai tersebut menunjukkan bahwa mahasiswa pada Cluster ini masih mengalami berbagai kendala dalam penggunaan internet, baik dari segi kecepatan maupun kestabilan koneksi. Rendahnya kualitas internet juga diikuti oleh rendahnya efektivitas belajar. Skor kemampuan internet dalam membantu memahami materi pembelajaran (B1) hanya sebesar 2,70, membantu menyelesaikan tugas lebih cepat (B6) sebesar 2,80, meningkatkan efektivitas penggunaan waktu belajar (B8) sebesar 2,80, dan mendukung proses pembelajaran (B9) sebesar 3,00. Hasil ini menunjukkan bahwa manfaat internet yang dirasakan mahasiswa dalam mendukung proses belajar masih relatif terbatas. Oleh karena itu, Cluster 1 dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet rendah dan efektivitas belajar rendah.

Perbandingan Metode

ARI <- adjustedRandIndex(
data$Cluster,
data$HC_Cluster
)

ARI
## [1] 1

Visualisasi ARI

barplot(
ARI,
ylim=c(0,1),
main="Adjusted Rand Index"
)

Nilai Silhouette Score kedua metode identik. Selain itu diperoleh Adjusted Rand Index (ARI) = 1,000 dan Normalized Mutual Information (NMI) = 1,000. Nilai ARI dan NMI yang sama dengan satu menunjukkan bahwa hasil pengelompokan dari kedua metode sepenuhnya identik. Seluruh responden ditempatkan pada kelompok yang sama, hanya berbeda pada penomoran label Cluster. Dengan demikian, struktur Cluster yang terbentuk dapat dikatakan sangat stabil dan tidak bergantung pada metode Clustering yang digunakan. Untuk membuktikan secara statistik bahwa Cluster yang terbentuk memang berbeda secara signifikan, digunakanlah kruskal-wallis method.Hasil uji Kruskal-Wallis dilakukan pada Cluster yang terbentuk untuk menguji apakah terdapat perbedaan karakteristik antar kelompok. Nilai p-value pada variabel kualitas internet dan efektivitas belajar menunjukkan hasil yang signifikan (p-value < 0,05). Mengingat hasil K-Means dan Hierarchical Clustering menghasilkan anggota Cluster yang identik, maka kesimpulan pengujian ini berlaku untuk kedua metode Clustering. Dengan demikian, kedua metode mampu membedakan kelompok mahasiswa berdasarkan kualitas internet pribadi dan efektivitas belajar secara signifikan.

KESIMPULAN

Berdasarkan hasil pengolahan dan analisis data menggunakan metode K-Means Clustering dan Hierarchical Clustering terhadap data mahasiswa Program Studi S-1 Statistika Universitas Riau Angkatan 2024, dapat disimpulkan bahwa instrumen penelitian yang digunakan telah memenuhi kriteria kualitas yang baik. Hasil uji validitas menunjukkan bahwa dari 20 item pernyataan yang digunakan, terdapat 15 item yang dinyatakan valid dan layak digunakan dalam analisis. Selain itu, hasil uji reliabilitas menunjukkan nilai Cronbach’s Alpha sebesar 0,831 untuk variabel kualitas internet pribadi dan 0,896 untuk variabel efektivitas belajar. Nilai tersebut lebih besar dari 0,70 sehingga instrumen penelitian dapat dinyatakan reliabel dan memiliki konsistensi yang baik. Hasil analisis deskriptif menunjukkan bahwa mahasiswa memiliki rata-rata skor kualitas internet pribadi sebesar 3,928 dan rata-rata skor efektivitas belajar sebesar 3,477. Nilai tersebut mengindikasikan bahwa secara umum mahasiswa memiliki kualitas internet yang tergolong baik dan efektivitas belajar yang cukup baik. Berdasarkan penentuan jumlah Cluster menggunakan Elbow Method dan Silhouette Score, diperoleh jumlah Cluster optimal sebanyak dua Cluster dengan nilai Silhouette Score sebesar 0,311 yang termasuk dalam kategori cukup baik (fair Clustering). Hasil K-Means Clustering menunjukkan bahwa terdapat dua kelompok mahasiswa yang memiliki karakteristik berbeda. Cluster pertama terdiri atas 10 mahasiswa (16,7%) dengan rata-rata kualitas internet sebesar 3,11 dan efektivitas belajar sebesar 2,88 sehingga dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar rendah. Sementara itu, Cluster kedua terdiri atas 50 mahasiswa (83,3%) dengan rata-rata kualitas internet sebesar 4,10 dan efektivitas belajar sebesar 3,92 sehingga dapat dikategorikan sebagai kelompok mahasiswa dengan kualitas internet dan efektivitas belajar tinggi. Hasil Hierarchical Clustering juga menghasilkan dua kelompok dengan jumlah anggota dan karakteristik yang sama, meskipun terdapat perbedaan pada penomoran label Cluster. Perbandingan antara K-Means dan Hierarchical Clustering menunjukkan bahwa kedua metode menghasilkan struktur Cluster yang identik. Hal ini dibuktikan oleh nilai Adjusted Rand Index (ARI) sebesar 1,000 dan Normalized Mutual Information (NMI) sebesar 1,000. Dengan demikian, hasil segmentasi yang diperoleh dapat dikatakan sangat stabil dan tidak dipengaruhi oleh metode Clustering yang digunakan. Secara keseluruhan, hasil penelitian menunjukkan adanya kecenderungan bahwa mahasiswa yang memiliki kualitas internet pribadi yang lebih baik juga memiliki efektivitas belajar yang lebih tinggi. Sebaliknya, mahasiswa dengan kualitas internet yang lebih rendah cenderung memiliki efektivitas belajar yang lebih rendah.