Nama Mahasiswa: Nabil Ulwan Muhammad Caesar
NIM: ‘220605110127’
Kelas: B
Matkul: Linear Algebra
Dosen Pengampu: Prof. Dr. Suhartono, M.Kom
Jurusan: Teknik Informatika
Lembaga: Universitas Islam Negeri Maulana Malik Ibrahim Malang
df <- USArrests
df <- na.omit(df)
df <- scale(df)
Kode ini berfungsi untuk mempersiapkan dataset sebelum dilakukan analisis clustering. Pertama, dataset USArrests dimuat dan disimpan ke dalam variabel df. Kemudian, fungsi na.omit() digunakan untuk menghapus baris yang mengandung nilai yang hilang (NA) dalam dataset. Terakhir, fungsi scale() digunakan untuk melakukan standarisasi data, yaitu mengubah setiap variabel menjadi memiliki mean 0 dan variansi 1. Hasilnya, dataset df siap untuk digunakan dalam analisis clustering.
# nstart is the number of random starting points
clusters <- kmeans(df, 4, nstart = 10)
Kode ini melakukan analisis clustering menggunakan metode k-means pada dataset df. Fungsi kmeans() digunakan dengan parameter pertama df sebagai data yang akan dianalisis. Parameter kedua adalah jumlah kelompok yang diinginkan, dalam contoh ini 4 kelompok. Parameter nstart digunakan untuk menentukan jumlah titik awal acak yang digunakan dalam algoritma k-means. Dalam contoh ini, diambil 10 titik awal acak. Hasil clustering disimpan dalam variabel clusters.
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.2.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.2.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ggplot2)
Kode ini memuat dua paket, yaitu factoextra dan ggplot2. Paket factoextra digunakan untuk visualisasi dan analisis hasil clustering, sedangkan paket ggplot2 digunakan untuk membuat grafik dan visualisasi data.
fviz_cluster(clusters, df)
Kode ini menggunakan fungsi fviz_cluster() dari paket factoextra untuk
memvisualisasikan hasil clustering yang disimpan dalam variabel
clusters. Fungsi ini menghasilkan plot visual yang menunjukkan
kelompok-kelompok yang terbentuk dari analisis k-means. Parameter
pertama adalah objek clustering (clusters) dan parameter kedua adalah
data (df) yang digunakan untuk analisis clustering.
Dengan menggunakan kode-kode tersebut, Anda dapat melakukan analisis clustering menggunakan metode k-means pada dataset USArrests dan memvisualisasikan hasilnya menggunakan fungsi fviz_cluster().
Sumber Referensi: Ruriko Yoshida - Linear Algebra and its Application with R