Nama Mahasiswa: Nabil Ulwan Muhammad Caesar
NIM: ‘220605110127’
Kelas: B
Matkul: Linear Algebra
Dosen Pengampu: Prof. Dr. Suhartono, M.Kom
Jurusan: Teknik Informatika
Lembaga: Universitas Islam Negeri Maulana Malik Ibrahim Malang
Ada banyak cara tak terhingga untuk membentuk basis ruang vektor. Namun, kita mungkin ingin memiliki basis di mana setiap vektor ortogonal dengan vektor lainnya Banyak kasus. Di bagian ini kita akan membahas bagaimana kita dapat mengukur sudut antara dua vektor dalam ruang hasil kali dalam.
Dalam PCA, komponen utama membentuk basis ruang vektor R, dimana d adalah jumlah variabel dalam kumpulan data input, dan mereka juga membentuk ortogonal dasar. Saat kami menggambar cluster pada kumpulan data “USArrests” yang kami dihitung melalui metode pengelompokan k-means di bagian sebelumnya dan juga melalui metode pengelompokan hierarkis di Bab 4, kami menggunakan kepala sekolah pertama komponen dan komponen utama kedua untuk memvisualisasikan data. PCA adalah sering digunakan untuk memvisualisasikan kumpulan data masukan dalam ruang vektor berdimensi lebih rendah. Dalam Contoh Kerja di bagian ini kami akan menerapkan PCA ke “USArrests” kumpulan data sehingga kita dapat melihat dari dekat semua komponen utama.
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
library(ggfortify)
## Warning: package 'ggfortify' was built under R version 4.2.3
library(gridExtra)
## Warning: package 'gridExtra' was built under R version 4.2.3
Pada bagian ini, tiga paket yaitu ggplot2, ggfortify, dan gridExtra diimpor ke dalam lingkungan R. Paket ggplot2 adalah paket populer untuk membuat visualisasi data, ggfortify adalah paket yang menyediakan fungsi tambahan untuk memperkaya fungsi-fungsi dari ggplot2, dan gridExtra adalah paket yang menyediakan alat untuk menggabungkan beberapa plot menjadi satu tata letak.
Lalu, unggah dan bersihkan data :
df <- USArrests
df <- na.omit(df)
df <- scale(df)
Pada bagian ini, dataset USArrests disimpan ke dalam variabel df. Kemudian, fungsi na.omit() digunakan untuk menghapus baris dengan nilai yang hilang dari dataset. Selanjutnya, fungsi scale() digunakan untuk melakukan penskalaan pada dataset sehingga setiap variabel memiliki mean 0 dan standar deviasi 1.
Kemudian, untuk memvisualisasikan kumpulan data melalui PCA, kami menggunakan fungsi autoplot() :
pc <- prcomp(df, scale=TRUE)
autoplot(pc, data=df)
Pada bagian ini, fungsi prcomp() digunakan untuk melakukan Principal
Component Analysis (PCA) pada dataset yang sudah diubah skala sebelumnya
(df). Hasil PCA disimpan dalam variabel pc. Selanjutnya, fungsi
autoplot() dari paket ggfortify digunakan untuk menghasilkan plot PCA
yang interaktif dengan menggunakan paket ggplot2. Data asli (df) juga
digunakan dalam plot ini.
Dengan demikian, kode ini melakukan analisis PCA pada dataset USArrests setelah menghilangkan nilai yang hilang dan melakukan penskalaan. Hasilnya ditampilkan dalam bentuk plot PCA yang interaktif menggunakan paket ggplot2.
Sumber Referensi: Ruriko Yoshida - Linear Algebra and its Application with R