Ruang vektor adalah fondasi di banyak area. Namun, ruang vektor tidak intuitif bagi banyak siswa. Oleh karena itu, kami mendefinisikan ruang vektor dan vektor subruang dengan aplikasi dalam ilmu data. Dalam Aplikasi Praktis, kami bekerja pada analisis komponen utama (PCA) yang dikembangkan oleh K. Pearson pada tahun 1901. PCA memproyeksikan titik data dalam ruang vektor berdimensi tinggi ke subruang vektor berdimensi lebih rendah. ## Contoh Kerja Pada bagian ini kami menerapkan PCA ke set data ” dari ISLR paket dalam R [24]. Ini berisi jarak tempuh bahan bakar, tenaga kuda, dan informasi lainnya untuk 392 kendaraan. Kumpulan data ini diambil dari perpustakaan StatLib yang dikelola di Carnegie Universitas Mellon. Dataset digunakan dalam American Statistical 1983 Pameran Asosiasi [24]. Pertama, kami memuat kumpulan data dari paket ISLR.
library(ISLR)
data(Auto)
summary(Auto)
## mpg cylinders displacement horsepower weight
## Min. : 9.00 Min. :3.000 Min. : 68.0 Min. : 46.0 Min. :1613
## 1st Qu.:17.00 1st Qu.:4.000 1st Qu.:105.0 1st Qu.: 75.0 1st Qu.:2225
## Median :22.75 Median :4.000 Median :151.0 Median : 93.5 Median :2804
## Mean :23.45 Mean :5.472 Mean :194.4 Mean :104.5 Mean :2978
## 3rd Qu.:29.00 3rd Qu.:8.000 3rd Qu.:275.8 3rd Qu.:126.0 3rd Qu.:3615
## Max. :46.60 Max. :8.000 Max. :455.0 Max. :230.0 Max. :5140
##
## acceleration year origin name
## Min. : 8.00 Min. :70.00 Min. :1.000 amc matador : 5
## 1st Qu.:13.78 1st Qu.:73.00 1st Qu.:1.000 ford pinto : 5
## Median :15.50 Median :76.00 Median :1.000 toyota corolla : 5
## Mean :15.54 Mean :75.98 Mean :1.577 amc gremlin : 4
## 3rd Qu.:17.02 3rd Qu.:79.00 3rd Qu.:2.000 amc hornet : 4
## Max. :24.80 Max. :82.00 Max. :3.000 chevrolet chevette: 4
## (Other) :365
Fungsi summary() menunjukkan ringkasan dataset termasuk masing-masing rata-rata variabel, dll. Sebelum melakukan apa pun, kami akan membersihkan dataset agar dapat digunakan berfungsi untuk menerapkan PCA serta memvisualisasikannya.
auto <- Auto[,1:9]
summary(auto)
## mpg cylinders displacement horsepower weight
## Min. : 9.00 Min. :3.000 Min. : 68.0 Min. : 46.0 Min. :1613
## 1st Qu.:17.00 1st Qu.:4.000 1st Qu.:105.0 1st Qu.: 75.0 1st Qu.:2225
## Median :22.75 Median :4.000 Median :151.0 Median : 93.5 Median :2804
## Mean :23.45 Mean :5.472 Mean :194.4 Mean :104.5 Mean :2978
## 3rd Qu.:29.00 3rd Qu.:8.000 3rd Qu.:275.8 3rd Qu.:126.0 3rd Qu.:3615
## Max. :46.60 Max. :8.000 Max. :455.0 Max. :230.0 Max. :5140
##
## acceleration year origin name
## Min. : 8.00 Min. :70.00 Min. :1.000 amc matador : 5
## 1st Qu.:13.78 1st Qu.:73.00 1st Qu.:1.000 ford pinto : 5
## Median :15.50 Median :76.00 Median :1.000 toyota corolla : 5
## Mean :15.54 Mean :75.98 Mean :1.577 amc gremlin : 4
## 3rd Qu.:17.02 3rd Qu.:79.00 3rd Qu.:2.000 amc hornet : 4
## Max. :24.80 Max. :82.00 Max. :3.000 chevrolet chevette: 4
## (Other) :365
Kemudian, kita akan memilih 9 variabel pertama dan juga membuat variabel “. sebagai kelas karakter.
new.data <- Auto[, 1:9]
new.data$origin <- as.character(new.data$origin)
summary(new.data)
## mpg cylinders displacement horsepower weight
## Min. : 9.00 Min. :3.000 Min. : 68.0 Min. : 46.0 Min. :1613
## 1st Qu.:17.00 1st Qu.:4.000 1st Qu.:105.0 1st Qu.: 75.0 1st Qu.:2225
## Median :22.75 Median :4.000 Median :151.0 Median : 93.5 Median :2804
## Mean :23.45 Mean :5.472 Mean :194.4 Mean :104.5 Mean :2978
## 3rd Qu.:29.00 3rd Qu.:8.000 3rd Qu.:275.8 3rd Qu.:126.0 3rd Qu.:3615
## Max. :46.60 Max. :8.000 Max. :455.0 Max. :230.0 Max. :5140
##
## acceleration year origin name
## Min. : 8.00 Min. :70.00 Length:392 amc matador : 5
## 1st Qu.:13.78 1st Qu.:73.00 Class :character ford pinto : 5
## Median :15.50 Median :76.00 Mode :character toyota corolla : 5
## Mean :15.54 Mean :75.98 amc gremlin : 4
## 3rd Qu.:17.02 3rd Qu.:79.00 amc hornet : 4
## Max. :24.80 Max. :82.00 chevrolet chevette: 4
## (Other) :365
Dalam Aplikasi Praktis, kami akan menunjukkan cara memilih dimensi untuk memvisualisasikan kumpulan data ini dan bagaimana kami dapat memvisualisasikan data dalam dimensi yang lebih rendah ruang vektor.
##DAFTAR PUSTAKA Yoshida.Ruriko.2021.Linear Algebra and Its Applications With R.London. CRC Press