NIM : 220605110070
KELAS : A
MATKUL : LINEAR ALGEBRA
DOSEN PENGAMPU : Prof.Dr.Suhartono,M.Kom
JURUSAN : TEKNIK INFORMATIKA
LEMBAGA : UNIVERSITAS ISLAM NEGERI MAULANA MALIK IBRAHIM MALANG
===================== RUANG VECTOR ========================
Ruang vektor merupakan fondasi dalam banyak bidang. Misalnya, dalam statistik, kita mengasumsikan sifat-sifat ruang vektor sehingga kita dapat melakukan analisis statistik pada suatu set data. Pada bab ini kita akan berfokus pada ruang vektor dan sifat-sifat dasarnya. Pertama, kita mendefinisikan sebuah ruang vektor dan kemudian untuk aplikasinya, kita mengasumsikan Ruang Euclidean sebagai ruang vektor.
Contoh Pengantar dari Data Science
Dalam ilmu data, pada dasarnya ada tiga sub-area model statistik: pembelajaran yang diawasi, pembelajaran yang tidak diawasi, dan pembelajaran penguatan. Dalam bab ini bab ini kita akan fokus pada pembelajaran tak terawasi, terutama pengelompokan. Model pembelajaran tak terawasi adalah metode statistik deskriptif tidak seperti pembelajaran terawasi.pembelajaran terawasi, yang merupakan metode statistik inferensial untuk memprediksi hasil atau parameter berdasarkan kumpulan data. Salah satu bidang utama dalam pembelajaran tak terawasi adalahpengelompokan. Metode pengelompokan adalah mengelompokkan pengamatan dalam satu set data bersama-samaberdasarkan “kesamaan” mereka. Pengukuran kemiripan ini didefinisikan sebagai sebuah produk” dari vektor-vektor dalam sebuah ruang vektor.Pada bagian ini kami mempertimbangkan satu set data kejahatan dari Amerika Serikat, set dataData set “dari R. Data ini berisi informasi tentang penangkapanyang dilakukan di Amerika Serikat: rata-rata penangkapan per 100.000 penduduk untuk penyerangan,pembunuhan, pemerkosaan, dan persentase penduduk yang tinggal di daerah perkotaan di setiapdari 50 negara bagian pada tahun 1973.Di sini kami menerapkan fungsi hclust() dari R untuk melihat pengelompokan, yaitu kelompoberdasarkan kemiripan antara setiap pengamatan. Pertama, kita mengunggah data” data dari R
df <- USArrests
head(df)
## Murder Assault UrbanPop Rape
## Alabama 13.2 236 58 21.2
## Alaska 10.0 263 48 44.5
## Arizona 8.1 294 80 31.0
## Arkansas 8.8 190 50 19.5
## California 9.0 276 91 40.6
## Colorado 7.9 204 78 38.7
Kemudian kita menggunakan fungsi scale() untuk “menstandarkan” setiap pengukuran. Alasan mengapa kami menerapkan fungsi ini adalah karena beberapa pengukuran jauh lebih besardari yang lain. Sebagai contoh, seorang siswa mengikuti tes ACT dan SAT. SAT memilikiskor maksimum 1600 dan ACT memiliki skor maksimum 36. Jika siswa iniingin mengetahui tes mana yang lebih baik, Anda tidak bisa hanya membandingkanskor-skor ini. Jika kita menghitung seberapa jauh nilai siswa untuk SAT atau ACTdari nilai rata-rata, maka kita dapat membandingkan nilai siswa tersebut pada ACT danSAT. Fungsi scale() menghitung seberapa jauh setiap pengamatan berada darirata-rata (mean)
df <- na.omit(df)
df <- scale(df)
d <- dist(df, method = "euclidean")
hc <- hclust(d)
sub_grp <- cutree(hc, k = 4)
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.2.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.2.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_cluster(list(data = df, cluster = sub_grp))