title: “Tugas Analisis Multivariat 1_Eka Aliya(012)”

author: “Eka Aliya”

date: “2026-02-06”

output: html_document

A.Pengantar

Laporan ini menyajikan hasil analisis multivariat pada dataset Sirtuin6 Small Molecules, yang mencakup perhitungan matriks korelasi, matriks varians-covarians, serta nilai eigen dan vektor eigen dengan menggunakan bahasa R. Kolom atau Fitur yang digunakan dalam analisis ini yaitu SC-5, SP-6, SHBd, minHaaCH, maxwHBa, dan FMF, karena kolom-kolom tersebut bersifat numerik dan bukan berupa label.

  1. Langkah Awal yaitu Import Data
library(readr)
SIRTUIN6 <- read_csv("SIRTUIN6.csv")
## Rows: 100 Columns: 7
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (1): Class
## dbl (6): SC-5, SP-6, SHBd, minHaaCH, maxwHBa, FMF
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
#View(SIRTUIN6)

Setelah import data, lalu memilih kolom yang digunakan untuk analisis (kolom numerik)

data_sirtuin<- SIRTUIN6[,1:6]

2.Menentukan Matriks Korelassi Matriks korelasi berguna untuk mengetahui nilai korelasi yang terjadi antar variabel/ fitur pada data.

mat_corr <- cor(data_sirtuin)
print(" Matriks Korelasi Data Sirtuin6:")
## [1] " Matriks Korelasi Data Sirtuin6:"
print(mat_corr)
##                 SC-5        SP-6        SHBd  minHaaCH     maxwHBa       FMF
## SC-5      1.00000000  0.66208234 -0.10165734 0.1101450 -0.08366394 0.1816990
## SP-6      0.66208234  1.00000000 -0.11309294 0.1956995  0.08952777 0.5798669
## SHBd     -0.10165734 -0.11309294  1.00000000 0.2325906  0.04922928 0.0525741
## minHaaCH  0.11014501  0.19569946  0.23259056 1.0000000  0.46076976 0.2582501
## maxwHBa  -0.08366394  0.08952777  0.04922928 0.4607698  1.00000000 0.1898255
## FMF       0.18169903  0.57986685  0.05257410 0.2582501  0.18982546 1.0000000
Berdasarkan output tersebut, diketahui bahwa nilai korelasi paling besar antara variabel satu dengan yang lain, terjadi antara variabel SC-5 dan SP-6 (0.66208234), hal tersebut menunjukkan adanya korelasi saat variabel SC-5 naik maka SP-6 juga naik. 

3.Matriks Varians-Covarians Matriks ini berguna untuk menunjukkan tingkat penyebaran data.

mat_cov <- cov(data_sirtuin)
print(" Matriks Varians-Covarians Data Sirtuin6:")
## [1] " Matriks Varians-Covarians Data Sirtuin6:"
print(mat_cov)
##                  SC-5        SP-6         SHBd    minHaaCH      maxwHBa
## SC-5      0.038073191  0.18129548 -0.006730516 0.002986591 -0.008537740
## SP-6      0.181295476  1.96938510 -0.053851871 0.038164206  0.065707969
## SHBd     -0.006730516 -0.05385187  0.115133039 0.010967139  0.008736117
## minHaaCH  0.002986591  0.03816421  0.010967139 0.019310901  0.033487306
## maxwHBa  -0.008537740  0.06570797  0.008736117 0.033487306  0.273520544
## FMF       0.002561709  0.05879780  0.001288960 0.002593040  0.007173265
##                  FMF
## SC-5     0.002561709
## SP-6     0.058797800
## SHBd     0.001288960
## minHaaCH 0.002593040
## maxwHBa  0.007173265
## FMF      0.005220775

Berdasarkan diagonal utama (varians) dari output tersebut, variabel SP-6 mempunyai varians terbesar (1.96938510), hal tersebut menunjukkan bahwa variabel SP-6 memiliki penyebaran paling luas dibandingkan variabel lain. Untuk varians terkecil terdapat pada variabel minHaaCH (0.019310901), artinya variabel tersebut lebih mengelompok di sekitar rata-rata. Berdasarkan diagonal luar (Covarians), variabel SC-5 dengan SP-6 memiliki nilai positif tertinggi (0.18129548), hal tersebut menunjukkan bahwa kedua variabel tersebut bergerak kearah yang sama.

4.Niai Eigen dan Vektor Eigen Nilai eigen berfungsi untuk menunjukkan tentang jumlah varians (informasi) yang dijelaskan oleh komponen utama dalam data. Vektor Eigen berfungsi untuk menunjukkan bobot variabel awal (asli) pada komponen utama baru.

hasil_eigen <- eigen(mat_corr)
print(" Nilai Eigen Data Sirtuin6:")
## [1] " Nilai Eigen Data Sirtuin6:"
print(hasil_eigen$values)
## [1] 2.1337497 1.5111648 0.9411512 0.7506341 0.4645041 0.1987961

Berdasarkan output tersebut didapatkan dua nilai eigen yang besarnya lebih dari 1 yaitu 2.1337497 dan 1.5111648, nilai tersebut menunjukkan bahwa dari 6 variabel asli dapat direduksi/ dirangkum menjadi 2 komponen utama, karena dua nilai tersebut sudah mewakili sebagian besar keragaman/varians data Sirtuin6.

print("Vektor Eigen Data Sirtuin6:")
## [1] "Vektor Eigen Data Sirtuin6:"
print(hasil_eigen$vectors)
##             [,1]        [,2]        [,3]         [,4]       [,5]        [,6]
## [1,] 0.445897765  0.40838358  0.17314940  0.551320810 -0.1693898  0.52131542
## [2,] 0.598031033  0.27866687  0.04010839 -0.047558233 -0.1348296 -0.73665064
## [3,] 0.008677753 -0.43555979  0.84158227  0.006452006 -0.3145028 -0.05475399
## [4,] 0.362540946 -0.51750901 -0.02118277  0.356021719  0.6862419 -0.05118976
## [5,] 0.246004756 -0.54390727 -0.50735760  0.109979696 -0.6075994  0.07044341
## [6,] 0.501502228 -0.04695312  0.04784818 -0.744912715  0.1187902  0.41832451

Berdasarkan output tersebut, Vektor eigen komponen utama pertama (PC1) diwakili oleh kolom [,1], dengan komponen bobot paling besar dipengaruhi oleh [2,] atau SP-6 dan [6,] atau FMF. Lalu, vektor eigen komponen utama kedua (PC2) diwakili oleh kolom [,2], dengan komponen bobot paling besar dipengaruhi oleh [4,] atau minHaaCH dan [5,] atau maxwHBa, meski bernilai negatif, nilai mutlak yang besar menunjukkan bahwa kedua variabel memiliki kontribusi besar, namun dengan arah yang terbalik (-).

Dataset Referensi: https://archive.ics.uci.edu/dataset/748/sirtuin6+small+molecules-1