Langkah pertama adalah memuat data SIRTUIN6.csv ke dalam
R. Kita akan melakukan inspeksi struktur data dan memilih hanya variabel
numerik untuk kebutuhan analisis multivariat (korelasi dan
kovarians).
## 'data.frame': 100 obs. of 7 variables:
## $ SC.5 : num 0.541 0.815 0.734 0.625 0.46 ...
## $ SP.6 : num 7.64 6.59 6.86 7.01 4.93 ...
## $ SHBd : num 0.162 0 0 0.45 0.449 ...
## $ minHaaCH: num 0.445 0.497 0.508 0.484 0.482 ...
## $ maxwHBa : num 2.21 2 1.89 2.03 2.06 ...
## $ FMF : num 0.468 0.415 0.4 0.5 0.537 ...
## $ Class : chr "High_BFE" "High_BFE" "High_BFE" "High_BFE" ...
Selanjutnya, kita akan menghitung matriks korelasi, matriks ragam-peragam (kovarians), serta melakukan dekomposisi eigen.
# a) Matriks Korelasi (Correlation Matrix)
cor_mat <- cor(data_num, method = "pearson")
# b) Matriks Ragam-Peragam (Variance-Covariance Matrix)
cov_mat <- cov(data_num)
# c) Dekomposisi Eigen (Eigen Values & Eigen Vectors)
# Eigen dihitung dari matriks korelasi untuk standarisasi skala
eigen_res <- eigen(cor_mat)Berikut adalah output dari perhitungan di atas beserta interpretasinya. a) Correlation Matrix
## SC.5 SP.6 SHBd minHaaCH maxwHBa FMF
## SC.5 1.00000000 0.66208234 -0.10165734 0.1101450 -0.08366394 0.1816990
## SP.6 0.66208234 1.00000000 -0.11309294 0.1956995 0.08952777 0.5798669
## SHBd -0.10165734 -0.11309294 1.00000000 0.2325906 0.04922928 0.0525741
## minHaaCH 0.11014501 0.19569946 0.23259056 1.0000000 0.46076976 0.2582501
## maxwHBa -0.08366394 0.08952777 0.04922928 0.4607698 1.00000000 0.1898255
## FMF 0.18169903 0.57986685 0.05257410 0.2582501 0.18982546 1.0000000
Interpretasi: Matriks korelasi menunjukkan hubungan linear antar variabel.
Terdapat korelasi positif yang cukup kuat (0.66) antara variabel SC.5 dan SP.6. Ini mengindikasikan adanya hubungan linear yang signifikan di antara keduanya.
Variabel SHBd memiliki korelasi yang sangat rendah (mendekati 0) dengan variabel lainnya, menandakan bahwa variabel ini cukup independen.
## SC.5 SP.6 SHBd minHaaCH maxwHBa
## SC.5 0.038073191 0.18129548 -0.006730516 0.002986591 -0.008537740
## SP.6 0.181295476 1.96938510 -0.053851871 0.038164206 0.065707969
## SHBd -0.006730516 -0.05385187 0.115133039 0.010967139 0.008736117
## minHaaCH 0.002986591 0.03816421 0.010967139 0.019310901 0.033487306
## maxwHBa -0.008537740 0.06570797 0.008736117 0.033487306 0.273520544
## FMF 0.002561709 0.05879780 0.001288960 0.002593040 0.007173265
## FMF
## SC.5 0.002561709
## SP.6 0.058797800
## SHBd 0.001288960
## minHaaCH 0.002593040
## maxwHBa 0.007173265
## FMF 0.005220775
Interpretasi: Diagonal utama matriks ini menunjukkan variansi. Terlihat bahwa SP.6 memiliki variansi tertinggi (~1.97), jauh lebih besar dibandingkan SC.5 (~0.038). Perbedaan skala yang mencolok ini menegaskan pentingnya menggunakan matriks korelasi (bukan kovarians) untuk analisis lanjut seperti PCA agar hasil tidak bias ke variabel dengan skala besar.
## Eigen Values:
## [1] 2.1337497 1.5111648 0.9411512 0.7506341 0.4645041 0.1987961
##
## Eigen Vectors:
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] -0.445897765 0.40838358 0.17314940 0.551320810 -0.1693898 0.52131542
## [2,] -0.598031033 0.27866687 0.04010839 -0.047558233 -0.1348296 -0.73665064
## [3,] -0.008677753 -0.43555979 0.84158227 0.006452006 -0.3145028 -0.05475399
## [4,] -0.362540946 -0.51750901 -0.02118277 0.356021719 0.6862419 -0.05118976
## [5,] -0.246004756 -0.54390727 -0.50735760 0.109979696 -0.6075994 0.07044341
## [6,] -0.501502228 -0.04695312 0.04784818 -0.744912715 0.1187902 0.41832451
Interpretasi:
Eigen Values: Nilai eigen pertama (2.13) dan kedua (1.51) mendominasi variansi data. Dua komponen pertama ini secara kumulatif menjelaskan sekitar 60% dari total informasi dalam dataset.
Eigen Vectors: Vektor kolom pertama menunjukkan kontribusi terbesar berasal dari SC.5, SP.6, dan FMF, yang konsisten dengan temuan korelasi sebelumnya.