#import data
data <- read.csv("C:/Users/ASUS/Downloads/SIRTUIN6.csv")
str(data)
## 'data.frame': 100 obs. of 7 variables:
## $ SC.5 : num 0.541 0.815 0.734 0.625 0.46 ...
## $ SP.6 : num 7.64 6.59 6.86 7.01 4.93 ...
## $ SHBd : num 0.162 0 0 0.45 0.449 ...
## $ minHaaCH: num 0.445 0.497 0.508 0.484 0.482 ...
## $ maxwHBa : num 2.21 2 1.89 2.03 2.06 ...
## $ FMF : num 0.468 0.415 0.4 0.5 0.537 ...
## $ Class : chr "High_BFE" "High_BFE" "High_BFE" "High_BFE" ...
head(data)
## SC.5 SP.6 SHBd minHaaCH maxwHBa FMF Class
## 1 0.540936 7.64192 0.162171 0.445270 2.20557 0.467742 High_BFE
## 2 0.815332 6.59011 0.000000 0.497445 2.00314 0.415385 High_BFE
## 3 0.734399 6.85522 0.000000 0.507748 1.88590 0.400000 High_BFE
## 4 0.624557 7.00949 0.450300 0.483648 2.02757 0.500000 High_BFE
## 5 0.460290 4.92643 0.448998 0.482293 2.06438 0.536585 High_BFE
## 6 0.739251 5.30234 0.000000 0.503995 1.84017 0.428571 High_BFE
Output yang ditampilkan menunjukkan bahwa file SIRTUIN6.csv berhasil
diimpor ke dalam R dan disimpan dalam bentuk data frame dengan 7
variabel, terdiri dari 6 variabel numerik (SC.5, SP.6, SHBd, minHaaCH,
maxWHBa, dan FMF) dan 1 variabel kategorikal (Class). Fungsi head(data)
menampilkan enam observasi pertama untuk memastikan data telah terbaca
dengan benar, di mana setiap baris merepresentasikan satu unit
pengamatan dan setiap kolom menunjukkan nilai variabel yang diukur. Tipe
data
#Correlation Matrix
data_num <- data[sapply(data, is.numeric)]
cor_matrix <- cor(data_num)
cor_matrix
## SC.5 SP.6 SHBd minHaaCH maxwHBa FMF
## SC.5 1.00000000 0.66208234 -0.10165734 0.1101450 -0.08366394 0.1816990
## SP.6 0.66208234 1.00000000 -0.11309294 0.1956995 0.08952777 0.5798669
## SHBd -0.10165734 -0.11309294 1.00000000 0.2325906 0.04922928 0.0525741
## minHaaCH 0.11014501 0.19569946 0.23259056 1.0000000 0.46076976 0.2582501
## maxwHBa -0.08366394 0.08952777 0.04922928 0.4607698 1.00000000 0.1898255
## FMF 0.18169903 0.57986685 0.05257410 0.2582501 0.18982546 1.0000000
Objek data_num dibuat untuk menyimpan hanya variabel numerik, karena perhitungan matriks korelasi dan kovarians hanya dapat dilakukan pada data numerik
#Variance-Covariance Matrix
cov_matrix <- cov(data_num)
cov_matrix
## SC.5 SP.6 SHBd minHaaCH maxwHBa
## SC.5 0.038073191 0.18129548 -0.006730516 0.002986591 -0.008537740
## SP.6 0.181295476 1.96938510 -0.053851871 0.038164206 0.065707969
## SHBd -0.006730516 -0.05385187 0.115133039 0.010967139 0.008736117
## minHaaCH 0.002986591 0.03816421 0.010967139 0.019310901 0.033487306
## maxwHBa -0.008537740 0.06570797 0.008736117 0.033487306 0.273520544
## FMF 0.002561709 0.05879780 0.001288960 0.002593040 0.007173265
## FMF
## SC.5 0.002561709
## SP.6 0.058797800
## SHBd 0.001288960
## minHaaCH 0.002593040
## maxwHBa 0.007173265
## FMF 0.005220775
Matriks varians-kovarians menunjukkan tingkat penyebaran data dan hubungan perubahan antar variabel. Elemen diagonal matriks merupakan varians masing-masing variabel, yang menunjukkan seberapa besar penyebaran data terhadap nilai rata-rata. Elemen di luar diagonal merupakan kovarians yang menunjukkan arah hubungan antar variabel; nilai kovarians positif menunjukkan bahwa dua variabel cenderung meningkat bersama, sedangkan nilai kovarians negatif menunjukkan bahwa satu variabel meningkat ketika variabel lain menurun. Matriks ini menjadi dasar dalam analisis multivariat seperti PCA dan analisis faktor.
#Eigen Value dan Eigen Vector
eigen_result <- eigen(cov_matrix)
eigen_result$values
## [1] 1.992769556 0.276942728 0.113877882 0.020953542 0.013224463 0.002875384
eigen_result$vectors
## [,1] [,2] [,3] [,4] [,5]
## [1,] -0.09219130 0.06060081 -0.003107518 0.970452736 -0.156055543
## [2,] -0.99396947 0.03294359 0.029422161 -0.090947728 -0.005846681
## [3,] 0.02852534 -0.07545079 0.990744881 -0.004387236 -0.107950230
## [4,] -0.01988516 -0.12606134 0.096256185 0.172774447 0.969390992
## [5,] -0.03789685 -0.98654030 -0.087766817 0.037590405 -0.127206548
## [6,] -0.02966771 -0.01990490 0.024103802 -0.136626137 0.089770986
## [,6]
## [1,] 0.147264400
## [2,] -0.042048512
## [3,] -0.015670467
## [4,] -0.069842391
## [5,] -0.002121028
## [6,] 0.985604940
Eigen value menunjukkan jumlah varians yang dijelaskan oleh setiap komponen utama. Semakin besar nilai eigen, semakin besar kontribusi komponen tersebut dalam menjelaskan keragaman data. Total eigen value sama dengan total varians data. Eigen vector menunjukkan bobot kontribusi masing-masing variabel pada setiap komponen utama, sehingga dapat digunakan untuk menginterpretasikan variabel mana yang paling berpengaruh dalam pembentukan komponen tersebut.