Pendahuluan

Analisis multivariat dilakukan untuk memahami hubungan antar variabel numerik dalam dataset, ditugas ini kita menggunakan dataset SIRTUIN6. Pada analisis ini digunakan matriks korelasi, matriks varians–kovarians, serta eigenvalue dan eigenvector sebagai dasar untuk memahami struktur data.

SIRTUIN6 <- read.csv("SIRTUIN6.csv")
data_num <- SIRTUIN6[, sapply(SIRTUIN6, is.numeric)]
head(data_num)
##       SC.5    SP.6     SHBd minHaaCH maxwHBa      FMF
## 1 0.540936 7.64192 0.162171 0.445270 2.20557 0.467742
## 2 0.815332 6.59011 0.000000 0.497445 2.00314 0.415385
## 3 0.734399 6.85522 0.000000 0.507748 1.88590 0.400000
## 4 0.624557 7.00949 0.450300 0.483648 2.02757 0.500000
## 5 0.460290 4.92643 0.448998 0.482293 2.06438 0.536585
## 6 0.739251 5.30234 0.000000 0.503995 1.84017 0.428571

Correlation Matrix

cor_matrix <- cor(data_num)
cor_matrix
##                 SC.5        SP.6        SHBd  minHaaCH     maxwHBa       FMF
## SC.5      1.00000000  0.66208234 -0.10165734 0.1101450 -0.08366394 0.1816990
## SP.6      0.66208234  1.00000000 -0.11309294 0.1956995  0.08952777 0.5798669
## SHBd     -0.10165734 -0.11309294  1.00000000 0.2325906  0.04922928 0.0525741
## minHaaCH  0.11014501  0.19569946  0.23259056 1.0000000  0.46076976 0.2582501
## maxwHBa  -0.08366394  0.08952777  0.04922928 0.4607698  1.00000000 0.1898255
## FMF       0.18169903  0.57986685  0.05257410 0.2582501  0.18982546 1.0000000
library(corrplot)
## corrplot 0.95 loaded
corrplot(cor_matrix)

Matriks korelasi diatas digunakan untuk menggambarkan hubungan antar variabel numerik berdasarkan tingkat keterkaitan antar nilainya. Nilai korelasi berada pada rentang −1 hingga 1, di mana nilai positif menunjukkan hubungan searah, nilai negatif menunjukkan hubungan berlawanan arah, dan nilai mendekati nol menunjukkan hubungan yang lemah.

Berdasarkan hasil matriks korelasi, beberapa pasangan variabel menunjukkan korelasi positif sedang, seperti antara SC.5 dan SP.6, SP.6 dan FMF, serta minHaaCH dan maxwHBa, yang mengindikasikan adanya kecenderungan peningkatan bersama antar variabel tersebut. Sementara itu, sebagian besar pasangan variabel lainnya memiliki nilai korelasi yang relatif kecil, sehingga hubungan antar variabel tersebut tergolong lemah.

Variance-Covariance Matrix

cov_matrix <- cov(data_num)
cov_matrix
##                  SC.5        SP.6         SHBd    minHaaCH      maxwHBa
## SC.5      0.038073191  0.18129548 -0.006730516 0.002986591 -0.008537740
## SP.6      0.181295476  1.96938510 -0.053851871 0.038164206  0.065707969
## SHBd     -0.006730516 -0.05385187  0.115133039 0.010967139  0.008736117
## minHaaCH  0.002986591  0.03816421  0.010967139 0.019310901  0.033487306
## maxwHBa  -0.008537740  0.06570797  0.008736117 0.033487306  0.273520544
## FMF       0.002561709  0.05879780  0.001288960 0.002593040  0.007173265
##                  FMF
## SC.5     0.002561709
## SP.6     0.058797800
## SHBd     0.001288960
## minHaaCH 0.002593040
## maxwHBa  0.007173265
## FMF      0.005220775

Berdasarkan hasil analisis, variabel SP.6 dan maxwHBa memiliki nilai varians yang relatif lebih besar dibandingkan variabel lainnya, yang menunjukkan bahwa kedua variabel tersebut memiliki tingkat penyebaran data yang lebih tinggi. Sebaliknya, variabel lain seperti SC.5, SHBd, minHaaCH, dan FMF memiliki varians yang lebih kecil, sehingga variasi datanya relatif lebih terbatas. Dan terdapat Kovariansi positif, seperti antara SC.5 dan SP.6 serta antara minHaaCH dan maxwHBa, menunjukkan kecenderungan peningkatan bersama antar variabel. Sementara itu, kovariansi negatif yang kecil, seperti antara SC.5 dan SHBd, mengindikasikan hubungan berlawanan arah yang lemah.

Eigen value dan Eigen vector

eigen_cov <- eigen(cov_matrix)
eigen_cov$values
## [1] 1.992769556 0.276942728 0.113877882 0.020953542 0.013224463 0.002875384
eigen_cov$vectors
##             [,1]        [,2]         [,3]         [,4]         [,5]
## [1,] -0.09219130  0.06060081 -0.003107518  0.970452736 -0.156055543
## [2,] -0.99396947  0.03294359  0.029422161 -0.090947728 -0.005846681
## [3,]  0.02852534 -0.07545079  0.990744881 -0.004387236 -0.107950230
## [4,] -0.01988516 -0.12606134  0.096256185  0.172774447  0.969390992
## [5,] -0.03789685 -0.98654030 -0.087766817  0.037590405 -0.127206548
## [6,] -0.02966771 -0.01990490  0.024103802 -0.136626137  0.089770986
##              [,6]
## [1,]  0.147264400
## [2,] -0.042048512
## [3,] -0.015670467
## [4,] -0.069842391
## [5,] -0.002121028
## [6,]  0.985604940

Dari hasil yang didapat, eigenvalue pertama (1.993) memiliki nilai paling besar dibandingkan eigenvalue lainnya, yang menunjukkan bahwa komponen utama pertama menjelaskan sebagian besar variasi data. Eigenvalue berikutnya memiliki nilai yang jauh lebih kecil, sehingga kontribusi variasinya relatif terbatas. Hal ini mengindikasikan bahwa struktur variasi data didominasi oleh satu komponen utama.

Eigenvector yang berasosiasi dengan eigenvalue terbesar menunjukkan bahwa variabel SP.6 memberikan kontribusi paling dominan pada komponen utama pertama, diikuti oleh kontribusi variabel lain dengan bobot yang relatif kecil. Sementara itu, komponen-komponen berikutnya merepresentasikan variasi tambahan dengan pola kontribusi variabel yang berbeda, namun dengan pengaruh yang lebih rendah.