Pendahuluan

Analisis multivariat merupakan teknik statistik yang digunakan untuk menganalisis lebih dari satu variabel secara bersamaan. Pada tugas ini digunakan dataset SIRTUIN6.csv dengan tujuan untuk menghitung dan menganalisis: Matriks Korelasi, Matriks Varians–Kovarians, Eigen value dan Eigen vector, Interpretasi dari setiap hasil output

Import data

df <- read.csv("SIRTUIN6.csv")
head(df)
##       SC.5    SP.6     SHBd minHaaCH maxwHBa      FMF    Class
## 1 0.540936 7.64192 0.162171 0.445270 2.20557 0.467742 High_BFE
## 2 0.815332 6.59011 0.000000 0.497445 2.00314 0.415385 High_BFE
## 3 0.734399 6.85522 0.000000 0.507748 1.88590 0.400000 High_BFE
## 4 0.624557 7.00949 0.450300 0.483648 2.02757 0.500000 High_BFE
## 5 0.460290 4.92643 0.448998 0.482293 2.06438 0.536585 High_BFE
## 6 0.739251 5.30234 0.000000 0.503995 1.84017 0.428571 High_BFE

#menampilkan data numerik

df_num <- df[, sapply(df, is.numeric)]
head(df_num)
##       SC.5    SP.6     SHBd minHaaCH maxwHBa      FMF
## 1 0.540936 7.64192 0.162171 0.445270 2.20557 0.467742
## 2 0.815332 6.59011 0.000000 0.497445 2.00314 0.415385
## 3 0.734399 6.85522 0.000000 0.507748 1.88590 0.400000
## 4 0.624557 7.00949 0.450300 0.483648 2.02757 0.500000
## 5 0.460290 4.92643 0.448998 0.482293 2.06438 0.536585
## 6 0.739251 5.30234 0.000000 0.503995 1.84017 0.428571

Matriks Korelasi

cor_mat <- cor(df_num, use = "complete.obs")
round(cor_mat, 4)
##             SC.5    SP.6    SHBd minHaaCH maxwHBa    FMF
## SC.5      1.0000  0.6621 -0.1017   0.1101 -0.0837 0.1817
## SP.6      0.6621  1.0000 -0.1131   0.1957  0.0895 0.5799
## SHBd     -0.1017 -0.1131  1.0000   0.2326  0.0492 0.0526
## minHaaCH  0.1101  0.1957  0.2326   1.0000  0.4608 0.2583
## maxwHBa  -0.0837  0.0895  0.0492   0.4608  1.0000 0.1898
## FMF       0.1817  0.5799  0.0526   0.2583  0.1898 1.0000

Matriks korelasi menunjukkan hubungan linier antar variabel numerik. Nilai korelasi berada pada rentang –1 sampai 1, di mana: - Nilai mendekati 1 menunjukkan hubungan positif kuat - Nilai mendekati –1 menunjukkan hubungan negatif kuat - Nilai mendekati 0 menunjukkan hubungan yang lemah

Matriks Varians-Kovarians

cov_mat <- cov(df_num, use = "complete.obs")
round(cov_mat, 4)
##             SC.5    SP.6    SHBd minHaaCH maxwHBa    FMF
## SC.5      0.0381  0.1813 -0.0067   0.0030 -0.0085 0.0026
## SP.6      0.1813  1.9694 -0.0539   0.0382  0.0657 0.0588
## SHBd     -0.0067 -0.0539  0.1151   0.0110  0.0087 0.0013
## minHaaCH  0.0030  0.0382  0.0110   0.0193  0.0335 0.0026
## maxwHBa  -0.0085  0.0657  0.0087   0.0335  0.2735 0.0072
## FMF       0.0026  0.0588  0.0013   0.0026  0.0072 0.0052

Matriks korelasi menunjukkan hubungan linier antar variabel numerik. Nilai korelasi berada pada rentang –1 sampai 1, di mana: - Nilai mendekati 1 menunjukkan hubungan positif kuat - Nilai mendekati –1 menunjukkan hubungan negatif kuat Nilai mendekati 0 menunjukkan hubungan yang lemah

Eigen value dan eigen vector

eigen_cov <- eigen(cov_mat) 
eigen_cov$values
## [1] 1.992769556 0.276942728 0.113877882 0.020953542 0.013224463 0.002875384
eigen_cov$vectors
##             [,1]        [,2]         [,3]         [,4]         [,5]
## [1,] -0.09219130  0.06060081 -0.003107518  0.970452736 -0.156055543
## [2,] -0.99396947  0.03294359  0.029422161 -0.090947728 -0.005846681
## [3,]  0.02852534 -0.07545079  0.990744881 -0.004387236 -0.107950230
## [4,] -0.01988516 -0.12606134  0.096256185  0.172774447  0.969390992
## [5,] -0.03789685 -0.98654030 -0.087766817  0.037590405 -0.127206548
## [6,] -0.02966771 -0.01990490  0.024103802 -0.136626137  0.089770986
##              [,6]
## [1,]  0.147264400
## [2,] -0.042048512
## [3,] -0.015670467
## [4,] -0.069842391
## [5,] -0.002121028
## [6,]  0.985604940

Berdasarkan hasil analisis yang diperoleh:

  1. Matriks korelasi menunjukkan adanya hubungan antar variabel numerik dalam dataset SIRTUIN6.
  2. Matriks varians–kovarians menggambarkan tingkat penyebaran data dan hubungan antar variabel secara statistik.
  3. Eigen value terbesar menunjukkan komponen utama yang menjelaskan variasi data paling besar.
  4. Eigen vector menunjukkan variabel mana yang paling berkontribusi terhadap masing-masing komponen utama.