Tugas pertemuan pertama Analisis Multivariat

Load Data

SIRTUIN6 <- read.csv("SIRTUIN6.csv", header = TRUE)

Perintah read.csv(“SIRTUIN6.csv”, header = TRUE) digunakan untuk membaca file SIRTUIN6.csv dan memasukkannya ke dalam R sebagai sebuah data frame dengan nama SIRTUIN6. Opsi header = TRUE menunjukkan bahwa baris pertama pada file CSV berisi nama kolom, sehingga data dapat dikenali dan diproses dengan benar dalam analisis selanjutnya.

Transformasi Data Numerik

data_num <- SIRTUIN6[sapply(SIRTUIN6, is.numeric)]
str(data_num)

## 'data.frame':    100 obs. of  6 variables:
##  $ SC.5    : num  0.541 0.815 0.734 0.625 0.46 ...
##  $ SP.6    : num  7.64 6.59 6.86 7.01 4.93 ...
##  $ SHBd    : num  0.162 0 0 0.45 0.449 ...
##  $ minHaaCH: num  0.445 0.497 0.508 0.484 0.482 ...
##  $ maxwHBa : num  2.21 2 1.89 2.03 2.06 ...
##  $ FMF     : num  0.468 0.415 0.4 0.5 0.537 ...

Data yang digunakan berbentuk tibble yang terdiri dari 100 observasi dan 6 variabel, yaitu SC-5, SP-6, SHBd, minHaaCH, maxwHBa, dan FMF. Seluruh variabel bertipe numerik, sehingga data memenuhi syarat untuk dilakukan analisis statistik seperti matriks korelasi, matriks varians–kovarians, serta perhitungan eigen value dan eigen vector. Setiap variabel memiliki skala dan tingkat penyebaran data yang berbeda, yang menunjukkan adanya variasi karakteristik antar variabel. Oleh karena itu, analisis lanjutan dilakukan untuk memahami hubungan antar variabel serta kontribusi masing-masing variabel dalam menjelaskan variasi data secara keseluruhan.

Correlation Matrix

cor_matrix <- cor(data_num)
cor_matrix

##                 SC.5        SP.6        SHBd  minHaaCH     maxwHBa       FMF
## SC.5      1.00000000  0.66208234 -0.10165734 0.1101450 -0.08366394 0.1816990
## SP.6      0.66208234  1.00000000 -0.11309294 0.1956995  0.08952777 0.5798669
## SHBd     -0.10165734 -0.11309294  1.00000000 0.2325906  0.04922928 0.0525741
## minHaaCH  0.11014501  0.19569946  0.23259056 1.0000000  0.46076976 0.2582501
## maxwHBa  -0.08366394  0.08952777  0.04922928 0.4607698  1.00000000 0.1898255
## FMF       0.18169903  0.57986685  0.05257410 0.2582501  0.18982546 1.0000000

Matriks korelasi digunakan untuk melihat hubungan antar variabel dengan nilai yang berada pada rentang –1 sampai 1. Nilai korelasi positif menunjukkan hubungan searah, nilai negatif menunjukkan hubungan berlawanan arah, sedangkan nilai yang mendekati nol menunjukkan hubungan yang lemah antar variabel. Berdasarkan hasil analisis, variabel SC-5 dan SP-6 memiliki nilai korelasi sebesar 0.662 yang menunjukkan hubungan positif kuat, sehingga peningkatan nilai SC-5 cenderung diikuti oleh peningkatan nilai SP-6. Selain itu, variabel SP-6 dan FMF juga memiliki korelasi positif cukup kuat sebesar 0.580. Sementara itu, sebagian besar pasangan variabel lainnya memiliki nilai korelasi yang kecil, baik positif maupun negatif, yang menunjukkan hubungan yang relatif lemah. Nilai diagonal pada matriks korelasi bernilai 1 karena menunjukkan korelasi variabel dengan dirinya sendiri.

Variance–Covariance Matrix

cov_matrix <- cov(data_num)
cov_matrix

##                  SC.5        SP.6         SHBd    minHaaCH      maxwHBa
## SC.5      0.038073191  0.18129548 -0.006730516 0.002986591 -0.008537740
## SP.6      0.181295476  1.96938510 -0.053851871 0.038164206  0.065707969
## SHBd     -0.006730516 -0.05385187  0.115133039 0.010967139  0.008736117
## minHaaCH  0.002986591  0.03816421  0.010967139 0.019310901  0.033487306
## maxwHBa  -0.008537740  0.06570797  0.008736117 0.033487306  0.273520544
## FMF       0.002561709  0.05879780  0.001288960 0.002593040  0.007173265
##                  FMF
## SC.5     0.002561709
## SP.6     0.058797800
## SHBd     0.001288960
## minHaaCH 0.002593040
## maxwHBa  0.007173265
## FMF      0.005220775

Matriks varians–kovarians digunakan untuk melihat tingkat penyebaran data (varians) dan hubungan variasi antar variabel (kovarians). Nilai varians terdapat pada diagonal utama matriks, sedangkan nilai kovarians berada di luar diagonal. Berdasarkan hasil perhitungan, variabel SP-6 memiliki nilai varians paling besar yang menunjukkan penyebaran data paling luas, sedangkan variabel FMF memiliki varians paling kecil sehingga datanya relatif lebih homogen. Nilai kovarians antar variabel sebagian besar bernilai kecil, baik positif maupun negatif, yang menunjukkan bahwa hubungan variasi antar variabel relatif lemah.

Eigen Value dan Eigen Vector

eigen_result <- eigen(cov_matrix)

eigen_result$values

## [1] 1.992769556 0.276942728 0.113877882 0.020953542 0.013224463 0.002875384

eigen_result$vectors

##             [,1]        [,2]         [,3]         [,4]         [,5]
## [1,] -0.09219130  0.06060081 -0.003107518  0.970452736 -0.156055543
## [2,] -0.99396947  0.03294359  0.029422161 -0.090947728 -0.005846681
## [3,]  0.02852534 -0.07545079  0.990744881 -0.004387236 -0.107950230
## [4,] -0.01988516 -0.12606134  0.096256185  0.172774447  0.969390992
## [5,] -0.03789685 -0.98654030 -0.087766817  0.037590405 -0.127206548
## [6,] -0.02966771 -0.01990490  0.024103802 -0.136626137  0.089770986
##              [,6]
## [1,]  0.147264400
## [2,] -0.042048512
## [3,] -0.015670467
## [4,] -0.069842391
## [5,] -0.002121028
## [6,]  0.985604940

Eigen value digunakan untuk menunjukkan besarnya variasi data yang dapat dijelaskan oleh masing-masing komponen utama. Semakin besar nilai eigen value, maka semakin besar pula kontribusi komponen tersebut dalam menjelaskan keragaman data. Oleh karena itu, komponen dengan eigen value terbesar dianggap paling penting dalam analisis. Eigen vector menunjukkan arah dan bobot masing-masing variabel dalam membentuk komponen utama. Nilai absolut yang besar pada eigen vector menunjukkan bahwa variabel tersebut memiliki kontribusi yang besar terhadap komponen terkait, sehingga tidak semua variabel memberikan pengaruh yang sama dalam menjelaskan variasi data.

Tugas pertemuan pertama Analisis Multivariat

Ayu Anggraini(24031554054)

Load Data

Transformasi Data Numerik

Correlation Matrix

Variance–Covariance Matrix

Eigen Value dan Eigen Vector