Lembar Kerja Mahasiswa

Mata Kuliah: Analisis Multivariat

Disusun oleh: Atya Azharina Aziz (24031554194) Kelas 2024 A

Dosen Pengampu Dinda Galuh Guminta, M.Stat. NIDN. 0011129602

Program Studi: S1 Sains Data Fakultas: FMIPA Universitas: Universitas Negeri Surabaya Tahun Akademik: 2025–2026

  1. Input file project Pada tahap awal, dilakukan penyiapan file project dengan memastikan bahwa file dataset SIRTUIN6.csv telah tersimpan di (working directory) R.

  2. Import Data (CSV) Dataset SIRTUIN6 diimpor ke R menggunakan fungsi read.csv(). Proses ini bertujuan untuk memuat data mentah ke dalam bentuk data frame sehingga bisa dilakukan eksplorasi awal. Setelah data berhasil diimpor, dilakukan pengecekan struktur data menggunakan fungsi str() serta peninjauan beberapa baris awal data menggunakan head() untuk memastikan bahwa data terbaca dengan benar.

data <- read.csv("SIRTUIN6.csv", header = TRUE)
str(data)
## 'data.frame':    100 obs. of  7 variables:
##  $ SC.5    : num  0.541 0.815 0.734 0.625 0.46 ...
##  $ SP.6    : num  7.64 6.59 6.86 7.01 4.93 ...
##  $ SHBd    : num  0.162 0 0 0.45 0.449 ...
##  $ minHaaCH: num  0.445 0.497 0.508 0.484 0.482 ...
##  $ maxwHBa : num  2.21 2 1.89 2.03 2.06 ...
##  $ FMF     : num  0.468 0.415 0.4 0.5 0.537 ...
##  $ Class   : chr  "High_BFE" "High_BFE" "High_BFE" "High_BFE" ...
head(data)
##       SC.5    SP.6     SHBd minHaaCH maxwHBa      FMF    Class
## 1 0.540936 7.64192 0.162171 0.445270 2.20557 0.467742 High_BFE
## 2 0.815332 6.59011 0.000000 0.497445 2.00314 0.415385 High_BFE
## 3 0.734399 6.85522 0.000000 0.507748 1.88590 0.400000 High_BFE
## 4 0.624557 7.00949 0.450300 0.483648 2.02757 0.500000 High_BFE
## 5 0.460290 4.92643 0.448998 0.482293 2.06438 0.536585 High_BFE
## 6 0.739251 5.30234 0.000000 0.503995 1.84017 0.428571 High_BFE
  1. Pisahkan Variabel Numerik Setelah data berhasil dimuat, dilakukan pemisahan variabel numerik dari keseluruhan dataset. Pemisahan ini dilakukan karena analisis multivariat, khususnya Principal Component Analysis (PCA), hanya bisa diterapkan pada variabel numerik. Variabel yang digunakan di analisis adalah SC.5, SP.6, SHBd, minHaaCH, maxwHBa, dan FMF.
X <- data[, c("SC.5", "SP.6", "SHBd", "minHaaCH", "maxwHBa", "FMF")]
  1. Soal:
  1. Matriks Korelasi Berdasarkan hasil perhitungan matriks korelasi, pasangan variabel SC.5 dan SP.6 memiliki koefisien korelasi sebesar 0,662, yang menunjukkan adanya hubungan linier positif. Pasangan variabel SP.6 dan FMF memiliki nilai korelasi sebesar 0,580, juga menunjukkan adanya keterkaitan linier positif antar kedua variabel tersebut. Sebaliknya, beberapa pasangan variabel seperti SC.5 dengan SHBd (−0,102) dan SP.6 dengan SHBd (−0,113) memiliki nilai korelasi yang berada dekat dengan nol, yang mengindikasikan bahwa hubungan linier antar variabel tersebut relatif rendah.
cor_matrix <- cor(X, use = "complete.obs")
round(cor_matrix, 3)
##            SC.5   SP.6   SHBd minHaaCH maxwHBa   FMF
## SC.5      1.000  0.662 -0.102    0.110  -0.084 0.182
## SP.6      0.662  1.000 -0.113    0.196   0.090 0.580
## SHBd     -0.102 -0.113  1.000    0.233   0.049 0.053
## minHaaCH  0.110  0.196  0.233    1.000   0.461 0.258
## maxwHBa  -0.084  0.090  0.049    0.461   1.000 0.190
## FMF       0.182  0.580  0.053    0.258   0.190 1.000
  1. Matriks Variance–Covariance Variabel SP.6 memiliki nilai varians terbesar yaitu 1,969, menunjukkan bahwa variabel ini memiliki tingkat penyebaran data paling besar dibandingkan variabel lain. Variabel FMF memiliki nilai varians 0,005, yang menunjukkan bahwa data pada variabel tersebut lebih terkonsentrasi di sekitar nilai rata-ratanya. Kovarians bernilai negatif, seperti antara SC.5 dan SHBd sebesar −0,007, menunjukkan kecenderungan perubahan yang berlawanan arah.
cov_matrix <- cov(X, use = "complete.obs")
round(cov_matrix, 3)
##            SC.5   SP.6   SHBd minHaaCH maxwHBa   FMF
## SC.5      0.038  0.181 -0.007    0.003  -0.009 0.003
## SP.6      0.181  1.969 -0.054    0.038   0.066 0.059
## SHBd     -0.007 -0.054  0.115    0.011   0.009 0.001
## minHaaCH  0.003  0.038  0.011    0.019   0.033 0.003
## maxwHBa  -0.009  0.066  0.009    0.033   0.274 0.007
## FMF       0.003  0.059  0.001    0.003   0.007 0.005
  1. Nilai Eigen & Vektor Eigen Berdasarkan hasil perhitungan, nilai eigen terbesar adalah 1,9928 pada komponen utama pertama. Hal ini menunjukkan bahwa komponen utama pertama menjelaskan proporsi variansi terbesar dari keseluruhan variansi data. Komponen utama kedua memiliki nilai eigen sebesar 0,2769, dan komponen utama ketiga sebesar 0,1139, yang menunjukkan bahwa kontribusi variansi yang dijelaskan oleh komponen-komponen berikutnya semakin menurun.

Vektor eigen pada komponen utama pertama menunjukkan bahwa variabel SP.6 memiliki koefisien dengan nilai absolut terbesar (−0,9939), sehingga variabel tersebut memberikan kontribusi paling besar dalam pembentukan komponen utama pertama. Dengan demikian, struktur variansi data banyak dipengaruhi oleh variasi pada variabel SP.6.

eig <- eigen(cov_matrix)
eig$values
## [1] 1.992769556 0.276942728 0.113877882 0.020953542 0.013224463 0.002875384
eig$vectors
##             [,1]        [,2]         [,3]         [,4]         [,5]
## [1,] -0.09219130  0.06060081 -0.003107518  0.970452736 -0.156055543
## [2,] -0.99396947  0.03294359  0.029422161 -0.090947728 -0.005846681
## [3,]  0.02852534 -0.07545079  0.990744881 -0.004387236 -0.107950230
## [4,] -0.01988516 -0.12606134  0.096256185  0.172774447  0.969390992
## [5,] -0.03789685 -0.98654030 -0.087766817  0.037590405 -0.127206548
## [6,] -0.02966771 -0.01990490  0.024103802 -0.136626137  0.089770986
##              [,6]
## [1,]  0.147264400
## [2,] -0.042048512
## [3,] -0.015670467
## [4,] -0.069842391
## [5,] -0.002121028
## [6,]  0.985604940
  1. Kesimpulan Berdasarkan hasil analisis multivariat terhadap data, disimpulkan bahwa antar variabel numerik terdapat hubungan linier dengan arah positif maupun negatif. Hasil matriks varians, kovarians menunjukkan bahwa setiap variabel memiliki tingkat penyebaran data yang berbeda. Perbedaan mengindikasikan bahwa kontribusi masing-masing variabel terhadap variasi tidak seragam. Hasil nilai eigen dan vektor eigen menunjukkan bahwa sebagian besar variasi data dapat direpresentasikan oleh sejumlah kecil komponen utama. Dengan demikian, struktur data memungkinkan dilakukannya reduksi dimensi untuk keperluan analisis lanjutan tanpa kehilangan informasi yang signifikan secara statistik.

  2. Publikasi ke RPubs Dokumen R Markdown ini dipublikasikan dalam bentuk halaman HTML melalui RPubs sehingga dapat diakses secara daring sebagai laporan analisis.