Langkah 1: Import data .csv

SIRTUIN6 <- read.csv(“D:/UAS tableau/SIRTUIN6.csv”, header= TRUE)

str(SIRTUIN6)

Dataset tersebut terdiri dari 100 observasi dan 7 variabel. Terdapat satu variabel yang berupa karakter, yaitu Class dan enam variabel lainnya yang bersifat numerik.

Langkah 2: Cek variabel numeric

data_num <- SIRTUIN6[, sapply(SIRTUIN6, is.numeric)]

str(data_num)

Variabel Class tidak diperlukan karena analisis matriks hanya dapat digunakan pada data numerik.

Langkah 3: Hitung correlation matrix

cor_matrix <- cor(data_num)

round(cor_matrix, 3)

Correlation matrix menunjukkan hubungan linier antara variabel numerik yang ada dalam dataset, dengan nilai dari -1 sampai 1. Dimana nilai -1 artinya hubungan negatif sempurna sedangkan nilai 1 artinya hubungan positif sempurna, dan nilai yang mendekati 0 artinya hubungan linier lemah. Matrix ini bersifat simetris, dengan diagonal utama bernilai 1, karena korelasi antara variabel dengan dirinya sendiri. Interpretasi: Jika terdapat dua descriptor memiliki correlation yang tinggi/besar, maka keduanya mengandung informasi yang serupa.

Langkah 4: Hitung variance-covariance matrix

cov_matrix <- cov(data_num)

round(cov_matrix, 3)

Menunjukkan sejauh mana tingkat penyebaran data dan hubungan antara variabel dengan menggunakan satuan asli data. Dimana terdapat elemen diagonal yang menunjukkan variance dari setiap variabel sedangkan elemen non-diagonal menunjukkan covariance antar dua variabel, dan covariance positif menunjukkan kedua variabel cenderung meningkat bersamaan. Interpretasi: Variance yang tinggi/besar menunjukkan bahwa variabel memiliki penyebaran data yang luas dan covariance yang tinggi/besar menunjukkan adanya hubungan yang kuat antara variabel, namun nilainya tergantung pada skala.

Langkah 5: Hitung eigen value & vector

eigen_result <- eigen(cov_matrix)

eigen_result$values

eigen_result$vectors

Eigen value menunjukkan besarnya variasi data yang dapat dijelaskan oleh setiap komponen utama, sedangkan Eigen vector menunjukkan arah kombinasi linier variabel yang membentuk komponen utama. Interpretasi: Jika eigen value tinggi maka komponen sangat signifikan, eigen value kecil maka kontribusi variasi nya kecil. Sedangkan pada setiap kolom eigen vector merepresentasikan satu arah utama variasi data dan nilai di dalam eigen vector menunjukkan kontribusi dari setiap variabel.