SIRTUIN6 <- read.csv(“D:/UAS tableau/SIRTUIN6.csv”, header= TRUE)
str(SIRTUIN6)
Dataset tersebut terdiri dari 100 observasi dan 7 variabel. Terdapat satu variabel yang berupa karakter, yaitu Class dan enam variabel lainnya yang bersifat numerik.
data_num <- SIRTUIN6[, sapply(SIRTUIN6, is.numeric)]
str(data_num)
Variabel Class tidak diperlukan karena analisis matriks hanya dapat digunakan pada data numerik.
cor_matrix <- cor(data_num)
round(cor_matrix, 3)
Correlation matrix menunjukkan hubungan linier antara variabel numerik yang ada dalam dataset, dengan nilai dari -1 sampai 1. Dimana nilai -1 artinya hubungan negatif sempurna sedangkan nilai 1 artinya hubungan positif sempurna, dan nilai yang mendekati 0 artinya hubungan linier lemah. Matrix ini bersifat simetris, dengan diagonal utama bernilai 1, karena korelasi antara variabel dengan dirinya sendiri. Interpretasi: Jika terdapat dua descriptor memiliki correlation yang tinggi/besar, maka keduanya mengandung informasi yang serupa.
cov_matrix <- cov(data_num)
round(cov_matrix, 3)
Menunjukkan sejauh mana tingkat penyebaran data dan hubungan antara variabel dengan menggunakan satuan asli data. Dimana terdapat elemen diagonal yang menunjukkan variance dari setiap variabel sedangkan elemen non-diagonal menunjukkan covariance antar dua variabel, dan covariance positif menunjukkan kedua variabel cenderung meningkat bersamaan. Interpretasi: Variance yang tinggi/besar menunjukkan bahwa variabel memiliki penyebaran data yang luas dan covariance yang tinggi/besar menunjukkan adanya hubungan yang kuat antara variabel, namun nilainya tergantung pada skala.
eigen_result <- eigen(cov_matrix)
eigen_result$values
eigen_result$vectors
Eigen value menunjukkan besarnya variasi data yang dapat dijelaskan oleh setiap komponen utama, sedangkan Eigen vector menunjukkan arah kombinasi linier variabel yang membentuk komponen utama. Interpretasi: Jika eigen value tinggi maka komponen sangat signifikan, eigen value kecil maka kontribusi variasi nya kecil. Sedangkan pada setiap kolom eigen vector merepresentasikan satu arah utama variasi data dan nilai di dalam eigen vector menunjukkan kontribusi dari setiap variabel.