titanic <- read.csv(“Titanic-Dataset.csv”)

## Cek hasil
dim(data_clean)
[1] 714 4
## Corrlation matrix cor_matrix <- cor(data_clean) round(cor_matrix, 3) Age SibSp Parch Fare Age 1.000 -0.308 -0.189 0.096 SibSp -0.308 1.000 0.384 0.138 Parch -0.189 0.384 1.000 0.205 Fare 0.096 0.138 0.205 1.000
## Dalam correlation matrix nila yang mendekati +1 menunjukan hubungan positif kuat, dan nilai yang mendekati -1 memiliki hubungan negatif kuat. dan nilai yang mendekati 0 menunjukkan sedikit atau tidak ada hubungan linier.
cov_matrix <- cov(data_clean)
round(cov_matrix, 2)
Age SibSp Parch Fare
Age 211.02 -4.16 -2.34 73.85
SibSp -4.16 0.86 0.30 6.81
Parch -2.34 0.30 0.73 9.26
Fare 73.85 6.81 9.26 2800.41
## hasil dari kovarians matriks adalah memeberikan gambaran data harga tiket (fare) memiliki nilai varians yang tinggi (2800) daripada variabel lain, nilai ini membuat analisis rata-rata tidak akurat
eigen_result <- eigen(cov_matrix)> print(eigen_result\(values) [1] 2802.5636587 209.0385659 0.9438783 0.4787214> print(eigen_result\)vectors) [,1] [,2] [,3] [,4] [1,] 0.028477552 0.99929943 -0.024018111 0.0035788596 [2,] 0.002386349 -0.02093144 -0.773693322 0.6332099362 [3,] 0.003280818 -0.01253786 -0.633088089 -0.7739712590 [4,] 0.999586200 -0.02837826 0.004609234 0.0009266652
## pada eigen value nilai 2802.56 memiliki nilai yang besar, yang berarti komponen ini hampir menjelaskan seluruh variasi dalam data titanic, untuk komponen 2,3, dan 4 cukup kecil hampir tidak membawa informasi ## hasil dari eigen vector berguna untuk mengungkap arah dominan dari sebaran data titanic, dimana setiap kolom mewakili satu komponen utama yang diurutkan berdasarkan kekuatanya. Pada kolom pertama, nilai 0,999 yang muncul di baris keempat menunjukkan bahwa komponen utama yang paling kuat ini hampir murni hanya berisi informasi mengenai Harga Tiket, sedangkan kolom kedua dengan nilai 0,999 di baris pertama menunjukkan bahwa komponen terkuat kedua hanyalah representasi dari Umur. Dari data ini menunjukan data bias karena tidak distandarisasi terlebih dahulu.