#membaca data Titanic <- read.csv(“C:/Users/salis/Downloads/Titanic-Dataset.csv”)
#mengambil data di kolom Age,sibsp, parch, fare. data <- Titanic[, c(“Age”, “SibSp”, “Parch”, “Fare”)]
#Menghapus otlier data_clean <- na.omit(data)
#Correlation Matrix cor_matrix <- cor(data_clean) cor_matrix # Hasil matriks korelasi dari data titanic ini terlihat hunbungan negatif lemah ada di Age – Parch yang bernilai -0,189 yang artinya penumpang yang lebih tua cenderung sedikit membawa anak atau orang tua. untuk korelasi Age - SibSp ini bernilai -0,308 yang menunjukkan hubungan negatf sedang.Korelasi positif sedang terdapat pada SibSp – Parch sebesar 0,384, melihatkan bahwa penumpang yang membawa lebih banyak saudara atau pasangan juga cenderung membawa anak atau orang tua. Untuk Variabel Fare memiliki korelasi positif lemah dengan semua variabel lain (Age = 0,096; SibSp = 0,138; Parch = 0,205), yang menunjukkan bahwa harga tiket sedikit meningkat dengan jumlah anggota keluarga.
#Variance-Covariance Matrix cov_matrix <- cov(data_clean) cov_matrix #Hasil matriks covariance dari data titanic ini terdapat Nilai yang berada di diagonal matriks menunjukkan varians, yaitu beragam data pada setiap variabel.Varians Age yang mempunyai nilai sebesar 211 yang berarti usia penumpang cukup beragam, dengan selisih usia yang cukup jauh antar penumpang. Varians SibSp sebesar 0,864 menunjukkan bahwa jumlah saudara atau pasangan yang ikut berbeda-beda, tetapi tidak terlalu jauh. Varians Parch sebesar 0,728 menandakan bahwa jumlah anak atau orang tua yang ikut juga tidak terlalu bervariasi. Sedangkan untuk varians Fare sebesar 2800 menunjukkan bahwa harga tiket penumpang sangat beragam, dari yang murah sampai yang sangat mahal.Untuk nilai yang diluar diagonal.Selain itu ada nilai di luar diagonal yang menunjukkan arah hubungan antar variabel. Kovarians Age dan SibSp bernilai negatif (–4,16), yang berarti semakin tua penumpang, semakin sedikit saudara atau pasangan yang ikut. Kovarians Age dan Parch juga bernilai negatif (–2,34), yang berarti penumpang yang lebih tua cenderung membawa lebih sedikit anak atau orang tua. dan Sebaliknya, kovarians Age dan Fare bernilai positif (73,85), yang menunjukkan bahwa penumpang yang lebih tua biasanya membeli tiket dengan harga lebih mahal. Selain itu, kovarians SibSp dan Parch bernilai positif (0,305), yang artinya penumpang yang membawa banyak saudara atau pasangan juga cenderung membawa anak atau orang tua.
#Eigen value dan eigen vector eigen_result <- eigen(cov_matrix) eigen_result$values #Eigenvalue menunjukkan seberapa besar variasi data yang dijelaskan oleh setiap bagian utama. Bagian 1 yaitu agenvalue 2802.56 ini merupakan bagian yang menjelaskan hampir seluruh variasi data yyang dominan.Bagian 2 yaitu Eigenvalue 209.04 ini merupakan bagian yang meberikan kontribusi variasi yang cukup.namun jauh lebih kecil dari bagian pertama.Untuk bagian 3(0,94) dan 4(0,478) memiliki memiliki nilai yang sangat kecil, sehingga kontribusinya dalam menjelaskan variasi data relatif tidak signifikan.
eigen_result$vectors #Berdasarkan eigenvector yang dihasilkan, bagian pertama didominasi variabel Fare, yang memiliki nilai paling besar mendekati 1 yaitu (9,999) yang artinya variasi terbesar dalam data ditentukan oleh harga tiket.untuk bagian kedua nilai terbesarnya adalah age = 0,9993. bagian Ini merepresentasikan usia penumpang. Variasi kedua terbesar dalam data berasal dari perbedaan usia penumpang.bagian ketiga nilai terbesar berada pada variabel SibSp = –0,7737 dan Parch = –0,6331 yang menunjukkan bahwa bagian ini menggambarkan struktur keluarga penumpang, yaitu jumlah saudara/pasangan dan jumlah anak/orang tua.dan ke empat variabel SibSp = 0,6332 dan Parch = –0,7740 menjadi dominan, tetapi arahnya berlawanan.Ini menunjukkan bahwa bagian keempat membedakan antara penumpang yang membawa lebih banyak saudara/pasangan dan penumpang yang membawa lebih banyak anak/orang tua