Analisis ini menggunakan dataset Titanic dengan tujuan untuk menganalisis hubungan antar variabel numerik, yaitu Age, SibSp, Parch, dan Fare.
Sebelum analisis dilakukan, data yang mengandung missing value dihapus agar hasil perhitungan lebih akurat.
Pada tahap ini dilakukan pemilihan kolom Age, SibSp, Parch, dan Fare dari dataset Titanic.
Selanjutnya, baris data yang mengandung missing value dihapus.
{r}cor_matrix <- cor(data_clean) cor_matrix
Matriks varians-kovarians menggambarkan sebaran data dan hubungan antar variabel dalam satuan aslinya.
Elemen diagonal pada matriks menunjukkan varians masing-masing variabel, sedangkan elemen di luar diagonal menunjukkan kovarians antar dua variabel.
Nilai varians pada variabel Fare lebih besar dibandingkan variabel lainnya karena perbedaan skala data.
{r}cov_matrix <- cov(data_clean) cov_matrix
Matriks varians-kovarians menggambarkan sebaran data dan hubungan antar variabel dalam satuan aslinya.
Elemen diagonal pada matriks menunjukkan varians masing-masing variabel, sedangkan elemen di luar diagonal menunjukkan kovarians antar dua variabel.
Nilai varians pada variabel Fare lebih besar dibandingkan variabel lainnya karena perbedaan skala data.
{r}eigen_result <- eigen(cov_matrix) eigen_result$values eigen_result$vectors
Eigen value menunjukkan besarnya variasi data yang dapat dijelaskan oleh masing-masing komponen utama. Komponen dengan eigen value terbesar memiliki kontribusi paling besar dalam menjelaskan variasi data.
Eigen vector menunjukkan kontribusi masing-masing variabel dalam membentuk komponen utama tersebut. Analisis eigen ini merupakan dasar dari Principal Component Analysis (PCA).
Berdasarkan hasil analisis yang telah dilakukan, dapat disimpulkan bahwa terdapat hubungan antar beberapa variabel dalam dataset Titanic.
Matriks korelasi dan varians-kovarians memberikan gambaran mengenai hubungan dan sebaran data, sedangkan analisis eigen menunjukkan komponen utama yang paling dominan dalam menjelaskan variasi dat