Pendahuluan

Analisis ini menggunakan dataset Titanic dengan tujuan untuk menganalisis hubungan antar variabel numerik, yaitu Age, SibSp, Parch, dan Fare.

Sebelum analisis dilakukan, data yang mengandung missing value dihapus agar hasil perhitungan lebih akurat.

Preprocessing Data

Pada tahap ini dilakukan pemilihan kolom Age, SibSp, Parch, dan Fare dari dataset Titanic.

Selanjutnya, baris data yang mengandung missing value dihapus.

Correlation Matrix

{r}cor_matrix <- cor(data_clean) cor_matrix

Matriks varians-kovarians menggambarkan sebaran data dan hubungan antar variabel dalam satuan aslinya.

Elemen diagonal pada matriks menunjukkan varians masing-masing variabel, sedangkan elemen di luar diagonal menunjukkan kovarians antar dua variabel.

Nilai varians pada variabel Fare lebih besar dibandingkan variabel lainnya karena perbedaan skala data.

Variance-Covariance Matrix

{r}cov_matrix <- cov(data_clean) cov_matrix

Matriks varians-kovarians menggambarkan sebaran data dan hubungan antar variabel dalam satuan aslinya.

Elemen diagonal pada matriks menunjukkan varians masing-masing variabel, sedangkan elemen di luar diagonal menunjukkan kovarians antar dua variabel.

Nilai varians pada variabel Fare lebih besar dibandingkan variabel lainnya karena perbedaan skala data.

Eigen Value dan Eigen Vector

{r}eigen_result <- eigen(cov_matrix) eigen_result$values eigen_result$vectors

Eigen value menunjukkan besarnya variasi data yang dapat dijelaskan oleh masing-masing komponen utama. Komponen dengan eigen value terbesar memiliki kontribusi paling besar dalam menjelaskan variasi data.

Eigen vector menunjukkan kontribusi masing-masing variabel dalam membentuk komponen utama tersebut. Analisis eigen ini merupakan dasar dari Principal Component Analysis (PCA).

Kesimpulan

Berdasarkan hasil analisis yang telah dilakukan, dapat disimpulkan bahwa terdapat hubungan antar beberapa variabel dalam dataset Titanic.

Matriks korelasi dan varians-kovarians memberikan gambaran mengenai hubungan dan sebaran data, sedangkan analisis eigen menunjukkan komponen utama yang paling dominan dalam menjelaskan variasi dat