Membaca data Titanic
data <- read.csv("D:/PERKULIAHAN/Semester 4/Analisis Multivariat/archive/Titanic-Dataset.csv")
Memilih variabel yang digunakan
data_sebagian <- data[, c("Age", "SibSp", "Parch", "Fare")]
Mengecek jumlah missing value
sum(is.na(data_sebagian))
## [1] 177
Menghapus baris yang mengandung missing value
data_sebagian_bersih <- na.omit(data_sebagian)
correlation_matrix <- cor(data_sebagian_bersih)
correlation_matrix
## Age SibSp Parch Fare
## Age 1.00000000 -0.3082468 -0.1891193 0.09606669
## SibSp -0.30824676 1.0000000 0.3838199 0.13832879
## Parch -0.18911926 0.3838199 1.0000000 0.20511888
## Fare 0.09606669 0.1383288 0.2051189 1.00000000
Age vs SibSp: -0.31 → hubungan negatif berlawanan. Artinya, semakin tua penumpang, saudara atau pasangan sedikit di kapal.
Age vs Parch: -0.19 → negatif lemah. Umur penumpang hampir tidak berpengaruh terhadap jumlah anak atau orang tua yang ikut di kapal.
Age vs Fare: 0.096 → positif lemah. Umur penumpang hampir tidak memengaruhi harga tiket.
SibSp vs Parch: 0.38 → positif. Semakin banyak saudara/pasangan yang ikut, semakin banyak anak/orang tua yang ikut.
SibSp vs Fare: 0.14 → positif lemah. Jumlah saudara/pasangan sedikit memengaruhi harga tiket.
Parch vs Fare: 0.21 → positif lemah. Jumlah anak/orang tua sedikit memengaruhi harga tiket.
Hubungan paling terlihat adalah SibSp dengan Parch.
variance_covariance_Matrix <- cov(data_sebagian_bersih)
variance_covariance_Matrix
## Age SibSp Parch Fare
## Age 211.019125 -4.1633339 -2.3441911 73.849030
## SibSp -4.163334 0.8644973 0.3045128 6.806212
## Parch -2.344191 0.3045128 0.7281027 9.262176
## Fare 73.849030 6.8062117 9.2621760 2800.413100
eigenvalue_eigenvector<- eigen(variance_covariance_Matrix)
eigenvalue_eigenvector
## eigen() decomposition
## $values
## [1] 2802.5636587 209.0385659 0.9438783 0.4787214
##
## $vectors
## [,1] [,2] [,3] [,4]
## [1,] 0.028477552 0.99929943 -0.024018111 0.0035788596
## [2,] 0.002386349 -0.02093144 -0.773693322 0.6332099362
## [3,] 0.003280818 -0.01253786 -0.633088089 -0.7739712590
## [4,] 0.999586200 -0.02837826 0.004609234 0.0009266652