# Pada percobaan kali ini menggunakan data credit card approvals dataset yang hanya menggambil kolom age,debt, yearsemployed, dan income untuk mencari eigen value, eigen vector, variance-covariance matrix dan correlation matrix. 
# Membuat matriks data
data_matrix <- matrix(c(30.83, 58.67, 24.50, 27.83, 20.17,  
                        0.000, 4.460, 0.500, 1.540, 5.625,  
                        1.25, 3.04, 1.50, 3.75, 1.71,  
                        0, 560, 824, 3, 0), 
                      nrow = 5, ncol = 4, byrow = FALSE)

# Menamai kolom agar lebih mudah dipahami
colnames(data_matrix) <- c("Age", "Debt", "YearsEmployed", "Income")
#Keterangan = pada baris pertama merupakan data dari age, baris kedua merupakan data dari debt, baris ketiga data dari yearsemployed dan baris terakhir merupakan data dari income. Data tersebut merupakan sample. byrow merupakan perintah agar data diproses secara urut.
# a) Menghitung Eigen Value dan Eigen Vector dari matriks kovarians
eig <- eigen(cov(data_matrix))
cat("Eigen Values:\n")
## Eigen Values:
print(eig$values)
## [1] 1.519855e+05 2.046288e+02 5.515401e+00 8.810774e-01
cat("Eigen Vectors:\n")
## Eigen Vectors:
print(eig$vectors)
##               [,1]        [,2]         [,3]          [,4]
## [1,] -0.0134874524  0.99771613  0.055954477 -0.0353512228
## [2,]  0.0007381111  0.05468974 -0.997847290 -0.0361838792
## [3,]  0.0002807996  0.03730694 -0.034170588  0.9987194221
## [4,] -0.9999087283 -0.01340703 -0.001500938  0.0007305969
# Keterangan = Menurut hasil, eigen values terbesar mempengaruhi variasi data yaitu income sebesar 8,810774. Menurut matrix eigen vector kolom pertama dipengaruhi oleh income, kolom kedua dipengaruhi oleh age, kolom ketiga dipengaruhi oleh debt sedangkan kolom terakhir dipengaruhi oleh yearsemployed.
# b) Menghitung Variance-Covariance Matrix
cov_matrix <- cov(data_matrix)
cat("Variance-Covariance Matrix:\n")
## Variance-Covariance Matrix:
print(cov_matrix)
##                       Age        Debt YearsEmployed      Income
## Age            231.361400    9.345663      6.999375   2046.9725
## Debt             9.345663    6.187675      0.605225   -112.3137
## YearsEmployed    6.999375    0.605225      1.182050    -42.7750
## Income        2046.972500 -112.313750    -42.775000 151957.8000
# Keterangan = Variance data (nilai diagonal) sangat bervariasi didata income. Covariance (hub antara dua var) memiliki hubungan positif antara age dan income yang menunjukan semakin bertambahnya usia maka pendapatan cenderung meningkat. Sedangkan hubungan negatif antara yearsemployed dan income yang menunjukan lama durasi orang bekerja tidak selalu memiliki pendapatan tinggi. 
# c) Menghitung Correlation Matrix
cor_matrix <- cor(data_matrix)
cat("Correlation Matrix:\n")
## Correlation Matrix:
print(cor_matrix)
##                     Age       Debt YearsEmployed     Income
## Age           1.0000000  0.2470022     0.4232489  0.3452272
## Debt          0.2470022  1.0000000     0.2237872 -0.1158264
## YearsEmployed 0.4232489  0.2237872     1.0000000 -0.1009278
## Income        0.3452272 -0.1158264    -0.1009278  1.0000000
# Keterangan = correlasi tertinggi ditunjukan oleh age dan yearsemployed dengan nilai 0,423 yang artinya semakin tua seseorang, maka kemungkinan memiliki pengalaman kerja lebih banyak.