1. Pendahuluan

Analisis ini bertujuan untuk menghitung matriks kovarians, nilai eigen, vektor eigen, dan matriks korelasi


2. Membuat Data Frame

# Membuat data frame dengan tipe data yang sesuai
data <- data.frame(
  Age = c(30.83, 58.67, 24.50, 27.83, 20.17),
  Debt = c(0.000, 4.460, 0.500, 1.540, 5.625),
  Married = factor(c(1, 1, 1, 1, 1)),
  BankCustomer = factor(c(1, 1, 1, 1, 1)),
  YearsEmployed = c(1.25, 3.04, 1.50, 3.75, 1.71),
  PriorDefault = factor(c(1, 1, 1, 1, 1)),
  Employed = factor(c(1, 1, 1, 1, 0)),
  CreditScore = c(1, 6, 0, 5, 0),
  DriversLicense = factor(c(0, 0, 0, 1, 0)),
  ZipCode = factor(c(202, 43, 280, 100, 120)),
  Income = c(0, 560, 824, 3, 0),
  Approved = factor(c(1, 1, 1, 1, 1))
)

# Menampilkan data awal
head(data)
##     Age  Debt Married BankCustomer YearsEmployed PriorDefault Employed
## 1 30.83 0.000       1            1          1.25            1        1
## 2 58.67 4.460       1            1          3.04            1        1
## 3 24.50 0.500       1            1          1.50            1        1
## 4 27.83 1.540       1            1          3.75            1        1
## 5 20.17 5.625       1            1          1.71            1        0
##   CreditScore DriversLicense ZipCode Income Approved
## 1           1              0     202      0        1
## 2           6              0      43    560        1
## 3           0              0     280    824        1
## 4           5              1     100      3        1
## 5           0              0     120      0        1

Penjelasan:
Dataset terdiri dari 12 variabel, dengan beberapa variabel numerik dan kategori.
Hanya variabel numerik yang digunakan untuk perhitungan selanjutnya.


3. Memilih Kolom Numerik

# Memilih hanya kolom numerik
numeric_data <- data[sapply(data, is.numeric)]

# Menampilkan data numerik
print(numeric_data)
##     Age  Debt YearsEmployed CreditScore Income
## 1 30.83 0.000          1.25           1      0
## 2 58.67 4.460          3.04           6    560
## 3 24.50 0.500          1.50           0    824
## 4 27.83 1.540          3.75           5      3
## 5 20.17 5.625          1.71           0      0

Penjelasan:
Hanya kolom numerik yang dipilih, karena matriks kovarians, eigen, dan korelasi hanya bisa dihitung dari variabel numerik.


4. Menghitung Matriks Kovarians

# Menghitung matriks kovarians
cov_matrix <- cov(numeric_data)

# Menampilkan hasil dengan pembulatan 4 angka desimal
print(round(cov_matrix, 4))
##                     Age      Debt YearsEmployed CreditScore      Income
## Age            231.3614    9.3457        6.9994       33.30   2046.9725
## Debt             9.3457    6.1877        0.6052        1.34   -112.3138
## YearsEmployed    6.9994    0.6052        1.1821        2.81    -42.7750
## CreditScore     33.3000    1.3400        2.8100        8.30     11.5500
## Income        2046.9725 -112.3138      -42.7750       11.55 151957.8000

Penjelasan:
Matriks kovarians menggambarkan hubungan linier antara dua variabel numerik.
- Nilai positif: Variabel meningkat bersama.
- Nilai negatif: Salah satu naik, yang lain turun.
- Nilai mendekati nol: Hubungan lemah atau tidak ada.


5. Menghitung Nilai Eigen dan Vektor Eigen

# Menghitung nilai eigen dan vektor eigen
eig <- eigen(cov_matrix)

# Menampilkan nilai eigen
eig$values <- round(eig$values, 4)
eig$vectors <- round(eig$vectors, 4)

eig
## eigen() decomposition
## $values
## [1] 151985.5068    210.1065      5.5893      3.6285      0.0000
## 
## $vectors
##         [,1]    [,2]    [,3]    [,4]    [,5]
## [1,] -0.0135  0.9844  0.0236  0.1665  0.0495
## [2,]  0.0007  0.0536 -0.9838 -0.1586 -0.0633
## [3,]  0.0003  0.0380  0.0246 -0.4876  0.8719
## [4,] -0.0001  0.1626  0.1757 -0.8422 -0.4831
## [5,] -0.9999 -0.0132 -0.0011 -0.0024 -0.0004

Penjelasan:
- Nilai eigen menggambarkan proporsi variabilitas yang dijelaskan oleh masing-masing komponen utama.
- Vektor eigen menunjukkan arah dari dimensi utama dalam dataset.


6. Menghitung Matriks Korelasi

# Menghitung matriks korelasi
cor_matrix <- cor(numeric_data)

# Menampilkan hasil dengan pembulatan 4 angka desimal
print(round(cor_matrix, 4))
##                  Age    Debt YearsEmployed CreditScore  Income
## Age           1.0000  0.2470        0.4232      0.7599  0.3452
## Debt          0.2470  1.0000        0.2238      0.1870 -0.1158
## YearsEmployed 0.4232  0.2238        1.0000      0.8971 -0.1009
## CreditScore   0.7599  0.1870        0.8971      1.0000  0.0103
## Income        0.3452 -0.1158       -0.1009      0.0103  1.0000

Penjelasan:
Matriks korelasi menunjukkan hubungan antar variabel dalam skala standar (-1 hingga 1).
- 1 → Hubungan positif sempurna.
- -1 → Hubungan negatif sempurna.
- 0 → Tidak ada hubungan yang signifikan.


7. Kesimpulan

Dari analisis ini, dapat memahami hubungan antar variabel dalam dataset:
- Matriks Kovarians menunjukkan hubungan dalam satuan asli.
- Matriks Korelasi memberikan hubungan dalam skala standar.
- Nilai Eigen membantu memahami variabilitas dalam data.