Analisis ini bertujuan untuk menghitung matriks kovarians, nilai eigen, vektor eigen, dan matriks korelasi
# Membuat data frame dengan tipe data yang sesuai
data <- data.frame(
Age = c(30.83, 58.67, 24.50, 27.83, 20.17),
Debt = c(0.000, 4.460, 0.500, 1.540, 5.625),
Married = factor(c(1, 1, 1, 1, 1)),
BankCustomer = factor(c(1, 1, 1, 1, 1)),
YearsEmployed = c(1.25, 3.04, 1.50, 3.75, 1.71),
PriorDefault = factor(c(1, 1, 1, 1, 1)),
Employed = factor(c(1, 1, 1, 1, 0)),
CreditScore = c(1, 6, 0, 5, 0),
DriversLicense = factor(c(0, 0, 0, 1, 0)),
ZipCode = factor(c(202, 43, 280, 100, 120)),
Income = c(0, 560, 824, 3, 0),
Approved = factor(c(1, 1, 1, 1, 1))
)
# Menampilkan data awal
head(data)
## Age Debt Married BankCustomer YearsEmployed PriorDefault Employed
## 1 30.83 0.000 1 1 1.25 1 1
## 2 58.67 4.460 1 1 3.04 1 1
## 3 24.50 0.500 1 1 1.50 1 1
## 4 27.83 1.540 1 1 3.75 1 1
## 5 20.17 5.625 1 1 1.71 1 0
## CreditScore DriversLicense ZipCode Income Approved
## 1 1 0 202 0 1
## 2 6 0 43 560 1
## 3 0 0 280 824 1
## 4 5 1 100 3 1
## 5 0 0 120 0 1
Penjelasan:
Dataset terdiri dari 12 variabel, dengan beberapa
variabel numerik dan kategori.
Hanya variabel numerik yang digunakan untuk perhitungan selanjutnya.
# Memilih hanya kolom numerik
numeric_data <- data[sapply(data, is.numeric)]
# Menampilkan data numerik
print(numeric_data)
## Age Debt YearsEmployed CreditScore Income
## 1 30.83 0.000 1.25 1 0
## 2 58.67 4.460 3.04 6 560
## 3 24.50 0.500 1.50 0 824
## 4 27.83 1.540 3.75 5 3
## 5 20.17 5.625 1.71 0 0
Penjelasan:
Hanya kolom numerik yang dipilih, karena matriks kovarians,
eigen, dan korelasi hanya bisa dihitung dari variabel
numerik.
# Menghitung matriks kovarians
cov_matrix <- cov(numeric_data)
# Menampilkan hasil dengan pembulatan 4 angka desimal
print(round(cov_matrix, 4))
## Age Debt YearsEmployed CreditScore Income
## Age 231.3614 9.3457 6.9994 33.30 2046.9725
## Debt 9.3457 6.1877 0.6052 1.34 -112.3138
## YearsEmployed 6.9994 0.6052 1.1821 2.81 -42.7750
## CreditScore 33.3000 1.3400 2.8100 8.30 11.5500
## Income 2046.9725 -112.3138 -42.7750 11.55 151957.8000
Penjelasan:
Matriks kovarians menggambarkan hubungan linier antara dua variabel
numerik.
- Nilai positif: Variabel meningkat bersama.
- Nilai negatif: Salah satu naik, yang lain turun.
- Nilai mendekati nol: Hubungan lemah atau tidak ada.
# Menghitung nilai eigen dan vektor eigen
eig <- eigen(cov_matrix)
# Menampilkan nilai eigen
eig$values <- round(eig$values, 4)
eig$vectors <- round(eig$vectors, 4)
eig
## eigen() decomposition
## $values
## [1] 151985.5068 210.1065 5.5893 3.6285 0.0000
##
## $vectors
## [,1] [,2] [,3] [,4] [,5]
## [1,] -0.0135 0.9844 0.0236 0.1665 0.0495
## [2,] 0.0007 0.0536 -0.9838 -0.1586 -0.0633
## [3,] 0.0003 0.0380 0.0246 -0.4876 0.8719
## [4,] -0.0001 0.1626 0.1757 -0.8422 -0.4831
## [5,] -0.9999 -0.0132 -0.0011 -0.0024 -0.0004
Penjelasan:
- Nilai eigen menggambarkan proporsi variabilitas yang dijelaskan oleh
masing-masing komponen utama.
- Vektor eigen menunjukkan arah dari dimensi utama dalam dataset.
# Menghitung matriks korelasi
cor_matrix <- cor(numeric_data)
# Menampilkan hasil dengan pembulatan 4 angka desimal
print(round(cor_matrix, 4))
## Age Debt YearsEmployed CreditScore Income
## Age 1.0000 0.2470 0.4232 0.7599 0.3452
## Debt 0.2470 1.0000 0.2238 0.1870 -0.1158
## YearsEmployed 0.4232 0.2238 1.0000 0.8971 -0.1009
## CreditScore 0.7599 0.1870 0.8971 1.0000 0.0103
## Income 0.3452 -0.1158 -0.1009 0.0103 1.0000
Penjelasan:
Matriks korelasi menunjukkan hubungan antar variabel dalam skala standar
(-1 hingga 1).
- 1 → Hubungan positif sempurna.
- -1 → Hubungan negatif sempurna.
- 0 → Tidak ada hubungan yang signifikan.
Dari analisis ini, dapat memahami hubungan antar variabel dalam
dataset:
- Matriks Kovarians menunjukkan hubungan dalam satuan
asli.
- Matriks Korelasi memberikan hubungan dalam skala
standar.
- Nilai Eigen membantu memahami variabilitas dalam
data.