Praktikum 1 membahas operasi dasar matriks dan
aplikasinya dalam Analisis Data Multivariat.
Materi meliputi: - Operasi Matriks (penjumlahan, pengurangan, perkalian,
transpose, invers, determinan)
- Eigen Value dan Eigen Vector
- Singular Value Decomposition (SVD)
- Matriks jarak (Euclidean, Chebyshev, Manhattan, Mahalanobis,
Minkowski)
- Vektor rata-rata, kovarians, korelasi, dan standardisasi
Operasi dasar matriks meliputi penjumlahan, pengurangan, perkalian,
transpose, invers, dan determinan.
Operasi ini menjadi dasar untuk analisis regresi, PCA, maupun analisis
diskriminan.
X <- matrix(c(6.5,8.2,7.9,
5.4,7.0,6.7,
8.1,6.9,9.2), 3, 3, byrow=TRUE)
Y <- matrix(c(7.3,6.8,8.5,
8.9,7.6,6.1,
9.4,8.0,7.2), 3, 3, byrow=TRUE)
X + Y
## [,1] [,2] [,3]
## [1,] 13.8 15.0 16.4
## [2,] 14.3 14.6 12.8
## [3,] 17.5 14.9 16.4
X %*% Y
## [,1] [,2] [,3]
## [1,] 194.69 169.72 162.15
## [2,] 164.70 143.52 136.84
## [3,] 207.02 181.12 177.18
t(X)
## [,1] [,2] [,3]
## [1,] 6.5 5.4 8.1
## [2,] 8.2 7.0 6.9
## [3,] 7.9 6.7 9.2
solve(X)
## [,1] [,2] [,3]
## [1,] 8.384864 -9.658514 -0.1661283
## [2,] 2.118136 -1.933549 -0.4107060
## [3,] -8.970928 9.953853 0.5629903
det(X)
## [1] 2.167
Operasi matriks menjadi dasar untuk manipulasi data multivariat.
Eigenvalue mengukur jumlah variasi yang dijelaskan oleh komponen, sedangkan eigenvector menunjukkan arah dari komponen tersebut.
Persamaan karakteristik:
\[ Av = \lambda v \]
Dengan \(\lambda\) eigenvalue dan \(v\) eigenvector.
Nilai \(\lambda\) diperoleh dari:
\[ \det(A - \lambda I) = 0 \]
eigX <- eigen(X)
eigX$values
## [1] 22.0140019 0.4816027 0.2043953
eigX$vectors
## [,1] [,2] [,3]
## [1,] -0.5877156 -0.5263753 -0.6237168
## [2,] -0.4964624 -0.3570747 -0.2383316
## [3,] -0.6388392 0.7716390 0.7444296
Eigenvalue yang besar menunjukkan dimensi yang lebih penting. Banyak digunakan dalam PCA.
SVD memecah matriks \(A_{m \times
n}\) menjadi tiga matriks:
\[ A = UDV^T \]
A <- matrix(c(5,-3,6,2,-4,8,-2,5,-1,7,3,9), 4, 3, byrow=TRUE)
svd_res <- svd(A)
svd_res$d
## [1] 16.07076 7.41936 3.11187
SVD digunakan untuk reduksi dimensi, kompresi data, dan sistem rekomendasi.
Matriks jarak digunakan untuk mengukur kedekatan antar objek.
set.seed(321)
ss <- sample(1:50, 15)
df <- USArrests[ss, ]
df.scaled <- scale(df)
dist.eucl <- dist(df.scaled, method="euclidean")
dist.man <- dist(df.scaled, method="manhattan")
dist.cheb <- dist(df.scaled, method="maximum")
dist.eucl[1:5]
## [1] 2.4122476 2.6164146 0.7934567 2.7921742 1.0532156
Pemilihan jenis jarak tergantung konteks analisis.
Vektor rata-rata menggambarkan nilai tengah variabel. Kovarians menunjukkan seberapa besar hubungan linear antar variabel, sedangkan korelasi mengukur hubungan terstandarisasi.
BB <- c(6.2,11.5,8.7,10.1,7.8,6.9,12.0,3.1,14.8,9.4)
PM <- c(61,73,68,70,64,60,76,49,84,71)
RTB <- c(115,138,127,123,131,120,143,95,160,128)
lizard <- cbind(BB,PM,RTB)
colMeans(lizard)
## BB PM RTB
## 9.05 67.60 128.00
cov(lizard)
## BB PM RTB
## BB 10.98056 31.80000 54.96667
## PM 31.80000 94.04444 160.22222
## RTB 54.96667 160.22222 300.66667
cor(lizard)
## BB PM RTB
## BB 1.0000000 0.9895743 0.9566313
## PM 0.9895743 1.0000000 0.9528259
## RTB 0.9566313 0.9528259 1.0000000
Kovarians dan korelasi adalah dasar dalam analisis multivariat seperti PCA dan analisis faktor.