data <- read.csv("Wholesale.csv")
head(data)
##   Channel Region Fresh Milk Grocery Frozen Detergents_Paper Delicassen
## 1       2      3 12669 9656    7561    214             2674       1338
## 2       2      3  7057 9810    9568   1762             3293       1776
## 3       2      3  6353 8808    7684   2405             3516       7844
## 4       1      3 13265 1196    4221   6404              507       1788
## 5       2      3 22615 5410    7198   3915             1777       5185
## 6       2      3  9413 8259    5126    666             1795       1451
x <- data[, 3:8]
head(x)
##   Fresh Milk Grocery Frozen Detergents_Paper Delicassen
## 1 12669 9656    7561    214             2674       1338
## 2  7057 9810    9568   1762             3293       1776
## 3  6353 8808    7684   2405             3516       7844
## 4 13265 1196    4221   6404              507       1788
## 5 22615 5410    7198   3915             1777       5185
## 6  9413 8259    5126    666             1795       1451
# correlation matriks
correlation_matriks <- cor(x)
print(correlation_matriks)
##                        Fresh      Milk     Grocery      Frozen Detergents_Paper
## Fresh             1.00000000 0.1005098 -0.01185387  0.34588146       -0.1019529
## Milk              0.10050977 1.0000000  0.72833512  0.12399376        0.6618157
## Grocery          -0.01185387 0.7283351  1.00000000 -0.04019274        0.9246407
## Frozen            0.34588146 0.1239938 -0.04019274  1.00000000       -0.1315249
## Detergents_Paper -0.10195294 0.6618157  0.92464069 -0.13152491        1.0000000
## Delicassen        0.24468997 0.4063683  0.20549651  0.39094747        0.0692913
##                  Delicassen
## Fresh             0.2446900
## Milk              0.4063683
## Grocery           0.2054965
## Frozen            0.3909475
## Detergents_Paper  0.0692913
## Delicassen        1.0000000
# variance-covariance matriks
cov_matriks <- cov(x)
print(cov_matriks)
##                      Fresh     Milk  Grocery   Frozen Detergents_Paper
## Fresh            159954927  9381789 -1424713 21236655       -6147825.7
## Milk               9381789 54469967 51083186  4442612       23288343.5
## Grocery           -1424713 51083186 90310104 -1854282       41895189.7
## Frozen            21236655  4442612 -1854282 23567853       -3044324.9
## Detergents_Paper  -6147826 23288343 41895190 -3044325       22732436.0
## Delicassen         8727310  8457925  5507291  5352342         931680.7
##                  Delicassen
## Fresh             8727310.0
## Milk              8457924.8
## Grocery           5507291.3
## Frozen            5352341.8
## Detergents_Paper   931680.7
## Delicassen        7952997.5
# eigenvalue dan eigenvector
Eigen <- eigen(cov_matriks)

# eigenvalue
Eigen$values
## [1] 164995904 145452098  25139978  15803901   5392764   2203641
# eigenvector
Eigen$vectors
##              [,1]        [,2]       [,3]        [,4]       [,5]        [,6]
## [1,]  0.976536846  0.11061386  0.1785573  0.04187648 -0.0159860 -0.01576316
## [2,]  0.121184071 -0.51580216 -0.5098868  0.64564047 -0.2032357  0.03349187
## [3,]  0.061540393 -0.76460638  0.2757809 -0.37546049  0.1602915  0.41093894
## [4,]  0.152364619  0.01872345 -0.7142004 -0.64629232 -0.2201861 -0.01328898
## [5,] -0.007054173 -0.36535076  0.2044099 -0.14938013 -0.2079302 -0.87128428
## [6,]  0.068104710 -0.05707921 -0.2832175  0.02039579  0.9170766 -0.26541687

Penjelasan

dari data wholesale costumer, hanya diambil fiturnya saja karena trget tidak termasuk.sehingga yang diambil hanya kolom fresh, milk, grocery, frozen, detergen, delicassen.

Correlation Matriks

korelasi matriks berfungsi untuk melihat korelasi hubungan yang kuat hingga lemah terhadap beberapa variabel sekaligus yang bernilai dari -1 hingga 1. dari output, korelasi tertinggi oleh detergen- grocery senilai 0.92, sedangkan korelasi terlemah ada pada frozen-detergen senilai -0.13.

Variance - Covarians Matriks

dalam output, fresh memiliki penyebaran yang sangat besar bernilai 159954927. sedangkan varians delicassen memiliki nilai 931680 sehingga data lebih terkonsentrasi.

Eigenvalue

menunjukkan besarnya varians. eigenvalue 2 pertama menunjukkan besar variasi data.

#Eigenvector menunjukkan arah komponen utama, dimana nilai setiap eigen vector merupakan ontribusi pada variabel pertama.