TUGAS:

1.Import data tersebut ke R

2.Tulislah code R sehingga menghasilkan

3a. Correlation Matrix

Variance-Covariance Matrix

Eigen value dan eigen vector

Jelaskan hasil dari setiap output

4.Pelajari Rpubs dan buat akun pada Rpubs

5.Unggah tugas Anda pada Rpubs

6.Kumpulkan link Rpubs pada tempat yang tersedia

URL(https://archive.ics.uci.edu/dataset/850/raisin)

PENYELESAIAN:

install.packages("readxl")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.5'
## (as 'lib' is unspecified)
library(readxl)
#1.Import data
raisin <- read_excel("Raisin_Dataset.xlsx")
head(raisin)
## # A tibble: 6 × 8
##    Area MajorAxisLength MinorAxisLength Eccentricity ConvexArea Extent Perimeter
##   <dbl>           <dbl>           <dbl>        <dbl>      <dbl>  <dbl>     <dbl>
## 1 87524            442.            253.        0.820      90546  0.759     1184.
## 2 75166            407.            243.        0.802      78789  0.684     1122.
## 3 90856            442.            266.        0.798      93717  0.638     1209.
## 4 45928            287.            209.        0.685      47336  0.700      844.
## 5 79408            352.            291.        0.564      81463  0.793     1073.
## 6 49242            318.            200.        0.777      51368  0.658      882.
## # ℹ 1 more variable: Class <chr>
#2. Ambil variabel numerik
X <- raisin[, 1:7]
#3a.Correlation Matrix
cor_matrix <- cor(X)
round(cor_matrix, 3)
##                   Area MajorAxisLength MinorAxisLength Eccentricity ConvexArea
## Area             1.000           0.933           0.907        0.336      0.996
## MajorAxisLength  0.933           1.000           0.728        0.584      0.945
## MinorAxisLength  0.907           0.728           1.000       -0.028      0.896
## Eccentricity     0.336           0.584          -0.028        1.000      0.348
## ConvexArea       0.996           0.945           0.896        0.348      1.000
## Extent          -0.013          -0.204           0.145       -0.361     -0.055
## Perimeter        0.961           0.978           0.827        0.448      0.977
##                 Extent Perimeter
## Area            -0.013     0.961
## MajorAxisLength -0.204     0.978
## MinorAxisLength  0.145     0.827
## Eccentricity    -0.361     0.448
## ConvexArea      -0.055     0.977
## Extent           1.000    -0.173
## Perimeter       -0.173     1.000
#3b.Variance Covariance Matrix
cov_matrix <- cov(X)
cov_matrix
##                          Area MajorAxisLength MinorAxisLength  Eccentricity
## Area             1.521165e+09    4.221378e+06    1.767671e+06  1.183972e+03
## MajorAxisLength  4.221378e+06    1.346415e+04    4.222916e+03  6.116279e+00
## MinorAxisLength  1.767671e+06    4.222916e+03    2.498890e+03 -1.249887e-01
## Eccentricity     1.183972e+03    6.116279e+00   -1.249887e-01  8.157415e-03
## ConvexArea       1.583600e+09    4.470629e+06    1.825348e+06  1.282186e+03
## Extent          -2.815116e+01   -1.264820e+00    3.884178e-01 -1.743625e-03
## Perimeter        1.026472e+07    3.106672e+04    1.132335e+04  1.107340e+01
##                    ConvexArea        Extent     Perimeter
## Area             1.583600e+09 -2.815116e+01  1.026472e+07
## MajorAxisLength  4.470629e+06 -1.264820e+00  3.106672e+04
## MinorAxisLength  1.825348e+06  3.884178e-01  1.132335e+04
## Eccentricity     1.282186e+03 -1.743625e-03  1.107340e+01
## ConvexArea       1.662135e+09 -1.194617e+02  1.090014e+07
## Extent          -1.194617e+02  2.858848e-03 -2.538891e+00
## Perimeter        1.090014e+07 -2.538891e+00  7.494690e+04
#3c.Eigen Value dan Eigen Vector
e <- eigen(cov_matrix)

e$values
## [1] 3.176903e+09 6.484070e+06 3.411647e+03 5.871721e+02 4.592383e+01
## [6] 1.781033e-03 1.565458e-03
e$vectors
##               [,1]          [,2]          [,3]          [,4]         [,5]
## [1,] -6.911978e-01  7.225900e-01  0.0099167946  2.336904e-03  0.002339507
## [2,] -1.935429e-03 -6.101735e-03  0.5800095074 -5.162209e-01 -0.630129625
## [3,] -7.998219e-04  2.427483e-03 -0.2137523625  6.499835e-01 -0.729259089
## [4,] -5.492743e-07 -4.737215e-06  0.0010540138 -1.661067e-03  0.001299584
## [5,] -7.226472e-01 -6.910123e-01 -0.0159270484 -5.209011e-03 -0.001481976
## [6,]  3.330314e-08  9.602308e-06 -0.0003483057  7.835626e-05 -0.001134514
## [7,] -4.712872e-03 -1.795989e-02  0.7858407300  5.576756e-01  0.266659316
##               [,6]          [,7]
## [1,]  1.174284e-06  6.537297e-06
## [2,]  4.904183e-04  6.364268e-04
## [3,]  8.891598e-04 -2.278570e-03
## [4,] -2.806809e-02 -9.996032e-01
## [5,] -1.815070e-08 -6.392384e-06
## [6,] -9.996054e-01  2.806617e-02
## [7,] -5.255305e-04  2.634392e-04

3d.Hasil dari setiap output Pada Correlation Matrix untuk melihat hubungan antar variabel pada data Raisin ini seperti Area, Perimeter dan juga panjang sumbubisa dilihat dengan nilai antara -1 samapai degan 1 sehingga semakun mendekati 1 maka hubungan antara 2 varibel semakin kuat dan searah dan sebaliknya. lalu dilihat pada data ini bahwasanya variabel Arean dan juga Perimeter memiliki korelasi yan tinggi yang berrarti kismis yang besar juga memiliki keliling yang besar.

Pada Covariance Matrix menunjukkan bahwa besar penyebarna data dari kedua variabel berubah bersama dengan variansi atau diagonal yang menunjukkan beragam nilai dalan suatu variabel sedangkan kovariansnya menunjukkan 2 variabel yang cenderung naik atau turun bersaamaan. nah dilihat dari data ini bahwa Area dan Perimeternya memiliki kovarians yang besar yang artinya memang saling berkaitan dalam ukuran kismis.

Pada Eigen Values menunjukkan besar informasi yang dapat dilihat dari setiap komponene dimana eigen value yang paling besar merupakan komponen yang paling penting karena menyimpan banyak informasi tentang perbedaan antar Raisin.

Pada Vector menunjukkan bahawsannya peran dari masing”varabel yang membentuk kompinen memiliki nilai besar di eigen vektor yang berpengaruh dalam membedakan ukuran serta bentuk kismis Raisin