TUGAS:
1.Import data tersebut ke R
2.Tulislah code R sehingga menghasilkan
3a. Correlation Matrix
Variance-Covariance Matrix
Eigen value dan eigen vector
Jelaskan hasil dari setiap output
4.Pelajari Rpubs dan buat akun pada Rpubs
5.Unggah tugas Anda pada Rpubs
6.Kumpulkan link Rpubs pada tempat yang tersedia
URL(https://archive.ics.uci.edu/dataset/850/raisin)
PENYELESAIAN:
install.packages("readxl")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.5'
## (as 'lib' is unspecified)
library(readxl)
#1.Import data
raisin <- read_excel("Raisin_Dataset.xlsx")
head(raisin)
## # A tibble: 6 × 8
## Area MajorAxisLength MinorAxisLength Eccentricity ConvexArea Extent Perimeter
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 87524 442. 253. 0.820 90546 0.759 1184.
## 2 75166 407. 243. 0.802 78789 0.684 1122.
## 3 90856 442. 266. 0.798 93717 0.638 1209.
## 4 45928 287. 209. 0.685 47336 0.700 844.
## 5 79408 352. 291. 0.564 81463 0.793 1073.
## 6 49242 318. 200. 0.777 51368 0.658 882.
## # ℹ 1 more variable: Class <chr>
#2. Ambil variabel numerik
X <- raisin[, 1:7]
#3a.Correlation Matrix
cor_matrix <- cor(X)
round(cor_matrix, 3)
## Area MajorAxisLength MinorAxisLength Eccentricity ConvexArea
## Area 1.000 0.933 0.907 0.336 0.996
## MajorAxisLength 0.933 1.000 0.728 0.584 0.945
## MinorAxisLength 0.907 0.728 1.000 -0.028 0.896
## Eccentricity 0.336 0.584 -0.028 1.000 0.348
## ConvexArea 0.996 0.945 0.896 0.348 1.000
## Extent -0.013 -0.204 0.145 -0.361 -0.055
## Perimeter 0.961 0.978 0.827 0.448 0.977
## Extent Perimeter
## Area -0.013 0.961
## MajorAxisLength -0.204 0.978
## MinorAxisLength 0.145 0.827
## Eccentricity -0.361 0.448
## ConvexArea -0.055 0.977
## Extent 1.000 -0.173
## Perimeter -0.173 1.000
#3b.Variance Covariance Matrix
cov_matrix <- cov(X)
cov_matrix
## Area MajorAxisLength MinorAxisLength Eccentricity
## Area 1.521165e+09 4.221378e+06 1.767671e+06 1.183972e+03
## MajorAxisLength 4.221378e+06 1.346415e+04 4.222916e+03 6.116279e+00
## MinorAxisLength 1.767671e+06 4.222916e+03 2.498890e+03 -1.249887e-01
## Eccentricity 1.183972e+03 6.116279e+00 -1.249887e-01 8.157415e-03
## ConvexArea 1.583600e+09 4.470629e+06 1.825348e+06 1.282186e+03
## Extent -2.815116e+01 -1.264820e+00 3.884178e-01 -1.743625e-03
## Perimeter 1.026472e+07 3.106672e+04 1.132335e+04 1.107340e+01
## ConvexArea Extent Perimeter
## Area 1.583600e+09 -2.815116e+01 1.026472e+07
## MajorAxisLength 4.470629e+06 -1.264820e+00 3.106672e+04
## MinorAxisLength 1.825348e+06 3.884178e-01 1.132335e+04
## Eccentricity 1.282186e+03 -1.743625e-03 1.107340e+01
## ConvexArea 1.662135e+09 -1.194617e+02 1.090014e+07
## Extent -1.194617e+02 2.858848e-03 -2.538891e+00
## Perimeter 1.090014e+07 -2.538891e+00 7.494690e+04
#3c.Eigen Value dan Eigen Vector
e <- eigen(cov_matrix)
e$values
## [1] 3.176903e+09 6.484070e+06 3.411647e+03 5.871721e+02 4.592383e+01
## [6] 1.781033e-03 1.565458e-03
e$vectors
## [,1] [,2] [,3] [,4] [,5]
## [1,] -6.911978e-01 7.225900e-01 0.0099167946 2.336904e-03 0.002339507
## [2,] -1.935429e-03 -6.101735e-03 0.5800095074 -5.162209e-01 -0.630129625
## [3,] -7.998219e-04 2.427483e-03 -0.2137523625 6.499835e-01 -0.729259089
## [4,] -5.492743e-07 -4.737215e-06 0.0010540138 -1.661067e-03 0.001299584
## [5,] -7.226472e-01 -6.910123e-01 -0.0159270484 -5.209011e-03 -0.001481976
## [6,] 3.330314e-08 9.602308e-06 -0.0003483057 7.835626e-05 -0.001134514
## [7,] -4.712872e-03 -1.795989e-02 0.7858407300 5.576756e-01 0.266659316
## [,6] [,7]
## [1,] 1.174284e-06 6.537297e-06
## [2,] 4.904183e-04 6.364268e-04
## [3,] 8.891598e-04 -2.278570e-03
## [4,] -2.806809e-02 -9.996032e-01
## [5,] -1.815070e-08 -6.392384e-06
## [6,] -9.996054e-01 2.806617e-02
## [7,] -5.255305e-04 2.634392e-04
3d.Hasil dari setiap output Pada Correlation Matrix untuk melihat hubungan antar variabel pada data Raisin ini seperti Area, Perimeter dan juga panjang sumbubisa dilihat dengan nilai antara -1 samapai degan 1 sehingga semakun mendekati 1 maka hubungan antara 2 varibel semakin kuat dan searah dan sebaliknya. lalu dilihat pada data ini bahwasanya variabel Arean dan juga Perimeter memiliki korelasi yan tinggi yang berrarti kismis yang besar juga memiliki keliling yang besar.
Pada Covariance Matrix menunjukkan bahwa besar penyebarna data dari kedua variabel berubah bersama dengan variansi atau diagonal yang menunjukkan beragam nilai dalan suatu variabel sedangkan kovariansnya menunjukkan 2 variabel yang cenderung naik atau turun bersaamaan. nah dilihat dari data ini bahwa Area dan Perimeternya memiliki kovarians yang besar yang artinya memang saling berkaitan dalam ukuran kismis.
Pada Eigen Values menunjukkan besar informasi yang dapat dilihat dari setiap komponene dimana eigen value yang paling besar merupakan komponen yang paling penting karena menyimpan banyak informasi tentang perbedaan antar Raisin.
Pada Vector menunjukkan bahawsannya peran dari masing”varabel yang membentuk kompinen memiliki nilai besar di eigen vektor yang berpengaruh dalam membedakan ukuran serta bentuk kismis Raisin