Nomor 2 TPG

Nomor 2

library(readxl)
## Warning: package 'readxl' was built under R version 4.3.2
dataaku<- read_excel("C:/Users/Admin/Downloads/Dataku2.xlsx")
dataaku
## # A tibble: 10 × 4
##    Observasi    X1    X2    X3
##        <dbl> <dbl> <dbl> <dbl>
##  1         1    70    40    30
##  2         2    40    10    80
##  3         3    60    30    50
##  4         4    80    60    10
##  5         5    80    50    70
##  6         6    70    20    90
##  7         7    50    30    30
##  8         8    90    50    80
##  9         9    70    40    50
## 10        10    80    20    20

Input data yang dibutuhkan untuk Analisis Komponen Utama, Data yang kami pakai adalah data observasi 10 siswa dengan objek observasinya adalah 3 Niiai pelajaran dari masing-masing siswa yang diwakilkan oleh X1 ( Matematika), X2 (IPAS), X3 (Bahasa).

Tenutkan Matrix Ragam-Koragam

#ambil matrix  var-covar dari X! x2 x3

covar <- cov(dataaku[,2:4])
covar
##           X1        X2         X3
## X1 232.22222  161.1111  -43.33333
## X2 161.11111  250.0000 -127.77778
## X3 -43.33333 -127.7778  787.77778

Ini adalah matrix Var-Covar yang terbentuk, dimana dapat disimpulkan bahwa Nilai keragaman tertinggi diduduki oleh X3 ( Nilai Bahasa) diikuti dengan NIlai IPAS dan keragaman terendah di Nilai Matematika, dapat dilihat juga bahwa terdapat korelasi negatif antara Nilai bahasa dan IPAS, dan Nilai Matematika dan Bahasa, Sedangkan terdapat korelasi positif antara Nilai Matematika dan IPAS.

Cari Akar Ciri dan Vektor Ciri

eigen(covar)
## eigen() decomposition
## $values
## [1] 827.39426 367.61293  74.99282
## 
## $vectors
##            [,1]      [,2]        [,3]
## [1,] -0.1375708 0.6990371  0.70172743
## [2,] -0.2504597 0.6608892 -0.70745703
## [3,]  0.9583028 0.2730799 -0.08416157

Didapatkan Eigen Value 1 827.3946, Eigen Value 2 367.61293, dan Eigen Vlaue 3 ada di 74.9992 dengan Vektori ciri terlihat pada outputnya.

Analisis Komponen Utama

Komponen utama yang dipakai adalah lewat Matriks Ragam-Koragam, sehingga pada Scale dan Center dibuat FALSE. kemudian akan dilihat berapa persen komponen AKU yang akan dipakai dalam pemodelan akhir.

library(factoextra)
## Warning: package 'factoextra' was built under R version 4.3.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
pcanilaisiswa <- prcomp(dataaku[,2:4],scale=FALSE,center=FALSE)
summary(pcanilaisiswa)
## Importance of components:
##                            PC1      PC2     PC3
## Standard deviation     99.7440 27.82006 9.39609
## Proportion of Variance  0.9202  0.07159 0.00817
## Cumulative Proportion   0.9202  0.99183 1.00000

Dapat ddari Cumulative Proportionnya, Principal Component 1 saja sudah mengcover 92 % keragaman total untuk Nilai siswa, artinya dengan menggunakan 1 komponen saja sudah cukup, namun pada konteks ini kami akan menggunakan 2 Komponen AKU untuk mendapatkan proporsi keragaman yang lebih tinggi.

fviz_screeplot(pcanilaisiswa,geom="line")

Terlihat dari Scree Plot bahwa dari KU 1 ke KU 2 saja sudah memberikan penurunan yang drastis diikuti penurunan yang cukup landai dari KU 2 ke KU 3.

Sehingga kami akan menggunakan KU 1 dan KU 2 dalam interpretasi akhirnya.

pcanilaisiswa$rotation
##           PC1        PC2        PC3
## X1 -0.7347714 -0.4011079  0.5470132
## X2 -0.3762719 -0.4299618 -0.8207023
## X3 -0.5643850  0.8088543 -0.1649980

Karena kita hanya menggunakan dua komponen saja, maka vector ciri yang akan dinterpretasikan hanya pada PC1 dan PC2

PC1: Pada PC1 dalam konteks nilai siswa, PC1 mengambbarkan kinerja umum siswa di semua mata pelajaran. Dapat dilihat bahwa vektor ciri pada PC1 memiliki kontribusi relatif besar mulai dari matematika (X1), IPAS (X2), dan Bahasa (X3) (walaupun kontribusi terbesar dari X1). Oleh karena itu, kita bisa menggunakan PC1 untuk menentukan siswa mana yang memiliki performa terbaik secara keseluruhan di semua mata pelajaran,

Pada dataset nilai siswa, PC2 menunjukkan perbedaan antara kemampuan bahasa (X3) dan matematika (X1) serta IPAS (X2). Siswa dengan nilai PC2 yang tinggi menunjukkan kemampuan bahasa yang lebih baik, tetapi performa mereka pada matematika dan IPAS mungkin lebih rendah. Hal ini bisa juga mengindikasikan bahwa PC 2 ini dapat melihat siswa yang pintar dalam Bahasa Indonesia namun kurang nilainya pada Matematika dan IPAS.

fviz_pca_ind(pcanilaisiswa,col.ind = "darkred")

Dilihat dari dimensinya, Sumbu Horizontal PC 1/ Dim 1 mengambbarkan variansi terbesar yang diambil dari komponen utama (92%) dimana sumbu vertikal mengambbarkan variansi kedua sekitar 7.2% dijelaskan. Bila dilihat secara eksploratif dari penempatan titik amatan secara dua dimensi, dapat dikatakan bahwa secara sumbuh horizontal, posisi paling kiri ditempati oleh siswa yang meiliki nilai paling tinggi, dan bila dilihat secara vertikal, posisi teratas mengindikasikan nilai bahasa yang paling tinggi namun nilai IPA dan Matematikanya tidak terlalu tinggi ( cenderung rendah).

Dapat dikatakan Bahwa siswa yang memiliki nilai tertinggi secara keseluruhan adalah siswa nomor 8 diikuti siswa nomor 5. Siswa dengan nilai terendah secara keseluruhan adalah siswa nomor 7( Dalam DImensi KU 1 ), Kemudian Siswa dengan kemampuan Bahasa yang paling baik adalah siswa Nomor 2 karena Posisinya teratas, namun diikuti dengan Nilai Matematika dan IPA yang kurang tinggi/ rendah ( dimana secara posisi horizontal juga berada ditengah, yang artinya nilai kesluruhannya tidak terlalu tinggi, namun secara vertikal berada diatas yang mengindikasikan dia memiliki nilai bahasa yang tinggi).

Sehingga dapat dikatakan Siswa nomor 2 memiliki kemampuan bahasa yang jauh lebih baik dibanding dengan pelajaran-pelajaran lainnya. Kemudian kontrapositifnya adalah Siswa Nomor 4 , yaitu memiliki nilai Bahasa yang paling buruk namun nilai-nilai mata pelajaran lainnya cukup tinggi. Sehingga Siswa nomor 4 perlu mengembangkan pelajaran bahasanya sendangkan siswa nomor 2 perlu menyeimbangan kemampuan Matematika dan IPA nya.

Kemudian yang menarik adalah siswa nomor 6, dimana dia berada diposisi cukup kiri yang artinya nilai kesuluruhannya tinggi , namun dia berada pada posisi atas yang mengartikan bahwa nilai bahasanya tinggi namun terdapat nilai mata pelajaran lain yang rendah. Bila diamati siswa nomor 6 ini Memiliki nilai yang tinggi di Bahasa (90) dan berada di posisi kiri secara horizontal dimana nilai Matematikanya cukup baik (70), namun dia berada di posisi atas , berarti ada satu nilai yang dia “jeblok” (kurang sekali), hal ini ditunjukan pada nilai IPAS nya yang rendah (20), sehingga perlu ada pembelajaran lebih bagi siswa nomor 6 di Bagian IPAS nya.