Analisis Komponen Utama (PCA) Terhadap Komposisi Pembuatan Kaca

Chintia Valentina

2023-10-23

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("factoextra")
> # install.packages("FactoMineR")

1 PENDAHULUAN

1.1 Latar Belakang

Pembuatan kaca adalah proses yang sangat penting dalam berbagai aplikasi industri, mulai dari pembuatan kaca jendela hingga kaca optik yang sangat presisi. Untuk mencapai sifat-sifat yang diinginkan dalam kaca, komposisi bahan baku yang digunakan sangat penting. Pembuatan kaca merupakan proses yang kompleks yang melibatkan campuran berbagai bahan kimia dasar seperti silikon dioksida (\(SiO_2\)), natrium oksida (\(Na_2O\)), kalsium oksida (\(CaO\)), dan komponen lainnya. Komposisi ini melibatkan sejumlah variabel kimia yang dapat memengaruhi sifat fisik dan optik dari kaca yang dihasilkan. Oleh karena itu, pemahaman yang mendalam tentang pengaruh masing-masing variabel komposisi terhadap kualitas dan karakteristik kaca sangat penting.

Salah satu metode analisis statistik yang dapat digunakan untuk mendekati masalah ini adalah Analisis Komponen Utama (PCA). PCA adalah teknik statistik multivariabel yang digunakan untuk mereduksi dimensi data, mengidentifikasi pola tersembunyi, dan menjelaskan sebagian besar variasi dalam dataset. Dalam konteks komposisi pembuatan kaca, PCA dapat digunakan untuk mengidentifikasi Komponen Utama atau faktor yang paling berpengaruh terhadap kualitas dan karakteristik kaca.

Variabel-variabel utama yang akan dianalisis dalam studi ini adalah sebagai berikut:

  1. RI (Indeks Bias Refraktif): Indeks bias refraktif adalah parameter yang mengukur sejauh mana cahaya dibiaskan saat melewati material. Indeks ini berpengaruh pada sifat optik kaca, seperti kejernihan dan lalu lintas cahaya.

  2. Na (Natrium): Kandungan natrium dalam kaca dapat mempengaruhi konduktivitas termal dan kontraksi linier kaca. Natrium oksida dapat berperan dalam mengontrol viskositas kaca selama proses pembuatan.

  3. Mg (Magnesium): Magnesium dapat memengaruhi ketahanan terhadap pemanasan dan pemadatan kaca. Kandungan magnesium dapat memengaruhi sifat fisik dan termal kaca.

  4. Al (Aluminium): Aluminium dapat mempengaruhi kekuatan dan ketahanan terhadap korosi kaca. Kandungan aluminium dalam kaca juga dapat memengaruhi titik lebur dan sifat mekanis kaca.

  5. Si (Silikon): Silikon adalah komponen utama dalam kaca dan memiliki pengaruh yang signifikan terhadap berbagai sifat kaca, termasuk titik lebur, indeks bias refraktif, dan ketahanan terhadap perubahan suhu.

  6. K (Kalium): Kandungan kalium dalam kaca dapat memengaruhi viskositas, warna, dan kejernihan kaca.

  7. Ca (Kalsium): Kalsium dapat memengaruhi stabilitas kimia dan sifat mekanis kaca. Kalsium sering digunakan sebagai pengganti natrium untuk mengubah karakteristik kaca.

  8. Ba (Barium): Barium dapat digunakan dalam kaca untuk mengubah sifat transmisi sinar-X. Kandungan barium dapat memengaruhi sifat radiasi kaca.

  9. Fe (Besi): Kandungan besi dalam kaca dapat mempengaruhi warna kaca, dan dalam beberapa kasus, besi dapat menjadi kontaminan yang tidak diinginkan.

Analisis Komponen Utama (PCA) adalah metode statistik multivariat yang dapat mengidentifikasi hubungan (linier atau non-linier) antara variabel dan mengidentifikasi Komponen Utama yang dapat digunakan untuk mengoptimalkan komposisi bahan baku dalam pembuatan kaca dengan mengurangi dimensi data tanpa kehilangan informasi penting. Hasil analisis ini dapat memberikan wawasan berharga kepada produsen kaca untuk meningkatkan kualitas, efisiensi, dan keberlanjutan dalam proses produksi kaca. Dengan pemahaman yang lebih mendalam tentang pengaruh variabel komposisi, dapat mengoptimalkan formulasi dan sifat-sifat kaca yang dihasilkan sehingga perusahaan dapat menghasilkan produk kaca yang lebih sesuai dengan kebutuhan pelanggan dan pasar.

1.2 Rumusan Masalah

Bagaimana hubungan antara variabel-variabel utama (RI, Na, Mg, Al, Si, K, Ca, Ba, dan Fe) mempengaruhi karakteristik pembuatan kaca?

1.3 Tujuan

Mengurangi dimensi data tanpa kehilangan informasi penting sehingga memungkinkan pemahaman yang lebih mendalam tentang hubungan antarvariabel dalam komposisi kaca.

1.4 Manfaat Penelitian

Analisis Komponen Utama (PCA) terhadap komposisi pembuatan kaca memiliki manfaat sebagai berikut:

  1. Optimasi Formulasi Kaca: Memungkinkan untuk merancang formulasi kaca yang optimal dengan mempertimbangkan interaksi antarvariabel yang paling signifikan.

  2. Peningkatan Kualitas Produk Kaca: Memungkinkan produsen kaca untuk meningkatkan kualitas fisik dan optik dari produk mereka dengan memodifikasi komposisi kaca sesuai dengan hasil analisis PCA.

  3. Efisiensi Produksi: Meminimalkan percobaan dan iterasi dalam proses produksi kaca dengan memberikan panduan yang lebih terarah dalam memilih proporsi komponen.

  4. Pengurangan Biaya Produksi: Memungkinkan untuk mengurangi biaya produksi dengan meminimalkan penggunaan bahan baku tertentu tanpa mengorbankan kualitas produk akhir.

2 TINJAUAN PUSTAKA

2.1 Analisis Komponen Utama

Analisis Komponen Utama (PCA) adalah teknik statistik yang digunakan untuk mengurangi dimensi dari dataset multivariat. Teknik ini ditemukan oleh Karl Pearson pada tahun 1901 dan dikembangkan lebih lanjut oleh Harold Hotelling pada tahun 1930-an. PCA memiliki banyak aplikasi di berbagai bidang termasuk statistik, ilmu komputer, ilmu data, dan bidang lainnya. Analisis Komponen Utama dilakukan untuk mengurangi dimensi dari data multivariat dan mempertahankan sebanyak mungkin informasi yang terkandung dalam data asli (Johnson, 2007).

2.2 Model

Variabel-variabel X disusun dalam vektor

\[ \mathbf{X} = \matrix{[X_1&X_2&...&X_p]} \]

memiliki matriks Var-Cov \(\Sigma\) dengan nilai eigen

\[\lambda_1\geq\lambda_2\geq...\geq\lambda_p\]

Diperoleh kombinasi linier berikut:

\[ Y_1=\mathbf{a}_1'\mathbf{X}=a_{11}X_1+a_{12}X_2+...+a_{1p}X_p\\ Y_2=\mathbf{a}_2'\mathbf{X}=a_{21}X_1+a_{22}X_2+...+a_{2p}X_p\\ \vdots\\ Y_p=\mathbf{a}_p'\mathbf{X}=a_{p1}X_1+a_{p2}X_2+...+a_{pp}X_p \]

dimana

\[ Var(Y_p)=\mathbf{a}_i'\mathbf{\Sigma}\mathbf{a}_i\\ Cov(Y_p,Y_k)=\mathbf{a}_i'\mathbf{\Sigma}\mathbf{a}_k \]

2.3 Pembentukan Komponen Utama

Komponen Utama adalah kombinasi linier dari \(Y_1, Y_2, ..., Y_p\) yang tidak saling berkorelasi dimana varians dari masing-masing kombinasi linier sebesar mungkin.

  • Komponen Utama ke- 1

\[Y_1 = \mathbf{a}_1'\mathbf{X}\]

akan memamksimumkan \(Var(\mathbf{a}_1'\mathbf{X})\), dengan syarat \(\mathbf{a}_1'a_1=1\).

  • Komponen Utama ke- 2

\[Y_2 = \mathbf{a}_2'\mathbf{X}\]

akan memamksimumkan \(Var(\mathbf{a}_2'\mathbf{X})\), dengan syarat \(\mathbf{a}_2'a_2=1\), dan \(Cov(\mathbf{a}_1\mathbf{X},\mathbf{a}_2'\mathbf{X})=0\).

  • Komponen Utama ke- i

\[Y_i = \mathbf{a}_i'\mathbf{X}\]

akan memamksimumkan \(Var(\mathbf{a}_i'\mathbf{X})\), dengan syarat \(\mathbf{a}_i'a_i=1\), dan \(Cov(\mathbf{a}_k'\mathbf{X},\mathbf{a}_i'\mathbf{X})=0\) untuk semua \(k<i\).

Agar \[\mathbf{a}_1'\mathbf{a}_1=1\] maka diperlukan normalisasi dengan matriks vektor normal, sehingga:

\[\mathbf{e}_i = \frac{1}{|\mathbf{u}_i\|}\mathbf{u}_i\]

Dengan matriks vektor normal, maka terbentuk:

Misalkan variabe-variabel X disusun dalam vektor

\[ \mathbf{X} = \matrix{[X_1&X_2&...&X_p]} \]

memiliki matriks Var-Cov \(\Sigma\) dengan pasangan nilai eigen dan vektor eigen

\[(\lambda_1,\mathbf{e}_1),(\lambda_2,\mathbf{e}_2),...,(\lambda_p,\mathbf{e}_p)\]

dengan

\[\lambda_1\geq\lambda_2\geq...\geq\lambda_p\]

Diperoleh Komponen Utama ke-i adalah:

\[Y_i=\mathbf{e}_i'\mathbf{X}=e_{i1}X_1+e_{i2}X_2+...+e_{ip}X_p\]

dimana

\[e_{i1}^2+e_{i2}^2+...+e_{ip}^2=1\]

Varians dan Kovarians dari Komponen Utama, yaitu:

\[ Var(Y_i)=\mathbf{e}_i'\mathbf{\Sigma}\mathbf{e}_i=\lambda_i\\ Cov(Y_i,Y_k)=\mathbf{e}_i'\mathbf{\Sigma}\mathbf{e}_k=0 \]

Proposi total keragaman yang dapat dijelaskan oleh Komponen Utama ke-j, yaitu:

\[\frac{\lambda_i}{\sum_{i=1}^{p} \lambda_i}\]

Didefinisikan sebagai:

\[\rho_{Y_i,Y_k}=\frac{e_{ik}\sqrt{\lambda_i} }{\sqrt{\sigma_{kk}}} \]

2.4 Menentukan Banyaknya Komponen Utama

Mengurangi dimensi dalam PC dapat dilakukan dengan menggantikan variabel p dengan m PC pertama (\(m<p\)) diterpakan (Jolliffe, 2002). Menentukan banyaknya komponen utama, yaitu:

  1. Persentase kumulatif dari variasi total lebih dari 70%

\[\frac{\sum_{i=1}^{k}\lambda_i}{\sum_{i=1}^{p} \lambda_i}\geq0.7\]

  1. Nilai eigen lebih dari 1

  2. Scree Plot

3 DATA

Data dalam penelitian ini adalah data sekunder dari website yaitu www.kaggle.com. Terdapat beberapa indikator yang dibahas, yaitu:

  • \(X_1\) : RI (Refractive Index)

  • \(X_2\) : Na (Natrium)

  • \(X_3\) : Mg (Magnesium)

  • \(X_4\) : Al (Alumunium)

  • \(X_5\) : Si (Silikon)

  • \(X_6\) : K (Kalium)

  • \(X_7\) : Ca (Kalsium)

  • \(X_8\) : Ba (Barium)

  • \(X_9\) : Fe (Besi)

4 SOURCE CODE

Library:

> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(readxl)
> library(DT)
> library(corrplot)
> library(factoextra)
> library(FactoMineR)

4.1 Statistika Deskriptif

Mempersiapkan data yang akan di analisis dengan fungsi import dataset dengan data yang sudah disimpan dalam Excel dengan tipe data .xlsx.

Struktur data:

> glass = read_excel("C:/Users/chint/Downloads/PRAK ANMUL/glass.xlsx")
> head(glass)
# A tibble: 6 × 9
     RI    Na    Mg    Al    Si     K    Ca    Ba    Fe
  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1  1.52  13.6  4.49  1.1   71.8  0.06  8.75     0  0   
2  1.52  13.9  3.6   1.36  72.7  0.48  7.83     0  0   
3  1.52  13.5  3.55  1.54  73.0  0.39  7.78     0  0   
4  1.52  13.2  3.69  1.29  72.6  0.57  8.22     0  0   
5  1.52  13.3  3.62  1.24  73.1  0.55  8.07     0  0   
6  1.52  12.8  3.61  1.62  73.0  0.64  8.07     0  0.26
> str(glass)
tibble [214 × 9] (S3: tbl_df/tbl/data.frame)
 $ RI: num [1:214] 1.52 1.52 1.52 1.52 1.52 ...
 $ Na: num [1:214] 13.6 13.9 13.5 13.2 13.3 ...
 $ Mg: num [1:214] 4.49 3.6 3.55 3.69 3.62 3.61 3.6 3.61 3.58 3.6 ...
 $ Al: num [1:214] 1.1 1.36 1.54 1.29 1.24 1.62 1.14 1.05 1.37 1.36 ...
 $ Si: num [1:214] 71.8 72.7 73 72.6 73.1 ...
 $ K : num [1:214] 0.06 0.48 0.39 0.57 0.55 0.64 0.58 0.57 0.56 0.57 ...
 $ Ca: num [1:214] 8.75 7.83 7.78 8.22 8.07 8.07 8.17 8.24 8.3 8.4 ...
 $ Ba: num [1:214] 0 0 0 0 0 0 0 0 0 0 ...
 $ Fe: num [1:214] 0 0 0 0 0 0.26 0 0 0 0.11 ...

Statistika deskriptif:

> summary(glass)

Struktur data setelah standarisasi:

> glass1 = read_excel("C:/Users/chint/Downloads/PRAK ANMUL/glass_1.xlsx")
> head(glass1)
# A tibble: 6 × 9
     RI     Na    Mg     Al      Si       K     Ca    Ba    Fe
  <dbl>  <dbl> <dbl>  <dbl>   <dbl>   <dbl>  <dbl> <dbl> <dbl>
1  1.52  0.284 1.25  -0.691 -1.12   -0.670  -0.145 -6.29  0   
2  1.52  0.590 0.635 -0.170  0.102  -0.0262 -0.792 -6.29  0   
3  1.52  0.150 0.600  0.190  0.438  -0.164  -0.827 -6.29  0   
4  1.52 -0.242 0.697 -0.310 -0.0528  0.112  -0.518 -6.29  0   
5  1.52 -0.169 0.649 -0.410  0.554   0.0812 -0.623 -6.29  0   
6  1.52 -0.757 0.642  0.351  0.412   0.219  -0.623 -6.29  0.26
> str(glass1)
tibble [214 × 9] (S3: tbl_df/tbl/data.frame)
 $ RI: num [1:214] 1.52 1.52 1.52 1.52 1.52 ...
 $ Na: num [1:214] 0.284 0.59 0.15 -0.242 -0.169 ...
 $ Mg: num [1:214] 1.252 0.635 0.6 0.697 0.649 ...
 $ Al: num [1:214] -0.691 -0.17 0.19 -0.31 -0.41 ...
 $ Si: num [1:214] -1.1244 0.1021 0.4378 -0.0528 0.554 ...
 $ K : num [1:214] -0.6701 -0.0262 -0.1641 0.1118 0.0812 ...
 $ Ca: num [1:214] -0.145 -0.792 -0.827 -0.518 -0.623 ...
 $ Ba: num [1:214] -6.29 -6.29 -6.29 -6.29 -6.29 ...
 $ Fe: num [1:214] 0 0 0 0 0 0.26 0 0 0 0.11 ...

Statistika deskriptif:

> summary(glass1)

Fungsi read_excel() merupakan fungsi membaca file Excel dengan format .xlsx ke dalam RStudio sebagai suatu data frame.

Fungsi head() merupakan fungsi melihat 6 baris pertama dari data frame atau data untuk memahami strukturnya.

Fungsi str() merupakan fungsi yang memberikan informasi mengenai struktur objek. Struktur data sebelum standarisasi maupun sesudah standarisasi menunjukkan bahwa data glass maupun glass1 merupakan data frame dengan 214 observasi dan 9 variabe dengan tipe data numerik.

Fungsi sumarry() merupakan fungsi yang memberikan ringkasan statistik deskriptif dari objek untuk memberikan informasi tentang distribusi dan karakteristik data. Jika setiap variabel memiliki rentang nilai yang sangat jauh sehingga perlu dilakukan standarisasi.

4.2 Eksplorasi Korelasi

> kor = cor(glass1)
> kor

Fungsi cor() merupakan fungsi yang menghitung korelasi antara variabel numerik.

> corrplot(kor, method="number")

Fungsi corrplot() merupakan fungsi yang membuat visualisasi korelasi antara variabel berupa plot.

4.3 Menampilkan Kumulatif Nilai Eigen dan Vektor Eigen

4.3.1 Dengan Matriks Kovarians

4.3.1.1 Dekomposisi Eigen

> sc = scale(glass1)
> sc

Fungsi scale() merupakan fungsi untuk penskalaan pada data.

> s = cov(sc)
> s

Fungsi cov() merupakan fungsi yang menghitung matriks kovarian dari data dimana data sudah dilakukan penskalaan.

> s_eig = eigen(s)
> s_eig

Fungsi eigen() merupakan fungsi yang menghitung nilai dan vektor eigen dari matriks kovarian.

4.3.1.2 Menggambarkan Scree Plot Berdasarkan Nilai Eigen

> plot(s_eig$values, xlab = "Eigenvalue Number", ylab = "Eigenvalue Size",
+      main = "Scree Plot") +
+   axis(2) +
+   axis(1, at = seq(1,9)) +
+   lines(s_eig$values) +
+   abline(h = 1, lty = 2, col = "red")

Fungsi plot() merupakan fungsi membuat plot atau lebih tepatnya Scree Plot yang menunjukkan nilai eigen dari komponen-komponen utama dalam urutan penurunan, dengan menambahkan nilai y=1 sehingga dapat menentukan titik di mana nilai eigen mulai menurun secara signifikan.

4.3.1.3 Nilai Kumulatif Eigen

> for (eg in s_eig$values){
+   print(eg / sum(s_eig$values))
+ }

Fungsi loop for merupakan fungsi iterasi melalui setiap nilai eigen dari matriks kovarian dimana setiap nilai eigen dibagi dengan jumlah semua nilai eigen.

4.3.1.4 Persamaan PC

> s_eig$vectors[,1:4]

Mengakses matriks dari vektor eigen pada seluruh baris dengan kolom 1 hingga 4.

4.3.2 Dengan Matriks Korelasi

4.3.2.1 Dekomposisi Eigen

> kor_eig = eigen(kor)
> kor_eig

Fungsi eigen() merupakan fungsi yang menghitung nilai dan vektor eigen dari matriks korelasi.

4.3.2.2 Scree Plot

> plot(kor_eig$values, xlab = "Eigenvalue Number", ylab = "Eigenvalue Size",
+      main = "Scree Plot") +
+   axis(2) +
+   axis(1, at = seq(1,9)) +
+   lines(kor_eig$values) +
+   abline(h = 1, lty = 2, col = "red")

Fungsi plot() merupakan fungsi membuat plot atau lebih tepatnya Scree Plot yang menunjukkan nilai eigen dari komponen-komponen utama dalam urutan penurunan, dengan menambahkan nilai y=1 sehingga dapat menentukan titik di mana nilai eigen mulai menurun secara signifikan.

4.3.2.3 Nilai Kumulatif Eigen

> for (eg in kor_eig$values){
+   print(eg / sum(kor_eig$values))
+ }

Fungsi loop for merupakan fungsi iterasi melalui setiap nilai eigen dari matriks korelasi dimana setiap nilai eigen dibagi dengan jumlah semua nilai eigen.

4.3.2.4 Persamaan PCA

> kor_eig$vectors[,1:4]

Mengakses matriks dari vektor eigen pada seluruh baris dengan kolom 1 hingga 4.

4.4 Fungsi PCA

4.4.1 prcomp

> PCA1 = prcomp(x = glass1,scale = T,center = T)
> PCA1

Fungsi prcomp() merupakan fungsi untuk melakukan Analisis Komposisi Utama (PCA).

> print(PCA1$rotation[,1:4],digits = 4)

Mencetak matriks rotasi dari hasil PCA pertama hingga empat Komponen Utama yang berkontribusi.

> summary(PCA1)

Fungsi summary() merupakan fungsi yang meringkas informasi penting dari hasil analisis.

4.4.2 princomp

4.4.2.1 Fungsi PCA

> pca = princomp(x = glass1, cor = T)
> pca

Fungsi printcomp() merupakan fungsi untuk melakukan Analisis Komposisi Utama (PCA).

> summary(pca)

Fungsi summary() merupakan fungsi yang meringkas informasi penting dari hasil analisis.

4.4.2.2 Memperoleh Nilai Loaidngs

> print(pca$loadings, digits = 4,cutoff = 0.1)

Mencetak matriks beban dari hasil PCA dengan batasan 0.1 yang menunjukkan hubungan antara variabel asli dan Komponen Utama.

> plot(pca)

Fungsi plot() merupakan fungsi yang menunjukkan plot sesuai dengan pca.

4.4.2.3 Memperoleh Nilai Kontribusi

> pca.var = get_pca_var(pca)
> pca.var$contrib

Fungsi get_pca_var() merupakan fungsi yang menunjukkan kontribusi variabel terhadap setiap Komponen Utama dalam PCA.

4.4.2.4 PCA

> pca1 <- PCA(glass1,scale.unit = T, graph = FALSE)
> pca1$eig

Fungsi PCA() merupakan fungsi yang melakukan Analisis Komponen Utama (PCA).

4.4.2.5 Menggambarkan Plot Kontribusi Variabel

> fviz_pca_var(pca1, col.var = "contrib",gradient.cols = c("#00AFBB", "#E7B800","#FC4E07"),axes = c(1, 2),repel=T)

Fungsi fviz_pca_var() nerupakan fungsi yang membuat visualisasi kontribusi variabel terhadap Komponen Utama.

4.4.2.6 Menggambarkan Plot Individu

> fviz_pca_ind(pca1,title="Provinces - PCA", axes = c(1,2))

Fungai fviz_pca_ind() merupakan fungsi yang membuat visualisasi dari individu atau kasus tersebar dalam ruang Komponen Utama.

4.4.2.7 Menggambarkan Biplot

> fviz_pca_biplot(pca1, axes = c(1,2), repel = TRUE, col.var = "#2E9FDF",col.ind = "#696969" )

Fungsi fviz_pca_biplot() merupakan fungsi yang membuat biplot yang menunjukkan hubungan antara variabel dan individu dalam analisis PCA

5 HASIL DAN PEMBAHASAN

5.1 Statistika Deskriptif

       RI              Na              Mg              Al       
 Min.   :1.511   Min.   :10.73   Min.   :0.000   Min.   :0.290  
 1st Qu.:1.517   1st Qu.:12.91   1st Qu.:2.115   1st Qu.:1.190  
 Median :1.518   Median :13.30   Median :3.480   Median :1.360  
 Mean   :1.518   Mean   :13.41   Mean   :2.685   Mean   :1.445  
 3rd Qu.:1.519   3rd Qu.:13.82   3rd Qu.:3.600   3rd Qu.:1.630  
 Max.   :1.534   Max.   :17.38   Max.   :4.490   Max.   :3.500  
       Si              K                Ca               Ba       
 Min.   :69.81   Min.   :0.0000   Min.   : 5.430   Min.   :0.000  
 1st Qu.:72.28   1st Qu.:0.1225   1st Qu.: 8.240   1st Qu.:0.000  
 Median :72.79   Median :0.5550   Median : 8.600   Median :0.000  
 Mean   :72.65   Mean   :0.4971   Mean   : 8.957   Mean   :0.175  
 3rd Qu.:73.09   3rd Qu.:0.6100   3rd Qu.: 9.172   3rd Qu.:0.000  
 Max.   :75.41   Max.   :6.2100   Max.   :16.190   Max.   :3.150  
       Fe         
 Min.   :0.00000  
 1st Qu.:0.00000  
 Median :0.00000  
 Mean   :0.05701  
 3rd Qu.:0.10000  
 Max.   :0.51000  

Melalui ouput yang diperoleh, terdapat ringkasan statistik dari data berupa nilai Min, \(Q_1\) , Median, Mean, \(Q_3\) , dan Max. Berdasarkan output, pada setiap variabel memiliki rentang nilai yang sangat jauh sehingga perlu dilakukan standarisasi.

       RI              Na                Mg                Al         
 Min.   :1.511   Min.   :-3.2793   Min.   :-1.8611   Min.   :-2.3132  
 1st Qu.:1.517   1st Qu.:-0.6127   1st Qu.:-0.3948   1st Qu.:-0.5106  
 Median :1.518   Median :-0.1321   Median : 0.5515   Median :-0.1701  
 Mean   :1.518   Mean   : 0.0000   Mean   : 0.0000   Mean   : 0.0000  
 3rd Qu.:1.519   3rd Qu.: 0.5108   3rd Qu.: 0.6347   3rd Qu.: 0.3707  
 Max.   :1.534   Max.   : 4.8642   Max.   : 1.2517   Max.   : 4.1162  
       Si                K                  Ca                Ba        
 Min.   :-3.6679   Min.   :-0.76213   Min.   :-2.4783   Min.   :-6.294  
 1st Qu.:-0.4789   1st Qu.:-0.57430   1st Qu.:-0.5038   1st Qu.:-6.294  
 Median : 0.1795   Median : 0.08884   Median :-0.2508   Median :-6.294  
 Mean   : 0.0000   Mean   : 0.00000   Mean   : 0.0000   Mean   :-6.171  
 3rd Qu.: 0.5636   3rd Qu.: 0.17318   3rd Qu.: 0.1515   3rd Qu.:-6.294  
 Max.   : 3.5622   Max.   : 8.75961   Max.   : 5.0824   Max.   :-4.080  
       Fe         
 Min.   :0.00000  
 1st Qu.:0.00000  
 Median :0.00000  
 Mean   :0.05701  
 3rd Qu.:0.10000  
 Max.   :0.51000  

Output ringkasan statistik yang diperoleh setelah dilakukan standarisasi data.

5.2 Eksplorasi Korelasi

              RI          Na           Mg          Al          Si            K
RI  1.0000000000 -0.19188538 -0.122274039 -0.40732603 -0.54205220 -0.289832711
Na -0.1918853790  1.00000000 -0.273731961  0.15679367 -0.06980881 -0.266086504
Mg -0.1222740393 -0.27373196  1.000000000 -0.48179851 -0.16592672  0.005395667
Al -0.4073260341  0.15679367 -0.481798509  1.00000000 -0.00552372  0.325958446
Si -0.5420521997 -0.06980881 -0.165926723 -0.00552372  1.00000000 -0.193330854
K  -0.2898327111 -0.26608650  0.005395667  0.32595845 -0.19333085  1.000000000
Ca  0.8104026963 -0.27544249 -0.443750026 -0.25959201 -0.20873215 -0.317836155
Ba -0.0003860189  0.32660288 -0.492262118  0.47940390 -0.10215131 -0.042618059
Fe  0.1430096093 -0.24134641  0.083059529 -0.07440215 -0.09420073 -0.007719049
           Ca            Ba           Fe
RI  0.8104027 -0.0003860189  0.143009609
Na -0.2754425  0.3266028795 -0.241346411
Mg -0.4437500 -0.4922621178  0.083059529
Al -0.2595920  0.4794039017 -0.074402151
Si -0.2087322 -0.1021513105 -0.094200731
K  -0.3178362 -0.0426180594 -0.007719049
Ca  1.0000000 -0.1128409671  0.124968219
Ba -0.1128410  1.0000000000 -0.058691755
Fe  0.1249682 -0.0586917554  1.000000000

Melalui output yang diperoleh, didapatkan informasi korelasi antar variabel dimana korelasi yang tinggi pada RI dengan Ca sehingga perlu menghilangkan korelasi yang tinggi dengan melakukan reduksi pada 9 variabel menggunakan PCA.

5.3 Nilai Eigen, Vektor Eigen, Scree Plot dan Persamaan PC

5.3.1 Dengan Matriks Kovarians

eigen() decomposition
$values
[1] 2.511163726 2.050072185 1.404843994 1.157862446 0.914002247 0.527635193
[7] 0.368958443 0.063852948 0.001608818

$vectors
            [,1]        [,2]          [,3]        [,4]         [,5]        [,6]
 [1,]  0.5451766 -0.28568318 -0.0869108293  0.14738099  0.073542700 -0.11528772
 [2,] -0.2581256 -0.27035007  0.3849196197  0.49124204 -0.153683304  0.55811757
 [3,]  0.1108810  0.59355826 -0.0084179590  0.37878577 -0.123509124 -0.30818598
 [4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592 -0.014108879  0.01885731
 [5,] -0.2288364  0.15509891  0.4587088382 -0.65253771 -0.008500117 -0.08609797
 [6,] -0.2193440  0.15397013 -0.6625741197 -0.03853544  0.307039842  0.24363237
 [7,]  0.4923061 -0.34537980  0.0009847321 -0.27644322  0.188187742  0.14866937
 [8,] -0.2503751 -0.48470218 -0.0740547309  0.13317545 -0.251334261 -0.65721884
 [9,]  0.1858415  0.06203879 -0.2844505524 -0.23049202 -0.873264047  0.24304431
             [,7]        [,8]        [,9]
 [1,]  0.08186724  0.75221590 -0.02573194
 [2,]  0.14858006  0.12769315  0.31193718
 [3,] -0.20604537  0.07689061  0.57727335
 [4,] -0.69923557  0.27444105  0.19222686
 [5,]  0.21606658  0.37992298  0.29807321
 [6,]  0.50412141  0.10981168  0.26050863
 [7,] -0.09913463 -0.39870468  0.57932321
 [8,]  0.35178255 -0.14493235  0.19822820
 [9,]  0.07372136  0.01627141  0.01466944

numeric(0)

Melalui ouput yang diperoleh, didapatkan informasi sebanyak 4 PC yang dapat dimanfaatkan.

            [,1]        [,2]          [,3]        [,4]
 [1,]  0.5451766 -0.28568318 -0.0869108293  0.14738099
 [2,] -0.2581256 -0.27035007  0.3849196197  0.49124204
 [3,]  0.1108810  0.59355826 -0.0084179590  0.37878577
 [4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592
 [5,] -0.2288364  0.15509891  0.4587088382 -0.65253771
 [6,] -0.2193440  0.15397013 -0.6625741197 -0.03853544
 [7,]  0.4923061 -0.34537980  0.0009847321 -0.27644322
 [8,] -0.2503751 -0.48470218 -0.0740547309  0.13317545
 [9,]  0.1858415  0.06203879 -0.2844505524 -0.23049202

Melalui output yang diperoleh, didapatkan persamaan PC:

\(PC_1 = 0.5451766X_1 - 0.2581256X_2 + 0.1108810X_3 - 0.4287086X_4\\ - 0.2288364X_5 - 0.2193440X_6 + 0.4923061X_7 - 0.2503751X_8\\ + 0.1858415X_9\)

\(PC_2 = -0.28568318X_1 - 0.27035007X_2 + 0.59355826X_3 - 0.29521154X_4\\ + 0.15509891X_5 + 0.15397013X_6 - 0.34537980X_7 - 0.48470218X_8\\ + 0.06203879X_9\)

\(PC_3 = -0.0869108293X_1 + 0.3849196197X_2 - 0.0084179590X_3\\ - 0.3292371183X_4 + 0.4587088382X_5 - 0.6625741197X_6\\ + 0.0009847321X_7 - 0.0740547309X_8 - 0.2844505524X_9\)

\(PC_4 = 0.14738099X_1 + 0.49124204X_2 + 0.37878577X_3 - 0.13750592X_4\\ - 0.65253771X_5 - 0.03853544X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\)

5.3.2 Dengan Matriks Korelasi

eigen() decomposition
$values
[1] 2.511163726 2.050072185 1.404843994 1.157862446 0.914002247 0.527635193
[7] 0.368958443 0.063852948 0.001608818

$vectors
            [,1]        [,2]          [,3]        [,4]         [,5]        [,6]
 [1,]  0.5451766 -0.28568318 -0.0869108293  0.14738099  0.073542700 -0.11528772
 [2,] -0.2581256 -0.27035007  0.3849196197  0.49124204 -0.153683304  0.55811757
 [3,]  0.1108810  0.59355826 -0.0084179590  0.37878577 -0.123509124 -0.30818598
 [4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592 -0.014108879  0.01885731
 [5,] -0.2288364  0.15509891  0.4587088382 -0.65253771 -0.008500117 -0.08609797
 [6,] -0.2193440  0.15397013 -0.6625741197 -0.03853544  0.307039842  0.24363237
 [7,]  0.4923061 -0.34537980  0.0009847321 -0.27644322  0.188187742  0.14866937
 [8,] -0.2503751 -0.48470218 -0.0740547309  0.13317545 -0.251334261 -0.65721884
 [9,]  0.1858415  0.06203879 -0.2844505524 -0.23049202 -0.873264047  0.24304431
             [,7]        [,8]        [,9]
 [1,]  0.08186724  0.75221590 -0.02573194
 [2,]  0.14858006  0.12769315  0.31193718
 [3,] -0.20604537  0.07689061  0.57727335
 [4,] -0.69923557  0.27444105  0.19222686
 [5,]  0.21606658  0.37992298  0.29807321
 [6,]  0.50412141  0.10981168  0.26050863
 [7,] -0.09913463 -0.39870468  0.57932321
 [8,]  0.35178255 -0.14493235  0.19822820
 [9,]  0.07372136  0.01627141  0.01466944

numeric(0)

Melalui ouput yang diperoleh, didapatkan informasi sebanyak 4 PC yang dapat dimanfaatkan.

            [,1]        [,2]          [,3]        [,4]
 [1,]  0.5451766 -0.28568318 -0.0869108293  0.14738099
 [2,] -0.2581256 -0.27035007  0.3849196197  0.49124204
 [3,]  0.1108810  0.59355826 -0.0084179590  0.37878577
 [4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592
 [5,] -0.2288364  0.15509891  0.4587088382 -0.65253771
 [6,] -0.2193440  0.15397013 -0.6625741197 -0.03853544
 [7,]  0.4923061 -0.34537980  0.0009847321 -0.27644322
 [8,] -0.2503751 -0.48470218 -0.0740547309  0.13317545
 [9,]  0.1858415  0.06203879 -0.2844505524 -0.23049202

Melalui output yang diperoleh, didapatkan persamaan PC:

\(PC_1 = 0.5451766X_1 - 0.2581256X_2 + 0.1108810X_3 - 0.4287086X_4\\ - 0.2288364X_5 - 0.2193440X_6 + 0.4923061X_7 - 0.2503751X_8\\ + 0.1858415X_9\)

\(PC_2 = -0.28568318X_1 - 0.27035007X_2 + 0.59355826X_3 - 0.29521154X_4\\ + 0.15509891X_5 + 0.15397013X_6 - 0.34537980X_7 - 0.48470218X_8\\ + 0.06203879X_9\)

\(PC_3 = -0.0869108293X_1 + 0.3849196197X_2 - 0.0084179590X_3\\ - 0.3292371183X_4 + 0.4587088382X_5 - 0.6625741197X_6\\ + 0.0009847321X_7 - 0.0740547309X_8 - 0.2844505524X_9\)

\(PC_4 = 0.14738099X_1 + 0.49124204X_2 + 0.37878577X_3 - 0.13750592X_4\\ - 0.65253771X_5 - 0.03853544X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\)

5.4 Fungsi PCA

5.4.1 prcomp

Standard deviations (1, .., p=9):
[1] 1.58466518 1.43180731 1.18526115 1.07604017 0.95603465 0.72638502 0.60741950
[8] 0.25269141 0.04011007

Rotation (n x k) = (9 x 9):
          PC1         PC2           PC3         PC4          PC5         PC6
RI -0.5451766  0.28568318  0.0869108293  0.14738099 -0.073542700  0.11528772
Na  0.2581256  0.27035007 -0.3849196197  0.49124204  0.153683304 -0.55811757
Mg -0.1108810 -0.59355826  0.0084179590  0.37878577  0.123509124  0.30818598
Al  0.4287086  0.29521154  0.3292371183 -0.13750592  0.014108879 -0.01885731
Si  0.2288364 -0.15509891 -0.4587088382 -0.65253771  0.008500117  0.08609797
K   0.2193440 -0.15397013  0.6625741197 -0.03853544 -0.307039842 -0.24363237
Ca -0.4923061  0.34537980 -0.0009847321 -0.27644322 -0.188187742 -0.14866937
Ba  0.2503751  0.48470218  0.0740547309  0.13317545  0.251334261  0.65721884
Fe -0.1858415 -0.06203879  0.2844505524 -0.23049202  0.873264047 -0.24304431
           PC7         PC8         PC9
RI -0.08186724 -0.75221590 -0.02573194
Na -0.14858006 -0.12769315  0.31193718
Mg  0.20604537 -0.07689061  0.57727335
Al  0.69923557 -0.27444105  0.19222686
Si -0.21606658 -0.37992298  0.29807321
K  -0.50412141 -0.10981168  0.26050863
Ca  0.09913463  0.39870468  0.57932321
Ba -0.35178255  0.14493235  0.19822820
Fe -0.07372136 -0.01627141  0.01466944
Importance of components:
                         PC1    PC2    PC3    PC4    PC5     PC6    PC7     PC8
Standard deviation     1.585 1.4318 1.1853 1.0760 0.9560 0.72639 0.6074 0.25269
Proportion of Variance 0.279 0.2278 0.1561 0.1286 0.1016 0.05863 0.0410 0.00709
Cumulative Proportion  0.279 0.5068 0.6629 0.7915 0.8931 0.95173 0.9927 0.99982
                           PC9
Standard deviation     0.04011
Proportion of Variance 0.00018
Cumulative Proportion  1.00000
       PC1      PC2        PC3      PC4
RI -0.5452  0.28568  0.0869108  0.14738
Na  0.2581  0.27035 -0.3849196  0.49124
Mg -0.1109 -0.59356  0.0084180  0.37879
Al  0.4287  0.29521  0.3292371 -0.13751
Si  0.2288 -0.15510 -0.4587088 -0.65254
K   0.2193 -0.15397  0.6625741 -0.03854
Ca -0.4923  0.34538 -0.0009847 -0.27644
Ba  0.2504  0.48470  0.0740547  0.13318
Fe -0.1858 -0.06204  0.2844506 -0.23049

Melalui output yang diperoleh, didapatkan informasi pada Komponen Utama 4 dapat menjelaskan 0.7915 atau 79.15% varians secara proporsi kumulatif. Dengan persamaan PC:

\(PC_1 = -0.5452X_1 + 0.2581X_2 - 0.1109X_3 + 0.4287X_4\\ + 0.2288X_5 + 0.2193X_6 - 0.4923X_7 + 2504X_8\\ - 0.1858X_9\)

\(PC_2 = 0.28568X_1 + 0.27035X_2 - 0.59356X_3 + 0.29521X_4\\ - 0.15510X_5 - 0.15397X_6 + 0.34538X_7 + 0.48470X_8\\ - 0.06204X_9\)

\(PC_3 = 0.0869108X_1 - 0.3849196X_2 + 0.0084179X_3\\ + 0.3292371X_4 - 0.4587088X_5 + 0.6625741X_6\\ - 0.0009847X_7 + 0.0740547X_8 + 0.2844506X_9\)

\(PC_4 = 0.14738X_1 + 0.49124X_2 + 0.37879X_3 - 0.13751X_4\\ - 0.65254X_5 - 0.4587088382X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\)

5.4.2 princomp

Call:
princomp(x = glass1, cor = T)

Standard deviations:
    Comp.1     Comp.2     Comp.3     Comp.4     Comp.5     Comp.6     Comp.7 
1.58466518 1.43180731 1.18526115 1.07604017 0.95603465 0.72638502 0.60741950 
    Comp.8     Comp.9 
0.25269141 0.04011007 

 9  variables and  214 observations.
Importance of components:
                          Comp.1    Comp.2    Comp.3    Comp.4    Comp.5
Standard deviation     1.5846652 1.4318073 1.1852612 1.0760402 0.9560346
Proportion of Variance 0.2790182 0.2277858 0.1560938 0.1286514 0.1015558
Cumulative Proportion  0.2790182 0.5068040 0.6628978 0.7915492 0.8931050
                           Comp.6     Comp.7      Comp.8       Comp.9
Standard deviation     0.72638502 0.60741950 0.252691408 0.0401100713
Proportion of Variance 0.05862613 0.04099538 0.007094772 0.0001787575
Cumulative Proportion  0.95173109 0.99272647 0.999821242 1.0000000000

Loadings:
   Comp.1  Comp.2  Comp.3  Comp.4  Comp.5  Comp.6  Comp.7  Comp.8  Comp.9 
RI  0.5452  0.2857          0.1474          0.1153          0.7522        
Na -0.2581  0.2704 -0.3849  0.4912 -0.1537 -0.5581  0.1486  0.1277 -0.3119
Mg  0.1109 -0.5936          0.3788 -0.1235  0.3082 -0.2060         -0.5773
Al -0.4287  0.2952  0.3292 -0.1375                 -0.6992  0.2744 -0.1922
Si -0.2288 -0.1551 -0.4587 -0.6525                  0.2161  0.3799 -0.2981
K  -0.2193 -0.1540  0.6626          0.3070 -0.2436  0.5041  0.1098 -0.2605
Ca  0.4923  0.3454         -0.2764  0.1882 -0.1487         -0.3987 -0.5793
Ba -0.2504  0.4847          0.1332 -0.2513  0.6572  0.3518 -0.1449 -0.1982
Fe  0.1858          0.2845 -0.2305 -0.8733 -0.2430                        

               Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9
SS loadings    1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
Proportion Var 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111
Cumulative Var 0.1111 0.2222 0.3333 0.4444 0.5556 0.6667 0.7778 0.8889 1.0000

       Dim.1      Dim.2        Dim.3     Dim.4        Dim.5       Dim.6
RI 29.721755  8.1614878 7.553492e-01  2.172116  0.540852877  1.32912586
Na  6.662882  7.3089158 1.481631e+01 24.131874  2.361855807 31.14952270
Mg  1.229459 35.2311409 7.086203e-03 14.347866  1.525450380  9.49785986
Al 18.379109  8.7149854 1.083971e+01  1.890788  0.019906047  0.03555983
Si  5.236608  2.4055673 2.104138e+01 42.580546  0.007225198  0.74128602
K   4.811181  2.3706801 4.390045e+01  0.148498  9.427346429  5.93567314
Ca 24.236528 11.9287208 9.696972e-05  7.642086  3.541462638  2.21025827
Ba  6.268770 23.4936208 5.484103e-01  1.773570  6.316891091 43.19366082
Fe  3.453708  0.3848812 8.091212e+00  5.312657 76.259009534  5.90705350
        Dim.7       Dim.8       Dim.9
RI  0.6702245 56.58287600  0.06621329
Na  2.2076033  1.63055415  9.73048063
Mg  4.2454696  0.59121658 33.32445189
Al 48.8930386  7.53178878  3.69511646
Si  4.6684767 14.43414740  8.88476399
K  25.4138397  1.20586056  6.78647457
Ca  0.9827675 15.89654216 33.56153794
Ba 12.3750961  2.10053849  3.92944198
Fe  0.5434839  0.02647588  0.02151925
        eigenvalue percentage of variance cumulative percentage of variance
comp 1 2.511163726            27.90181918                          27.90182
comp 2 2.050072185            22.77857983                          50.68040
comp 3 1.404843994            15.60937771                          66.28978
comp 4 1.157862446            12.86513829                          79.15492
comp 5 0.914002247            10.15558052                          89.31050
comp 6 0.527635193             5.86261325                          95.17311
comp 7 0.368958443             4.09953826                          99.27265
comp 8 0.063852948             0.70947720                          99.98212
comp 9 0.001608818             0.01787575                         100.00000

Melalui output yang diperoleh, didapatkan informasi pada komponen utama 1, 2, 3 dan 4 memiliki nilai eigen lebih dari 1 dimana dapat menjelaskan 79% varians dari persentase kumulatif varians, sehingga dapat menggunakan 4 komponen utama pertama untuk membentuk persamaan PC. Dengan output dari plot kontribusi variabel, RI dengan Ca memiliki kontribusi paling rendah terhadap Komponen Utama sedangkan Si, K, dan Mg memiliki kontribusi paling tinggi terhadap Komponen Utama.

6 KESIMPULAN DAN SARAN

6.1 Kesimpulan

Persamaan Komponen Utama:

\[PC_1 = 0.5451766X_1 - 0.2581256X_2 + 0.1108810X_3 - 0.4287086X_4\\ - 0.2288364X_5 - 0.2193440X_6 + 0.4923061X_7 - 0.2503751X_8\\ + 0.1858415X_9\]

\[PC_2 = -0.28568318X_1 - 0.27035007X_2 + 0.59355826X_3 - 0.29521154X_4\\ + 0.15509891X_5 + 0.15397013X_6 - 0.34537980X_7 - 0.48470218X_8\\ + 0.06203879X_9\]

\[PC_3 = -0.0869108293X_1 + 0.3849196197X_2 - 0.0084179590X_3\\ - 0.3292371183X_4 + 0.4587088382X_5 - 0.6625741197X_6\\ + 0.0009847321X_7 - 0.0740547309X_8 - 0.2844505524X_9\]

\[PC_4 = 0.14738099X_1 + 0.49124204X_2 + 0.37878577X_3 - 0.13750592X_4\\ - 0.65253771X_5 - 0.03853544X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\]

Diperoleh \(PC_1\) meningkat seiring dengan meningkatnya RI dan Ca dengan menurunnya Al, \(PC_2\) meningkat seiring dengan meningkatnya Mg dengan menurunnya Ca dan Ba, \(PC_3\) meningkat seiring dengan meningkatnya Na dengan menurunnya Si dan K, dan \(PC_4\) meningkat seiring dengan meningkatnya Na dan Mg dengan menurunnya Si.

Jadi, hasil Analisis Komponen Utama (PCA) menunjukkan bahwa terdapat 4 Komponen Utama (\(PC_1\), \(PC_2\), \(PC_3\), dan \(PC_4\)) yang menjelaskan sebagian besar variasi dalam data komposisi pembuatan kaca. Setiap Komponen Utama memiliki koefisien yang mengidikasikan pengaruh variabel asli (RI, Na, Mg, Al, Si, K, Ca, Ba, dan Fe) terhadap komponen tersebut.

6.2 Saran

  1. Optimasi Formulasi Kaca: Memperhatikan koefisien dari setiap variabel pada komponen utama, pabrikan kaca dapat mempertimbangkan peningkatan proporsi dari bahan seperti RI dan Ca, sambil mengurangi proporsi Al untuk merancang formulasi kaca yang optimal.

  2. Peningkatan Kualitas Produk Kaca: Produsen kaca dapat mempertimbangkan untuk meningkatkan proporsi Mg dalam komposisi kaca untuk meningkatkan kualitas fisik dan optik dari produk mereka. Penurunan proporsi Ca dan Ba juga dapat berkontribusi positif.

  3. Efisiensi Produksi: Dengan memahami pengaruh variabel pada komponen utama, produsen dapat meminimalkan percobaan dan iterasi dalam proses produksi kaca. Hal ini memungkinkan untuk memilih proporsi komponen dengan lebih terarah.

  4. Pengurangan Biaya Produksi: Mempertimbangkan koefisien dari setiap variabel pada komponen utama, pabrikan kaca dapat mencari cara untuk mengurangi biaya produksi dengan mengoptimalkan penggunaan bahan baku tertentu tanpa mengorbankan kualitas produk akhir.

Dengan memperhatikan pengaruh variabel pada Komponen Utama, pabrikan kaca dapat meningkatkan efisiensi, kualitas, dan keuntungan produksi mereka.

7 DAFTAR PUSTASKA

Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis (6th Edition). Pearson Education.

Jolliffe, I.T. (2002). Principal Component Analysis (2nd Edition). Springer.

https://www.kaggle.com/datasets/uciml/glass (diakses pada 20 Oktober 2023)