Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("factoextra")
> # install.packages("FactoMineR")1 PENDAHULUAN
1.1 Latar Belakang
Pembuatan kaca adalah proses yang sangat penting dalam berbagai aplikasi industri, mulai dari pembuatan kaca jendela hingga kaca optik yang sangat presisi. Untuk mencapai sifat-sifat yang diinginkan dalam kaca, komposisi bahan baku yang digunakan sangat penting. Pembuatan kaca merupakan proses yang kompleks yang melibatkan campuran berbagai bahan kimia dasar seperti silikon dioksida (\(SiO_2\)), natrium oksida (\(Na_2O\)), kalsium oksida (\(CaO\)), dan komponen lainnya. Komposisi ini melibatkan sejumlah variabel kimia yang dapat memengaruhi sifat fisik dan optik dari kaca yang dihasilkan. Oleh karena itu, pemahaman yang mendalam tentang pengaruh masing-masing variabel komposisi terhadap kualitas dan karakteristik kaca sangat penting.
Salah satu metode analisis statistik yang dapat digunakan untuk mendekati masalah ini adalah Analisis Komponen Utama (PCA). PCA adalah teknik statistik multivariabel yang digunakan untuk mereduksi dimensi data, mengidentifikasi pola tersembunyi, dan menjelaskan sebagian besar variasi dalam dataset. Dalam konteks komposisi pembuatan kaca, PCA dapat digunakan untuk mengidentifikasi Komponen Utama atau faktor yang paling berpengaruh terhadap kualitas dan karakteristik kaca.
Variabel-variabel utama yang akan dianalisis dalam studi ini adalah sebagai berikut:
RI (Indeks Bias Refraktif): Indeks bias refraktif adalah parameter yang mengukur sejauh mana cahaya dibiaskan saat melewati material. Indeks ini berpengaruh pada sifat optik kaca, seperti kejernihan dan lalu lintas cahaya.
Na (Natrium): Kandungan natrium dalam kaca dapat mempengaruhi konduktivitas termal dan kontraksi linier kaca. Natrium oksida dapat berperan dalam mengontrol viskositas kaca selama proses pembuatan.
Mg (Magnesium): Magnesium dapat memengaruhi ketahanan terhadap pemanasan dan pemadatan kaca. Kandungan magnesium dapat memengaruhi sifat fisik dan termal kaca.
Al (Aluminium): Aluminium dapat mempengaruhi kekuatan dan ketahanan terhadap korosi kaca. Kandungan aluminium dalam kaca juga dapat memengaruhi titik lebur dan sifat mekanis kaca.
Si (Silikon): Silikon adalah komponen utama dalam kaca dan memiliki pengaruh yang signifikan terhadap berbagai sifat kaca, termasuk titik lebur, indeks bias refraktif, dan ketahanan terhadap perubahan suhu.
K (Kalium): Kandungan kalium dalam kaca dapat memengaruhi viskositas, warna, dan kejernihan kaca.
Ca (Kalsium): Kalsium dapat memengaruhi stabilitas kimia dan sifat mekanis kaca. Kalsium sering digunakan sebagai pengganti natrium untuk mengubah karakteristik kaca.
Ba (Barium): Barium dapat digunakan dalam kaca untuk mengubah sifat transmisi sinar-X. Kandungan barium dapat memengaruhi sifat radiasi kaca.
Fe (Besi): Kandungan besi dalam kaca dapat mempengaruhi warna kaca, dan dalam beberapa kasus, besi dapat menjadi kontaminan yang tidak diinginkan.
Analisis Komponen Utama (PCA) adalah metode statistik multivariat yang dapat mengidentifikasi hubungan (linier atau non-linier) antara variabel dan mengidentifikasi Komponen Utama yang dapat digunakan untuk mengoptimalkan komposisi bahan baku dalam pembuatan kaca dengan mengurangi dimensi data tanpa kehilangan informasi penting. Hasil analisis ini dapat memberikan wawasan berharga kepada produsen kaca untuk meningkatkan kualitas, efisiensi, dan keberlanjutan dalam proses produksi kaca. Dengan pemahaman yang lebih mendalam tentang pengaruh variabel komposisi, dapat mengoptimalkan formulasi dan sifat-sifat kaca yang dihasilkan sehingga perusahaan dapat menghasilkan produk kaca yang lebih sesuai dengan kebutuhan pelanggan dan pasar.
1.2 Rumusan Masalah
Bagaimana hubungan antara variabel-variabel utama (RI, Na, Mg, Al, Si, K, Ca, Ba, dan Fe) mempengaruhi karakteristik pembuatan kaca?
1.3 Tujuan
Mengurangi dimensi data tanpa kehilangan informasi penting sehingga memungkinkan pemahaman yang lebih mendalam tentang hubungan antarvariabel dalam komposisi kaca.
1.4 Manfaat Penelitian
Analisis Komponen Utama (PCA) terhadap komposisi pembuatan kaca memiliki manfaat sebagai berikut:
Optimasi Formulasi Kaca: Memungkinkan untuk merancang formulasi kaca yang optimal dengan mempertimbangkan interaksi antarvariabel yang paling signifikan.
Peningkatan Kualitas Produk Kaca: Memungkinkan produsen kaca untuk meningkatkan kualitas fisik dan optik dari produk mereka dengan memodifikasi komposisi kaca sesuai dengan hasil analisis PCA.
Efisiensi Produksi: Meminimalkan percobaan dan iterasi dalam proses produksi kaca dengan memberikan panduan yang lebih terarah dalam memilih proporsi komponen.
Pengurangan Biaya Produksi: Memungkinkan untuk mengurangi biaya produksi dengan meminimalkan penggunaan bahan baku tertentu tanpa mengorbankan kualitas produk akhir.
2 TINJAUAN PUSTAKA
2.1 Analisis Komponen Utama
Analisis Komponen Utama (PCA) adalah teknik statistik yang digunakan untuk mengurangi dimensi dari dataset multivariat. Teknik ini ditemukan oleh Karl Pearson pada tahun 1901 dan dikembangkan lebih lanjut oleh Harold Hotelling pada tahun 1930-an. PCA memiliki banyak aplikasi di berbagai bidang termasuk statistik, ilmu komputer, ilmu data, dan bidang lainnya. Analisis Komponen Utama dilakukan untuk mengurangi dimensi dari data multivariat dan mempertahankan sebanyak mungkin informasi yang terkandung dalam data asli (Johnson, 2007).
2.2 Model
Variabel-variabel X disusun dalam vektor
\[ \mathbf{X} = \matrix{[X_1&X_2&...&X_p]} \]
memiliki matriks Var-Cov \(\Sigma\) dengan nilai eigen
\[\lambda_1\geq\lambda_2\geq...\geq\lambda_p\]
Diperoleh kombinasi linier berikut:
\[ Y_1=\mathbf{a}_1'\mathbf{X}=a_{11}X_1+a_{12}X_2+...+a_{1p}X_p\\ Y_2=\mathbf{a}_2'\mathbf{X}=a_{21}X_1+a_{22}X_2+...+a_{2p}X_p\\ \vdots\\ Y_p=\mathbf{a}_p'\mathbf{X}=a_{p1}X_1+a_{p2}X_2+...+a_{pp}X_p \]
dimana
\[ Var(Y_p)=\mathbf{a}_i'\mathbf{\Sigma}\mathbf{a}_i\\ Cov(Y_p,Y_k)=\mathbf{a}_i'\mathbf{\Sigma}\mathbf{a}_k \]
2.3 Pembentukan Komponen Utama
Komponen Utama adalah kombinasi linier dari \(Y_1, Y_2, ..., Y_p\) yang tidak saling berkorelasi dimana varians dari masing-masing kombinasi linier sebesar mungkin.
- Komponen Utama ke- 1
\[Y_1 = \mathbf{a}_1'\mathbf{X}\]
akan memamksimumkan \(Var(\mathbf{a}_1'\mathbf{X})\), dengan syarat \(\mathbf{a}_1'a_1=1\).
- Komponen Utama ke- 2
\[Y_2 = \mathbf{a}_2'\mathbf{X}\]
akan memamksimumkan \(Var(\mathbf{a}_2'\mathbf{X})\), dengan syarat \(\mathbf{a}_2'a_2=1\), dan \(Cov(\mathbf{a}_1\mathbf{X},\mathbf{a}_2'\mathbf{X})=0\).
- Komponen Utama ke- i
\[Y_i = \mathbf{a}_i'\mathbf{X}\]
akan memamksimumkan \(Var(\mathbf{a}_i'\mathbf{X})\), dengan syarat \(\mathbf{a}_i'a_i=1\), dan \(Cov(\mathbf{a}_k'\mathbf{X},\mathbf{a}_i'\mathbf{X})=0\) untuk semua \(k<i\).
Agar \[\mathbf{a}_1'\mathbf{a}_1=1\] maka diperlukan normalisasi dengan matriks vektor normal, sehingga:
\[\mathbf{e}_i = \frac{1}{|\mathbf{u}_i\|}\mathbf{u}_i\]
Dengan matriks vektor normal, maka terbentuk:
Misalkan variabe-variabel X disusun dalam vektor
\[ \mathbf{X} = \matrix{[X_1&X_2&...&X_p]} \]
memiliki matriks Var-Cov \(\Sigma\) dengan pasangan nilai eigen dan vektor eigen
\[(\lambda_1,\mathbf{e}_1),(\lambda_2,\mathbf{e}_2),...,(\lambda_p,\mathbf{e}_p)\]
dengan
\[\lambda_1\geq\lambda_2\geq...\geq\lambda_p\]
Diperoleh Komponen Utama ke-i adalah:
\[Y_i=\mathbf{e}_i'\mathbf{X}=e_{i1}X_1+e_{i2}X_2+...+e_{ip}X_p\]
dimana
\[e_{i1}^2+e_{i2}^2+...+e_{ip}^2=1\]
Varians dan Kovarians dari Komponen Utama, yaitu:
\[ Var(Y_i)=\mathbf{e}_i'\mathbf{\Sigma}\mathbf{e}_i=\lambda_i\\ Cov(Y_i,Y_k)=\mathbf{e}_i'\mathbf{\Sigma}\mathbf{e}_k=0 \]
Proposi total keragaman yang dapat dijelaskan oleh Komponen Utama ke-j, yaitu:
\[\frac{\lambda_i}{\sum_{i=1}^{p} \lambda_i}\]
Didefinisikan sebagai:
\[\rho_{Y_i,Y_k}=\frac{e_{ik}\sqrt{\lambda_i} }{\sqrt{\sigma_{kk}}} \]
2.4 Menentukan Banyaknya Komponen Utama
Mengurangi dimensi dalam PC dapat dilakukan dengan menggantikan variabel p dengan m PC pertama (\(m<p\)) diterpakan (Jolliffe, 2002). Menentukan banyaknya komponen utama, yaitu:
- Persentase kumulatif dari variasi total lebih dari 70%
\[\frac{\sum_{i=1}^{k}\lambda_i}{\sum_{i=1}^{p} \lambda_i}\geq0.7\]
Nilai eigen lebih dari 1
Scree Plot
3 DATA
Data dalam penelitian ini adalah data sekunder dari website yaitu www.kaggle.com. Terdapat beberapa indikator yang dibahas, yaitu:
\(X_1\) : RI (Refractive Index)
\(X_2\) : Na (Natrium)
\(X_3\) : Mg (Magnesium)
\(X_4\) : Al (Alumunium)
\(X_5\) : Si (Silikon)
\(X_6\) : K (Kalium)
\(X_7\) : Ca (Kalsium)
\(X_8\) : Ba (Barium)
\(X_9\) : Fe (Besi)
4 SOURCE CODE
Library:
> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(readxl)
> library(DT)
> library(corrplot)
> library(factoextra)
> library(FactoMineR)4.1 Statistika Deskriptif
Mempersiapkan data yang akan di analisis dengan fungsi import
dataset dengan data yang sudah disimpan dalam Excel dengan tipe
data .xlsx.
Struktur data:
> glass = read_excel("C:/Users/chint/Downloads/PRAK ANMUL/glass.xlsx")
> head(glass)
# A tibble: 6 × 9
RI Na Mg Al Si K Ca Ba Fe
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1.52 13.6 4.49 1.1 71.8 0.06 8.75 0 0
2 1.52 13.9 3.6 1.36 72.7 0.48 7.83 0 0
3 1.52 13.5 3.55 1.54 73.0 0.39 7.78 0 0
4 1.52 13.2 3.69 1.29 72.6 0.57 8.22 0 0
5 1.52 13.3 3.62 1.24 73.1 0.55 8.07 0 0
6 1.52 12.8 3.61 1.62 73.0 0.64 8.07 0 0.26> str(glass)
tibble [214 × 9] (S3: tbl_df/tbl/data.frame)
$ RI: num [1:214] 1.52 1.52 1.52 1.52 1.52 ...
$ Na: num [1:214] 13.6 13.9 13.5 13.2 13.3 ...
$ Mg: num [1:214] 4.49 3.6 3.55 3.69 3.62 3.61 3.6 3.61 3.58 3.6 ...
$ Al: num [1:214] 1.1 1.36 1.54 1.29 1.24 1.62 1.14 1.05 1.37 1.36 ...
$ Si: num [1:214] 71.8 72.7 73 72.6 73.1 ...
$ K : num [1:214] 0.06 0.48 0.39 0.57 0.55 0.64 0.58 0.57 0.56 0.57 ...
$ Ca: num [1:214] 8.75 7.83 7.78 8.22 8.07 8.07 8.17 8.24 8.3 8.4 ...
$ Ba: num [1:214] 0 0 0 0 0 0 0 0 0 0 ...
$ Fe: num [1:214] 0 0 0 0 0 0.26 0 0 0 0.11 ...Statistika deskriptif:
Struktur data setelah standarisasi:
> glass1 = read_excel("C:/Users/chint/Downloads/PRAK ANMUL/glass_1.xlsx")
> head(glass1)
# A tibble: 6 × 9
RI Na Mg Al Si K Ca Ba Fe
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1.52 0.284 1.25 -0.691 -1.12 -0.670 -0.145 -6.29 0
2 1.52 0.590 0.635 -0.170 0.102 -0.0262 -0.792 -6.29 0
3 1.52 0.150 0.600 0.190 0.438 -0.164 -0.827 -6.29 0
4 1.52 -0.242 0.697 -0.310 -0.0528 0.112 -0.518 -6.29 0
5 1.52 -0.169 0.649 -0.410 0.554 0.0812 -0.623 -6.29 0
6 1.52 -0.757 0.642 0.351 0.412 0.219 -0.623 -6.29 0.26> str(glass1)
tibble [214 × 9] (S3: tbl_df/tbl/data.frame)
$ RI: num [1:214] 1.52 1.52 1.52 1.52 1.52 ...
$ Na: num [1:214] 0.284 0.59 0.15 -0.242 -0.169 ...
$ Mg: num [1:214] 1.252 0.635 0.6 0.697 0.649 ...
$ Al: num [1:214] -0.691 -0.17 0.19 -0.31 -0.41 ...
$ Si: num [1:214] -1.1244 0.1021 0.4378 -0.0528 0.554 ...
$ K : num [1:214] -0.6701 -0.0262 -0.1641 0.1118 0.0812 ...
$ Ca: num [1:214] -0.145 -0.792 -0.827 -0.518 -0.623 ...
$ Ba: num [1:214] -6.29 -6.29 -6.29 -6.29 -6.29 ...
$ Fe: num [1:214] 0 0 0 0 0 0.26 0 0 0 0.11 ...Statistika deskriptif:
Fungsi read_excel() merupakan fungsi membaca
file Excel dengan format .xlsx ke dalam RStudio
sebagai suatu data frame.
Fungsi head() merupakan fungsi melihat 6 baris pertama
dari data frame atau data untuk memahami strukturnya.
Fungsi str() merupakan fungsi yang memberikan informasi
mengenai struktur objek. Struktur data sebelum standarisasi maupun
sesudah standarisasi menunjukkan bahwa data glass maupun
glass1 merupakan data frame dengan 214 observasi
dan 9 variabe dengan tipe data numerik.
Fungsi sumarry() merupakan fungsi yang memberikan
ringkasan statistik deskriptif dari objek untuk memberikan informasi
tentang distribusi dan karakteristik data. Jika setiap variabel memiliki
rentang nilai yang sangat jauh sehingga perlu dilakukan
standarisasi.
4.2 Eksplorasi Korelasi
Fungsi cor() merupakan fungsi yang menghitung korelasi
antara variabel numerik.
Fungsi corrplot() merupakan fungsi yang membuat
visualisasi korelasi antara variabel berupa plot.
4.3 Menampilkan Kumulatif Nilai Eigen dan Vektor Eigen
4.3.1 Dengan Matriks Kovarians
4.3.1.1 Dekomposisi Eigen
Fungsi scale() merupakan fungsi untuk penskalaan pada
data.
Fungsi cov() merupakan fungsi yang menghitung matriks
kovarian dari data dimana data sudah dilakukan penskalaan.
Fungsi eigen() merupakan fungsi yang menghitung nilai
dan vektor eigen dari matriks kovarian.
4.3.1.2 Menggambarkan Scree Plot Berdasarkan Nilai Eigen
> plot(s_eig$values, xlab = "Eigenvalue Number", ylab = "Eigenvalue Size",
+ main = "Scree Plot") +
+ axis(2) +
+ axis(1, at = seq(1,9)) +
+ lines(s_eig$values) +
+ abline(h = 1, lty = 2, col = "red")Fungsi plot() merupakan fungsi membuat plot
atau lebih tepatnya Scree Plot yang menunjukkan nilai eigen
dari komponen-komponen utama dalam urutan penurunan, dengan menambahkan
nilai y=1 sehingga dapat menentukan titik di mana nilai eigen mulai
menurun secara signifikan.
4.3.1.3 Nilai Kumulatif Eigen
Fungsi loop for merupakan fungsi iterasi melalui setiap
nilai eigen dari matriks kovarian dimana setiap nilai eigen dibagi
dengan jumlah semua nilai eigen.
4.3.2 Dengan Matriks Korelasi
4.3.2.1 Dekomposisi Eigen
Fungsi eigen() merupakan fungsi yang menghitung nilai
dan vektor eigen dari matriks korelasi.
4.3.2.2 Scree Plot
> plot(kor_eig$values, xlab = "Eigenvalue Number", ylab = "Eigenvalue Size",
+ main = "Scree Plot") +
+ axis(2) +
+ axis(1, at = seq(1,9)) +
+ lines(kor_eig$values) +
+ abline(h = 1, lty = 2, col = "red")Fungsi plot() merupakan fungsi membuat plot
atau lebih tepatnya Scree Plot yang menunjukkan nilai eigen
dari komponen-komponen utama dalam urutan penurunan, dengan menambahkan
nilai y=1 sehingga dapat menentukan titik di mana nilai eigen mulai
menurun secara signifikan.
4.3.2.3 Nilai Kumulatif Eigen
Fungsi loop for merupakan fungsi iterasi melalui setiap
nilai eigen dari matriks korelasi dimana setiap nilai eigen dibagi
dengan jumlah semua nilai eigen.
4.4 Fungsi PCA
4.4.1
prcomp
Fungsi prcomp() merupakan fungsi untuk melakukan
Analisis Komposisi Utama (PCA).
Mencetak matriks rotasi dari hasil PCA pertama hingga empat Komponen Utama yang berkontribusi.
Fungsi summary() merupakan fungsi yang meringkas
informasi penting dari hasil analisis.
4.4.2
princomp
4.4.2.1 Fungsi PCA
Fungsi printcomp() merupakan fungsi untuk melakukan
Analisis Komposisi Utama (PCA).
Fungsi summary() merupakan fungsi yang meringkas
informasi penting dari hasil analisis.
4.4.2.2 Memperoleh Nilai Loaidngs
Mencetak matriks beban dari hasil PCA dengan batasan 0.1 yang menunjukkan hubungan antara variabel asli dan Komponen Utama.
Fungsi plot() merupakan fungsi yang menunjukkan
plot sesuai dengan pca.
4.4.2.3 Memperoleh Nilai Kontribusi
Fungsi get_pca_var() merupakan fungsi yang menunjukkan
kontribusi variabel terhadap setiap Komponen Utama dalam PCA.
4.4.2.4 PCA
Fungsi PCA() merupakan fungsi yang melakukan Analisis
Komponen Utama (PCA).
4.4.2.5 Menggambarkan Plot Kontribusi Variabel
> fviz_pca_var(pca1, col.var = "contrib",gradient.cols = c("#00AFBB", "#E7B800","#FC4E07"),axes = c(1, 2),repel=T)Fungsi fviz_pca_var() nerupakan fungsi yang membuat
visualisasi kontribusi variabel terhadap Komponen Utama.
4.4.2.6 Menggambarkan Plot Individu
Fungai fviz_pca_ind() merupakan fungsi yang membuat
visualisasi dari individu atau kasus tersebar dalam ruang Komponen
Utama.
5 HASIL DAN PEMBAHASAN
5.1 Statistika Deskriptif
RI Na Mg Al
Min. :1.511 Min. :10.73 Min. :0.000 Min. :0.290
1st Qu.:1.517 1st Qu.:12.91 1st Qu.:2.115 1st Qu.:1.190
Median :1.518 Median :13.30 Median :3.480 Median :1.360
Mean :1.518 Mean :13.41 Mean :2.685 Mean :1.445
3rd Qu.:1.519 3rd Qu.:13.82 3rd Qu.:3.600 3rd Qu.:1.630
Max. :1.534 Max. :17.38 Max. :4.490 Max. :3.500
Si K Ca Ba
Min. :69.81 Min. :0.0000 Min. : 5.430 Min. :0.000
1st Qu.:72.28 1st Qu.:0.1225 1st Qu.: 8.240 1st Qu.:0.000
Median :72.79 Median :0.5550 Median : 8.600 Median :0.000
Mean :72.65 Mean :0.4971 Mean : 8.957 Mean :0.175
3rd Qu.:73.09 3rd Qu.:0.6100 3rd Qu.: 9.172 3rd Qu.:0.000
Max. :75.41 Max. :6.2100 Max. :16.190 Max. :3.150
Fe
Min. :0.00000
1st Qu.:0.00000
Median :0.00000
Mean :0.05701
3rd Qu.:0.10000
Max. :0.51000
Melalui ouput yang diperoleh, terdapat ringkasan statistik dari data berupa nilai Min, \(Q_1\) , Median, Mean, \(Q_3\) , dan Max. Berdasarkan output, pada setiap variabel memiliki rentang nilai yang sangat jauh sehingga perlu dilakukan standarisasi.
RI Na Mg Al
Min. :1.511 Min. :-3.2793 Min. :-1.8611 Min. :-2.3132
1st Qu.:1.517 1st Qu.:-0.6127 1st Qu.:-0.3948 1st Qu.:-0.5106
Median :1.518 Median :-0.1321 Median : 0.5515 Median :-0.1701
Mean :1.518 Mean : 0.0000 Mean : 0.0000 Mean : 0.0000
3rd Qu.:1.519 3rd Qu.: 0.5108 3rd Qu.: 0.6347 3rd Qu.: 0.3707
Max. :1.534 Max. : 4.8642 Max. : 1.2517 Max. : 4.1162
Si K Ca Ba
Min. :-3.6679 Min. :-0.76213 Min. :-2.4783 Min. :-6.294
1st Qu.:-0.4789 1st Qu.:-0.57430 1st Qu.:-0.5038 1st Qu.:-6.294
Median : 0.1795 Median : 0.08884 Median :-0.2508 Median :-6.294
Mean : 0.0000 Mean : 0.00000 Mean : 0.0000 Mean :-6.171
3rd Qu.: 0.5636 3rd Qu.: 0.17318 3rd Qu.: 0.1515 3rd Qu.:-6.294
Max. : 3.5622 Max. : 8.75961 Max. : 5.0824 Max. :-4.080
Fe
Min. :0.00000
1st Qu.:0.00000
Median :0.00000
Mean :0.05701
3rd Qu.:0.10000
Max. :0.51000
Output ringkasan statistik yang diperoleh setelah dilakukan standarisasi data.
5.2 Eksplorasi Korelasi
RI Na Mg Al Si K
RI 1.0000000000 -0.19188538 -0.122274039 -0.40732603 -0.54205220 -0.289832711
Na -0.1918853790 1.00000000 -0.273731961 0.15679367 -0.06980881 -0.266086504
Mg -0.1222740393 -0.27373196 1.000000000 -0.48179851 -0.16592672 0.005395667
Al -0.4073260341 0.15679367 -0.481798509 1.00000000 -0.00552372 0.325958446
Si -0.5420521997 -0.06980881 -0.165926723 -0.00552372 1.00000000 -0.193330854
K -0.2898327111 -0.26608650 0.005395667 0.32595845 -0.19333085 1.000000000
Ca 0.8104026963 -0.27544249 -0.443750026 -0.25959201 -0.20873215 -0.317836155
Ba -0.0003860189 0.32660288 -0.492262118 0.47940390 -0.10215131 -0.042618059
Fe 0.1430096093 -0.24134641 0.083059529 -0.07440215 -0.09420073 -0.007719049
Ca Ba Fe
RI 0.8104027 -0.0003860189 0.143009609
Na -0.2754425 0.3266028795 -0.241346411
Mg -0.4437500 -0.4922621178 0.083059529
Al -0.2595920 0.4794039017 -0.074402151
Si -0.2087322 -0.1021513105 -0.094200731
K -0.3178362 -0.0426180594 -0.007719049
Ca 1.0000000 -0.1128409671 0.124968219
Ba -0.1128410 1.0000000000 -0.058691755
Fe 0.1249682 -0.0586917554 1.000000000
Melalui output yang diperoleh, didapatkan informasi korelasi antar variabel dimana korelasi yang tinggi pada RI dengan Ca sehingga perlu menghilangkan korelasi yang tinggi dengan melakukan reduksi pada 9 variabel menggunakan PCA.
5.3 Nilai Eigen, Vektor Eigen, Scree Plot dan Persamaan PC
5.3.1 Dengan Matriks Kovarians
eigen() decomposition
$values
[1] 2.511163726 2.050072185 1.404843994 1.157862446 0.914002247 0.527635193
[7] 0.368958443 0.063852948 0.001608818
$vectors
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0.5451766 -0.28568318 -0.0869108293 0.14738099 0.073542700 -0.11528772
[2,] -0.2581256 -0.27035007 0.3849196197 0.49124204 -0.153683304 0.55811757
[3,] 0.1108810 0.59355826 -0.0084179590 0.37878577 -0.123509124 -0.30818598
[4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592 -0.014108879 0.01885731
[5,] -0.2288364 0.15509891 0.4587088382 -0.65253771 -0.008500117 -0.08609797
[6,] -0.2193440 0.15397013 -0.6625741197 -0.03853544 0.307039842 0.24363237
[7,] 0.4923061 -0.34537980 0.0009847321 -0.27644322 0.188187742 0.14866937
[8,] -0.2503751 -0.48470218 -0.0740547309 0.13317545 -0.251334261 -0.65721884
[9,] 0.1858415 0.06203879 -0.2844505524 -0.23049202 -0.873264047 0.24304431
[,7] [,8] [,9]
[1,] 0.08186724 0.75221590 -0.02573194
[2,] 0.14858006 0.12769315 0.31193718
[3,] -0.20604537 0.07689061 0.57727335
[4,] -0.69923557 0.27444105 0.19222686
[5,] 0.21606658 0.37992298 0.29807321
[6,] 0.50412141 0.10981168 0.26050863
[7,] -0.09913463 -0.39870468 0.57932321
[8,] 0.35178255 -0.14493235 0.19822820
[9,] 0.07372136 0.01627141 0.01466944
numeric(0)
Melalui ouput yang diperoleh, didapatkan informasi sebanyak 4 PC yang dapat dimanfaatkan.
[,1] [,2] [,3] [,4]
[1,] 0.5451766 -0.28568318 -0.0869108293 0.14738099
[2,] -0.2581256 -0.27035007 0.3849196197 0.49124204
[3,] 0.1108810 0.59355826 -0.0084179590 0.37878577
[4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592
[5,] -0.2288364 0.15509891 0.4587088382 -0.65253771
[6,] -0.2193440 0.15397013 -0.6625741197 -0.03853544
[7,] 0.4923061 -0.34537980 0.0009847321 -0.27644322
[8,] -0.2503751 -0.48470218 -0.0740547309 0.13317545
[9,] 0.1858415 0.06203879 -0.2844505524 -0.23049202
Melalui output yang diperoleh, didapatkan persamaan PC:
\(PC_1 = 0.5451766X_1 - 0.2581256X_2 + 0.1108810X_3 - 0.4287086X_4\\ - 0.2288364X_5 - 0.2193440X_6 + 0.4923061X_7 - 0.2503751X_8\\ + 0.1858415X_9\)
\(PC_2 = -0.28568318X_1 - 0.27035007X_2 + 0.59355826X_3 - 0.29521154X_4\\ + 0.15509891X_5 + 0.15397013X_6 - 0.34537980X_7 - 0.48470218X_8\\ + 0.06203879X_9\)
\(PC_3 = -0.0869108293X_1 + 0.3849196197X_2 - 0.0084179590X_3\\ - 0.3292371183X_4 + 0.4587088382X_5 - 0.6625741197X_6\\ + 0.0009847321X_7 - 0.0740547309X_8 - 0.2844505524X_9\)
\(PC_4 = 0.14738099X_1 + 0.49124204X_2 + 0.37878577X_3 - 0.13750592X_4\\ - 0.65253771X_5 - 0.03853544X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\)
5.3.2 Dengan Matriks Korelasi
eigen() decomposition
$values
[1] 2.511163726 2.050072185 1.404843994 1.157862446 0.914002247 0.527635193
[7] 0.368958443 0.063852948 0.001608818
$vectors
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0.5451766 -0.28568318 -0.0869108293 0.14738099 0.073542700 -0.11528772
[2,] -0.2581256 -0.27035007 0.3849196197 0.49124204 -0.153683304 0.55811757
[3,] 0.1108810 0.59355826 -0.0084179590 0.37878577 -0.123509124 -0.30818598
[4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592 -0.014108879 0.01885731
[5,] -0.2288364 0.15509891 0.4587088382 -0.65253771 -0.008500117 -0.08609797
[6,] -0.2193440 0.15397013 -0.6625741197 -0.03853544 0.307039842 0.24363237
[7,] 0.4923061 -0.34537980 0.0009847321 -0.27644322 0.188187742 0.14866937
[8,] -0.2503751 -0.48470218 -0.0740547309 0.13317545 -0.251334261 -0.65721884
[9,] 0.1858415 0.06203879 -0.2844505524 -0.23049202 -0.873264047 0.24304431
[,7] [,8] [,9]
[1,] 0.08186724 0.75221590 -0.02573194
[2,] 0.14858006 0.12769315 0.31193718
[3,] -0.20604537 0.07689061 0.57727335
[4,] -0.69923557 0.27444105 0.19222686
[5,] 0.21606658 0.37992298 0.29807321
[6,] 0.50412141 0.10981168 0.26050863
[7,] -0.09913463 -0.39870468 0.57932321
[8,] 0.35178255 -0.14493235 0.19822820
[9,] 0.07372136 0.01627141 0.01466944
numeric(0)
Melalui ouput yang diperoleh, didapatkan informasi sebanyak 4 PC yang dapat dimanfaatkan.
[,1] [,2] [,3] [,4]
[1,] 0.5451766 -0.28568318 -0.0869108293 0.14738099
[2,] -0.2581256 -0.27035007 0.3849196197 0.49124204
[3,] 0.1108810 0.59355826 -0.0084179590 0.37878577
[4,] -0.4287086 -0.29521154 -0.3292371183 -0.13750592
[5,] -0.2288364 0.15509891 0.4587088382 -0.65253771
[6,] -0.2193440 0.15397013 -0.6625741197 -0.03853544
[7,] 0.4923061 -0.34537980 0.0009847321 -0.27644322
[8,] -0.2503751 -0.48470218 -0.0740547309 0.13317545
[9,] 0.1858415 0.06203879 -0.2844505524 -0.23049202
Melalui output yang diperoleh, didapatkan persamaan PC:
\(PC_1 = 0.5451766X_1 - 0.2581256X_2 + 0.1108810X_3 - 0.4287086X_4\\ - 0.2288364X_5 - 0.2193440X_6 + 0.4923061X_7 - 0.2503751X_8\\ + 0.1858415X_9\)
\(PC_2 = -0.28568318X_1 - 0.27035007X_2 + 0.59355826X_3 - 0.29521154X_4\\ + 0.15509891X_5 + 0.15397013X_6 - 0.34537980X_7 - 0.48470218X_8\\ + 0.06203879X_9\)
\(PC_3 = -0.0869108293X_1 + 0.3849196197X_2 - 0.0084179590X_3\\ - 0.3292371183X_4 + 0.4587088382X_5 - 0.6625741197X_6\\ + 0.0009847321X_7 - 0.0740547309X_8 - 0.2844505524X_9\)
\(PC_4 = 0.14738099X_1 + 0.49124204X_2 + 0.37878577X_3 - 0.13750592X_4\\ - 0.65253771X_5 - 0.03853544X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\)
5.4 Fungsi PCA
5.4.1
prcomp
Standard deviations (1, .., p=9):
[1] 1.58466518 1.43180731 1.18526115 1.07604017 0.95603465 0.72638502 0.60741950
[8] 0.25269141 0.04011007
Rotation (n x k) = (9 x 9):
PC1 PC2 PC3 PC4 PC5 PC6
RI -0.5451766 0.28568318 0.0869108293 0.14738099 -0.073542700 0.11528772
Na 0.2581256 0.27035007 -0.3849196197 0.49124204 0.153683304 -0.55811757
Mg -0.1108810 -0.59355826 0.0084179590 0.37878577 0.123509124 0.30818598
Al 0.4287086 0.29521154 0.3292371183 -0.13750592 0.014108879 -0.01885731
Si 0.2288364 -0.15509891 -0.4587088382 -0.65253771 0.008500117 0.08609797
K 0.2193440 -0.15397013 0.6625741197 -0.03853544 -0.307039842 -0.24363237
Ca -0.4923061 0.34537980 -0.0009847321 -0.27644322 -0.188187742 -0.14866937
Ba 0.2503751 0.48470218 0.0740547309 0.13317545 0.251334261 0.65721884
Fe -0.1858415 -0.06203879 0.2844505524 -0.23049202 0.873264047 -0.24304431
PC7 PC8 PC9
RI -0.08186724 -0.75221590 -0.02573194
Na -0.14858006 -0.12769315 0.31193718
Mg 0.20604537 -0.07689061 0.57727335
Al 0.69923557 -0.27444105 0.19222686
Si -0.21606658 -0.37992298 0.29807321
K -0.50412141 -0.10981168 0.26050863
Ca 0.09913463 0.39870468 0.57932321
Ba -0.35178255 0.14493235 0.19822820
Fe -0.07372136 -0.01627141 0.01466944
Importance of components:
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8
Standard deviation 1.585 1.4318 1.1853 1.0760 0.9560 0.72639 0.6074 0.25269
Proportion of Variance 0.279 0.2278 0.1561 0.1286 0.1016 0.05863 0.0410 0.00709
Cumulative Proportion 0.279 0.5068 0.6629 0.7915 0.8931 0.95173 0.9927 0.99982
PC9
Standard deviation 0.04011
Proportion of Variance 0.00018
Cumulative Proportion 1.00000
PC1 PC2 PC3 PC4
RI -0.5452 0.28568 0.0869108 0.14738
Na 0.2581 0.27035 -0.3849196 0.49124
Mg -0.1109 -0.59356 0.0084180 0.37879
Al 0.4287 0.29521 0.3292371 -0.13751
Si 0.2288 -0.15510 -0.4587088 -0.65254
K 0.2193 -0.15397 0.6625741 -0.03854
Ca -0.4923 0.34538 -0.0009847 -0.27644
Ba 0.2504 0.48470 0.0740547 0.13318
Fe -0.1858 -0.06204 0.2844506 -0.23049
Melalui output yang diperoleh, didapatkan informasi pada Komponen Utama 4 dapat menjelaskan 0.7915 atau 79.15% varians secara proporsi kumulatif. Dengan persamaan PC:
\(PC_1 = -0.5452X_1 + 0.2581X_2 - 0.1109X_3 + 0.4287X_4\\ + 0.2288X_5 + 0.2193X_6 - 0.4923X_7 + 2504X_8\\ - 0.1858X_9\)
\(PC_2 = 0.28568X_1 + 0.27035X_2 - 0.59356X_3 + 0.29521X_4\\ - 0.15510X_5 - 0.15397X_6 + 0.34538X_7 + 0.48470X_8\\ - 0.06204X_9\)
\(PC_3 = 0.0869108X_1 - 0.3849196X_2 + 0.0084179X_3\\ + 0.3292371X_4 - 0.4587088X_5 + 0.6625741X_6\\ - 0.0009847X_7 + 0.0740547X_8 + 0.2844506X_9\)
\(PC_4 = 0.14738X_1 + 0.49124X_2 + 0.37879X_3 - 0.13751X_4\\ - 0.65254X_5 - 0.4587088382X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\)
5.4.2
princomp
Call:
princomp(x = glass1, cor = T)
Standard deviations:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7
1.58466518 1.43180731 1.18526115 1.07604017 0.95603465 0.72638502 0.60741950
Comp.8 Comp.9
0.25269141 0.04011007
9 variables and 214 observations.
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
Standard deviation 1.5846652 1.4318073 1.1852612 1.0760402 0.9560346
Proportion of Variance 0.2790182 0.2277858 0.1560938 0.1286514 0.1015558
Cumulative Proportion 0.2790182 0.5068040 0.6628978 0.7915492 0.8931050
Comp.6 Comp.7 Comp.8 Comp.9
Standard deviation 0.72638502 0.60741950 0.252691408 0.0401100713
Proportion of Variance 0.05862613 0.04099538 0.007094772 0.0001787575
Cumulative Proportion 0.95173109 0.99272647 0.999821242 1.0000000000
Loadings:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9
RI 0.5452 0.2857 0.1474 0.1153 0.7522
Na -0.2581 0.2704 -0.3849 0.4912 -0.1537 -0.5581 0.1486 0.1277 -0.3119
Mg 0.1109 -0.5936 0.3788 -0.1235 0.3082 -0.2060 -0.5773
Al -0.4287 0.2952 0.3292 -0.1375 -0.6992 0.2744 -0.1922
Si -0.2288 -0.1551 -0.4587 -0.6525 0.2161 0.3799 -0.2981
K -0.2193 -0.1540 0.6626 0.3070 -0.2436 0.5041 0.1098 -0.2605
Ca 0.4923 0.3454 -0.2764 0.1882 -0.1487 -0.3987 -0.5793
Ba -0.2504 0.4847 0.1332 -0.2513 0.6572 0.3518 -0.1449 -0.1982
Fe 0.1858 0.2845 -0.2305 -0.8733 -0.2430
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9
SS loadings 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
Proportion Var 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111 0.1111
Cumulative Var 0.1111 0.2222 0.3333 0.4444 0.5556 0.6667 0.7778 0.8889 1.0000
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
RI 29.721755 8.1614878 7.553492e-01 2.172116 0.540852877 1.32912586
Na 6.662882 7.3089158 1.481631e+01 24.131874 2.361855807 31.14952270
Mg 1.229459 35.2311409 7.086203e-03 14.347866 1.525450380 9.49785986
Al 18.379109 8.7149854 1.083971e+01 1.890788 0.019906047 0.03555983
Si 5.236608 2.4055673 2.104138e+01 42.580546 0.007225198 0.74128602
K 4.811181 2.3706801 4.390045e+01 0.148498 9.427346429 5.93567314
Ca 24.236528 11.9287208 9.696972e-05 7.642086 3.541462638 2.21025827
Ba 6.268770 23.4936208 5.484103e-01 1.773570 6.316891091 43.19366082
Fe 3.453708 0.3848812 8.091212e+00 5.312657 76.259009534 5.90705350
Dim.7 Dim.8 Dim.9
RI 0.6702245 56.58287600 0.06621329
Na 2.2076033 1.63055415 9.73048063
Mg 4.2454696 0.59121658 33.32445189
Al 48.8930386 7.53178878 3.69511646
Si 4.6684767 14.43414740 8.88476399
K 25.4138397 1.20586056 6.78647457
Ca 0.9827675 15.89654216 33.56153794
Ba 12.3750961 2.10053849 3.92944198
Fe 0.5434839 0.02647588 0.02151925
eigenvalue percentage of variance cumulative percentage of variance
comp 1 2.511163726 27.90181918 27.90182
comp 2 2.050072185 22.77857983 50.68040
comp 3 1.404843994 15.60937771 66.28978
comp 4 1.157862446 12.86513829 79.15492
comp 5 0.914002247 10.15558052 89.31050
comp 6 0.527635193 5.86261325 95.17311
comp 7 0.368958443 4.09953826 99.27265
comp 8 0.063852948 0.70947720 99.98212
comp 9 0.001608818 0.01787575 100.00000
Melalui output yang diperoleh, didapatkan informasi pada komponen utama 1, 2, 3 dan 4 memiliki nilai eigen lebih dari 1 dimana dapat menjelaskan 79% varians dari persentase kumulatif varians, sehingga dapat menggunakan 4 komponen utama pertama untuk membentuk persamaan PC. Dengan output dari plot kontribusi variabel, RI dengan Ca memiliki kontribusi paling rendah terhadap Komponen Utama sedangkan Si, K, dan Mg memiliki kontribusi paling tinggi terhadap Komponen Utama.
6 KESIMPULAN DAN SARAN
6.1 Kesimpulan
Persamaan Komponen Utama:
\[PC_1 = 0.5451766X_1 - 0.2581256X_2 + 0.1108810X_3 - 0.4287086X_4\\ - 0.2288364X_5 - 0.2193440X_6 + 0.4923061X_7 - 0.2503751X_8\\ + 0.1858415X_9\]
\[PC_2 = -0.28568318X_1 - 0.27035007X_2 + 0.59355826X_3 - 0.29521154X_4\\ + 0.15509891X_5 + 0.15397013X_6 - 0.34537980X_7 - 0.48470218X_8\\ + 0.06203879X_9\]
\[PC_3 = -0.0869108293X_1 + 0.3849196197X_2 - 0.0084179590X_3\\ - 0.3292371183X_4 + 0.4587088382X_5 - 0.6625741197X_6\\ + 0.0009847321X_7 - 0.0740547309X_8 - 0.2844505524X_9\]
\[PC_4 = 0.14738099X_1 + 0.49124204X_2 + 0.37878577X_3 - 0.13750592X_4\\ - 0.65253771X_5 - 0.03853544X_6 - 0.27644322X_7 + 0.13317545X_8\\ - 0.23049202X_9\]
Diperoleh \(PC_1\) meningkat seiring dengan meningkatnya RI dan Ca dengan menurunnya Al, \(PC_2\) meningkat seiring dengan meningkatnya Mg dengan menurunnya Ca dan Ba, \(PC_3\) meningkat seiring dengan meningkatnya Na dengan menurunnya Si dan K, dan \(PC_4\) meningkat seiring dengan meningkatnya Na dan Mg dengan menurunnya Si.
Jadi, hasil Analisis Komponen Utama (PCA) menunjukkan bahwa terdapat 4 Komponen Utama (\(PC_1\), \(PC_2\), \(PC_3\), dan \(PC_4\)) yang menjelaskan sebagian besar variasi dalam data komposisi pembuatan kaca. Setiap Komponen Utama memiliki koefisien yang mengidikasikan pengaruh variabel asli (RI, Na, Mg, Al, Si, K, Ca, Ba, dan Fe) terhadap komponen tersebut.
6.2 Saran
Optimasi Formulasi Kaca: Memperhatikan koefisien dari setiap variabel pada komponen utama, pabrikan kaca dapat mempertimbangkan peningkatan proporsi dari bahan seperti RI dan Ca, sambil mengurangi proporsi Al untuk merancang formulasi kaca yang optimal.
Peningkatan Kualitas Produk Kaca: Produsen kaca dapat mempertimbangkan untuk meningkatkan proporsi Mg dalam komposisi kaca untuk meningkatkan kualitas fisik dan optik dari produk mereka. Penurunan proporsi Ca dan Ba juga dapat berkontribusi positif.
Efisiensi Produksi: Dengan memahami pengaruh variabel pada komponen utama, produsen dapat meminimalkan percobaan dan iterasi dalam proses produksi kaca. Hal ini memungkinkan untuk memilih proporsi komponen dengan lebih terarah.
Pengurangan Biaya Produksi: Mempertimbangkan koefisien dari setiap variabel pada komponen utama, pabrikan kaca dapat mencari cara untuk mengurangi biaya produksi dengan mengoptimalkan penggunaan bahan baku tertentu tanpa mengorbankan kualitas produk akhir.
Dengan memperhatikan pengaruh variabel pada Komponen Utama, pabrikan kaca dapat meningkatkan efisiensi, kualitas, dan keuntungan produksi mereka.
7 DAFTAR PUSTASKA
Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis (6th Edition). Pearson Education.
Jolliffe, I.T. (2002). Principal Component Analysis (2nd Edition). Springer.
https://www.kaggle.com/datasets/uciml/glass (diakses pada 20 Oktober 2023)