> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
Analisis komponen utama (PCA) pertama kali diperkenalkan oleh Karl Pearson pada awalnya tahun 1900-an. Analisis komponen utama (PCA) adalah teknik statistik yang memiliki telah dikembangkan secara khusus untuk mengatasi tujuan reduksi data. Secara umum tujuan utama PCA adalah untuk mengurangi kompleksitas hubungan antar sejumlah besar variabel yang diamati menjadi jumlah kombinasi linier yang relatif kecil. Tujuan utama PCA adalah untuk mengidentifikasi pola atau hubungan yang ada dalam data dengan mengubah data ke dalam koordinat baru yang disebut “komponen utama” sehingga variabilitas data tersebar seefisien mungkin dalam komponen-komponen ini.
Principal Component Analysis (PCA) adalah sebuah metode analisis data multivariat yang berguna untuk menyederhanakan dataset yang kompleks. PCA membantu menemukan pola dan hubungan antar variabel dalam data dengan menggantikan variabel-variabel tersebut dengan sejumlah komponen utama baru yang disusun berdasarkan tingkat variasi yang dijelaskan. Komponen utama ini adalah kombinasi linier dari variabel asli yang membantu kita memahami esensi data.
Metode PCA bertujuan untuk menyederhanakan variabel-variabel yang diamati dengan cara mengurangi dimensi mereka. Ini dilakukan dengan menghapus korelasi di antara variabel bebas melalui transformasi ke dalam variabel baru yang saling independen. Setelah menghasilkan komponen-komponen yang bebas dari multikolinearitas, kita dapat menggunakannya sebagai variabel baru yang akan dianalisis dalam hubungannya dengan variabel respons (Y) menggunakan analisis regresi. Salah satu keunggulan PCA adalah kemampuannya untuk membersihkan data dari korelasi tanpa harus mengurangi jumlah variabel asli. Proses PCA melibatkan matriks data, melakukan transformasi linier pada data tersebut, dan menghasilkan komponen utama yang merepresentasikan variasi data dengan baik.
Secara matematis, PCA melibatkan dekomposisi nilai singular (singular value decomposition/SVD) pada matriks data, menghasilkan matriks komponen utama. Komponen utama ini diurutkan berdasarkan besarnya variansi yang dijelaskan oleh masing-masing, dan dapat digunakan untuk menyederhanakan data dengan efisien. Dalam praktiknya, PCA membantu mengoptimalkan analisis data dengan menghilangkan variabel yang tidak relevan dan mengungkapkan hubungan antara variabel. Dengan PCA, struktur dalam data yang rumit menjadi lebih jelas, memungkinkan penelitian yang lebih efektif dan kesimpulan yang lebih tepat.
1.1 Kelebihan dan Kekurangan
Berikut adalah beberapa kelebihan dan kekurangan PCA:
1.1.1 Kelebihan
Reduksi Dimensi: Salah satu manfaat utama PCA adalah kemampuannya untuk mengurangi dimensi data. Dengan mengubah data ke dalam ruang komponen utama yang lebih sedikit, PCA dapat membantu mengatasi masalah “kutukan dimensi” dan mengurangi kompleksitas analisis.
Menghilangkan Korelasi: PCA merumuskan komponen utama sedemikian rupa sehingga komponen-komponen tersebut ortogonal satu sama lain. Hal ini menghilangkan korelasi antara variabel, yang dapat membantu dalam analisis dan pemodelan data.
Identifikasi Pola: PCA membantu dalam mengidentifikasi pola atau struktur dalam data yang mungkin sulit dilihat dalam dimensi asli. Ini berguna untuk visualisasi data dan analisis penambahan.
Kompresi Data: PCA dapat digunakan untuk kompresi data, mengurangi ruang dimensi sambil mempertahankan sebagian besar informasi yang penting.
Pengurangan Noise: PCA cenderung mengurangi noise atau variabilitas acak dalam data, fokus pada variabilitas yang penting.
1.1.2 Kekurangan
Ketergantungan pada Data: PCA sangat bergantung pada data yang dianalisis dan mungkin tidak memberikan hasil yang optimal jika data tidak berdistribusi normal.
Interpretasi yang Sulit: Hasil PCA dapat sulit diinterpretasikan karena komponen utama tidak selalu memiliki arti yang jelas dalam konteks data asli.
Informasi Hilang: Meskipun PCA dapat mengurangi dimensi data, ini juga berarti beberapa informasi akan hilang. Komponen utama yang terakhir mungkin mengandung sedikit informasi yang signifikan.
Sensitif terhadap Skala PCA sangat sensitif terhadap skala data. Variabel dengan skala yang berbeda-beda dapat mendominasi komponen utama, yang bisa menjadi masalah.
1.2 Langkah-Langkah
Persiapan Data: Mulai dengan dataset yang ingin dianalisis menggunakan PCA dan memastikan data yang telah diatur dengan benar dan variabel telah dinormalisasi jika diperlukan.
Statistika Deskriptif: Menghitung rata-rata (mean) dan standar deviasi (standard deviation) dari setiap variabel dalam dataset.
Eksplorasi Korelasi: Eksplorasi korelasi adalah langkah penting dalam PCA. Hal ini melibatkan pemeriksaan hubungan antara variabel dalam dataset sebelum melanjutkan ke langkah-langkah berikutnya dalam analisis PCA. Langkah-langkah eksplorasi korelasi adalah nilai korelasi antar variabel dan visualisasi korelasi.
Matriks Kovarians atau Matriks Korelasi: PCA dengan matriks kovarians jika ingin mempertahankan struktur varian asli dari data dan jika variabel yang akan di analisis mempunyai unit satuan sama. PCA dengan matriks korelasi jika ingin fokus pada hubungan antar variabel dan jika variabel yang akan di analisis mempunyai unit satuan berbeda.
Nilai Eigen dan Vektor Eigen: Hitung nilai dan vektor eigen (eigenvalues dan eigenvectors) dari matriks kovarians atau matriks korelasi yang dilakukan langkah sebelumnya. Ini dapat dilakukan menggunakan teknik komputasi numerik, seperti metode eigen decomposition atau metode iteratif seperti metode iterasi kuasa (power iteration). Nilai eigen adalah ukuran dari variasi yang dijelaskan oleh masing-masing komponen utama, sedangkan vektor eigen adalah arah dari komponen utama.
Scree Plot: Scree plot adalah grafik yang umumnya digunakan dalam analisis PCA untuk membantu memilih jumlah komponen utama yang akan dipertahankan. Ini membantu dalam menentukan tingkat variasi yang dijelaskan oleh setiap komponen utama.
Nilai Kumulatif Eigen: Nilai kumulatif eigen (cumulative eigenvalues) adalah cara alternatif yang dapat digunakan untuk menentukan jumlah komponen utama yang akan dipertahankan dalam analisis PCA. Ini adalah metode yang lebih berdasarkan pada jumlah total variasi yang dijelaskan oleh komponen utama daripada pada perubahan dalam eigenvalues individual.
Persamaan PCA: Setelah mendapatkan nilai kumulatif eigen, ubah ke dalam ruang ke dalam ruang komponen utama dengan menggunakan vektor eigen yang sesuai melibatkan perkalian matriks data awal dengan matriks yang berisi vektor eigen terkait dengan komponen utama yang dipilih. Setelah itu, dapat dibentuk model atau persamaan sesuai jumlah komponen utama yang didapat.
2 VARIABEL YANG DIGUNAKAN
Data yang digunakan adalah mengenai faktor-faktor penyebab kematian pada tahun 1990 di berbagai macam negara yang diambil dari https://www.kaggle.com sebagai sumber data. Data yang diambil mencakup 9 variabel yaitu polusi (\(X_1\)), darah tinggi (\(X_2\)), low birth weight (\(X_3\)), alkohol (\(X_4\)), sumber air yang tidak aman (\(X_5\)), aktivitas fisik rendah (\(X_6\)), body mass index tinggi (\(X_7\)), child stunting (\(X_8\)), kekurangan zat besi (\(X_9\)), dan diet (\(X_{10}\)).
3 SOURCE CODE
3.1 Input Data
> library(readxl)
> faktor_kematian <- read_excel("D:/Number of Deaths by Risk Factors.xlsx")
> View(faktor_kematian)3.2 Principal Component Analysis (PCA)
3.2.1 Struktur Data
> str(faktor_kematian)3.2.2 Statistika Deskriptif
> summary(faktor_kematian)3.2.3 Eksplorasi Korelasi
> library(corrplot)
> kor <- cor(faktor_kematian)
> corrplot(kor, method="number")3.2.4 Matriks Kovarians
3.2.4.1 Nilai Eigen dan Vektor Eigen
> sc <- scale(faktor_kematian)
> sc
> s <- cov(sc)
> s_eig <- eigen(s)
> s_eig3.2.4.2 Scree Plot
> plot(s_eig$values, xlab="Eigenvalue Number", ylab = "Eigenvalue Size",
+ main = "Scree Plot")
> lines(s_eig$values)3.2.4.3 Nilai Kumulatif Eigen
> for (eg in s_eig$values){
+ print(eg / sum(s_eig$values))
+ }3.2.4.4 Persamaan PCA
> s_eig$vectors[,1:2]3.2.5 Matriks Korelasi
3.2.5.1 Nilai Eigen dan Vektor Eigen
> kor_eig <- eigen(kor)
> kor_eig3.2.5.2 Scree Plot
> plot(kor_eig$values, xlab="Eigenvalue Number", ylab="Eigenvalue Size",
+ main = "Scree Plot")
> lines(kor_eig$values)3.2.5.3 Nilai Kumulatif Eigen
> for (eg in kor_eig$values){
+ print(eg / sum(kor_eig$values))
+ }3.2.5.4 Persamaan PCA
> kor_eig$vectors[,1:2]3.2.6 Fungsi PCA
> PCA <- prcomp(x=faktor_kematian,scale=T,center=T)
> PCA
> print(PCA$rotation[,1:2],digits=4)
> summary(PCA)4 HASIL DAN PEMBAHASAN
4.1 Struktur Data
tibble [50 × 10] (S3: tbl_df/tbl/data.frame)
$ Polusi : num [1:50] 3169 93970 1017 11189 4 ...
$ Darah Tinggi : num [1:50] 25633 356866 4280 32361 38 ...
$ Low Birth Weight : num [1:50] 16135 625281 731 14803 9 ...
$ Alkohol : num [1:50] 356 175615 289 496 3 ...
$ Sumber Air yang Tidak Aman: num [1:50] 3702 809960 53 1851 2 ...
$ Aktivitas Fisik Rendah : num [1:50] 2637 15088 117 3805 4 ...
$ Body Mass Index Tinggi : num [1:50] 9518 119182 1417 14353 44 ...
$ Child Stunting : num [1:50] 7686 305355 390 1622 0 ...
$ Kekurangan Zat Besi : num [1:50] 564 18607 4 284 0 ...
$ Diet : num [1:50] 3679 37123 186 2513 4 ...
Berdasarkan struktur data yang didapat, tipe data seluruh variabel \(X\) adalah numerik.
4.2 Statistika Deskriptif
Polusi Darah Tinggi Low Birth Weight Alkohol
Min. : 2.0 Min. : 25 Min. : 1.0 Min. : 2
1st Qu.: 255.8 1st Qu.: 595 1st Qu.: 242.2 1st Qu.: 142
Median : 1830.5 Median : 5732 Median : 856.5 Median : 1726
Mean : 18241.0 Mean : 46237 Mean : 26460.9 Mean : 14340
3rd Qu.: 5714.2 3rd Qu.: 24671 3rd Qu.: 10088.2 3rd Qu.: 6034
Max. :626744.0 Max. :1222195 Max. :625281.0 Max. :357337
Sumber Air yang Tidak Aman Aktivitas Fisik Rendah Body Mass Index Tinggi
Min. : 0.0 Min. : 2.00 Min. : 22
1st Qu.: 7.0 1st Qu.: 58.75 1st Qu.: 364
Median : 286.5 Median : 228.00 Median : 1787
Mean : 23833.4 Mean : 2459.38 Mean : 13030
3rd Qu.: 6337.8 3rd Qu.: 2112.50 3rd Qu.: 9061
Max. :809960.0 Max. :46082.00 Max. :234998
Child Stunting Kekurangan Zat Besi Diet
Min. : 0.00 Min. : 0.0 Min. : 1.0
1st Qu.: 2.25 1st Qu.: 1.0 1st Qu.: 56.0
Median : 123.50 Median : 11.5 Median : 525.5
Mean : 9792.98 Mean : 657.6 Mean : 3822.5
3rd Qu.: 3276.25 3rd Qu.: 266.8 3rd Qu.: 1846.5
Max. :305355.00 Max. :18607.0 Max. :86522.0
Berdasarkan data yang digunakan terlihat bahwa setiap variabel memiliki rentang nilai yang sangat jauh, sehingga akan diperlukan standarisasi.
4.3 Eksplorasi Korelasi
Dari hasil output yang telah disajikan di atas, dapat diketahui nilai korelasi antar variabel dalam dataset. Hubungan antar variabel secara keseluruhan memiliki hubungan positif. Selain itu, kita juga dapat mengamati adanya korelasi yang sangat tinggi yaitu pada variabel \(X_1\) dengan \(X_2\), \(X_2\) dengan \(X_{10}\), \(X_4\) dengan \(X_{10}\), \(X_5\) dengan \(X_8\), \(X_5\) dengan \(X_9\), dan \(X_8\) dengan \(X_9\) yang memiliki nilai korelasi sebesar 0,99.
4.4 Matriks Kovarians
4.4.1 Nilai Eigen dan Vektor Eigen
Polusi Darah Tinggi Low Birth Weight Alkohol
[1,] -0.16946859 -0.11563199 -0.10720024 -0.25163475
[2,] 0.85148923 1.74324550 6.21678603 2.90205462
[3,] -0.19366547 -0.23546489 -0.26712033 -0.25284038
[4,] -0.07929247 -0.07787449 -0.12102870 -0.24911553
[5,] -0.20505554 -0.25927096 -0.27461594 -0.25798679
[6,] -0.20498808 -0.25926535 -0.27469899 -0.25764490
[7,] -0.18982005 -0.21591270 -0.10323442 -0.20087241
[8,] -0.20484191 -0.25893986 -0.27461594 -0.25784284
[9,] -0.07450256 -0.02131121 -0.19568368 0.08097467
[10,] -0.17983547 -0.22671018 -0.26339329 -0.24958339
[11,] -0.17794649 -0.09641652 -0.26695422 -0.14915636
[12,] -0.14458582 -0.14362461 -0.27206203 -0.16169849
[13,] -0.16172153 -0.18648341 -0.23580905 -0.21339655
[14,] -0.20442589 -0.25795214 -0.27424219 -0.25618735
[15,] -0.20176108 -0.25709912 -0.27340127 -0.25715905
[16,] 0.06938569 0.11322511 1.40103601 -0.15048795
[17,] -0.20340269 -0.25705423 -0.27432525 -0.25679916
[18,] -0.08321659 -0.06546076 -0.26860492 -0.14658315
[19,] -0.12420062 -0.15198087 -0.27104462 -0.14071696
[20,] -0.20477445 -0.25878833 -0.27388922 -0.25748295
[21,] -0.19626281 -0.24079628 -0.19346199 -0.24202572
[22,] -0.20492062 -0.25886690 -0.27466785 -0.25759092
[23,] -0.20420101 -0.25783991 -0.26476368 -0.25582746
[24,] -0.17132383 -0.23974684 -0.21836775 -0.22097221
[25,] -0.18142086 -0.21181595 -0.26844919 -0.23383824
[26,] -0.20237950 -0.25341765 -0.26687117 -0.24817982
[27,] 0.14084070 0.60030688 0.45039183 0.54890235
[28,] -0.20480818 -0.25837304 -0.27449136 -0.25771688
[29,] -0.06678925 -0.03108169 -0.26979882 -0.12817483
[30,] -0.19238366 -0.22934220 -0.12396672 -0.19766940
[31,] -0.19721854 -0.23307979 -0.20054233 -0.15036199
[32,] -0.18761625 -0.21796669 -0.14323521 -0.22906971
[33,] -0.17440466 -0.22792798 -0.16429973 -0.19111942
[34,] -0.13533209 -0.03674419 -0.26369436 -0.11768407
[35,] -0.20438091 -0.25767155 -0.27287181 -0.25660122
[36,] -0.19936613 -0.24304108 -0.23017177 -0.22487701
[37,] -0.19559942 -0.23646943 -0.18289340 -0.24098204
[38,] -0.16264354 -0.18196575 -0.25857617 -0.13155779
[39,] 6.84194945 6.59946635 2.35501272 6.17204212
[40,] -0.12586472 -0.13723816 -0.16567011 -0.11278957
[41,] -0.20466201 -0.25727309 -0.26695422 -0.25744696
[42,] -0.19906254 -0.24345637 -0.25431966 -0.23637546
[43,] -0.20507803 -0.25934392 -0.27467823 -0.25800479
[44,] -0.20089530 -0.24731742 -0.26968462 -0.24877364
[45,] -0.17781156 -0.22213079 -0.08037386 -0.19891101
[46,] -0.15245656 -0.16322169 -0.27223852 -0.18352576
[47,] -0.15242283 -0.18107906 -0.26722415 -0.21937070
[48,] -0.20056923 -0.25141417 -0.27380616 -0.25445988
[49,] -0.05668097 -0.04515657 -0.26858415 -0.12353226
[50,] -0.13960477 -0.08722407 0.13335471 -0.05934606
Sumber Air yang Tidak Aman Aktivitas Fisik Rendah Body Mass Index Tinggi
[1,] -0.17510206 0.02410721 -0.093420380
[2,] 6.83770255 1.71400031 2.824011161
[3,] -0.20684093 -0.31791597 -0.308934249
[4,] -0.19120199 0.18263223 0.035206895
[5,] -0.20728453 -0.33325273 -0.345460671
[6,] -0.20730193 -0.33325273 -0.346045945
[7,] 0.06537930 -0.30000048 -0.315824521
[8,] -0.20728453 -0.33216694 -0.345593688
[9,] -0.20010871 -0.22820275 0.245852348
[10,] -0.20571890 -0.28927832 -0.289247758
[11,] -0.20723234 0.12087805 -0.015711948
[12,] -0.20729323 -0.02977502 -0.158944471
[13,] -0.19782114 -0.25453311 -0.197226715
[14,] -0.20725844 -0.32999537 -0.341656390
[15,] -0.20726714 -0.32375208 -0.337639281
[16,] 0.65793693 0.13431467 -0.173097462
[17,] -0.20724974 -0.32158051 -0.338969450
[18,] -0.20698880 -0.02461753 -0.008449229
[19,] -0.20724104 0.04908033 -0.142024730
[20,] -0.20710187 -0.33148832 -0.344875397
[21,] -0.15050421 -0.31601585 -0.320666334
[22,] -0.20729323 -0.33135260 -0.344768983
[23,] -0.20452728 -0.33108115 -0.344662570
[24,] -0.18865349 -0.30950112 -0.277409260
[25,] -0.20718016 -0.28887115 -0.264160784
[26,] -0.19988256 -0.32700945 -0.334872531
[27,] 0.08026152 2.73952695 1.629094369
[28,] -0.20730193 -0.33148832 -0.345088224
[29,] -0.20711927 -0.09899399 0.194640868
[30,] -0.02700179 -0.31750880 -0.317846377
[31,] -0.13917076 -0.32470215 -0.320320490
[32,] -0.15288745 -0.30325784 -0.317633550
[33,] -0.05225199 -0.29810035 -0.246708976
[34,] -0.20723234 0.20774108 0.122412729
[35,] -0.20509264 -0.33189549 -0.344662570
[36,] -0.15193937 -0.32090189 -0.332105781
[37,] -0.07329237 -0.31655874 -0.330376562
[38,] -0.20537098 -0.25439738 -0.166579637
[39,] 0.45215175 5.92061398 5.905106611
[40,] -0.17890307 -0.20553693 -0.066391360
[41,] -0.20291815 -0.33325273 -0.343438815
[42,] -0.18096449 -0.31791597 -0.318085807
[43,] -0.20730193 -0.33352418 -0.345912928
[44,] -0.20652781 -0.32619511 -0.322023105
[45,] -0.11650386 -0.30244350 -0.281027318
[46,] -0.20724104 -0.22426677 -0.161418584
[47,] -0.20394451 -0.02421036 -0.162349702
[48,] -0.20729323 -0.31411572 -0.333329536
[49,] -0.20724104 0.02655023 0.138534369
[50,] 0.06840620 -0.18653564 -0.049897273
Child Stunting Kekurangan Zat Besi Diet
[1,] -0.047887423 -0.03457919 -0.01081653
[2,] 6.717531063 6.63115022 2.51077774
[3,] -0.213710849 -0.24146321 -0.27418002
[4,] -0.185709964 -0.13802120 -0.09873002
[5,] -0.222574766 -0.24294096 -0.28790237
[6,] -0.222574766 -0.24294096 -0.28812856
[7,] 0.008296171 -0.10698860 -0.22381449
[8,] -0.222574766 -0.24294096 -0.28760078
[9,] -0.219461031 -0.22040537 0.04799353
[10,] -0.220074687 -0.24109378 -0.28171977
[11,] -0.222506582 -0.24220208 -0.13967087
[12,] -0.222552038 -0.24257152 -0.18166728
[13,] -0.202369581 -0.23776885 -0.24982663
[14,] -0.222552038 -0.24294096 -0.28752538
[15,] -0.222529310 -0.24257152 -0.28714839
[16,] 0.555131646 1.34009127 0.56770856
[17,] -0.222574766 -0.24294096 -0.28533885
[18,] -0.222211118 -0.24109378 -0.13718275
[19,] -0.222552038 -0.24257152 -0.20036586
[20,] -0.222461126 -0.24294096 -0.28714839
[21,] -0.149663369 -0.15427637 -0.26558471
[22,] -0.222574766 -0.24294096 -0.28782697
[23,] -0.218801919 -0.23481337 -0.28526346
[24,] -0.187869123 -0.18493954 -0.25110839
[25,] -0.222461126 -0.24220208 -0.25736638
[26,] -0.219392847 -0.23813829 -0.27983484
[27,] -0.080342995 0.03524417 0.94914455
[28,] -0.222574766 -0.24257152 -0.28692220
[29,] -0.221665646 -0.24109378 -0.21258026
[30,] -0.049705663 -0.14319330 -0.24198529
[31,] -0.147595122 -0.14799597 -0.24085432
[32,] -0.099411780 -0.10440255 -0.21416361
[33,] -0.095411654 -0.11474675 -0.24733851
[34,] -0.222529310 -0.24220208 -0.11471429
[35,] -0.221597462 -0.24183265 -0.28556505
[36,] -0.185709964 -0.19011164 -0.26256881
[37,] -0.096843517 -0.12582982 -0.24990203
[38,] -0.221574734 -0.23629111 -0.22803675
[39,] 1.320292206 0.98469407 6.23533926
[40,] -0.207801571 -0.20193359 -0.12640091
[41,] -0.218438271 -0.23924660 -0.28466028
[42,] -0.213097193 -0.21227779 -0.26550931
[43,] -0.222574766 -0.24294096 -0.28805316
[44,] -0.222279302 -0.24183265 -0.27056094
[45,] -0.130390032 -0.07706430 -0.24145750
[46,] -0.222506582 -0.24257152 -0.22811215
[47,] -0.222256574 -0.23776885 -0.17691724
[48,] -0.222574766 -0.24294096 -0.28194597
[49,] -0.222506582 -0.24220208 -0.08093621
[50,] 0.125777159 0.40615767 -0.04602716
attr(,"scaled:center")
Polusi Darah Tinggi
18241.04 46237.44
Low Birth Weight Alkohol
26460.86 14340.02
Sumber Air yang Tidak Aman Aktivitas Fisik Rendah
23833.38 2459.38
Body Mass Index Tinggi Child Stunting
13029.60 9792.98
Kekurangan Zat Besi Diet
657.60 3822.46
attr(,"scaled:scale")
Polusi Darah Tinggi
88937.073 178189.796
Low Birth Weight Alkohol
96323.106 55572.689
Sumber Air yang Tidak Aman Aktivitas Fisik Rendah
114969.409 7367.922
Body Mass Index Tinggi Child Stunting
37589.228 43998.609
Kekurangan Zat Besi Diet
2706.831 13263.038
eigen() decomposition
$values
[1] 7.4670160010 2.3814776977 0.1145589592 0.0279781983 0.0053593322
[6] 0.0016266227 0.0010410356 0.0006917669 0.0001550328 0.0000953536
$vectors
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.3078244 0.3345917 -0.46594639 0.12137281 -0.209688518 0.3566853
[2,] -0.3330556 0.2634699 -0.23155852 0.02813865 0.008597444 0.3179061
[3,] -0.3176419 -0.3173533 0.02815897 0.47081891 0.085454148 -0.3124905
[4,] -0.3526629 0.1589450 -0.24199748 -0.35628528 -0.128788422 -0.5624970
[5,] -0.2540181 -0.4649041 0.02905983 -0.31512747 -0.253326853 -0.1196050
[6,] -0.3235688 0.2523982 0.75271200 0.12653584 -0.455947132 0.1280736
[7,] -0.3503509 0.1660259 0.29617421 -0.42294871 0.709097173 0.1045040
[8,] -0.2834436 -0.4073558 -0.09937913 -0.33306728 -0.249903029 0.2872105
[9,] -0.2727613 -0.4298811 -0.02417487 0.34445110 0.291276791 0.3064281
[10,] -0.3497768 0.1857784 -0.06572121 0.33479036 0.099464390 -0.3736854
[,7] [,8] [,9] [,10]
[1,] 0.25071219 -0.197379019 -0.04445990 -0.535228643
[2,] 0.07392267 0.003737043 0.18233374 0.790812323
[3,] 0.43365300 -0.236761779 -0.45114740 0.152739435
[4,] -0.44319893 -0.347141218 -0.11626558 0.037736582
[5,] 0.39374442 -0.078371556 0.61319642 -0.059352467
[6,] -0.11624059 -0.098098545 -0.01803955 -0.035502921
[7,] 0.19931084 -0.016220349 -0.08194135 -0.150474973
[8,] -0.13504454 0.477886180 -0.49118021 0.009966598
[9,] -0.56217122 -0.236099453 0.23866791 -0.118702725
[10,] -0.06821850 0.695929389 0.25779067 -0.147571086
4.4.2 Scree Plot
Berdasarkan output di atas, dapat diketahui bahwa dalam dataset ini jumlah komponen utama yang dipilih sebanyak 2 komponen utama. Hal ini bisa dilihat pada eigenvalue size yang lebih dari 1 sehingga mendapatkan hasil bahwa eigenvalue number (komponen utama) yang terbentuk sebanyak 2.
4.4.3 Nilai Kumulatif Eigen
[1] 0.7467016
[1] 0.2381478
[1] 0.0114559
[1] 0.00279782
[1] 0.0005359332
[1] 0.0001626623
[1] 0.0001041036
[1] 6.917669e-05
[1] 1.550328e-05
[1] 9.53536e-06
Berdasarkan nilai kumulatif eigen dapat diketahui bahwa sebanyak 2 komponen utama sudah mencapai 75% keragaman dalam data yaitu sekitar 98,49%.
4.4.4 Persamaan PCA
[,1] [,2]
[1,] -0.3078244 0.3345917
[2,] -0.3330556 0.2634699
[3,] -0.3176419 -0.3173533
[4,] -0.3526629 0.1589450
[5,] -0.2540181 -0.4649041
[6,] -0.3235688 0.2523982
[7,] -0.3503509 0.1660259
[8,] -0.2834436 -0.4073558
[9,] -0.2727613 -0.4298811
[10,] -0.3497768 0.1857784
Persamaan komponen utama yang terbentuk adalah sebagai berikut. \(KU_1=0,3078X_1+0,3331X_2+0,3176X_3+0,3527X_4+0,254X_5+0,3236X_6+0,3504X_7+0,2834X_8+0,2728X_9+0,3498X_{10}\) \(KU_2=-0,3346X_1-0,2635X_2+0,3174X_3-0,1589X_4+0,4649X_5-0,2524X_6-0,166X_7+0,4074X_8+0,4299X_9-0,1858X_{10}\)
4.5 Matriks Korelasi
4.5.1 Nilai Eigen dan Vektor Eigen
eigen() decomposition
$values
[1] 7.4670160010 2.3814776977 0.1145589592 0.0279781983 0.0053593322
[6] 0.0016266227 0.0010410356 0.0006917669 0.0001550328 0.0000953536
$vectors
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.3078244 0.3345917 -0.46594639 0.12137281 -0.209688518 0.3566853
[2,] -0.3330556 0.2634699 -0.23155852 0.02813865 0.008597444 0.3179061
[3,] -0.3176419 -0.3173533 0.02815897 0.47081891 0.085454148 -0.3124905
[4,] -0.3526629 0.1589450 -0.24199748 -0.35628528 -0.128788422 -0.5624970
[5,] -0.2540181 -0.4649041 0.02905983 -0.31512747 -0.253326853 -0.1196050
[6,] -0.3235688 0.2523982 0.75271200 0.12653584 -0.455947132 0.1280736
[7,] -0.3503509 0.1660259 0.29617421 -0.42294871 0.709097173 0.1045040
[8,] -0.2834436 -0.4073558 -0.09937913 -0.33306728 -0.249903029 0.2872105
[9,] -0.2727613 -0.4298811 -0.02417487 0.34445110 0.291276791 0.3064281
[10,] -0.3497768 0.1857784 -0.06572121 0.33479036 0.099464390 -0.3736854
[,7] [,8] [,9] [,10]
[1,] 0.25071219 0.197379019 -0.04445990 0.535228643
[2,] 0.07392267 -0.003737043 0.18233374 -0.790812323
[3,] 0.43365300 0.236761779 -0.45114740 -0.152739435
[4,] -0.44319893 0.347141218 -0.11626558 -0.037736582
[5,] 0.39374442 0.078371556 0.61319642 0.059352467
[6,] -0.11624059 0.098098545 -0.01803955 0.035502921
[7,] 0.19931084 0.016220349 -0.08194135 0.150474973
[8,] -0.13504454 -0.477886180 -0.49118021 -0.009966598
[9,] -0.56217122 0.236099453 0.23866791 0.118702725
[10,] -0.06821850 -0.695929389 0.25779067 0.147571086
4.5.2 Scree Plot
Berdasarkan output di atas, dapat diketahui bahwa dalam dataset ini jumlah komponen utama yang dipilih sebanyak 2 komponen utama. Hal ini bisa dilihat pada eigenvalue size yang lebih dari 1 sehingga mendapatkan hasil bahwa eigenvalue number (komponen utama) yang terbentuk sebanyak 2.
4.5.3 Nilai Kumulatif Eigen
[1] 0.7467016
[1] 0.2381478
[1] 0.0114559
[1] 0.00279782
[1] 0.0005359332
[1] 0.0001626623
[1] 0.0001041036
[1] 6.917669e-05
[1] 1.550328e-05
[1] 9.53536e-06
Berdasarkan nilai kumulatif eigen dapat diketahui bahwa sebanyak 2 komponen utama sudah mencapai 75% keragaman dalam data yaitu sekitar 98,49%.
4.5.4 Persamaan PCA
[,1] [,2]
[1,] -0.3078244 0.3345917
[2,] -0.3330556 0.2634699
[3,] -0.3176419 -0.3173533
[4,] -0.3526629 0.1589450
[5,] -0.2540181 -0.4649041
[6,] -0.3235688 0.2523982
[7,] -0.3503509 0.1660259
[8,] -0.2834436 -0.4073558
[9,] -0.2727613 -0.4298811
[10,] -0.3497768 0.1857784
Persamaan komponen utama yang terbentuk adalah sebagai berikut. \(KU_1=0,3078X_1+0,3331X_2+0,3176X_3+0,3527X_4+0,254X_5+0,3236X_6+0,3504X_7+0,2834X_8+0,2728X_9+0,3498X_{10}\) \(KU_2=-0,3346X_1-0,2635X_2+0,3174X_3-0,1589X_4+0,4649X_5-0,2524X_6-0,166X_7+0,4074X_8+0,4299X_9-0,1858X_{10}\)
4.6 Fungsi PCA
Standard deviations (1, .., p=10):
[1] 2.732584125 1.543203712 0.338465595 0.167266848 0.073207460 0.040331410
[7] 0.032265083 0.026301463 0.012451219 0.009764917
Rotation (n x k) = (10 x 10):
PC1 PC2 PC3 PC4
Polusi 0.3078244 -0.3345917 0.46594639 -0.12137281
Darah Tinggi 0.3330556 -0.2634699 0.23155852 -0.02813865
Low Birth Weight 0.3176419 0.3173533 -0.02815897 -0.47081891
Alkohol 0.3526629 -0.1589450 0.24199748 0.35628528
Sumber Air yang Tidak Aman 0.2540181 0.4649041 -0.02905983 0.31512747
Aktivitas Fisik Rendah 0.3235688 -0.2523982 -0.75271200 -0.12653584
Body Mass Index Tinggi 0.3503509 -0.1660259 -0.29617421 0.42294871
Child Stunting 0.2834436 0.4073558 0.09937913 0.33306728
Kekurangan Zat Besi 0.2727613 0.4298811 0.02417487 -0.34445110
Diet 0.3497768 -0.1857784 0.06572121 -0.33479036
PC5 PC6 PC7 PC8
Polusi 0.209688518 -0.3566853 0.25071219 0.197379019
Darah Tinggi -0.008597444 -0.3179061 0.07392267 -0.003737043
Low Birth Weight -0.085454148 0.3124905 0.43365300 0.236761779
Alkohol 0.128788422 0.5624970 -0.44319893 0.347141218
Sumber Air yang Tidak Aman 0.253326853 0.1196050 0.39374442 0.078371556
Aktivitas Fisik Rendah 0.455947132 -0.1280736 -0.11624059 0.098098545
Body Mass Index Tinggi -0.709097173 -0.1045040 0.19931084 0.016220349
Child Stunting 0.249903029 -0.2872105 -0.13504454 -0.477886180
Kekurangan Zat Besi -0.291276791 -0.3064281 -0.56217122 0.236099453
Diet -0.099464390 0.3736854 -0.06821850 -0.695929389
PC9 PC10
Polusi -0.04445990 -0.535228643
Darah Tinggi 0.18233374 0.790812323
Low Birth Weight -0.45114740 0.152739435
Alkohol -0.11626558 0.037736582
Sumber Air yang Tidak Aman 0.61319642 -0.059352467
Aktivitas Fisik Rendah -0.01803955 -0.035502921
Body Mass Index Tinggi -0.08194135 -0.150474973
Child Stunting -0.49118021 0.009966598
Kekurangan Zat Besi 0.23866791 -0.118702725
Diet 0.25779067 -0.147571086
PC1 PC2
Polusi 0.3078 -0.3346
Darah Tinggi 0.3331 -0.2635
Low Birth Weight 0.3176 0.3174
Alkohol 0.3527 -0.1589
Sumber Air yang Tidak Aman 0.2540 0.4649
Aktivitas Fisik Rendah 0.3236 -0.2524
Body Mass Index Tinggi 0.3504 -0.1660
Child Stunting 0.2834 0.4074
Kekurangan Zat Besi 0.2728 0.4299
Diet 0.3498 -0.1858
Importance of components:
PC1 PC2 PC3 PC4 PC5 PC6 PC7
Standard deviation 2.7326 1.5432 0.33847 0.1673 0.07321 0.04033 0.03227
Proportion of Variance 0.7467 0.2382 0.01146 0.0028 0.00054 0.00016 0.00010
Cumulative Proportion 0.7467 0.9849 0.99631 0.9991 0.99964 0.99980 0.99991
PC8 PC9 PC10
Standard deviation 0.02630 0.01245 0.009765
Proportion of Variance 0.00007 0.00002 0.000010
Cumulative Proportion 0.99997 0.99999 1.000000
Jika menggunakan package dari PCA sendiri, dapat tersusun persamaan sebagai berikut. \(KU_1=0,3078X_1+0,3331X_2+0,3176X_3+0,3527X_4+0,254X_5+0,3236X_6+0,3504X_7+0,2834X_8+0,2728X_9+0,3498X_{10}\) \(KU_2=-0,3346X_1-0,2635X_2+0,3174X_3-0,1589X_4+0,4649X_5-0,2524X_6-0,166X_7+0,4074X_8+0,4299X_9-0,1858X_{10}\)
5 KESIMPULAN
Berdasarkan analisis mengenai faktor-faktor penyebab kematian pada tahun 1990 di berbagai macam negara dapat disimpulkan bahwa terdapat dua komponen utama yang terbentuk. Persamaan yang terbentuk adalah \[KU_1=0,3078X_1+0,3331X_2+0,3176X_3+0,3527X_4+0,254X_5+0,3236X_6+0,3504X_7+0,2834X_8+0,2728X_9+0,3498X_{10}\] \[KU_2=-0,3346X_1-0,2635X_2+0,3174X_3-0,1589X_4+0,4649X_5-0,2524X_6-0,166X_7+0,4074X_8+0,4299X_9-0,1858X_{10}\] Dari persamaan yang terbentuk dapat di interpretasi kedua komponen utama. Variabel dengan loading (koefisien persamaan) yang tinggi (positif atau negatif) berkontribusi secara signifikan terhadap pembentukan komponen utama tersebut. Dengan demikian, variabel dengan loading tinggi mempengaruhi arah dan variasi komponen utama. Interpretasi dari kedua komponen utama antara lain:
Komponen utama 1 dapat mencakup variabel darah tinggi (\(X_2\)), low birth weight (\(X_3\)), alkohol (\(X_4\)), aktivitas fisik rendah (\(X_6\)), body mass index tinggi (\(X_7\)), dan diet (\(X_{10}\)) yang seluruhnya memiliki kontribusi yang positif dalam komponen utama 1. Komponen utama 1 ini dapat disebut sebagai “Faktor Kesehatan Gizi”.
Komponen utama 2 dapat mencakup variabel polusi (\(X_1\)) yang memiliki kontribusi positif dan variabel sumber air yang tidak aman (\(X_3\)), child stunting (\(X_8\)), dan kekurangan zat besi (\(X_9\)) yang memiliki kontribusi positif dalam komponen 2. Komponen utama 2 ini dapat disebut sebagai “Faktor Lingkungan dan Nutrisi”.
6 DAFTAR PUSTAKA
Brown, B. L., Hendrix, S. B., Hedges, D. W., & Smith, T. B. 2011.Multivariate analysis for the biobehavioral and social sciences: Agraphical approach. John Wiley & Sons.
Christensen, W. F., & Rencher, A. C. 2002. Methods of Multivariate Analysis. America. Härdle, W. K.,& Simar, L. 2019. Applied Multivariate Statistical Analysis. Springer Nature.
Johnson, R. A., & Wichern, D. W. 2002. Applied Multivariate Statistical Analysis.
Raykov, T., & Marcoulides, G. A. 2008. An introduction to applied multivariate analysis. Routledge.
Timm, N. H. (Ed.). 2002. Applied multivariate analysis. New York: Springer New York.