1 PENDAHULUAN

1.1 Latar Belakang

Kematian pada dasarnya merupakan suatu peristiwa universal yang akan dihadapi oleh semua makhluk hidup. Kematian dapat disebabkan oleh penyakit yang dimiliki, tenggelam, dan kekerasan yang terjadi pada masing-masing individu. Kesehatan adalah salah satu hak asasi manusia yang dijamin dalam UUD 1945. Dokumen tersebut juga menggarisbawahi hak setiap individu untuk menikmati kehidupan yang sejahtera, baik secara fisik maupun mental, serta memiliki tempat tinggal yang layak dan lingkungan yang bersih dan sehat. Semua orang juga berhak mendapatkan pelayanan kesehatan. Konsep kesehatan sebagai hak asasi manusia membawa tanggung jawab untuk merawat individu yang sakit dan berupaya menjaga agar yang sehat tetap sehat. Kesehatan merujuk pada keadaan yang optimal dari segi fisik, mental, dan sosial yang memungkinkan setiap orang untuk berkontribusi secara produktif dalam masyarakat dan ekonomi. Ini memberikan dasar bagi pandangan bahwa menjaga kesehatan adalah suatu investasi. Untuk menjaga kesejahteraan tubuh, langkah pertama adalah menerapkan gaya hidup yang sehat. Ini melibatkan memilih makanan bergizi dan mengambil suplemen vitamin atau antibodi untuk memperkuat sistem kekebalan tubuh, sehingga risiko terserang penyakit yang dapat mengganggu kesehatan dapat diminimalkan. Namun, sebagian besar masyarakat tidak memberikan cukup perhatian terhadap kesehatan mereka. Dampaknya adalah banyak di antara mereka yang tiba-tiba menderita penyakit serius. Selain minimnya kesadaran akan pentingnya kesehatan, pertumbuhan penduduk yang relatif cepat juga memudahkan penyebaran penyakit.

Beberapa contoh penyakit yang berdampak negatif dan mengkhawatirkan masyarakat pada saat ini adalah meningitis, alzheimer, penyakit parkinson, kekurangan gizi, dan malaria. Meningitis merupakan sebuah penyakit infeksi yang mempengaruhi cairan otak dan menyebabkan peradangan pada piameter (lapisan dalam selaput otak) dan arakhnoid, serta dalam kasus yang lebih ringan, juga dapat mempengaruhi jaringan otak dan medula spinalis yang berada di permukaan (Ratniasih, 2017). Alzheimer merupakan penyakit neurodegeneratif yang ditandai oleh penurunan memori dan kognitif, gangguan dalam melakukan aktivitas sehari-hari, serta gangguan perilaku dan neuropsikiatri. Penyakit Parkison merupakan salah satu penyakit neurodegeneratif yang paling umum dan menempati urutan ke dua setelah penyakit alzheimer. Kekurangan gizi dapat menyebabkan tidak mempunyai cadangan lemak dan sangat sedikit otot menyebabkan perkembangan otak menjadi lambat. Malaria merupakan penyakit menular yang disebabkan oleh nyamuk dipengaruhi perubahan iklim.

Kematian tidak wajar terjadi hampir di semua tempat di seluruh dunia. Kematian tidak wajar merupakan kematian yang disebabkan oleh pembunuhan, bunuh diri, dan kecelakaan seperti cedera, kecelakaan lalu lintas, tenggelam, keracunan, dan kekerasan lainnya. Menurut Malik, pembunuhan terbagi menjadi dua yaitu pembunuhan sengaja dan pembunuhan kesalahan. Pembunuhan sengaja merupakan perbuatan dengan tujuan menganiaya dan mengakibatkan hilangnya nyawa atau jiwa orang yang dianiaya. Sedangkan, pembunuhan kesalahan merupakan perbuatan yang mengakibatkan kematian tanpa memiliki tujuan untuk penganiayaan. Tenggelam merupakan masuknya cairan yang banyak ke dalam saluran pernapasan atau paru-paru. Tenggelam dapat terjadi tidak hanya di perairan yang dalam seperti laut, sungai, danau atau kolam renang, tetapi bisa juga terjadi di kubangan atau selokan di mana hanya bagian muka yang berada di bawah permukaan air. World Health Organization (WHO) menyatakan bahwa 0,7% penyebab kematian di dunia atau lebih dari 500.000 kematian setiap tahunnya disebabkan oleh tenggelam.

Di seluruh dunia kasus kematian karena penyakit dan kasus kematian tidak wajar seperti pembunuhan, bunuh diri, dan kecelakaan tidak jarang terjadi. Namun, penelitian yang dilakukan masih jarang. Berdasarkan latar belakang ini, maka peneliti memiliki tujuan untuk mengetahui gambaran sebab kematian di seluruh dunia pada tahun 2019.

1.2 Latar Belakang Metode

Jenis penelitian ini adalah penelitian kuantitatif dengan menggunakan metode analisis faktor, yaitu Principal Component Analysis (PCA). Menurut Zulfahmi pada tahun 2019, tujuan penggunaan PCA untuk menyederhanakan dan menghilangkan faktor ataupun indikator yang kurang dominan tanpa mengurangi maksud dan tujuan dari data aslinya. Tahap analisis dilakukan dengan mengumpulkan faktor-faktor yang menyebabkan kematian di seluruh dunia. Penelitian ini menggunakan data yang sudah ada berasal dari kaggle. Terdapat 7 variabel yang digunakan dalam penelitian ini, yaitu meningitis, alzheimer, penyakit parkinson, kekurangan nutrisi, malaria, tenggelam, dan kekerasan antar masing-masing individu.

Adapun subjek pada penelitian ini adalah seluruh masyarakat di seluruh dunia selama 19 tahun dari 1990 sampai 2019. Data yang sudah didapatkan dianalisis menggunakan metode Principal Component Analysis (PCA). Menurut Wangge pada tahun 2021 bahwa data observasi layak dianalisis menggunakan PCA jika nilai KMO (Kaiser Meyer Olkin) > 0,5. Menurut Ilmaniati dan Putro pada tahun 2019 bahwa proses analisis PCA dilakukan dengan beberapa tahapan yaitu uji Bartlett’s, pengujian nilai KMO, pengujian matriks korelasi, analisis PCA, dan interpretasi hasil PCA.

1.3 Tinjauan Pustaka Metode

Principal Component Analysis (PCA) adalah teknik analisis multivariat yang digunakan untuk mengidentifikasi pola dan hubungan antar variabel dalam sebuah dataset yang kompleks. Komponen utama merupakan mentransformasikan PCA menjadi sejumlah komponen baru yang saling bebas secara linear. PCA digunakan untukmengurangi dimensi variabel yang ada tanpa mengorbankan banyak informasi dan mengidentifikasi hubungan antar variabel serta menghilangkan pengaruh variabel yang tidak penting. PCA membantu memperjelas struktur dalam data yang kompleks dan memungkinkan peneliti untuk membuat kesimpulan yang lebih tepat dan efektif. Secara umum, PCA dapat digunakan untuk berbagai jenis data, termasuk data numerik, data kategorik, dan data ordinal.

PCA memiliki 3 syarat yaitu setiap PC memberikan nilai varians terbesar, setiap PC tidak memiliki korelasi dengan PC lain, dan panjang vektor yang memuat koefisien PC adalah 1. Asumsi yang harus berjalan agar PCA berjalan yaitu tipe variabel harus numerik, variabel yang menjadi input PCA adalah variabel prediktor, dan variabel-variabel prediktor memiliki hubungan yang linier. Kelebihan PCA adalah mengurangi dimensi data, menghilangkan korelasi antara variabel, membantu mengidentifikasi pola atau struktur dalam data yang sulit dilihat dalam dimensi asli,mengurangi ruang dimensi sambil mempertahankan sebagian besar informasi yang penting, dan cenderung mengurangi noise dalam data. Namun, PCA juga memiliki kekurangan yaitu apabila data tidak berdistribusi normal akan mendapatkan hasil yang kurang optimal, sulit diinterpretasikan, beberapa informasi akan hilang, dan sangat sensitif terhadap skala data. Perhitungan PCA dilakukan menggunakan konsep eigen value untuk menunjukkan kontribusi PC terhadap variabilitas data dan vektor eigen untuk memberikan koefisien PC. Banyaknya PC akan dipilih sesuai dengan batas yang diinginkan atau menggunakan metode elbow atau screeplot.

Langkah-Langkah Perhitungan PCA :

Persiapkan dataset yang ingin dianalisis menggunakan PCA.
Menghitung rata-rata dan standar deviasi dari setiap variabel dalam dataset.
Pemeriksaan hubungan antara variabel dalam dataset yaitu nilai korelasi antar variabel dan visualisasi korelasi.
PCA dengan matriks kovarians jika ingin mempertahankan struktur varian asli dari data dan jika variabel yang akan di analisis mempunyai unit satuan sama. PCA dengan matriks korelasi jika ingin fokus pada hubungan antar variabel dan jika variabel yang akan di analisis mempunyai unit satuan berbeda.
Hitung nilai eigen dan vektor eigen dari matriks kovarians atau matriks korelasi.Nilai eigen adalah ukuran dari variasi yang dijelaskan oleh masing-masing komponen utama, sedangkan vektor eigen adalah arah dari komponen utama.
Membuat scree plot untuk membantu memilih jumlah komponen utama yang akan dipertahankan.
Menghitung nilai kumulatif eigen untuk menentukan jumlah komponen utama yang akan dipertahankan dalam analisis PCA.
Setelah mendapatkan nilai kumulatif eigen, ubah ke dalam ruang ke dalam ruang komponen utama dengan menggunakan vektor eigen yang sesuai melibatkan perkalian matriks data awal dengan matriks yang berisi vektor eigen terkait dengan komponen utama yang dipilih.
Membentuk model atau persamaan sesuai jumlah komponen utama yang didapatkan.

1.4 Data

Data yang digunakan untuk analisis berasal dari kaggle dataset pada tahun 2022 yang terdapat kumpulan data dari 204 negara di Seluruh dunia. Indikator yang dicatatkan berupa beberapa indikator penyebab kematian yaitu:

\(X_1\) : Meningitis

\(X_2\) : Alzheimer’s Disease and Other Dementias

\(X_3\) : Parkinson’s Disease

\(X_4\) : Nutritional Deficiencies

\(X_5\) : Malaria

\(X_6\) : Drowning

\(X_7\) : Interpersonal Violence

5 Data teratas yang digunakan:


Country/Territory	\(X_1\)	\(X_2\)	\(X_3\)	\(X_4\)	\(X_5\)	\(X_6\)	\(X_7\)

Afghanistan	1563	1775	560	1244	530	1687	5015

Albania	13	917	248	5	0	36	57

Algeria	292	5209	1283	114	0	526	459

American Samoa	1	7	3	2	0	4	3

Andorra	0	36	7	0	0	0	0

2 SOURCE CODE

2.1 Library

Membuat grafik dan visualisasi data dengan cara yang sangat fleksibel dan kuat.

> library(ggplot2)

Menghasilkan visualisasi dan grafik yang membantu dalam analisis data hasil analisis faktor atau analisis komponen utama (PCA).

> library(factoextra)

Mereduksi dimensi untuk mengidentifikasi hubungan antar variabel-variabel dalam data.

> library(FactoMineR)

Membantu dalam visualisasi dan analisis hasil dari analisis komponen utama (PCA).

> library(PerformanceAnalytics)

Memudahkan visualisasi dan plot hasil dari analisis komponen utama (PCA) sehingga informatif, menarik, dan mudah menjelaskan hasil analisis kepada orang lain.

> library(ggfortify)

Menghitung dan memvisualisasikan matriks korelasi antara variabel-variabel dalam dataset.

> library(corrr)

Memvisualisasikan matriks korelasi antara variabel-variabel dalam dataset.

> library(ggcorrplot)
> library(corrplot)

2.2 Analisis Komponen Utama (PCA)

2.2.1 Import Data

Digunakan untuk membaca data dari berbagai sumber yaitu xlsx dan mengubahnya menjadi objek data yang dapat digunakan dalam analisis dan visualisasi.

> library(readxl)
> cause_of_death <- read_xlsx("C:/Users/nzsan/Downloads/penyebab_meninggal.xlsx",  
+ col_types = c("text", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric"))
> nama_variabel <- names(cause_of_death)
> cause_of_death <- cause_of_death[-1]
> View(cause_of_death)

2.2.2 Struktur Data

digunakan untuk menampilkan struktur objek data seperti tipe data objek, jumlah elemen dalam objek, dan informasi lainnya.

> struktur_data <- str(cause_of_death)
tibble [204 × 7] (S3: tbl_df/tbl/data.frame)
 $ X1: num [1:204] 1563 13 292 1 0 ...
 $ X2: num [1:204] 1775 917 5209 7 36 ...
 $ X3: num [1:204] 560 248 1283 3 7 ...
 $ X4: num [1:204] 1244 5 114 2 0 ...
 $ X5: num [1:204] 530 0 0 0 0 ...
 $ X6: num [1:204] 1687 36 526 4 0 ...
 $ X7: num [1:204] 5015 57 459 3 0 ...

2.2.3 Statistika Deskriptif

digunakan untuk memberikan pemahaman awal tentang data yang akan diuji.

> statistika_deskriptif <- summary(cause_of_death)

2.2.4 Analisis Hubungan Antara Variabel

digunakan untuk memahami dan mengukur bagaimana dua atau lebih variabel saling berhubungan atau berinteraksi.

> korelasi <- cor(cause_of_death)
> corr_matrix <- cor(cause_of_death)
> matrix_korelasi <- ggcorrplot(corr_matrix)
> datamatrix <- cor(cause_of_death)
> plot_matrix <- corrplot(datamatrix, method="number")

2.2.5 Scaling Data

digunakan untuk mengubah rentang atau ukuran data agar sesuai kerangka kerja atau unit yang lebih mudah dipahami. Scaling data mencakup normalisasi data ke dalam rentang 0 hingga 1 (min-max scaling), standarisasi data dengan mean 0 dan standar deviasi 1 (z-score scalling).

> scaling_data <- scale(cause_of_death)

2.2.6 Matriks Kovarians

digunakan untuk mempertahankan struktur varian asli dari data dan jika variabel yang akan di analisis mempunyai unit satuan sama.

> matrix_covariance <- cov(scaling_data)

2.2.6.1 Nilai Eigen dan Vektor Eigen

nilai eigen digunakan untuk mengukur ukuran dari variasi yang dijelaskan oleh masing-masing komponen utama, sedangkan vektor eigen digunakan untuk melihat arah dari komponen utama.

> nilaivektor_eigen <- eigen(matrix_covariance)

2.2.6.2 Scree Plot

digunakan untuk memilih jumlah komponen utama yang akan dipertahankan.

> scree_plot <- plot(nilaivektor_eigen$values, xlab="Eigenvalue Number", ylab="Eigenvalue Size", main="Scree Plot Cause of Death")
> screeplot_garis <- lines(nilaivektor_eigen$values)

2.2.6.3 Nilai Kumulatif Eigen

digunakan untuk menentukan jumlah komponen utama yang akan dipertahankan dalam analisis PCA.

> nilai_kumulatif_eigen <- 
+   for (eg in nilaivektor_eigen$values)
+ {print(eg/sum(nilaivektor_eigen$values))}
[1] 0.5712188
[1] 0.2347098
[1] 0.1012282
[1] 0.05749562
[1] 0.02437986
[1] 0.008310213
[1] 0.00265746

2.2.6.4 Persamaan PC

digunakan untuk menghitung komponen utama dari data asli.

> PersamaanPC_matrixkovarians <- nilaivektor_eigen$vectors[,1:3]

2.2.7 Matriks Korelasi

digunakan untuk mengetahui hubungan antar variabel dan jika variabel yang akan di analisis mempunyai unit satuan berbeda.

> corr_matrix <- cor(cause_of_death)

2.2.7.1 Nilai Eigen dan Vektor Eigen

nilai eigen digunakan untuk mengukur ukuran dari variasi yang dijelaskan oleh masing-masing komponen utama, sedangkan vektor eigen digunakan untuk melihat arah dari komponen utama.

> nilaivektoreigen_korelasi <- eigen(korelasi)

2.2.7.2 Scree Plot

digunakan untuk memilih jumlah komponen utama yang akan dipertahankan.

> scree_plot <- plot(nilaivektoreigen_korelasi$values, xlab="Eigenvalue Number", ylab="Eigenvalue Size", main="Scree Plot Cause of Death")
> screeplot_garis <- lines(nilaivektoreigen_korelasi$values)

2.2.7.3 Nilai Kumulatif Eigen

digunakan untuk menentukan jumlah komponen utama yang akan dipertahankan dalam analisis PCA.

> kumulatif_eigen_korelasi <- for (cor in nilaivektoreigen_korelasi$values)
+ {print(cor/sum(nilaivektoreigen_korelasi$values))}
[1] 0.5712188
[1] 0.2347098
[1] 0.1012282
[1] 0.05749562
[1] 0.02437986
[1] 0.008310213
[1] 0.00265746

2.2.7.4 Persamaan PC

digunakan untuk menghitung komponen utama dari data asli.

> PersamaanPC_matrixkorelasi <- nilaivektoreigen_korelasi$vectors[,1:3]

2.2.8 Analisis PCA

digunakan untuk mengurangi dimensi data multidimensi dan mengidentifikasi pola dan struktur yang ada dalam data.

> analisis_pca <- prcomp(cause_of_death, center = TRUE,scale. = TRUE)

2.2.8.1 Varians dan proporsi

digunakan untuk menjelaskan seberapa signifikan suatu komponen dalam menjelaskan data asli.

> perhitungan <- summary(analisis_pca)

2.2.8.2 Matriks Rotasi

digunakan untuk mengubah komponen utama hasil dari analisis faktor sehingga mudah diinterpretasikan.

> matrix_rotasi <- print(analisis_pca$rotation[, 1:4], digits = 3)
      PC1     PC2     PC3     PC4
X1 -0.342  0.5413  0.0974 -0.0978
X2 -0.410 -0.3474  0.2625  0.3159
X3 -0.444 -0.3053  0.2320  0.1440
X4 -0.417  0.0994 -0.2203 -0.7401
X5 -0.181  0.6668  0.3025  0.3535
X6 -0.454 -0.1897  0.1454 -0.1194
X7 -0.325  0.0511 -0.8406  0.4277

2.2.8.3 Matriks Loading

digunakan untuk menggambarkan hubungan antara variabel asli dan komponen utama yang dihasilkan dalam analisis PCA.

> matrix_loading <- print(analisis_pca$loadings, digits=3, cutoff=0.1)
NULL

2.2.8.4 Nilai Kontribusi

digunakan untuk menilai pentingnya variabel dalam analisis PCA dan memahami bagaimana variabel-variabel tersebut mempengaruhi hasil analisis.

> nilaikontribusi_pca <- get_pca_var(analisis_pca)
> hasil_nilaikontribusi <- nilaikontribusi_pca$contrib

2.2.9 Plot

digunakan untuk memvisualisasikan hasil analisis komponen utama (PCA) dan memahami hubungan antara observasi(data) atau komponen utama dalam ruang dua atau tiga dimensi.

> membuat_plot <- plot(analisis_pca)

2.2.9.1 Plot Efek Setiap PCA

digunakan untuk mengevaluasi sejauh mana setiap komponen utama dalam PCA mempengaruhi atau menjelaskan variasi dalam data.

> plot_effect <- fviz_eig(analisis_pca, addlabels = TRUE)

2.2.9.2 Plot Kontribusi Variabel

digunakan untuk menilai pengaruh variabel terhadap dua komponen utama yang paling signifikan dalam analisis.

> plot_hubungan1 <- fviz_cos2(analisis_pca, choice = "var", axes = 1:2)
> plot_hubungan2 <- fviz_pca_var(analisis_pca, col.var = "cos2", gradient.cols = c("orange", "purple", "red"),repel = TRUE)

2.2.9.3 Plot Individu

digunakan untuk memvisualisasikan bagaimana observasi atau individu dalam dataset terdistribusi dalam ruang komponen utama yang dihasilkan dalam PCA.

> plot_individu <- fviz_pca_ind(analisis_pca, title="Country In The WOrld ~ PCA", axes=c(1,2))

2.2.9.4 Biplot

digunakan untuk memvisualisasikan dua jenis informasi yaitu variabel asli dan komponen utama sekaligus dalam satu plot.

> biplot <- fviz_pca_biplot(pca3, axes=c(1,2), repel=TRUE, col.var = "yellow",col.ind = "pink")
Error in eval(expr, envir, enclos): object 'pca3' not found

3 HASIL DAN PEMBAHASAN

3.1 Struktur Data

> struktur_data <- str(cause_of_death)
tibble [204 × 7] (S3: tbl_df/tbl/data.frame)
 $ X1: num [1:204] 1563 13 292 1 0 ...
 $ X2: num [1:204] 1775 917 5209 7 36 ...
 $ X3: num [1:204] 560 248 1283 3 7 ...
 $ X4: num [1:204] 1244 5 114 2 0 ...
 $ X5: num [1:204] 530 0 0 0 0 ...
 $ X6: num [1:204] 1687 36 526 4 0 ...
 $ X7: num [1:204] 5015 57 459 3 0 ...
> struktur_data
NULL

Interpretasi : Berdasarkan output dari struktur data, maka didapatkan hasil bahwa tipe data variabel X1 sampai dengan X7 adalah numerik.

3.2 Statistika Deskriptif

> statistika_deskriptif <- summary(cause_of_death)
> statistika_deskriptif
       X1                 X2                 X3                 X4         
 Min.   :    0.00   Min.   :     0.0   Min.   :    0.00   Min.   :    0.0  
 1st Qu.:    9.75   1st Qu.:   152.5   1st Qu.:   43.75   1st Qu.:    8.0  
 Median :   71.50   Median :  1087.0   Median :  237.50   Median :  106.0  
 Mean   : 1157.27   Mean   :  7953.1   Mean   : 1777.95   Mean   : 1232.4  
 3rd Qu.:  471.50   3rd Qu.:  4201.8   3rd Qu.:  919.50   3rd Qu.:  838.5  
 Max.   :44914.00   Max.   :320715.0   Max.   :76990.00   Max.   :26868.0  
       X5               X6                X7          
 Min.   :     0   Min.   :    0.0   Min.   :    0.00  
 1st Qu.:     0   1st Qu.:   31.0   1st Qu.:   42.75  
 Median :     0   Median :  142.0   Median :  292.50  
 Mean   :  3153   Mean   : 1162.1   Mean   : 2030.18  
 3rd Qu.:   112   3rd Qu.:  623.2   3rd Qu.:  838.75  
 Max.   :191106   Max.   :56524.0   Max.   :65907.00

Interpretasi :

Berdasarkan output dari statistika deskriptif, diketahui bahwa setiap variabel X mulai dari X1 sampai X7 memiliki rentang nilai yang sangat jauh sehingga diperlukan standarisasi agar lebih mudah dipahami.

3.3 Analisis Hubungan Antara Variabel

> korelasi <- cor(cause_of_death)
> corr_matrix <- cor(cause_of_death)
> matrix_korelasi <- ggcorrplot(corr_matrix)
> datamatrix <- cor(cause_of_death)
> plot_matrix <- corrplot(datamatrix, method="number")

Interpretasi :

Berdasarkan output dari analisis hubungan antar variabel dapat diketahui bahwa hubungan antar variabel memiliki hubungan yang positif. Apabila hubungan antar variabel positif atau korelasi positif mengindikasikan bahwa saat nilai salah satu variabel meningkat, nilai variabel lainnya juga cenderung meningkat. Nilai korelasi yang paling tinggi adalah X2 dengan X3 sebesar 0,96 dan nilai korelasi yang paling rendah adalah X2 dengan X5 sebesar 0,03.

3.4 Matriks Kovarians

> matrix_covariance <- cov(scaling_data)
> matrix_covariance
          X1         X2         X3        X4         X5        X6        X7
X1 1.0000000 0.24604411 0.34468617 0.6449987 0.81729524 0.4827651 0.4142825
X2 0.2460441 1.00000000 0.96028603 0.5213153 0.02674052 0.8085132 0.3972833
X3 0.3446862 0.96028603 1.00000000 0.6148924 0.05856001 0.9052590 0.4366841
X4 0.6449987 0.52131531 0.61489243 1.0000000 0.27985300 0.6914172 0.5511089
X5 0.8172952 0.02674052 0.05856001 0.2798530 1.00000000 0.1216070 0.1717514
X6 0.4827651 0.80851315 0.90525904 0.6914172 0.12160700 1.0000000 0.4711559
X7 0.4142825 0.39728334 0.43668410 0.5511089 0.17175143 0.4711559 1.0000000

> nilaivektor_eigen <- eigen(matrix_covariance)
> nilaivektor_eigen
eigen() decomposition
$values
[1] 3.99853192 1.64296855 0.70859744 0.40246935 0.17065903 0.05817149 0.01860222

$vectors
           [,1]        [,2]       [,3]        [,4]        [,5]        [,6]
[1,] -0.3417324  0.54127605 -0.0973867  0.09775972 -0.26539227  0.70717573
[2,] -0.4097428 -0.34740138 -0.2625166 -0.31591719  0.43960883  0.22035954
[3,] -0.4438990 -0.30525290 -0.2319549 -0.14402172  0.06200083  0.05931762
[4,] -0.4170398  0.09942914  0.2203294  0.74014120  0.42866613 -0.18930754
[5,] -0.1813916  0.66682996 -0.3025360 -0.35348073  0.20980429 -0.51122329
[6,] -0.4540264 -0.18971607 -0.1453560  0.11938419 -0.70951152 -0.38662042
[7,] -0.3245279  0.05111408  0.8405929 -0.42765278 -0.03588633 -0.03411221
            [,7]
[1,] -0.02583587
[2,] -0.54853462
[3,]  0.79238017
[4,] -0.01567179
[5,]  0.02431298
[6,] -0.26382748
[7,]  0.01158771

> scree_plot <- plot(nilaivektor_eigen$values, xlab="Eigenvalue Number", ylab="Eigenvalue Size", main="Scree Plot Cause of Death")
> screeplot_garis <- lines(nilaivektor_eigen$values)

Interpretasi :

Berdasarkan output dari scree plot dari matriks kovarians dapat diketahui bahwa jumlah komponen utama yang dipilih sebanyak 3. Hal ini dapat dilihat pada eigenvalue size lebih dari 1 sehingga mendapatkan hasil bahwa eigenvalue number yang terbentuk sebanyak 3. Selain itu, dapat dilihat titik ekstrim dimana garis kurva mulai melandai ditunjukkan pada komponen ke 3.

> nilai_kumulatif_eigen <- 
+   for (eg in nilaivektor_eigen$values)
+ {print(eg/sum(nilaivektor_eigen$values))}
[1] 0.5712188
[1] 0.2347098
[1] 0.1012282
[1] 0.05749562
[1] 0.02437986
[1] 0.008310213
[1] 0.00265746

Interpretasi :

Berdasarkan output dari nilai kumulatif eigen dapat diketahui bahwa 3 komponen utama sudah mencapai 75% keragaman dalam data yaitu sebesar 90,72%.

> PersamaanPC_matrixkovarians <- nilaivektor_eigen$vectors[,1:3]
> PersamaanPC_matrixkovarians
           [,1]        [,2]       [,3]
[1,] -0.3417324  0.54127605 -0.0973867
[2,] -0.4097428 -0.34740138 -0.2625166
[3,] -0.4438990 -0.30525290 -0.2319549
[4,] -0.4170398  0.09942914  0.2203294
[5,] -0.1813916  0.66682996 -0.3025360
[6,] -0.4540264 -0.18971607 -0.1453560
[7,] -0.3245279  0.05111408  0.8405929

Interpretasi :

Berdasarkan output dari persamaan PCA, dapat diketahui persamaan komponen utama (PCA) sebagai berikut:

Komponen Utama 1

\(KU_1\) = -0,34\(X_1\)-0,41\(X_2\)-0,44\(X_3\)-0,42\(X_4\)-0,18\(X_5\)-0,45\(X_6\)-0,32\(X_7\)
Komponen Utama 2

\(K_2\) = 0,54\(X_1\)-0,35\(X_2\)-0,31\(X_3\)+0,1\(X_4\)+0,67\(X_5\)-0,19\(X_6\)+0,05\(X_7\)
Komponen Utama 3

\(KU_3\) = -0,1\(X_1\)-0,26\(X_2\)-0,23\(X_3\)+0,22\(X_4\)-0,3\(X_5\)-0,15\(X_6\)+0,84\(X_7\)

3.5 Matriks Korelasi

> corr_matrix <- cor(cause_of_death)
> corr_matrix
          X1         X2         X3        X4         X5        X6        X7
X1 1.0000000 0.24604411 0.34468617 0.6449987 0.81729524 0.4827651 0.4142825
X2 0.2460441 1.00000000 0.96028603 0.5213153 0.02674052 0.8085132 0.3972833
X3 0.3446862 0.96028603 1.00000000 0.6148924 0.05856001 0.9052590 0.4366841
X4 0.6449987 0.52131531 0.61489243 1.0000000 0.27985300 0.6914172 0.5511089
X5 0.8172952 0.02674052 0.05856001 0.2798530 1.00000000 0.1216070 0.1717514
X6 0.4827651 0.80851315 0.90525904 0.6914172 0.12160700 1.0000000 0.4711559
X7 0.4142825 0.39728334 0.43668410 0.5511089 0.17175143 0.4711559 1.0000000

> nilaivektoreigen_korelasi <- eigen(korelasi)
> nilaivektoreigen_korelasi
eigen() decomposition
$values
[1] 3.99853192 1.64296855 0.70859744 0.40246935 0.17065903 0.05817149 0.01860222

$vectors
           [,1]        [,2]       [,3]        [,4]        [,5]        [,6]
[1,] -0.3417324  0.54127605 -0.0973867  0.09775972  0.26539227  0.70717573
[2,] -0.4097428 -0.34740138 -0.2625166 -0.31591719 -0.43960883  0.22035954
[3,] -0.4438990 -0.30525290 -0.2319549 -0.14402172 -0.06200083  0.05931762
[4,] -0.4170398  0.09942914  0.2203294  0.74014120 -0.42866613 -0.18930754
[5,] -0.1813916  0.66682996 -0.3025360 -0.35348073 -0.20980429 -0.51122329
[6,] -0.4540264 -0.18971607 -0.1453560  0.11938419  0.70951152 -0.38662042
[7,] -0.3245279  0.05111408  0.8405929 -0.42765278  0.03588633 -0.03411221
            [,7]
[1,] -0.02583587
[2,] -0.54853462
[3,]  0.79238017
[4,] -0.01567179
[5,]  0.02431298
[6,] -0.26382748
[7,]  0.01158771

> scree_plot <- plot(nilaivektoreigen_korelasi$values, xlab="Eigenvalue Number", ylab="Eigenvalue Size", main="Scree Plot Cause of Death")
> screeplot_garis <- lines(nilaivektoreigen_korelasi$values)

Interpretasi :

Berdasarkan output dari scree plot dari matriks korelasi dapat diketahui bahwa jumlah komponen utama yang dipilih sebanyak 3. Hal ini dapat dilihat pada eigenvalue size lebih dari 1 sehingga mendapatkan hasil bahwa eigenvalue number yang terbentuk sebanyak 3. Selain itu, dapat dilihat titik ekstrim dimana garis kurva mulai melandai ditunjukkan pada komponen ke 3.

> kumulatif_eigen_korelasi <- for (cor in nilaivektoreigen_korelasi$values)
+ {print(cor/sum(nilaivektoreigen_korelasi$values))}
[1] 0.5712188
[1] 0.2347098
[1] 0.1012282
[1] 0.05749562
[1] 0.02437986
[1] 0.008310213
[1] 0.00265746

Interpretasi :

Berdasarkan output dari nilai kumulatif eigen dapat diketahui bahwa 3 komponen utama sudah mencapai 75% keragaman dalam data yaitu sebesar 90,72%.

> PersamaanPC_matrixkorelasi <- nilaivektoreigen_korelasi$vectors[,1:3]
> PersamaanPC_matrixkorelasi
           [,1]        [,2]       [,3]
[1,] -0.3417324  0.54127605 -0.0973867
[2,] -0.4097428 -0.34740138 -0.2625166
[3,] -0.4438990 -0.30525290 -0.2319549
[4,] -0.4170398  0.09942914  0.2203294
[5,] -0.1813916  0.66682996 -0.3025360
[6,] -0.4540264 -0.18971607 -0.1453560
[7,] -0.3245279  0.05111408  0.8405929

Interpretasi :

Berdasarkan output dari persamaan PCA, dapat diketahui persamaan komponen utama (PCA) sebagai berikut:

Komponen Utama 1

\(KU_1\) = -0,34\(X_1\)-0,41\(X_2\)-0,44\(X_3\)-0,42\(X_4\)-0,18\(X_5\)-0,45\(X_6\)-0,32\(X_7\)
Komponen Utama 2

\(K_2\) = 0,54\(X_1\)-0,35\(X_2\)-0,31\(X_3\)+0,1\(X_4\)+0,67\(X_5\)-0,19\(X_6\)+0,05\(X_7\)
Komponen Utama 3

\(KU_3\) = -0,1\(X_1\)-0,26\(X_2\)-0,23\(X_3\)+0,22\(X_4\)-0,3\(X_5\)-0,15\(X_6\)+0,84\(X_7\)

3.6 Analisis PCA

> analisis_pca <- prcomp(cause_of_death, center = TRUE,scale. = TRUE)
> analisis_pca
Standard deviations (1, .., p=7):
[1] 1.9996329 1.2817833 0.8417823 0.6344047 0.4131090 0.2411877 0.1363899

Rotation (n x k) = (7 x 7):
          PC1         PC2        PC3         PC4         PC5         PC6
X1 -0.3417324  0.54127605  0.0973867 -0.09775972  0.26539227 -0.70717573
X2 -0.4097428 -0.34740138  0.2625166  0.31591719 -0.43960883 -0.22035954
X3 -0.4438990 -0.30525290  0.2319549  0.14402172 -0.06200083 -0.05931762
X4 -0.4170398  0.09942914 -0.2203294 -0.74014120 -0.42866613  0.18930754
X5 -0.1813916  0.66682996  0.3025360  0.35348073 -0.20980429  0.51122329
X6 -0.4540264 -0.18971607  0.1453560 -0.11938419  0.70951152  0.38662042
X7 -0.3245279  0.05111408 -0.8405929  0.42765278  0.03588633  0.03411221
           PC7
X1 -0.02583587
X2 -0.54853462
X3  0.79238017
X4 -0.01567179
X5  0.02431298
X6 -0.26382748
X7  0.01158771

> perhitungan <- summary(analisis_pca)
> perhitungan
Importance of components:
                          PC1    PC2    PC3    PC4     PC5     PC6     PC7
Standard deviation     1.9996 1.2818 0.8418 0.6344 0.41311 0.24119 0.13639
Proportion of Variance 0.5712 0.2347 0.1012 0.0575 0.02438 0.00831 0.00266
Cumulative Proportion  0.5712 0.8059 0.9072 0.9647 0.98903 0.99734 1.00000

Interpretasi :

Berdasarkan output dari varians dan proporsi, dapat diketahui bahwa nilai standar deviasi, proporsi dari varians, dan proporsi kumulatif dari setiap variabel mulai dari PC1 sampai PC7. Banyak komponen utama yang dapat diambil sebanyak 3 karena telah menangkap minimal 80% varians data. Ketiga komponen utama telah mampu menangkap 90,72% dari total keragaman data.

> matrix_rotasi <- print(analisis_pca$rotation[, 1:4], digits = 3)
      PC1     PC2     PC3     PC4
X1 -0.342  0.5413  0.0974 -0.0978
X2 -0.410 -0.3474  0.2625  0.3159
X3 -0.444 -0.3053  0.2320  0.1440
X4 -0.417  0.0994 -0.2203 -0.7401
X5 -0.181  0.6668  0.3025  0.3535
X6 -0.454 -0.1897  0.1454 -0.1194
X7 -0.325  0.0511 -0.8406  0.4277
> matrix_rotasi
          PC1         PC2        PC3         PC4
X1 -0.3417324  0.54127605  0.0973867 -0.09775972
X2 -0.4097428 -0.34740138  0.2625166  0.31591719
X3 -0.4438990 -0.30525290  0.2319549  0.14402172
X4 -0.4170398  0.09942914 -0.2203294 -0.74014120
X5 -0.1813916  0.66682996  0.3025360  0.35348073
X6 -0.4540264 -0.18971607  0.1453560 -0.11938419
X7 -0.3245279  0.05111408 -0.8405929  0.42765278

> matrix_loading <- print(analisis_pca$loadings, digits=3, cutoff=0.1)
NULL

> nilaikontribusi_pca <- get_pca_var(analisis_pca)
> hasil_nilaikontribusi <- nilaikontribusi_pca$contrib
> hasil_nilaikontribusi
       Dim.1      Dim.2      Dim.3      Dim.4      Dim.5      Dim.6       Dim.7
X1 11.678105 29.2979763  0.9484169  0.9556964  7.0433057 50.0097507  0.06674922
X2 16.788916 12.0687722  6.8914962  9.9803672 19.3255923  4.8558327 30.08902296
X3 19.704633  9.3179333  5.3803062  2.0742255  0.3844103  0.3518580 62.78663382
X4 17.392220  0.9886153  4.8545047 54.7808998 18.3754654  3.5837343  0.02456051
X5  3.290291 44.4662193  9.1528054 12.4948623  4.4017841 26.1349254  0.05911210
X6 20.614000  3.5992186  2.1128355  1.4252584 50.3406593 14.9475347  6.96049389
X7 10.531835  0.2612649 70.6596349 18.2886903  0.1287829  0.1163643  0.01342749

3.7 Plot

> membuat_plot <- plot(analisis_pca)

3.7.1 Plot Efek Setiap PCA

> plot_effect <- fviz_eig(analisis_pca, addlabels = TRUE)
> plot_effect

Interpretasi :

Berdasarkan output dari plot efek dari setiap PCA dapat diketahui seberapa besar persentase penjelasan keragaman mulai dari PCA 1 sampai PCA 7. persentase penjelasan keragaan pada PCA 1 sebesar 57.1%, PCA 2 sebesar 23.5%, PCA 3 sebesar 10.1%, PCA 4 sebesar 5.7%, PCA 5 sebesar 2.4%, PCA 6 sebesar 0.8%, dan PCA 7 sebesar 0.3%.

3.7.2 Plot Kontribusi Variabel

> plot_hubungan1 <- fviz_cos2(analisis_pca, choice = "var", axes = 1:2)
> plot_hubungan1

> plot_hubungan2 <- fviz_pca_var(analisis_pca, col.var = "cos2", gradient.cols = c("orange", "purple", "red"),repel = TRUE)
> plot_hubungan2

Interpretasi :

Berdasarkan output dari plot kontribusi variabel, dapat diketahui nilai kontribusi setiap variabel terhadap dimensi 1 dan dimensi 2. X1, X3, X6, X2, X5 nilainya lebih besar dari 0.75, sedangkan X4 dan X7 nilainya kurang dari 0.75.

3.7.3 Plot Individu

> plot_individu <- fviz_pca_ind(analisis_pca, title="Country In The World ~ PCA", axes=c(1,2))
> plot_individu

3.7.4 Biplot

> biplot <- fviz_pca_biplot(analisis_pca, axes=c(1,2), repel=TRUE, col.var = "yellow",col.ind = "pink")
> biplot

4 Penutup

4.1 Kesimpulan

Berdasarkan analisis mengenai penyebab kematian di seluruh dunia pada tahun 2019 dapat disimpulkan bahwa terdapat 3 komponen utama yang terbentuk. Persamaan yang terbentuk yaitu:

Komponen Utama 1

\(KU_1\) = -0,34\(X_1\)-0,41\(X_2\)-0,44\(X_3\)-0,42\(X_4\)-0,18\(X_5\)-0,45\(X_6\)-0,32\(X_7\)
Komponen Utama 2

\(K_2\) = 0,54\(X_1\)-0,35\(X_2\)-0,31\(X_3\)+0,1\(X_4\)+0,67\(X_5\)-0,19\(X_6\)+0,05\(X_7\)
Komponen Utama 3

\(KU_3\) = -0,1\(X_1\)-0,26\(X_2\)-0,23\(X_3\)+0,22\(X_4\)-0,3\(X_5\)-0,15\(X_6\)+0,84\(X_7\)

Dapat disimpulkan bahwa \(KU_1\) tidak memiliki hubungan yang positif dengan nilai X1 sampai X7 sehingga apabila nilai \(KU_1\) meningkat, maka nilai variabel X1 sampai X7 menurun. \(KU_2\) memiliki hubungan yang positif dengan X1, X4, X5, dan X7 sehingga apabila nilai \(KU_2\) meningkat seiring dengan meningkatnya meningitis, nutritional deficiencies, malaria, dan interpersonal violence. \(KU_3\) memiliki hubungan yang positif dengan X4, X5, dan X7 sehingga apabila nilai \(KU_3\) meningkat seiring dengan meningkatnya nutritional deficiencies, malaria, dan interpersonal violence.

Dengan metode analisis komponen utama (PCA), dapat diketahui bahwa data penyebab kematian di seluruh dunia yang terdiri dari 7 indikator yaitu meningitis, alzheimer’s disease, parkinson’s disease, nutritional deficiencies, malaria, drowning, interpersonal violence dapat direduksi menjadi 3 indikator namun tetap dapat menggambarkan keragaman dari data awal. ketiga indikator tersebut adalah meningitis, alzheimer’s disease, dan parkinson’s disease. Sehingga, diperoleh bahwa penyebab yang paling sering terjadi di seluruh dunia disebabkan oleh meningitis, alzheimer’s disease, dan parkinson’s disease.

4.2 Saran

Berdasarkan uraian hasil dan pembahasan, maka saran yang dapat diberikan adalah dapat melakukan analisis lanjutan dengan menggunakan indikator baru yang terbentuk. Contoh analisis lanjutannya adalah regresi dan klasifikasi dan telah mengatasi masalah multikolinearitas karena memiliki sifat saling bebas satu sama lain.

4.3 Daftar Pustaka

Utami, T.P., Hasyim, H., Kaltsum, U., Dwifitri, U., Meriwati, Y., Yuniwarti, Paridah, Y., & Zulaiha. (2022). Faktor Risiko Penyebab Terjadinya Malaria di Indonesia: Literature Review.

Alia, S., Hidayati, H.B., Hamdan, M., Nugraha, P., Fahmi, A., Turchan, A., & Haryono, Y. (2021). Penyakit Parkinson: Tinjauan Tentang Salah Satu Penyakit Neurodegeneratif yang Paling Umum. Jurnal Kesehatan Neurologi, 1(2).

Zulaekah, S., Purwanto, S., & Hidayati, L. (2014). Anemia Terhadap Pertumbuhan dan Perkembangan Anak Malnutrisi. Jurnal Kesehatan Masyarakat, 9(2).

Wijaya, S., & Arifin, M. (2013). Analisis Potensi Curcumin Kunyit (Curcuma longa) Sebagai Agen Neuroprotektor, Antiinflamasi, dan Antioksidan: Inovasi Pengembangan Terapi yang Efektif pada Penderita Alzheimer. Jurnal Ilmiah Mahasiswa Kedokteran Indonesia, 1(2).

Fitriati, D., & Gibran, I. (2021). Sistem Pakar Diagnosis Penyakit Meningitis Menggunakan Metode Forward Chaining. Jurnal Kedokteran Terapan, 12(1)

Ismurrizal. (2018). Angka Kejadian Penyebab Kematian Mendadak di Instalasi Kedokteran Forensik Dan Medikolegal RSUD Dr. Pirngadi Medan Tahun 2013-2015. Jurnal Kedokteran Forensik dan Medikolegal, 1(3).

PCA : Analisis Penyebab Kematian di Seluruh Dunia Pada Tahun 2019

Ananda Nur Zahra Salsabila

03 November 2023

1 PENDAHULUAN

1.1 Latar Belakang

1.2 Latar Belakang Metode

1.3 Tinjauan Pustaka Metode

1.4 Data

2 SOURCE CODE

2.1 Library

2.2 Analisis Komponen Utama (PCA)

2.2.1 Import Data

2.2.2 Struktur Data

2.2.3 Statistika Deskriptif

2.2.4 Analisis Hubungan Antara Variabel

2.2.5 Scaling Data

2.2.6 Matriks Kovarians

2.2.6.1 Nilai Eigen dan Vektor Eigen

2.2.6.2 Scree Plot

2.2.6.3 Nilai Kumulatif Eigen

2.2.6.4 Persamaan PC

2.2.7 Matriks Korelasi

2.2.7.1 Nilai Eigen dan Vektor Eigen

2.2.7.2 Scree Plot

2.2.7.3 Nilai Kumulatif Eigen

2.2.7.4 Persamaan PC

2.2.8 Analisis PCA

2.2.8.1 Varians dan proporsi

2.2.8.2 Matriks Rotasi

2.2.8.3 Matriks Loading

2.2.8.4 Nilai Kontribusi

2.2.9 Plot

2.2.9.1 Plot Efek Setiap PCA

2.2.9.2 Plot Kontribusi Variabel

2.2.9.3 Plot Individu

2.2.9.4 Biplot

3 HASIL DAN PEMBAHASAN

3.1 Struktur Data

3.2 Statistika Deskriptif

3.3 Analisis Hubungan Antara Variabel

3.4 Matriks Kovarians

3.5 Matriks Korelasi

3.6 Analisis PCA

3.7 Plot

3.7.1 Plot Efek Setiap PCA

3.7.2 Plot Kontribusi Variabel

3.7.3 Plot Individu

3.7.4 Biplot

4 Penutup

4.1 Kesimpulan

4.2 Saran

4.3 Daftar Pustaka