Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Angka harapan hidup adalah topik penting dalam studi kesehatan masyarakat dan pembangunan sosial. Angka harapan hidup mencerminkan rata-rata usia yang diharapkan penduduk suatu negara atau wilayah, dan merupakan indikator penting kesejahteraan masyarakat. Jepang merupakan salah satu negara dengan harapan hidup tertinggi di dunia, dengan perkiraan harapan hidup pada saat kelahiran mencapai 84,26 tahun (World Health Organization, 2020). Keistimewaan harapan hidup penduduk Jepang, terutama perempuan Jepang, sangat mencolok, menduduki peringkat pertama di seluruh dunia dengan harapan hidup sekitar 86,94 tahun, sedangkan pria Jepang menduduki peringkat kedua dengan harapan hidup sekitar 81,49 tahun. Tingginya harapan hidup dapat capai karena berbagai faktor yang melibatkan sistem sosial, ekonomi, pendidikan dan kesehatan di suatu wilayah.
Terdapat banyak faktor yang dapat mempengaruhi angka harapan hidup di Jepang. Faktor yang banyak ini dapat menyulitkan dalam penggambaran dan interpretasi angka harapan hidup di Jepang. Oleh karena itu dilakukan penelitian untuk mereduksi sejumlah faktor yang memengaruhi angka harapan hidup di Jepang, menjadi beberapa variabel baru yang lebih sedikit tapi tetap mempertahakan karakteristik dari faktor-faktor awal tersebut. Hal ini dilakukan agar lebih mudah untuk menginterpretasikan data tersebut. Selain itu, penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020.
1.2 Rumusan Masalah
Apa faktor-faktor yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020?
1.3 Tujuan Penelitian
Untuk mengetahui faktor-faktor yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020.
2 TINJAUAN PUSTAKA
2.1 Principle Component Analysis (PCA)
Principle Component Analysis (PCA) atau Analisis Komponen Utama (AKU) merupakan analisis peubah ganda yang mengubah sejumlah variabel awal menjadi beberapa variabel baru yang tidak terkorelasi satu sama lain dan keragaman total dari variabel awal tetap dipertahankan (Nugroho, 2008). Sifat komponen utamanya yaitu komponen utama yang dihasilkan saling bebas. Kemudian, pada komponen pertama cenderung terkumpul sebagian besar keragaman dan pada komponen utama terakhir terkumpul sedikit keragaman dari variabel awal. Tujuan umum dari analisis ini adalah reduksi dan interpretasi (Johnson dan Wichern, 2007).
PCA (Principal Component Analysis) memiliki beberapa kegunaan sebagai berikut:
Membentuk variabel komposit untuk mengurangi jumlah variabel, membuat analisis lebih mudah diinterpretasikan.
Mengubah variabel yang saling berkorelasi menjadi variabel komposit yang independen, mengatasi masalah multikolinearitas dalam regresi berganda dengan komponen utama.
Pengelompokan objek berdasarkan karakteristik yang terkandung dalam variabel komposit.
Pengujian eksploratif untuk normalitas ganda, yang sering digunakan dalam analisis multivariat seperti MANOVA dan analisis diskriminan.
Kelebihan PCA:
Mengurangi dimensi variabel: PCA mereduksi dimensi variabel dalam dataset kompleks untuk analisis data lebih cepat dan pemahaman yang lebih baik.
Meningkatkan efisiensi: Dengan menghilangkan variabel tidak penting dan mengidentifikasi hubungan antar variabel, PCA meningkatkan efisiensi dan akurasi analisis data.
Memperdalam pemahaman pola data: PCA memperkuat pemahaman pola dalam data kompleks sehingga memungkinkan pengambilan keputusan yang lebih akurat.
Dapat digunakan untuk berbagai jenis data: PCA berlaku untuk data numerik, kategori, dan ordinal.
Kekurangan PCA:
Bergantung pada data: PCA sangat tergantung pada distribusi normal data karena dapat mempengaruhi hasil.
Interpretasi yang sulit: Hasil PCA kadang sulit diinterpretasikan karena komponen utama tidak selalu bermakna dalam konteks data asli.
Risiko kerugian informasi: PCA bisa menghilangkan banyak variasi data jika komponen utamanya tidak dapat menjelaskan sebagian besar variasi dalam data.
Sensitif terhadap skala: Normalisasi skala variabel penting untuk menghindari pengaruh buruk PCA karena sensitif terhadap skala.
Langkah-langkah untuk melakukan PCA:
Memilih variabel yang berskala numerik dan tidak mengikutsertakan variabel respon
Melakukan standarisasi data
Menentukan banyaknya komponen utama.
Terdapat beberapa cara yang dilakukan, antara lain (Rencher, 2002):
a. Nilai proporsi kumulatif Pertahankan komponen yang cukup untuk menjelaskan sebagian persentase tertentu dari variasi total, seperti 75%- 80%.
b. Nilai eigen Pertahankan komponen dengan eigenvalue yang melebihi rata-rata eigenvalue, yang dalam kasus matriks korelasi adalah 1.
c. Scree Plot Scree plot merupakan plot eigenvalue (λi) terhadap nomor komponen (i). Cari perbedaan yang besar antara eigenvalue “besar” dan eigenvalue “kecil” atau titik di mana terdapat penurunan tajam disusul penurunan yang tidak tajam.
2.2 Studi Kasus
Suatu penelitian dilakukan untuk mengetahui faktor-faktor utama yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020. Variabel-variabel yang diamati adalah:
Kepadatan Penduduk (\(X_{1}\)) : Variabel ini mengukur jumlah penduduk per unit luas wilayah (dalam kilometer persegi).
Pendapatan per Kapita (\(X_{2}\)) : Variabel ini mengukur pendapatan per individu di wilayah yang diteliti.
Rata-rata Jam Kerja (\(X_{3}\)) : Variabel ini mengukur rata-rata jam kerja bulanan.
Sekolah Dasar (\(X_{4}\)) : Variabel ini adalah persentase dari populasi yang telah menyelesaikan pendidikan tingkat sekolah dasar.
Universitas (\(X_{5}\)) : Variabel ini adalah persentase dari populasi yang telah menyelesaikan pendidikan hingga tingkat perguruan tinggi atau universitas.
Jumlah Rumah Sakit (\(X_{6}\)): Variabel ini mengukur jumlah rumah sakit umum dalam proporsi per 100.000 penduduk.
Pengeluaran Kesehatan (\(X_{7}\)): Variabel ini adalah persentase dari pengeluaran total wilayah yang diperuntukkan untuk kesehatan.
Pengeluaran Pendidikan (\(X_{8}\)): Variabel in adalah persentase dari pengeluaran total wilayah yang diperuntukkan untuk pendidikan.
Fasilitas Olahraga (\(X_{9}\)): Variabel in adalah persentase dari jumlah fasilitas olahraga per 1.000.000 penduduk.
Taman (\(X_{10}\)): Variabel in adalah persentase luas taman alami terhadap luas total lahan di wilayah tersebut.
3 DATA
Data yang digunakan pada penelitian ini berasal dari website statistik Pemerintahan Jepang yaitu dapat diakses melalui laman berikut https://www.e-stat.go.jp/en. Data yang digunakan yaitu beberapa faktor yang mempengaruhi angka harapan hidup pada 47 prefektur di Jepang.
> library(knitr)
> kable(data)| Prefektur | Kepadatan Penduduk | Pendapatan per Kapita | Rata-rata Jam Kerja | Sekolah dasar | Universitas | Jumlah Rumah Sakit | Pengeluaran Kesehatan | Pengeluaran Pendidikan | Fasilitas Olahraga | Taman |
|---|---|---|---|---|---|---|---|---|---|---|
| Aichi | 2517.7 | 3728 | 171.5 | 12.9 | 23.7 | 3.8 | 2.06 | 21.41 | 234.5 | 17.2 |
| Akita | 296.8 | 2697 | 173.0 | 19.0 | 11.9 | 5.2 | 3.24 | 17.93 | 877.2 | 10.6 |
| Aomori | 380.5 | 2507 | 174.5 | 22.0 | 11.8 | 6.2 | 3.40 | 20.98 | 554.4 | 11.8 |
| Chiba | 1778.4 | 3116 | 173.5 | 9.6 | 24.9 | 4.1 | 3.53 | 25.44 | 246.1 | 5.5 |
| Ehime | 801.2 | 2658 | 178.0 | 15.2 | 18.0 | 9.1 | 4.82 | 20.47 | 482.7 | 7.2 |
| Fukui | 711.9 | 3280 | 173.0 | 16.4 | 18.8 | 7.4 | 2.40 | 20.51 | 626.8 | 14.8 |
| Fukuoka | 1858.3 | 2885 | 172.5 | 10.4 | 20.4 | 7.7 | 2.54 | 18.82 | 260.4 | 17.7 |
| Fukushima | 433.3 | 2943 | 173.0 | 16.9 | 13.1 | 5.6 | 3.09 | 17.63 | 737.8 | 13.0 |
| Gifu | 895.1 | 2919 | 175.0 | 16.6 | 18.5 | 4.3 | 3.18 | 24.82 | 535.2 | 18.4 |
| Gunma | 854.6 | 3283 | 174.0 | 14.6 | 17.5 | 5.9 | 2.59 | 24.21 | 626.0 | 14.0 |
| Hiroshima | 1217.9 | 3109 | 174.5 | 9.6 | 23.1 | 7.4 | 3.59 | 20.43 | 387.7 | 4.5 |
| Hokkaido | 230.2 | 2742 | 174.0 | 15.8 | 14.4 | 9.2 | 2.52 | 17.74 | 743.4 | 11.2 |
| Hyogo | 1973.3 | 2968 | 173.5 | 10.7 | 24.5 | 5.7 | 2.93 | 20.43 | 211.6 | 19.8 |
| Ibaraki | 737.2 | 3327 | 173.5 | 14.5 | 18.2 | 5.3 | 3.06 | 26.37 | 425.0 | 14.9 |
| Ishikawa | 812.1 | 3023 | 174.0 | 14.8 | 19.8 | 6.9 | 2.51 | 20.12 | 725.8 | 12.6 |
| Iwate | 322.7 | 2841 | 173.5 | 20.7 | 12.7 | 6.4 | 6.05 | 16.04 | 732.3 | 4.7 |
| Kagawa | 945.6 | 3013 | 175.0 | 11.9 | 20.8 | 8.1 | 4.02 | 21.53 | 487.0 | 10.9 |
| Kagoshima | 483.0 | 2509 | 175.0 | 16.9 | 14.0 | 12.4 | 3.32 | 23.49 | 625.2 | 13.6 |
| Kanagawa | 6267.5 | 3268 | 174.0 | 7.6 | 29.2 | 3.1 | 2.82 | 21.51 | 159.7 | 22.8 |
| Kochi | 595.5 | 2644 | 173.5 | 18.2 | 14.3 | 16.1 | 3.84 | 21.66 | 550.2 | 6.7 |
| Kumamoto | 632.8 | 2667 | 176.0 | 16.1 | 16.3 | 9.8 | 3.60 | 17.09 | 520.2 | 21.0 |
| Kyoto | 2189.8 | 2983 | 172.0 | 9.7 | 24.0 | 5.9 | 2.74 | 20.62 | 258.7 | 20.6 |
| Mie | 857.6 | 3121 | 176.0 | 15.4 | 18.0 | 4.6 | 3.58 | 25.42 | 365.9 | 36.1 |
| Miyagi | 722.6 | 2945 | 176.0 | 13.0 | 18.4 | 4.7 | 2.90 | 17.21 | 387.9 | 23.5 |
| Miyazaki | 570.1 | 2468 | 175.0 | 18.8 | 13.4 | 11.2 | 3.32 | 20.23 | 603.3 | 11.9 |
| Nagano | 630.4 | 3010 | 171.0 | 12.3 | 18.1 | 5.4 | 2.61 | 25.09 | 954.2 | 20.5 |
| Nagasaki | 786.8 | 2629 | 176.0 | 18.1 | 14.1 | 9.1 | 3.07 | 22.18 | 611.5 | 17.9 |
| Nara | 1551.1 | 2632 | 173.0 | 9.7 | 26.3 | 5.4 | 4.06 | 24.66 | 360.9 | 17.2 |
| Niigata | 483.8 | 2916 | 173.0 | 18.8 | 14.5 | 4.8 | 3.84 | 17.42 | 652.7 | 25.2 |
| Oita | 626.1 | 2714 | 176.0 | 12.8 | 15.9 | 11.4 | 2.58 | 21.21 | 510.9 | 27.6 |
| Okayama | 847.5 | 2769 | 175.0 | 11.4 | 20.4 | 7.7 | 2.17 | 20.93 | 441.7 | 11.3 |
| Okinawa | 1302.6 | 2391 | 174.5 | 13.0 | 15.8 | 5.2 | 4.37 | 24.61 | 348.7 | 35.7 |
| Osaka | 6624.7 | 3190 | 173.0 | 10.2 | 21.8 | 5.4 | 2.31 | 20.94 | 133.5 | 10.5 |
| Saga | 608.0 | 2753 | 177.5 | 15.5 | 15.7 | 10.6 | 2.96 | 22.49 | 604.1 | 11.0 |
| Saitama | 2821.6 | 3047 | 174.0 | 10.3 | 23.9 | 4.0 | 3.08 | 27.53 | 225.0 | 32.8 |
| Shiga | 1087.8 | 3318 | 173.0 | 11.9 | 22.4 | 3.5 | 3.68 | 27.02 | 407.4 | 37.3 |
| Shimane | 528.0 | 2667 | 173.5 | 18.2 | 15.8 | 5.7 | 3.97 | 19.81 | 843.1 | 6.0 |
| Shizuoka | 1309.4 | 3432 | 173.0 | 15.5 | 19.5 | 3.9 | 4.17 | 21.17 | 373.1 | 10.8 |
| Tochigi | 643.3 | 3479 | 172.5 | 14.5 | 17.3 | 4.5 | 4.21 | 25.05 | 486.9 | 20.8 |
| Tokushima | 708.2 | 3092 | 172.0 | 16.4 | 19.2 | 12.8 | 5.00 | 17.41 | 498.6 | 9.3 |
| Tokyo | 9873.3 | 5415 | 171.5 | 5.6 | 31.6 | 4.2 | 3.32 | 16.76 | 155.0 | 36.4 |
| Tottori | 611.9 | 2515 | 173.0 | 13.0 | 16.6 | 7.0 | 3.61 | 19.09 | 957.3 | 14.0 |
| Toyama | 561.7 | 3398 | 173.0 | 14.2 | 19.8 | 8.4 | 3.03 | 22.56 | 652.4 | 29.6 |
| Wakayama | 821.3 | 2913 | 175.0 | 16.0 | 16.3 | 8.1 | 2.33 | 19.84 | 469.1 | 12.6 |
| Yamagata | 371.7 | 2897 | 173.0 | 16.7 | 13.7 | 5.0 | 5.47 | 19.28 | 590.7 | 16.7 |
| Yamaguchi | 782.5 | 3199 | 174.0 | 12.5 | 16.9 | 8.5 | 3.21 | 23.56 | 535.4 | 7.0 |
| Yamanashi | 849.8 | 3160 | 174.0 | 12.4 | 19.9 | 6.4 | 3.20 | 20.87 | 754.0 | 27.1 |
4 SOURCE CODE
4.1 Library
> library(rmarkdown)
> library(knitr)
> library(tinytex)
> library(prettydoc)
> library(readxl)
> library(ggcorrplot)
> library(corrplot)4.2 Struktur Data
> library(readxl)
> data <- read_excel("C:/Users/Acer/OneDrive/Documents/College/semester 5/data prak anmul pca.xlsx")
> str(data)
tibble [47 × 11] (S3: tbl_df/tbl/data.frame)
$ Prefektur : chr [1:47] "Aichi" "Akita" "Aomori" "Chiba" ...
$ Kepadatan Penduduk : num [1:47] 2518 297 380 1778 801 ...
$ Pendapatan per Kapita : num [1:47] 3728 2697 2507 3116 2658 ...
$ Rata-rata Jam Kerja : num [1:47] 172 173 174 174 178 ...
$ Sekolah dasar : num [1:47] 12.9 19 22 9.6 15.2 16.4 10.4 16.9 16.6 14.6 ...
$ Universitas : num [1:47] 23.7 11.9 11.8 24.9 18 18.8 20.4 13.1 18.5 17.5 ...
$ Jumlah Rumah Sakit : num [1:47] 3.8 5.2 6.2 4.1 9.1 7.4 7.7 5.6 4.3 5.9 ...
$ Pengeluaran Kesehatan : num [1:47] 2.06 3.24 3.4 3.53 4.82 2.4 2.54 3.09 3.18 2.59 ...
$ Pengeluaran Pendidikan: num [1:47] 21.4 17.9 21 25.4 20.5 ...
$ Fasilitas Olahraga : num [1:47] 234 877 554 246 483 ...
$ Taman : num [1:47] 17.2 10.6 11.8 5.5 7.2 14.8 17.7 13 18.4 14 ...4.3 Statistika Deskriptif
summary(data)
4.4 Eksplorasi Korelasi
library(corrplot)
data_pca <- scale(data[,-1])
head(data_pca)
cor(data_pca)
ggcorrplot(cor(data_pca))
corrplot(cor(data_pca), method = "number")
4.5 Matriks Ragam Peragam
- Dekomposisi Eigen
matriks_ragam_peragam <- cov(data_pca)
matriks_ragam_peragam
hasil_eigen <- eigen(matriks_ragam_peragam)
hasil_eigen
- Scree Plot
scree_data = data.frame(hasil_eigen$values, PC = 1:10)
scree_data
plot(hasil_eigen$values, type = 'b',
xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)',
main = 'Scree Plot')
lines(hasil_eigen$values)
- Nilai Kumulatif Eigen
for (eg in hasil_eigen$values){
print(eg / hasil_eigen$values)
}
- Persamaan PCA
hasil_eigen$vectors[,1:4]
4.6 Matriks Korelasi
- Dekomposisi Eigen
cor_eigen <- eigen(cor(data_pca))
cor_eigen
- Scree Plot
scree_data = data.frame(cor_eigen$values, PC = 1:10)
scree_data
plot(cor_eigen$values, type = 'b',
xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)',
main = 'Scree Plot')
lines(cor_eigen$values)
- Nilai Kumulatif Eigen
for (eg in cor_eigen$values){
print(eg / cor_eigen$values)
}
- Persamaan PCA
cor_eigen$vectors[,1:4]
4.7 PCA
PCA=prcomp(x = data[,-1],center = TRUE, scale. = TRUE)
PCA
print(PCA$rotation[,1:4],digits=4)
summary(PCA)
5 HASIL DAN PEMBAHASAN
5.1 Statistika Deskriptif
> summary(data)
Prefektur Kepadatan Penduduk Pendapatan per Kapita
Length:47 Min. : 230.2 Min. :2391
Class :character 1st Qu.: 601.8 1st Qu.:2706
Mode :character Median : 786.8 Median :2945
Mean :1351.4 Mean :3004
3rd Qu.:1260.2 3rd Qu.:3175
Max. :9873.3 Max. :5415
Rata-rata Jam Kerja Sekolah dasar Universitas Jumlah Rumah Sakit
Min. :171.0 Min. : 5.60 Min. :11.80 Min. : 3.100
1st Qu.:173.0 1st Qu.:11.90 1st Qu.:15.75 1st Qu.: 4.900
Median :173.5 Median :14.50 Median :18.10 Median : 5.900
Mean :173.9 Mean :14.18 Mean :18.62 Mean : 6.874
3rd Qu.:175.0 3rd Qu.:16.50 3rd Qu.:20.60 3rd Qu.: 8.250
Max. :178.0 Max. :22.00 Max. :31.60 Max. :16.100
Pengeluaran Kesehatan Pengeluaran Pendidikan Fasilitas Olahraga
Min. :2.06 Min. :16.04 Min. :133.5
1st Qu.:2.78 1st Qu.:19.55 1st Qu.:369.5
Median :3.21 Median :20.94 Median :510.9
Mean :3.36 Mean :21.31 Mean :509.2
3rd Qu.:3.76 3rd Qu.:23.52 3rd Qu.:626.4
Max. :6.05 Max. :27.53 Max. :957.3
Taman
Min. : 4.50
1st Qu.:10.95
Median :14.80
Mean :17.07
3rd Qu.:20.90
Max. :37.30 Berdasarkan data yang digunakan diperoleh output berupa nilai minimal, kuartil 1, median, mean, kuartil 3, dan nilai maksimal dari variabel-variabel yang dianalisis.
5.2 Eksplorasi Korelasi
> library(ggcorrplot)
> library(corrplot)
> data_pca <- scale(data[,-1])
> head(data_pca)
Kepadatan Penduduk Pendapatan per Kapita Rata-rata Jam Kerja Sekolah dasar
[1,] 0.6511069 1.5476618 -1.6284462 -0.3651617
[2,] -0.5887801 -0.6557419 -0.6169444 1.3797027
[3,] -0.5420519 -1.0618008 0.3945575 2.2378327
[4,] 0.2383695 0.2397248 -0.2797771 -1.3091048
[5,] -0.3071830 -0.7390908 2.7547284 0.2927380
[6,] -0.3570375 0.5902177 -0.6169444 0.6359900
Universitas Jumlah Rumah Sakit Pengeluaran Kesehatan
[1,] 1.13877382 -1.1044910 -1.53801317
[2,] -1.50707435 -0.6015463 -0.14151333
[3,] -1.52949680 -0.2423001 0.04784258
[4,] 1.40784312 -0.9967171 0.20169426
[5,] -0.13930539 0.7995139 1.72837629
[6,] 0.04007415 0.1887953 -1.13563186
Pengeluaran Pendidikan Fasilitas Olahraga Taman
[1,] 0.03406304 -1.3170301 0.01453969
[2,] -1.15639639 1.7646369 -0.72483913
[3,] -0.11303396 0.2168508 -0.59040662
[4,] 1.41266978 -1.2614095 -1.29617731
[5,] -0.28749784 -0.1269418 -1.10573125
[6,] -0.27381440 0.5639999 -0.25432534
>
> cor(data_pca)
Kepadatan Penduduk Pendapatan per Kapita
Kepadatan Penduduk 1.00000000 0.68959682
Pendapatan per Kapita 0.68959682 1.00000000
Rata-rata Jam Kerja -0.28992428 -0.45595905
Sekolah dasar -0.65650193 -0.49742538
Universitas 0.72684478 0.62852684
Jumlah Rumah Sakit -0.34041203 -0.39785189
Pengeluaran Kesehatan -0.20777492 -0.13744263
Pengeluaran Pendidikan -0.06080255 -0.00694975
Fasilitas Olahraga -0.63332856 -0.40101768
Taman 0.30185454 0.33964625
Rata-rata Jam Kerja Sekolah dasar Universitas
Kepadatan Penduduk -0.28992428 -0.6565019 0.7268448
Pendapatan per Kapita -0.45595905 -0.4974254 0.6285268
Rata-rata Jam Kerja 1.00000000 0.2327514 -0.3073840
Sekolah dasar 0.23275143 1.0000000 -0.8856282
Universitas -0.30738402 -0.8856282 1.0000000
Jumlah Rumah Sakit 0.34888452 0.3419493 -0.4192448
Pengeluaran Kesehatan 0.01879422 0.3188503 -0.2337427
Pengeluaran Pendidikan 0.05146030 -0.2435874 0.2124695
Fasilitas Olahraga 0.02359628 0.6268015 -0.7015256
Taman -0.08058407 -0.3480133 0.3180364
Jumlah Rumah Sakit Pengeluaran Kesehatan
Kepadatan Penduduk -0.34041203 -0.20777492
Pendapatan per Kapita -0.39785189 -0.13744263
Rata-rata Jam Kerja 0.34888452 0.01879422
Sekolah dasar 0.34194930 0.31885030
Universitas -0.41924477 -0.23374274
Jumlah Rumah Sakit 1.00000000 0.04338919
Pengeluaran Kesehatan 0.04338919 1.00000000
Pengeluaran Pendidikan -0.21844915 -0.13444800
Fasilitas Olahraga 0.27824428 0.13650659
Taman -0.36640355 -0.12731714
Pengeluaran Pendidikan Fasilitas Olahraga Taman
Kepadatan Penduduk -0.06080255 -0.63332856 0.30185454
Pendapatan per Kapita -0.00694975 -0.40101768 0.33964625
Rata-rata Jam Kerja 0.05146030 0.02359628 -0.08058407
Sekolah dasar -0.24358739 0.62680151 -0.34801330
Universitas 0.21246949 -0.70152555 0.31803639
Jumlah Rumah Sakit -0.21844915 0.27824428 -0.36640355
Pengeluaran Kesehatan -0.13444800 0.13650659 -0.12731714
Pengeluaran Pendidikan 1.00000000 -0.22132864 0.28452391
Fasilitas Olahraga -0.22132864 1.00000000 -0.28204482
Taman 0.28452391 -0.28204482 1.00000000
> ggcorrplot(cor(data_pca))> corrplot(cor(data_pca), method = "number")Dari output yang telah disajikan di atas, diketahui nilai korelasi antara berbagai variabel dalam analisis. Penting untuk diingat bahwa sebuah variabel akan selalu memiliki korelasi maksimal dengan dirinya sendiri, yaitu sebesar 1. Selain itu, kita juga dapat mengamati adanya korelasi yang sangat tinggi yaitu pada variabel \(X_{4}\) dan variabel \(X_{5}\).
5.3 Matriks Ragam Peragam
- Dekomposisi Eigen
> matriks_ragam_peragam <- cov(data_pca)
> matriks_ragam_peragam
Kepadatan Penduduk Pendapatan per Kapita
Kepadatan Penduduk 1.00000000 0.68959682
Pendapatan per Kapita 0.68959682 1.00000000
Rata-rata Jam Kerja -0.28992428 -0.45595905
Sekolah dasar -0.65650193 -0.49742538
Universitas 0.72684478 0.62852684
Jumlah Rumah Sakit -0.34041203 -0.39785189
Pengeluaran Kesehatan -0.20777492 -0.13744263
Pengeluaran Pendidikan -0.06080255 -0.00694975
Fasilitas Olahraga -0.63332856 -0.40101768
Taman 0.30185454 0.33964625
Rata-rata Jam Kerja Sekolah dasar Universitas
Kepadatan Penduduk -0.28992428 -0.6565019 0.7268448
Pendapatan per Kapita -0.45595905 -0.4974254 0.6285268
Rata-rata Jam Kerja 1.00000000 0.2327514 -0.3073840
Sekolah dasar 0.23275143 1.0000000 -0.8856282
Universitas -0.30738402 -0.8856282 1.0000000
Jumlah Rumah Sakit 0.34888452 0.3419493 -0.4192448
Pengeluaran Kesehatan 0.01879422 0.3188503 -0.2337427
Pengeluaran Pendidikan 0.05146030 -0.2435874 0.2124695
Fasilitas Olahraga 0.02359628 0.6268015 -0.7015256
Taman -0.08058407 -0.3480133 0.3180364
Jumlah Rumah Sakit Pengeluaran Kesehatan
Kepadatan Penduduk -0.34041203 -0.20777492
Pendapatan per Kapita -0.39785189 -0.13744263
Rata-rata Jam Kerja 0.34888452 0.01879422
Sekolah dasar 0.34194930 0.31885030
Universitas -0.41924477 -0.23374274
Jumlah Rumah Sakit 1.00000000 0.04338919
Pengeluaran Kesehatan 0.04338919 1.00000000
Pengeluaran Pendidikan -0.21844915 -0.13444800
Fasilitas Olahraga 0.27824428 0.13650659
Taman -0.36640355 -0.12731714
Pengeluaran Pendidikan Fasilitas Olahraga Taman
Kepadatan Penduduk -0.06080255 -0.63332856 0.30185454
Pendapatan per Kapita -0.00694975 -0.40101768 0.33964625
Rata-rata Jam Kerja 0.05146030 0.02359628 -0.08058407
Sekolah dasar -0.24358739 0.62680151 -0.34801330
Universitas 0.21246949 -0.70152555 0.31803639
Jumlah Rumah Sakit -0.21844915 0.27824428 -0.36640355
Pengeluaran Kesehatan -0.13444800 0.13650659 -0.12731714
Pengeluaran Pendidikan 1.00000000 -0.22132864 0.28452391
Fasilitas Olahraga -0.22132864 1.00000000 -0.28204482
Taman 0.28452391 -0.28204482 1.00000000
>
> hasil_eigen <- eigen(matriks_ragam_peragam)
> hasil_eigen
eigen() decomposition
$values
[1] 4.28020551 1.35233536 1.14420033 0.91577656 0.73432948 0.54108078
[7] 0.40104196 0.33439023 0.21245837 0.08418141
$vectors
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0.4024030 -0.18853759 -0.25211096 0.096126226 0.16122430 -0.03090452
[2,] 0.3673640 -0.31980907 0.04837151 -0.045258141 0.17609049 0.22825540
[3,] -0.1942865 0.52552907 -0.35226272 0.329285190 0.34336135 -0.31986509
[4,] -0.4151232 -0.13337299 0.18244871 0.016851791 0.17639574 -0.08240945
[5,] 0.4428063 0.02471386 -0.14655509 0.079855088 -0.20855048 0.03765080
[6,] -0.2741053 0.06282758 -0.54142778 -0.008909622 0.03494837 0.78619024
[7,] -0.1466472 -0.27181227 0.28327801 0.856732188 -0.12672801 0.19671314
[8,] 0.1176918 0.61985671 0.39088963 -0.028889223 -0.43687520 0.28787404
[9,] -0.3563018 -0.19901306 0.26463170 -0.371017926 0.09291749 0.12269298
[10,] 0.2439717 0.25678406 0.39878591 0.032612626 0.73056014 0.28584195
[,7] [,8] [,9] [,10]
[1,] -0.20156875 0.10059277 0.806734086 0.03475802
[2,] -0.64188012 -0.30097089 -0.379476558 -0.16933209
[3,] -0.23955208 -0.41867353 -0.018877624 0.01773123
[4,] -0.47941447 0.39221122 -0.001856896 0.59559614
[5,] 0.20721968 -0.26639480 -0.175279053 0.76545202
[6,] 0.01327570 0.07711662 -0.001940986 0.04745613
[7,] 0.08597458 -0.14610287 0.070511979 -0.04370979
[8,] -0.35236573 -0.01495685 0.224001054 -0.00195148
[9,] 0.08648587 -0.67545961 0.343991271 0.14147756
[10,] 0.27926195 0.12430541 -0.024757287 0.07049991- Scree Plot
> scree_data = data.frame(hasil_eigen$values, PC = 1:10)
> scree_data
hasil_eigen.values PC
1 4.28020551 1
2 1.35233536 2
3 1.14420033 3
4 0.91577656 4
5 0.73432948 5
6 0.54108078 6
7 0.40104196 7
8 0.33439023 8
9 0.21245837 9
10 0.08418141 10
> plot(hasil_eigen$values, type = 'b', xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)', main = 'Scree Plot')
> lines(hasil_eigen$values)Berdasarkan Scree Plot di atas, banyaknya komponen utama yang dipilih adalah 4 komponen.
- Nilai Kumulatif Eigen
> for (eg in hasil_eigen$values){
+ print(eg / sum(hasil_eigen$values))
+ }
[1] 0.4280206
[1] 0.1352335
[1] 0.11442
[1] 0.09157766
[1] 0.07343295
[1] 0.05410808
[1] 0.0401042
[1] 0.03343902
[1] 0.02124584
[1] 0.008418141Berdasarkan informasi diatas, banyaknya komponen utama yang dapat diambil adalah 4 komponen utama karena telah mencapai minimal 75% varians data. Keempat komponen utama telah mampu menangkap 76,925 % dari total keragaman data.
- Persamaan PCA
> hasil_eigen$vectors[,1:4]
[,1] [,2] [,3] [,4]
[1,] 0.4024030 -0.18853759 -0.25211096 0.096126226
[2,] 0.3673640 -0.31980907 0.04837151 -0.045258141
[3,] -0.1942865 0.52552907 -0.35226272 0.329285190
[4,] -0.4151232 -0.13337299 0.18244871 0.016851791
[5,] 0.4428063 0.02471386 -0.14655509 0.079855088
[6,] -0.2741053 0.06282758 -0.54142778 -0.008909622
[7,] -0.1466472 -0.27181227 0.28327801 0.856732188
[8,] 0.1176918 0.61985671 0.39088963 -0.028889223
[9,] -0.3563018 -0.19901306 0.26463170 -0.371017926
[10,] 0.2439717 0.25678406 0.39878591 0.032612626Persamaan yang terbentuk yaitu:
Komponen Utama 1: \(KU_{1} = 0.4024030X_{1} +0.3673640X_{2} -0.1942865X_{3} -0.4151232X_{4} +0.4428063X_{5} -0.2741053X_{6} -0.1466472X_{7} +0.1176918X_{8} -0.3563018X_{9} +0.2439717X_{10}\)
Komponen Utama 2: \(KU_{2} = -0.1885376X_{1} -0.3198091X_{2} +0.5255291X_{3} -0.1333730X_{4} +0.0247139X_{5} +0.0628276X_{6} -0.2718123X_{7} +0.6198567X_{8} -0.1990131X_{9} +0.2567841X_{10}\)
Komponen Utama 3: \(KU_{3} = -0.25211096X_{1} +0.04837151X_{2} -0.35226272X_{3} +0.18244871X_{4} -0.14655509X_{5} -0.54142778X_{6} +0.28327801X_{7} +0.39088963X_{8} +0.26463170X_{9} +0.39878591X_{10}\)
Komponen Utama 4: \(KU_{4} = 0.0961262X_{1} -0.0452581X_{2} +0.3292852X_{3} +0.0168518X_{4} +0.0798551X_{5} -0.0089096X_{6} +0.8567322X_{7} -0.0288892X_{8} -0.3710179X_{9} +0.0326126X_{10}\)
5.4 Matriks Korelasi
- Dekomposisi Eigen
> cor_eigen <- eigen(cor(data_pca))
> cor_eigen
eigen() decomposition
$values
[1] 4.28020551 1.35233536 1.14420033 0.91577656 0.73432948 0.54108078
[7] 0.40104196 0.33439023 0.21245837 0.08418141
$vectors
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.4024030 -0.18853759 -0.25211096 -0.096126226 0.16122430 -0.03090452
[2,] -0.3673640 -0.31980907 0.04837151 0.045258141 0.17609049 0.22825540
[3,] 0.1942865 0.52552907 -0.35226272 -0.329285190 0.34336135 -0.31986509
[4,] 0.4151232 -0.13337299 0.18244871 -0.016851791 0.17639574 -0.08240945
[5,] -0.4428063 0.02471386 -0.14655509 -0.079855088 -0.20855048 0.03765080
[6,] 0.2741053 0.06282758 -0.54142778 0.008909622 0.03494837 0.78619024
[7,] 0.1466472 -0.27181227 0.28327801 -0.856732188 -0.12672801 0.19671314
[8,] -0.1176918 0.61985671 0.39088963 0.028889223 -0.43687520 0.28787404
[9,] 0.3563018 -0.19901306 0.26463170 0.371017926 0.09291749 0.12269298
[10,] -0.2439717 0.25678406 0.39878591 -0.032612626 0.73056014 0.28584195
[,7] [,8] [,9] [,10]
[1,] -0.20156875 0.10059277 0.806734086 0.03475802
[2,] -0.64188012 -0.30097089 -0.379476558 -0.16933209
[3,] -0.23955208 -0.41867353 -0.018877624 0.01773123
[4,] -0.47941447 0.39221122 -0.001856896 0.59559614
[5,] 0.20721968 -0.26639480 -0.175279053 0.76545202
[6,] 0.01327570 0.07711662 -0.001940986 0.04745613
[7,] 0.08597458 -0.14610287 0.070511979 -0.04370979
[8,] -0.35236573 -0.01495685 0.224001054 -0.00195148
[9,] 0.08648587 -0.67545961 0.343991271 0.14147756
[10,] 0.27926195 0.12430541 -0.024757287 0.07049991- Scree Plot
> scree_data = data.frame(cor_eigen$values, PC = 1:10)
> scree_data
cor_eigen.values PC
1 4.28020551 1
2 1.35233536 2
3 1.14420033 3
4 0.91577656 4
5 0.73432948 5
6 0.54108078 6
7 0.40104196 7
8 0.33439023 8
9 0.21245837 9
10 0.08418141 10
> plot(cor_eigen$values, type = 'b', xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)', main = 'Scree Plot')
> lines(cor_eigen$values)Berdasarkan Scree Plot di atas, banyaknya komponen utama yang dipilih adalah 4 komponen.
- Nilai Kumulatif Eigen
> for (eg in cor_eigen$values){
+ print(eg / sum(cor_eigen$values))
+ }
[1] 0.4280206
[1] 0.1352335
[1] 0.11442
[1] 0.09157766
[1] 0.07343295
[1] 0.05410808
[1] 0.0401042
[1] 0.03343902
[1] 0.02124584
[1] 0.008418141Berdasarkan informasi diatas, banyaknya komponen utama yang dapat diambil adalah 4 komponen utama karena telah mencapai minimal 75% varians data. Keempat komponen utama telah mampu menangkap 76,925 % dari total keragaman data.
- Persamaan PCA
> cor_eigen$vectors[,1:4]
[,1] [,2] [,3] [,4]
[1,] -0.4024030 -0.18853759 -0.25211096 -0.096126226
[2,] -0.3673640 -0.31980907 0.04837151 0.045258141
[3,] 0.1942865 0.52552907 -0.35226272 -0.329285190
[4,] 0.4151232 -0.13337299 0.18244871 -0.016851791
[5,] -0.4428063 0.02471386 -0.14655509 -0.079855088
[6,] 0.2741053 0.06282758 -0.54142778 0.008909622
[7,] 0.1466472 -0.27181227 0.28327801 -0.856732188
[8,] -0.1176918 0.61985671 0.39088963 0.028889223
[9,] 0.3563018 -0.19901306 0.26463170 0.371017926
[10,] -0.2439717 0.25678406 0.39878591 -0.032612626Persamaan yang terbentuk yaitu:
Komponen Utama 1: \(KU_{1} = -0.4024030X_{1} - 0.3673640X_{2} + 0.1942865X_{3} + 0.4151232X_{4} - 0.4428063X_{5}+ 0.2741053X_{6} + 0.1466472X_{7} - 0.1176918X_{8} + 0.3563018X_{9} - 0.2439717X_{10}\)
Komponen Utama 2 (\(PC_{2}\)): \(KU_{2} = -0.1885376X_{1} - 0.3198091X_{2} + 0.5255291X_{3} - 0.1333730X_{4} + 0.0247139X_{5} + 0.0628276X_{6} - 0.2718123X_{7} + 0.6198567X_{8} - 0.1990131X_{9} + 0.2567841X_{10}\)
Komponen Utama 3 (\(PC_{3}\)): \(KU_{3} = -0.25211096X_{1} + 0.04837151X_{2} - 0.35226272X_{3} + 0.18244871X_{4} - 0.14655509X_{5} - 0.54142778X_{6} + 0.28327801X_{7} + 0.39088963X_{8} + 0.26463170X_{9} + 0.39878591X_{10}\)
Komponen Utama 4 (\(PC_{4}\)): \(KU_{4} = -0.0961262X_{1} + 0.0452581X_{2} - 0.3292852X_{3} - 0.0168518X_{4} - 0.0798551X_{5} + 0.0089096X_{6} - 0.8567322X_{7} + 0.0288892X_{8} + 0.3710179X_{9} - 0.0326126X_{10}\)
5.5 PCA
> PCA=prcomp(x = data[,-1],center = TRUE, scale. = TRUE)
> PCA
Standard deviations (1, .., p=10):
[1] 2.0688658 1.1628996 1.0696730 0.9569622 0.8569303 0.7355819 0.6332787
[8] 0.5782648 0.4609321 0.2901403
Rotation (n x k) = (10 x 10):
PC1 PC2 PC3 PC4
Kepadatan Penduduk -0.4024030 0.18853759 -0.25211096 0.096126226
Pendapatan per Kapita -0.3673640 0.31980907 0.04837151 -0.045258141
Rata-rata Jam Kerja 0.1942865 -0.52552907 -0.35226272 0.329285190
Sekolah dasar 0.4151232 0.13337299 0.18244871 0.016851791
Universitas -0.4428063 -0.02471386 -0.14655509 0.079855088
Jumlah Rumah Sakit 0.2741053 -0.06282758 -0.54142778 -0.008909622
Pengeluaran Kesehatan 0.1466472 0.27181227 0.28327801 0.856732188
Pengeluaran Pendidikan -0.1176918 -0.61985671 0.39088963 -0.028889223
Fasilitas Olahraga 0.3563018 0.19901306 0.26463170 -0.371017926
Taman -0.2439717 -0.25678406 0.39878591 0.032612626
PC5 PC6 PC7 PC8
Kepadatan Penduduk 0.16122430 -0.03090452 -0.20156875 -0.10059277
Pendapatan per Kapita 0.17609049 0.22825540 -0.64188012 0.30097089
Rata-rata Jam Kerja 0.34336135 -0.31986509 -0.23955208 0.41867353
Sekolah dasar 0.17639574 -0.08240945 -0.47941447 -0.39221122
Universitas -0.20855048 0.03765080 0.20721968 0.26639480
Jumlah Rumah Sakit 0.03494837 0.78619024 0.01327570 -0.07711662
Pengeluaran Kesehatan -0.12672801 0.19671314 0.08597458 0.14610287
Pengeluaran Pendidikan -0.43687520 0.28787404 -0.35236573 0.01495685
Fasilitas Olahraga 0.09291749 0.12269298 0.08648587 0.67545961
Taman 0.73056014 0.28584195 0.27926195 -0.12430541
PC9 PC10
Kepadatan Penduduk -0.806734086 0.03475802
Pendapatan per Kapita 0.379476558 -0.16933209
Rata-rata Jam Kerja 0.018877624 0.01773123
Sekolah dasar 0.001856896 0.59559614
Universitas 0.175279053 0.76545202
Jumlah Rumah Sakit 0.001940986 0.04745613
Pengeluaran Kesehatan -0.070511979 -0.04370979
Pengeluaran Pendidikan -0.224001054 -0.00195148
Fasilitas Olahraga -0.343991271 0.14147756
Taman 0.024757287 0.07049991
>
> print(PCA$rotation[,1:4],digits=4)
PC1 PC2 PC3 PC4
Kepadatan Penduduk -0.4024 0.18854 -0.25211 0.09613
Pendapatan per Kapita -0.3674 0.31981 0.04837 -0.04526
Rata-rata Jam Kerja 0.1943 -0.52553 -0.35226 0.32929
Sekolah dasar 0.4151 0.13337 0.18245 0.01685
Universitas -0.4428 -0.02471 -0.14656 0.07986
Jumlah Rumah Sakit 0.2741 -0.06283 -0.54143 -0.00891
Pengeluaran Kesehatan 0.1466 0.27181 0.28328 0.85673
Pengeluaran Pendidikan -0.1177 -0.61986 0.39089 -0.02889
Fasilitas Olahraga 0.3563 0.19901 0.26463 -0.37102
Taman -0.2440 -0.25678 0.39879 0.03261
> summary(PCA)
Importance of components:
PC1 PC2 PC3 PC4 PC5 PC6 PC7
Standard deviation 2.069 1.1629 1.0697 0.95696 0.85693 0.73558 0.6333
Proportion of Variance 0.428 0.1352 0.1144 0.09158 0.07343 0.05411 0.0401
Cumulative Proportion 0.428 0.5633 0.6777 0.76925 0.84268 0.89679 0.9369
PC8 PC9 PC10
Standard deviation 0.57826 0.46093 0.29014
Proportion of Variance 0.03344 0.02125 0.00842
Cumulative Proportion 0.97034 0.99158 1.00000Persamaan yang terbentuk yaitu:
Komponen Utama 1: \(KU_{1} = -0.4024X_{1} - 0.3674X_{2} + 0.1943X_{3} + 0.4151X_{4} - 0.4428X_{5} + 0.2741X_{6} + 0.1466X_{7} - 0.1177X_{8} + 0.3563X_{9} - 0.2440X_{10}\)
Komponen Utama 2: \(KU_{2} = 0.18854X_{1} + 0.31981X_{2} - 0.52553X_{3} + 0.13337X_{4} - 0.02471X_{5} - 0.06283X_{6} + 0.27181X_{7} - 0.61986X_{8} + 0.19901X_{9} - 0.25678X_{10}\)
Komponen Utama 3: \(KU_{3} = -0.25211X_{1} + 0.04837X_{2} - 0.35226X_{3} + 0.18245X_{4} - 0.14656X_{5} - 0.54143X_{6} + 0.28328X_{7} + 0.39089X_{8} + 0.26463X_{9} + 0.39879X_{10}\)
Komponen Utama 4: \(KU_{4} = 0.09613X_{1} - 0.04526X_{2} + 0.32929X_{3} + 0.01685X_{4} + 0.07986X_{5} - 0.00891X_{6} + 0.85673X_{7} - 0.02889X_{8} - 0.37102X_{9} + 0.03261X_{10}\)
6 KESIMPULAN
Dari persamaan yang terbentuk, dapat ditarik kesimpulan sebagai berikut:
\(PC_{1}\) berkorelasi dengan variabel Kepadatan Penduduk(\(X_{1}\)),Pendapatan per Kapita(\(X_{2}\)), Sekolah Dasar(\(X_{4}\)), dan Universitas(\(X_{5}\)). Ketika \(PC_{1}\) meningkat, hal ini mengindikasikan bahwa Sekolah Dasar meningkat sementara Kepadatan Penduduk, Pendapatan per Kapita, dan Universitas menurun. Faktor yang terbentuk dalam \(PC_{1}\) adalah “Faktor Kualitas Hidup.”
\(PC_{2}\) memiliki korelasi dengan variabel Rata-rata Jam Kerja(\(X_{3}\)) dan Pengeluaran Pendidikan(\(X_{8}\)). Kenaikan nilai \(PC_{2}\) menunjukkan penurunan dalam Rata-rata Jam Kerja dan Pengeluaran Pendidikan. Faktor yang terbentuk dalam \(PC_{2}\) adalah “Faktor Tenaga Kerja dan Pendidikan.”
\(PC_{3}\) berhubungan dengan variabel Jumlah Rumah Sakit(\(X_{6}\)) dan Taman(\(X_{10}\)). Ketika \(PC_{3}\) meningkat, ini menggambarkan bahwa Jumlah Rumah Sakit menurun sementara Taman meningkat. Faktor yang terbentuk dalam \(PC_{3}\) adalah “Faktor Layanan Kesehatan dan Rekreasi.”
\(PC_{4}\) berhubungan dengan variabel Pengeluaran Kesehatan (\(X_{7}\)) dan Fasilitas Olahraga(\(X_{9}\)). Peningkatan nilai \(PC_{4}\) mengindikasikan peningkatan dalam Pengeluaran Kesehatan dan penurunan dalam Fasilitas Olahraga. Faktor yang terbentuk dalam \(PC_{4}\) adalah “Faktor Kesehatan dan Olahraga.”
Komponen utama (PC) tersebut menggambarkan faktor-faktor yang paling berpengaruh terhadap angka harapan hidup di Jepang Tahun 2020.
7 DAFTAR PUSTAKA
Johnson, R.A. dan Wichern, D.W., (2007). Applied Multivariate Statistical Analysis Sixth Edition. Pearson Education, Inc.
Nugroho, Sigit. (2008). Statistika Multivariat Terapan. UNIB Press.
Rencher, A.C. (2002). Methods of Multivariate Analysis Second Edition. A John Wiley & Sons, Inc. Publication.
World Health Organization. (2020). https://www.who.int/data/gho/data/indicators/indicator-details/GHO/life-expectancy-at-birth-(years (tanggal akses: 21 Oktober 2023)
https://www.e-stat.go.jp/en (tanggal akses: 21 Oktober 2023)