Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Angka harapan hidup adalah topik penting dalam studi kesehatan masyarakat dan pembangunan sosial. Angka harapan hidup mencerminkan rata-rata usia yang diharapkan penduduk suatu negara atau wilayah, dan merupakan indikator penting kesejahteraan masyarakat. Jepang merupakan salah satu negara dengan harapan hidup tertinggi di dunia, dengan perkiraan harapan hidup pada saat kelahiran mencapai 84,26 tahun (World Health Organization, 2020). Keistimewaan harapan hidup penduduk Jepang, terutama perempuan Jepang, sangat mencolok, menduduki peringkat pertama di seluruh dunia dengan harapan hidup sekitar 86,94 tahun, sedangkan pria Jepang menduduki peringkat kedua dengan harapan hidup sekitar 81,49 tahun. Tingginya harapan hidup dapat capai karena berbagai faktor yang melibatkan sistem sosial, ekonomi, pendidikan dan kesehatan di suatu wilayah.

Terdapat banyak faktor yang dapat mempengaruhi angka harapan hidup di Jepang. Faktor yang banyak ini dapat menyulitkan dalam penggambaran dan interpretasi angka harapan hidup di Jepang. Oleh karena itu dilakukan penelitian untuk mereduksi sejumlah faktor yang memengaruhi angka harapan hidup di Jepang, menjadi beberapa variabel baru yang lebih sedikit tapi tetap mempertahakan karakteristik dari faktor-faktor awal tersebut. Hal ini dilakukan agar lebih mudah untuk menginterpretasikan data tersebut. Selain itu, penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020.

1.2 Rumusan Masalah

Apa faktor-faktor yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020?

1.3 Tujuan Penelitian

Untuk mengetahui faktor-faktor yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020.

2 TINJAUAN PUSTAKA

2.1 Principle Component Analysis (PCA)

Principle Component Analysis (PCA) atau Analisis Komponen Utama (AKU) merupakan analisis peubah ganda yang mengubah sejumlah variabel awal menjadi beberapa variabel baru yang tidak terkorelasi satu sama lain dan keragaman total dari variabel awal tetap dipertahankan (Nugroho, 2008). Sifat komponen utamanya yaitu komponen utama yang dihasilkan saling bebas. Kemudian, pada komponen pertama cenderung terkumpul sebagian besar keragaman dan pada komponen utama terakhir terkumpul sedikit keragaman dari variabel awal. Tujuan umum dari analisis ini adalah reduksi dan interpretasi (Johnson dan Wichern, 2007).

PCA (Principal Component Analysis) memiliki beberapa kegunaan sebagai berikut:

  1. Membentuk variabel komposit untuk mengurangi jumlah variabel, membuat analisis lebih mudah diinterpretasikan.

  2. Mengubah variabel yang saling berkorelasi menjadi variabel komposit yang independen, mengatasi masalah multikolinearitas dalam regresi berganda dengan komponen utama.

  3. Pengelompokan objek berdasarkan karakteristik yang terkandung dalam variabel komposit.

  4. Pengujian eksploratif untuk normalitas ganda, yang sering digunakan dalam analisis multivariat seperti MANOVA dan analisis diskriminan.

Kelebihan PCA:

  1. Mengurangi dimensi variabel: PCA mereduksi dimensi variabel dalam dataset kompleks untuk analisis data lebih cepat dan pemahaman yang lebih baik.

  2. Meningkatkan efisiensi: Dengan menghilangkan variabel tidak penting dan mengidentifikasi hubungan antar variabel, PCA meningkatkan efisiensi dan akurasi analisis data.

  3. Memperdalam pemahaman pola data: PCA memperkuat pemahaman pola dalam data kompleks sehingga memungkinkan pengambilan keputusan yang lebih akurat.

  4. Dapat digunakan untuk berbagai jenis data: PCA berlaku untuk data numerik, kategori, dan ordinal.

Kekurangan PCA:

  1. Bergantung pada data: PCA sangat tergantung pada distribusi normal data karena dapat mempengaruhi hasil.

  2. Interpretasi yang sulit: Hasil PCA kadang sulit diinterpretasikan karena komponen utama tidak selalu bermakna dalam konteks data asli.

  3. Risiko kerugian informasi: PCA bisa menghilangkan banyak variasi data jika komponen utamanya tidak dapat menjelaskan sebagian besar variasi dalam data.

  4. Sensitif terhadap skala: Normalisasi skala variabel penting untuk menghindari pengaruh buruk PCA karena sensitif terhadap skala.

Langkah-langkah untuk melakukan PCA:

  1. Memilih variabel yang berskala numerik dan tidak mengikutsertakan variabel respon

  2. Melakukan standarisasi data

  3. Menentukan banyaknya komponen utama.

    Terdapat beberapa cara yang dilakukan, antara lain (Rencher, 2002):

    a. Nilai proporsi kumulatif Pertahankan komponen yang cukup untuk menjelaskan sebagian persentase tertentu dari variasi total, seperti 75%- 80%.

    b. Nilai eigen Pertahankan komponen dengan eigenvalue yang melebihi rata-rata eigenvalue, yang dalam kasus matriks korelasi adalah 1.

    c. Scree Plot Scree plot merupakan plot eigenvalue (λi) terhadap nomor komponen (i). Cari perbedaan yang besar antara eigenvalue “besar” dan eigenvalue “kecil” atau titik di mana terdapat penurunan tajam disusul penurunan yang tidak tajam.

2.2 Studi Kasus

Suatu penelitian dilakukan untuk mengetahui faktor-faktor utama yang paling berpengaruh pada angka harapan hidup di Jepang pada tahun 2020. Variabel-variabel yang diamati adalah:

  • Kepadatan Penduduk (\(X_{1}\)) : Variabel ini mengukur jumlah penduduk per unit luas wilayah (dalam kilometer persegi).

  • Pendapatan per Kapita (\(X_{2}\)) : Variabel ini mengukur pendapatan per individu di wilayah yang diteliti.

  • Rata-rata Jam Kerja (\(X_{3}\)) : Variabel ini mengukur rata-rata jam kerja bulanan.

  • Sekolah Dasar (\(X_{4}\)) : Variabel ini adalah persentase dari populasi yang telah menyelesaikan pendidikan tingkat sekolah dasar.

  • Universitas (\(X_{5}\)) : Variabel ini adalah persentase dari populasi yang telah menyelesaikan pendidikan hingga tingkat perguruan tinggi atau universitas.

  • Jumlah Rumah Sakit (\(X_{6}\)): Variabel ini mengukur jumlah rumah sakit umum dalam proporsi per 100.000 penduduk.

  • Pengeluaran Kesehatan (\(X_{7}\)): Variabel ini adalah persentase dari pengeluaran total wilayah yang diperuntukkan untuk kesehatan.

  • Pengeluaran Pendidikan (\(X_{8}\)): Variabel in adalah persentase dari pengeluaran total wilayah yang diperuntukkan untuk pendidikan.

  • Fasilitas Olahraga (\(X_{9}\)): Variabel in adalah persentase dari jumlah fasilitas olahraga per 1.000.000 penduduk.

  • Taman (\(X_{10}\)): Variabel in adalah persentase luas taman alami terhadap luas total lahan di wilayah tersebut.

3 DATA

Data yang digunakan pada penelitian ini berasal dari website statistik Pemerintahan Jepang yaitu dapat diakses melalui laman berikut https://www.e-stat.go.jp/en. Data yang digunakan yaitu beberapa faktor yang mempengaruhi angka harapan hidup pada 47 prefektur di Jepang.

> library(knitr)
> kable(data)
Prefektur Kepadatan Penduduk Pendapatan per Kapita Rata-rata Jam Kerja Sekolah dasar Universitas Jumlah Rumah Sakit Pengeluaran Kesehatan Pengeluaran Pendidikan Fasilitas Olahraga Taman
Aichi 2517.7 3728 171.5 12.9 23.7 3.8 2.06 21.41 234.5 17.2
Akita 296.8 2697 173.0 19.0 11.9 5.2 3.24 17.93 877.2 10.6
Aomori 380.5 2507 174.5 22.0 11.8 6.2 3.40 20.98 554.4 11.8
Chiba 1778.4 3116 173.5 9.6 24.9 4.1 3.53 25.44 246.1 5.5
Ehime 801.2 2658 178.0 15.2 18.0 9.1 4.82 20.47 482.7 7.2
Fukui 711.9 3280 173.0 16.4 18.8 7.4 2.40 20.51 626.8 14.8
Fukuoka 1858.3 2885 172.5 10.4 20.4 7.7 2.54 18.82 260.4 17.7
Fukushima 433.3 2943 173.0 16.9 13.1 5.6 3.09 17.63 737.8 13.0
Gifu 895.1 2919 175.0 16.6 18.5 4.3 3.18 24.82 535.2 18.4
Gunma 854.6 3283 174.0 14.6 17.5 5.9 2.59 24.21 626.0 14.0
Hiroshima 1217.9 3109 174.5 9.6 23.1 7.4 3.59 20.43 387.7 4.5
Hokkaido 230.2 2742 174.0 15.8 14.4 9.2 2.52 17.74 743.4 11.2
Hyogo 1973.3 2968 173.5 10.7 24.5 5.7 2.93 20.43 211.6 19.8
Ibaraki 737.2 3327 173.5 14.5 18.2 5.3 3.06 26.37 425.0 14.9
Ishikawa 812.1 3023 174.0 14.8 19.8 6.9 2.51 20.12 725.8 12.6
Iwate 322.7 2841 173.5 20.7 12.7 6.4 6.05 16.04 732.3 4.7
Kagawa 945.6 3013 175.0 11.9 20.8 8.1 4.02 21.53 487.0 10.9
Kagoshima 483.0 2509 175.0 16.9 14.0 12.4 3.32 23.49 625.2 13.6
Kanagawa 6267.5 3268 174.0 7.6 29.2 3.1 2.82 21.51 159.7 22.8
Kochi 595.5 2644 173.5 18.2 14.3 16.1 3.84 21.66 550.2 6.7
Kumamoto 632.8 2667 176.0 16.1 16.3 9.8 3.60 17.09 520.2 21.0
Kyoto 2189.8 2983 172.0 9.7 24.0 5.9 2.74 20.62 258.7 20.6
Mie 857.6 3121 176.0 15.4 18.0 4.6 3.58 25.42 365.9 36.1
Miyagi 722.6 2945 176.0 13.0 18.4 4.7 2.90 17.21 387.9 23.5
Miyazaki 570.1 2468 175.0 18.8 13.4 11.2 3.32 20.23 603.3 11.9
Nagano 630.4 3010 171.0 12.3 18.1 5.4 2.61 25.09 954.2 20.5
Nagasaki 786.8 2629 176.0 18.1 14.1 9.1 3.07 22.18 611.5 17.9
Nara 1551.1 2632 173.0 9.7 26.3 5.4 4.06 24.66 360.9 17.2
Niigata 483.8 2916 173.0 18.8 14.5 4.8 3.84 17.42 652.7 25.2
Oita 626.1 2714 176.0 12.8 15.9 11.4 2.58 21.21 510.9 27.6
Okayama 847.5 2769 175.0 11.4 20.4 7.7 2.17 20.93 441.7 11.3
Okinawa 1302.6 2391 174.5 13.0 15.8 5.2 4.37 24.61 348.7 35.7
Osaka 6624.7 3190 173.0 10.2 21.8 5.4 2.31 20.94 133.5 10.5
Saga 608.0 2753 177.5 15.5 15.7 10.6 2.96 22.49 604.1 11.0
Saitama 2821.6 3047 174.0 10.3 23.9 4.0 3.08 27.53 225.0 32.8
Shiga 1087.8 3318 173.0 11.9 22.4 3.5 3.68 27.02 407.4 37.3
Shimane 528.0 2667 173.5 18.2 15.8 5.7 3.97 19.81 843.1 6.0
Shizuoka 1309.4 3432 173.0 15.5 19.5 3.9 4.17 21.17 373.1 10.8
Tochigi 643.3 3479 172.5 14.5 17.3 4.5 4.21 25.05 486.9 20.8
Tokushima 708.2 3092 172.0 16.4 19.2 12.8 5.00 17.41 498.6 9.3
Tokyo 9873.3 5415 171.5 5.6 31.6 4.2 3.32 16.76 155.0 36.4
Tottori 611.9 2515 173.0 13.0 16.6 7.0 3.61 19.09 957.3 14.0
Toyama 561.7 3398 173.0 14.2 19.8 8.4 3.03 22.56 652.4 29.6
Wakayama 821.3 2913 175.0 16.0 16.3 8.1 2.33 19.84 469.1 12.6
Yamagata 371.7 2897 173.0 16.7 13.7 5.0 5.47 19.28 590.7 16.7
Yamaguchi 782.5 3199 174.0 12.5 16.9 8.5 3.21 23.56 535.4 7.0
Yamanashi 849.8 3160 174.0 12.4 19.9 6.4 3.20 20.87 754.0 27.1

4 SOURCE CODE

4.1 Library

> library(rmarkdown)
> library(knitr)
> library(tinytex)
> library(prettydoc)
> library(readxl)
> library(ggcorrplot)
> library(corrplot)

4.2 Struktur Data

> library(readxl)
> data <- read_excel("C:/Users/Acer/OneDrive/Documents/College/semester 5/data prak anmul pca.xlsx")
> str(data)
tibble [47 × 11] (S3: tbl_df/tbl/data.frame)
 $ Prefektur             : chr [1:47] "Aichi" "Akita" "Aomori" "Chiba" ...
 $ Kepadatan Penduduk    : num [1:47] 2518 297 380 1778 801 ...
 $ Pendapatan per Kapita : num [1:47] 3728 2697 2507 3116 2658 ...
 $ Rata-rata Jam Kerja   : num [1:47] 172 173 174 174 178 ...
 $ Sekolah dasar         : num [1:47] 12.9 19 22 9.6 15.2 16.4 10.4 16.9 16.6 14.6 ...
 $ Universitas           : num [1:47] 23.7 11.9 11.8 24.9 18 18.8 20.4 13.1 18.5 17.5 ...
 $ Jumlah Rumah Sakit    : num [1:47] 3.8 5.2 6.2 4.1 9.1 7.4 7.7 5.6 4.3 5.9 ...
 $ Pengeluaran Kesehatan : num [1:47] 2.06 3.24 3.4 3.53 4.82 2.4 2.54 3.09 3.18 2.59 ...
 $ Pengeluaran Pendidikan: num [1:47] 21.4 17.9 21 25.4 20.5 ...
 $ Fasilitas Olahraga    : num [1:47] 234 877 554 246 483 ...
 $ Taman                 : num [1:47] 17.2 10.6 11.8 5.5 7.2 14.8 17.7 13 18.4 14 ...

4.3 Statistika Deskriptif

summary(data)

4.4 Eksplorasi Korelasi

library(corrplot)
data_pca <- scale(data[,-1])
head(data_pca)

cor(data_pca)
ggcorrplot(cor(data_pca))
corrplot(cor(data_pca), method = "number")

4.5 Matriks Ragam Peragam

  • Dekomposisi Eigen
matriks_ragam_peragam <- cov(data_pca)
matriks_ragam_peragam

hasil_eigen <- eigen(matriks_ragam_peragam)
hasil_eigen
  • Scree Plot
scree_data = data.frame(hasil_eigen$values, PC = 1:10)
scree_data
plot(hasil_eigen$values, type = 'b',
     xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)', 
     main = 'Scree Plot')
lines(hasil_eigen$values)
  • Nilai Kumulatif Eigen
for (eg in hasil_eigen$values){
  print(eg / hasil_eigen$values)
}
  • Persamaan PCA
hasil_eigen$vectors[,1:4]

4.6 Matriks Korelasi

  • Dekomposisi Eigen
cor_eigen <- eigen(cor(data_pca))
cor_eigen
  • Scree Plot
scree_data = data.frame(cor_eigen$values, PC = 1:10)
scree_data
plot(cor_eigen$values, type = 'b',
     xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)', 
     main = 'Scree Plot')
lines(cor_eigen$values)
  • Nilai Kumulatif Eigen
for (eg in cor_eigen$values){
  print(eg / cor_eigen$values)
}
  • Persamaan PCA
cor_eigen$vectors[,1:4]

4.7 PCA

PCA=prcomp(x = data[,-1],center = TRUE, scale. = TRUE)
PCA

print(PCA$rotation[,1:4],digits=4)
summary(PCA)

5 HASIL DAN PEMBAHASAN

5.1 Statistika Deskriptif

> summary(data)
  Prefektur         Kepadatan Penduduk Pendapatan per Kapita
 Length:47          Min.   : 230.2     Min.   :2391         
 Class :character   1st Qu.: 601.8     1st Qu.:2706         
 Mode  :character   Median : 786.8     Median :2945         
                    Mean   :1351.4     Mean   :3004         
                    3rd Qu.:1260.2     3rd Qu.:3175         
                    Max.   :9873.3     Max.   :5415         
 Rata-rata Jam Kerja Sekolah dasar    Universitas    Jumlah Rumah Sakit
 Min.   :171.0       Min.   : 5.60   Min.   :11.80   Min.   : 3.100    
 1st Qu.:173.0       1st Qu.:11.90   1st Qu.:15.75   1st Qu.: 4.900    
 Median :173.5       Median :14.50   Median :18.10   Median : 5.900    
 Mean   :173.9       Mean   :14.18   Mean   :18.62   Mean   : 6.874    
 3rd Qu.:175.0       3rd Qu.:16.50   3rd Qu.:20.60   3rd Qu.: 8.250    
 Max.   :178.0       Max.   :22.00   Max.   :31.60   Max.   :16.100    
 Pengeluaran Kesehatan Pengeluaran Pendidikan Fasilitas Olahraga
 Min.   :2.06          Min.   :16.04          Min.   :133.5     
 1st Qu.:2.78          1st Qu.:19.55          1st Qu.:369.5     
 Median :3.21          Median :20.94          Median :510.9     
 Mean   :3.36          Mean   :21.31          Mean   :509.2     
 3rd Qu.:3.76          3rd Qu.:23.52          3rd Qu.:626.4     
 Max.   :6.05          Max.   :27.53          Max.   :957.3     
     Taman      
 Min.   : 4.50  
 1st Qu.:10.95  
 Median :14.80  
 Mean   :17.07  
 3rd Qu.:20.90  
 Max.   :37.30  

Berdasarkan data yang digunakan diperoleh output berupa nilai minimal, kuartil 1, median, mean, kuartil 3, dan nilai maksimal dari variabel-variabel yang dianalisis.

5.2 Eksplorasi Korelasi

> library(ggcorrplot)
> library(corrplot)
> data_pca <- scale(data[,-1])
> head(data_pca)
     Kepadatan Penduduk Pendapatan per Kapita Rata-rata Jam Kerja Sekolah dasar
[1,]          0.6511069             1.5476618          -1.6284462    -0.3651617
[2,]         -0.5887801            -0.6557419          -0.6169444     1.3797027
[3,]         -0.5420519            -1.0618008           0.3945575     2.2378327
[4,]          0.2383695             0.2397248          -0.2797771    -1.3091048
[5,]         -0.3071830            -0.7390908           2.7547284     0.2927380
[6,]         -0.3570375             0.5902177          -0.6169444     0.6359900
     Universitas Jumlah Rumah Sakit Pengeluaran Kesehatan
[1,]  1.13877382         -1.1044910           -1.53801317
[2,] -1.50707435         -0.6015463           -0.14151333
[3,] -1.52949680         -0.2423001            0.04784258
[4,]  1.40784312         -0.9967171            0.20169426
[5,] -0.13930539          0.7995139            1.72837629
[6,]  0.04007415          0.1887953           -1.13563186
     Pengeluaran Pendidikan Fasilitas Olahraga       Taman
[1,]             0.03406304         -1.3170301  0.01453969
[2,]            -1.15639639          1.7646369 -0.72483913
[3,]            -0.11303396          0.2168508 -0.59040662
[4,]             1.41266978         -1.2614095 -1.29617731
[5,]            -0.28749784         -0.1269418 -1.10573125
[6,]            -0.27381440          0.5639999 -0.25432534
> 
> cor(data_pca)
                       Kepadatan Penduduk Pendapatan per Kapita
Kepadatan Penduduk             1.00000000            0.68959682
Pendapatan per Kapita          0.68959682            1.00000000
Rata-rata Jam Kerja           -0.28992428           -0.45595905
Sekolah dasar                 -0.65650193           -0.49742538
Universitas                    0.72684478            0.62852684
Jumlah Rumah Sakit            -0.34041203           -0.39785189
Pengeluaran Kesehatan         -0.20777492           -0.13744263
Pengeluaran Pendidikan        -0.06080255           -0.00694975
Fasilitas Olahraga            -0.63332856           -0.40101768
Taman                          0.30185454            0.33964625
                       Rata-rata Jam Kerja Sekolah dasar Universitas
Kepadatan Penduduk             -0.28992428    -0.6565019   0.7268448
Pendapatan per Kapita          -0.45595905    -0.4974254   0.6285268
Rata-rata Jam Kerja             1.00000000     0.2327514  -0.3073840
Sekolah dasar                   0.23275143     1.0000000  -0.8856282
Universitas                    -0.30738402    -0.8856282   1.0000000
Jumlah Rumah Sakit              0.34888452     0.3419493  -0.4192448
Pengeluaran Kesehatan           0.01879422     0.3188503  -0.2337427
Pengeluaran Pendidikan          0.05146030    -0.2435874   0.2124695
Fasilitas Olahraga              0.02359628     0.6268015  -0.7015256
Taman                          -0.08058407    -0.3480133   0.3180364
                       Jumlah Rumah Sakit Pengeluaran Kesehatan
Kepadatan Penduduk            -0.34041203           -0.20777492
Pendapatan per Kapita         -0.39785189           -0.13744263
Rata-rata Jam Kerja            0.34888452            0.01879422
Sekolah dasar                  0.34194930            0.31885030
Universitas                   -0.41924477           -0.23374274
Jumlah Rumah Sakit             1.00000000            0.04338919
Pengeluaran Kesehatan          0.04338919            1.00000000
Pengeluaran Pendidikan        -0.21844915           -0.13444800
Fasilitas Olahraga             0.27824428            0.13650659
Taman                         -0.36640355           -0.12731714
                       Pengeluaran Pendidikan Fasilitas Olahraga       Taman
Kepadatan Penduduk                -0.06080255        -0.63332856  0.30185454
Pendapatan per Kapita             -0.00694975        -0.40101768  0.33964625
Rata-rata Jam Kerja                0.05146030         0.02359628 -0.08058407
Sekolah dasar                     -0.24358739         0.62680151 -0.34801330
Universitas                        0.21246949        -0.70152555  0.31803639
Jumlah Rumah Sakit                -0.21844915         0.27824428 -0.36640355
Pengeluaran Kesehatan             -0.13444800         0.13650659 -0.12731714
Pengeluaran Pendidikan             1.00000000        -0.22132864  0.28452391
Fasilitas Olahraga                -0.22132864         1.00000000 -0.28204482
Taman                              0.28452391        -0.28204482  1.00000000
> ggcorrplot(cor(data_pca))

> corrplot(cor(data_pca), method = "number")

Dari output yang telah disajikan di atas, diketahui nilai korelasi antara berbagai variabel dalam analisis. Penting untuk diingat bahwa sebuah variabel akan selalu memiliki korelasi maksimal dengan dirinya sendiri, yaitu sebesar 1. Selain itu, kita juga dapat mengamati adanya korelasi yang sangat tinggi yaitu pada variabel \(X_{4}\) dan variabel \(X_{5}\).

5.3 Matriks Ragam Peragam

  • Dekomposisi Eigen
> matriks_ragam_peragam <- cov(data_pca)
> matriks_ragam_peragam
                       Kepadatan Penduduk Pendapatan per Kapita
Kepadatan Penduduk             1.00000000            0.68959682
Pendapatan per Kapita          0.68959682            1.00000000
Rata-rata Jam Kerja           -0.28992428           -0.45595905
Sekolah dasar                 -0.65650193           -0.49742538
Universitas                    0.72684478            0.62852684
Jumlah Rumah Sakit            -0.34041203           -0.39785189
Pengeluaran Kesehatan         -0.20777492           -0.13744263
Pengeluaran Pendidikan        -0.06080255           -0.00694975
Fasilitas Olahraga            -0.63332856           -0.40101768
Taman                          0.30185454            0.33964625
                       Rata-rata Jam Kerja Sekolah dasar Universitas
Kepadatan Penduduk             -0.28992428    -0.6565019   0.7268448
Pendapatan per Kapita          -0.45595905    -0.4974254   0.6285268
Rata-rata Jam Kerja             1.00000000     0.2327514  -0.3073840
Sekolah dasar                   0.23275143     1.0000000  -0.8856282
Universitas                    -0.30738402    -0.8856282   1.0000000
Jumlah Rumah Sakit              0.34888452     0.3419493  -0.4192448
Pengeluaran Kesehatan           0.01879422     0.3188503  -0.2337427
Pengeluaran Pendidikan          0.05146030    -0.2435874   0.2124695
Fasilitas Olahraga              0.02359628     0.6268015  -0.7015256
Taman                          -0.08058407    -0.3480133   0.3180364
                       Jumlah Rumah Sakit Pengeluaran Kesehatan
Kepadatan Penduduk            -0.34041203           -0.20777492
Pendapatan per Kapita         -0.39785189           -0.13744263
Rata-rata Jam Kerja            0.34888452            0.01879422
Sekolah dasar                  0.34194930            0.31885030
Universitas                   -0.41924477           -0.23374274
Jumlah Rumah Sakit             1.00000000            0.04338919
Pengeluaran Kesehatan          0.04338919            1.00000000
Pengeluaran Pendidikan        -0.21844915           -0.13444800
Fasilitas Olahraga             0.27824428            0.13650659
Taman                         -0.36640355           -0.12731714
                       Pengeluaran Pendidikan Fasilitas Olahraga       Taman
Kepadatan Penduduk                -0.06080255        -0.63332856  0.30185454
Pendapatan per Kapita             -0.00694975        -0.40101768  0.33964625
Rata-rata Jam Kerja                0.05146030         0.02359628 -0.08058407
Sekolah dasar                     -0.24358739         0.62680151 -0.34801330
Universitas                        0.21246949        -0.70152555  0.31803639
Jumlah Rumah Sakit                -0.21844915         0.27824428 -0.36640355
Pengeluaran Kesehatan             -0.13444800         0.13650659 -0.12731714
Pengeluaran Pendidikan             1.00000000        -0.22132864  0.28452391
Fasilitas Olahraga                -0.22132864         1.00000000 -0.28204482
Taman                              0.28452391        -0.28204482  1.00000000
> 
> hasil_eigen <- eigen(matriks_ragam_peragam)
> hasil_eigen
eigen() decomposition
$values
 [1] 4.28020551 1.35233536 1.14420033 0.91577656 0.73432948 0.54108078
 [7] 0.40104196 0.33439023 0.21245837 0.08418141

$vectors
            [,1]        [,2]        [,3]         [,4]        [,5]        [,6]
 [1,]  0.4024030 -0.18853759 -0.25211096  0.096126226  0.16122430 -0.03090452
 [2,]  0.3673640 -0.31980907  0.04837151 -0.045258141  0.17609049  0.22825540
 [3,] -0.1942865  0.52552907 -0.35226272  0.329285190  0.34336135 -0.31986509
 [4,] -0.4151232 -0.13337299  0.18244871  0.016851791  0.17639574 -0.08240945
 [5,]  0.4428063  0.02471386 -0.14655509  0.079855088 -0.20855048  0.03765080
 [6,] -0.2741053  0.06282758 -0.54142778 -0.008909622  0.03494837  0.78619024
 [7,] -0.1466472 -0.27181227  0.28327801  0.856732188 -0.12672801  0.19671314
 [8,]  0.1176918  0.61985671  0.39088963 -0.028889223 -0.43687520  0.28787404
 [9,] -0.3563018 -0.19901306  0.26463170 -0.371017926  0.09291749  0.12269298
[10,]  0.2439717  0.25678406  0.39878591  0.032612626  0.73056014  0.28584195
             [,7]        [,8]         [,9]       [,10]
 [1,] -0.20156875  0.10059277  0.806734086  0.03475802
 [2,] -0.64188012 -0.30097089 -0.379476558 -0.16933209
 [3,] -0.23955208 -0.41867353 -0.018877624  0.01773123
 [4,] -0.47941447  0.39221122 -0.001856896  0.59559614
 [5,]  0.20721968 -0.26639480 -0.175279053  0.76545202
 [6,]  0.01327570  0.07711662 -0.001940986  0.04745613
 [7,]  0.08597458 -0.14610287  0.070511979 -0.04370979
 [8,] -0.35236573 -0.01495685  0.224001054 -0.00195148
 [9,]  0.08648587 -0.67545961  0.343991271  0.14147756
[10,]  0.27926195  0.12430541 -0.024757287  0.07049991
  • Scree Plot
> scree_data = data.frame(hasil_eigen$values, PC = 1:10)
> scree_data
   hasil_eigen.values PC
1          4.28020551  1
2          1.35233536  2
3          1.14420033  3
4          0.91577656  4
5          0.73432948  5
6          0.54108078  6
7          0.40104196  7
8          0.33439023  8
9          0.21245837  9
10         0.08418141 10
> plot(hasil_eigen$values, type = 'b', xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)', main = 'Scree Plot')
> lines(hasil_eigen$values)

Berdasarkan Scree Plot di atas, banyaknya komponen utama yang dipilih adalah 4 komponen.

  • Nilai Kumulatif Eigen
> for (eg in hasil_eigen$values){
+   print(eg / sum(hasil_eigen$values))
+ }
[1] 0.4280206
[1] 0.1352335
[1] 0.11442
[1] 0.09157766
[1] 0.07343295
[1] 0.05410808
[1] 0.0401042
[1] 0.03343902
[1] 0.02124584
[1] 0.008418141

Berdasarkan informasi diatas, banyaknya komponen utama yang dapat diambil adalah 4 komponen utama karena telah mencapai minimal 75% varians data. Keempat komponen utama telah mampu menangkap 76,925 % dari total keragaman data.

  • Persamaan PCA
> hasil_eigen$vectors[,1:4]
            [,1]        [,2]        [,3]         [,4]
 [1,]  0.4024030 -0.18853759 -0.25211096  0.096126226
 [2,]  0.3673640 -0.31980907  0.04837151 -0.045258141
 [3,] -0.1942865  0.52552907 -0.35226272  0.329285190
 [4,] -0.4151232 -0.13337299  0.18244871  0.016851791
 [5,]  0.4428063  0.02471386 -0.14655509  0.079855088
 [6,] -0.2741053  0.06282758 -0.54142778 -0.008909622
 [7,] -0.1466472 -0.27181227  0.28327801  0.856732188
 [8,]  0.1176918  0.61985671  0.39088963 -0.028889223
 [9,] -0.3563018 -0.19901306  0.26463170 -0.371017926
[10,]  0.2439717  0.25678406  0.39878591  0.032612626

Persamaan yang terbentuk yaitu:

Komponen Utama 1: \(KU_{1} = 0.4024030X_{1} +0.3673640X_{2} -0.1942865X_{3} -0.4151232X_{4} +0.4428063X_{5} -0.2741053X_{6} -0.1466472X_{7} +0.1176918X_{8} -0.3563018X_{9} +0.2439717X_{10}\)

Komponen Utama 2: \(KU_{2} = -0.1885376X_{1} -0.3198091X_{2} +0.5255291X_{3} -0.1333730X_{4} +0.0247139X_{5} +0.0628276X_{6} -0.2718123X_{7} +0.6198567X_{8} -0.1990131X_{9} +0.2567841X_{10}\)

Komponen Utama 3: \(KU_{3} = -0.25211096X_{1} +0.04837151X_{2} -0.35226272X_{3} +0.18244871X_{4} -0.14655509X_{5} -0.54142778X_{6} +0.28327801X_{7} +0.39088963X_{8} +0.26463170X_{9} +0.39878591X_{10}\)

Komponen Utama 4: \(KU_{4} = 0.0961262X_{1} -0.0452581X_{2} +0.3292852X_{3} +0.0168518X_{4} +0.0798551X_{5} -0.0089096X_{6} +0.8567322X_{7} -0.0288892X_{8} -0.3710179X_{9} +0.0326126X_{10}\)

5.4 Matriks Korelasi

  • Dekomposisi Eigen
> cor_eigen <- eigen(cor(data_pca))
> cor_eigen
eigen() decomposition
$values
 [1] 4.28020551 1.35233536 1.14420033 0.91577656 0.73432948 0.54108078
 [7] 0.40104196 0.33439023 0.21245837 0.08418141

$vectors
            [,1]        [,2]        [,3]         [,4]        [,5]        [,6]
 [1,] -0.4024030 -0.18853759 -0.25211096 -0.096126226  0.16122430 -0.03090452
 [2,] -0.3673640 -0.31980907  0.04837151  0.045258141  0.17609049  0.22825540
 [3,]  0.1942865  0.52552907 -0.35226272 -0.329285190  0.34336135 -0.31986509
 [4,]  0.4151232 -0.13337299  0.18244871 -0.016851791  0.17639574 -0.08240945
 [5,] -0.4428063  0.02471386 -0.14655509 -0.079855088 -0.20855048  0.03765080
 [6,]  0.2741053  0.06282758 -0.54142778  0.008909622  0.03494837  0.78619024
 [7,]  0.1466472 -0.27181227  0.28327801 -0.856732188 -0.12672801  0.19671314
 [8,] -0.1176918  0.61985671  0.39088963  0.028889223 -0.43687520  0.28787404
 [9,]  0.3563018 -0.19901306  0.26463170  0.371017926  0.09291749  0.12269298
[10,] -0.2439717  0.25678406  0.39878591 -0.032612626  0.73056014  0.28584195
             [,7]        [,8]         [,9]       [,10]
 [1,] -0.20156875  0.10059277  0.806734086  0.03475802
 [2,] -0.64188012 -0.30097089 -0.379476558 -0.16933209
 [3,] -0.23955208 -0.41867353 -0.018877624  0.01773123
 [4,] -0.47941447  0.39221122 -0.001856896  0.59559614
 [5,]  0.20721968 -0.26639480 -0.175279053  0.76545202
 [6,]  0.01327570  0.07711662 -0.001940986  0.04745613
 [7,]  0.08597458 -0.14610287  0.070511979 -0.04370979
 [8,] -0.35236573 -0.01495685  0.224001054 -0.00195148
 [9,]  0.08648587 -0.67545961  0.343991271  0.14147756
[10,]  0.27926195  0.12430541 -0.024757287  0.07049991
  • Scree Plot
> scree_data = data.frame(cor_eigen$values, PC = 1:10)
> scree_data
   cor_eigen.values PC
1        4.28020551  1
2        1.35233536  2
3        1.14420033  3
4        0.91577656  4
5        0.73432948  5
6        0.54108078  6
7        0.40104196  7
8        0.33439023  8
9        0.21245837  9
10       0.08418141 10
> plot(cor_eigen$values, type = 'b', xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)',  main = 'Scree Plot')
> lines(cor_eigen$values)

Berdasarkan Scree Plot di atas, banyaknya komponen utama yang dipilih adalah 4 komponen.

  • Nilai Kumulatif Eigen
> for (eg in cor_eigen$values){
+   print(eg / sum(cor_eigen$values))
+ }
[1] 0.4280206
[1] 0.1352335
[1] 0.11442
[1] 0.09157766
[1] 0.07343295
[1] 0.05410808
[1] 0.0401042
[1] 0.03343902
[1] 0.02124584
[1] 0.008418141

Berdasarkan informasi diatas, banyaknya komponen utama yang dapat diambil adalah 4 komponen utama karena telah mencapai minimal 75% varians data. Keempat komponen utama telah mampu menangkap 76,925 % dari total keragaman data.

  • Persamaan PCA
> cor_eigen$vectors[,1:4]
            [,1]        [,2]        [,3]         [,4]
 [1,] -0.4024030 -0.18853759 -0.25211096 -0.096126226
 [2,] -0.3673640 -0.31980907  0.04837151  0.045258141
 [3,]  0.1942865  0.52552907 -0.35226272 -0.329285190
 [4,]  0.4151232 -0.13337299  0.18244871 -0.016851791
 [5,] -0.4428063  0.02471386 -0.14655509 -0.079855088
 [6,]  0.2741053  0.06282758 -0.54142778  0.008909622
 [7,]  0.1466472 -0.27181227  0.28327801 -0.856732188
 [8,] -0.1176918  0.61985671  0.39088963  0.028889223
 [9,]  0.3563018 -0.19901306  0.26463170  0.371017926
[10,] -0.2439717  0.25678406  0.39878591 -0.032612626

Persamaan yang terbentuk yaitu:

Komponen Utama 1: \(KU_{1} = -0.4024030X_{1} - 0.3673640X_{2} + 0.1942865X_{3} + 0.4151232X_{4} - 0.4428063X_{5}+ 0.2741053X_{6} + 0.1466472X_{7} - 0.1176918X_{8} + 0.3563018X_{9} - 0.2439717X_{10}\)

Komponen Utama 2 (\(PC_{2}\)): \(KU_{2} = -0.1885376X_{1} - 0.3198091X_{2} + 0.5255291X_{3} - 0.1333730X_{4} + 0.0247139X_{5} + 0.0628276X_{6} - 0.2718123X_{7} + 0.6198567X_{8} - 0.1990131X_{9} + 0.2567841X_{10}\)

Komponen Utama 3 (\(PC_{3}\)): \(KU_{3} = -0.25211096X_{1} + 0.04837151X_{2} - 0.35226272X_{3} + 0.18244871X_{4} - 0.14655509X_{5} - 0.54142778X_{6} + 0.28327801X_{7} + 0.39088963X_{8} + 0.26463170X_{9} + 0.39878591X_{10}\)

Komponen Utama 4 (\(PC_{4}\)): \(KU_{4} = -0.0961262X_{1} + 0.0452581X_{2} - 0.3292852X_{3} - 0.0168518X_{4} - 0.0798551X_{5} + 0.0089096X_{6} - 0.8567322X_{7} + 0.0288892X_{8} + 0.3710179X_{9} - 0.0326126X_{10}\)

5.5 PCA

> PCA=prcomp(x = data[,-1],center = TRUE, scale. = TRUE)
> PCA
Standard deviations (1, .., p=10):
 [1] 2.0688658 1.1628996 1.0696730 0.9569622 0.8569303 0.7355819 0.6332787
 [8] 0.5782648 0.4609321 0.2901403

Rotation (n x k) = (10 x 10):
                              PC1         PC2         PC3          PC4
Kepadatan Penduduk     -0.4024030  0.18853759 -0.25211096  0.096126226
Pendapatan per Kapita  -0.3673640  0.31980907  0.04837151 -0.045258141
Rata-rata Jam Kerja     0.1942865 -0.52552907 -0.35226272  0.329285190
Sekolah dasar           0.4151232  0.13337299  0.18244871  0.016851791
Universitas            -0.4428063 -0.02471386 -0.14655509  0.079855088
Jumlah Rumah Sakit      0.2741053 -0.06282758 -0.54142778 -0.008909622
Pengeluaran Kesehatan   0.1466472  0.27181227  0.28327801  0.856732188
Pengeluaran Pendidikan -0.1176918 -0.61985671  0.39088963 -0.028889223
Fasilitas Olahraga      0.3563018  0.19901306  0.26463170 -0.371017926
Taman                  -0.2439717 -0.25678406  0.39878591  0.032612626
                               PC5         PC6         PC7         PC8
Kepadatan Penduduk      0.16122430 -0.03090452 -0.20156875 -0.10059277
Pendapatan per Kapita   0.17609049  0.22825540 -0.64188012  0.30097089
Rata-rata Jam Kerja     0.34336135 -0.31986509 -0.23955208  0.41867353
Sekolah dasar           0.17639574 -0.08240945 -0.47941447 -0.39221122
Universitas            -0.20855048  0.03765080  0.20721968  0.26639480
Jumlah Rumah Sakit      0.03494837  0.78619024  0.01327570 -0.07711662
Pengeluaran Kesehatan  -0.12672801  0.19671314  0.08597458  0.14610287
Pengeluaran Pendidikan -0.43687520  0.28787404 -0.35236573  0.01495685
Fasilitas Olahraga      0.09291749  0.12269298  0.08648587  0.67545961
Taman                   0.73056014  0.28584195  0.27926195 -0.12430541
                                PC9        PC10
Kepadatan Penduduk     -0.806734086  0.03475802
Pendapatan per Kapita   0.379476558 -0.16933209
Rata-rata Jam Kerja     0.018877624  0.01773123
Sekolah dasar           0.001856896  0.59559614
Universitas             0.175279053  0.76545202
Jumlah Rumah Sakit      0.001940986  0.04745613
Pengeluaran Kesehatan  -0.070511979 -0.04370979
Pengeluaran Pendidikan -0.224001054 -0.00195148
Fasilitas Olahraga     -0.343991271  0.14147756
Taman                   0.024757287  0.07049991
> 
> print(PCA$rotation[,1:4],digits=4)
                           PC1      PC2      PC3      PC4
Kepadatan Penduduk     -0.4024  0.18854 -0.25211  0.09613
Pendapatan per Kapita  -0.3674  0.31981  0.04837 -0.04526
Rata-rata Jam Kerja     0.1943 -0.52553 -0.35226  0.32929
Sekolah dasar           0.4151  0.13337  0.18245  0.01685
Universitas            -0.4428 -0.02471 -0.14656  0.07986
Jumlah Rumah Sakit      0.2741 -0.06283 -0.54143 -0.00891
Pengeluaran Kesehatan   0.1466  0.27181  0.28328  0.85673
Pengeluaran Pendidikan -0.1177 -0.61986  0.39089 -0.02889
Fasilitas Olahraga      0.3563  0.19901  0.26463 -0.37102
Taman                  -0.2440 -0.25678  0.39879  0.03261
> summary(PCA)
Importance of components:
                         PC1    PC2    PC3     PC4     PC5     PC6    PC7
Standard deviation     2.069 1.1629 1.0697 0.95696 0.85693 0.73558 0.6333
Proportion of Variance 0.428 0.1352 0.1144 0.09158 0.07343 0.05411 0.0401
Cumulative Proportion  0.428 0.5633 0.6777 0.76925 0.84268 0.89679 0.9369
                           PC8     PC9    PC10
Standard deviation     0.57826 0.46093 0.29014
Proportion of Variance 0.03344 0.02125 0.00842
Cumulative Proportion  0.97034 0.99158 1.00000

Persamaan yang terbentuk yaitu:

Komponen Utama 1: \(KU_{1} = -0.4024X_{1} - 0.3674X_{2} + 0.1943X_{3} + 0.4151X_{4} - 0.4428X_{5} + 0.2741X_{6} + 0.1466X_{7} - 0.1177X_{8} + 0.3563X_{9} - 0.2440X_{10}\)

Komponen Utama 2: \(KU_{2} = 0.18854X_{1} + 0.31981X_{2} - 0.52553X_{3} + 0.13337X_{4} - 0.02471X_{5} - 0.06283X_{6} + 0.27181X_{7} - 0.61986X_{8} + 0.19901X_{9} - 0.25678X_{10}\)

Komponen Utama 3: \(KU_{3} = -0.25211X_{1} + 0.04837X_{2} - 0.35226X_{3} + 0.18245X_{4} - 0.14656X_{5} - 0.54143X_{6} + 0.28328X_{7} + 0.39089X_{8} + 0.26463X_{9} + 0.39879X_{10}\)

Komponen Utama 4: \(KU_{4} = 0.09613X_{1} - 0.04526X_{2} + 0.32929X_{3} + 0.01685X_{4} + 0.07986X_{5} - 0.00891X_{6} + 0.85673X_{7} - 0.02889X_{8} - 0.37102X_{9} + 0.03261X_{10}\)

6 KESIMPULAN

Dari persamaan yang terbentuk, dapat ditarik kesimpulan sebagai berikut:

\(PC_{1}\) berkorelasi dengan variabel Kepadatan Penduduk(\(X_{1}\)),Pendapatan per Kapita(\(X_{2}\)), Sekolah Dasar(\(X_{4}\)), dan Universitas(\(X_{5}\)). Ketika \(PC_{1}\) meningkat, hal ini mengindikasikan bahwa Sekolah Dasar meningkat sementara Kepadatan Penduduk, Pendapatan per Kapita, dan Universitas menurun. Faktor yang terbentuk dalam \(PC_{1}\) adalah “Faktor Kualitas Hidup.”

\(PC_{2}\) memiliki korelasi dengan variabel Rata-rata Jam Kerja(\(X_{3}\)) dan Pengeluaran Pendidikan(\(X_{8}\)). Kenaikan nilai \(PC_{2}\) menunjukkan penurunan dalam Rata-rata Jam Kerja dan Pengeluaran Pendidikan. Faktor yang terbentuk dalam \(PC_{2}\) adalah “Faktor Tenaga Kerja dan Pendidikan.”

\(PC_{3}\) berhubungan dengan variabel Jumlah Rumah Sakit(\(X_{6}\)) dan Taman(\(X_{10}\)). Ketika \(PC_{3}\) meningkat, ini menggambarkan bahwa Jumlah Rumah Sakit menurun sementara Taman meningkat. Faktor yang terbentuk dalam \(PC_{3}\) adalah “Faktor Layanan Kesehatan dan Rekreasi.”

\(PC_{4}\) berhubungan dengan variabel Pengeluaran Kesehatan (\(X_{7}\)) dan Fasilitas Olahraga(\(X_{9}\)). Peningkatan nilai \(PC_{4}\) mengindikasikan peningkatan dalam Pengeluaran Kesehatan dan penurunan dalam Fasilitas Olahraga. Faktor yang terbentuk dalam \(PC_{4}\) adalah “Faktor Kesehatan dan Olahraga.”

Komponen utama (PC) tersebut menggambarkan faktor-faktor yang paling berpengaruh terhadap angka harapan hidup di Jepang Tahun 2020.

7 DAFTAR PUSTAKA

Johnson, R.A. dan Wichern, D.W., (2007). Applied Multivariate Statistical Analysis Sixth Edition. Pearson Education, Inc.

Nugroho, Sigit. (2008). Statistika Multivariat Terapan. UNIB Press.

Rencher, A.C. (2002). Methods of Multivariate Analysis Second Edition. A John Wiley & Sons, Inc. Publication.

World Health Organization. (2020). https://www.who.int/data/gho/data/indicators/indicator-details/GHO/life-expectancy-at-birth-(years (tanggal akses: 21 Oktober 2023)

https://www.e-stat.go.jp/en (tanggal akses: 21 Oktober 2023)