Pendahuluan

Penggunaan statistika sangat diperlukan dalam penelitian di semua bidang ilmu apapun yang menggunakan perhitungan-perhitungan. Hasil sebuah penelitian dipengaruhi oleh penggunaan satatistika dalam mengolah data penelitian. dalam statistika terdapat metode metode analisis yaitu analisis regresi. tujuan dari analisis data adalah untuk memodelkan hubungan variabel dan model tersebut digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen. analisis regresi merupakan sebuah metode statistika yang berguna untuk memahami hubungan antara satu variabel dependen (variabel respon) dan satu atau lebih variabel independen (variabel prediktor).

Indonesia, sebuah negara kepulauan yang megah, tantangan kesehatan menjadi kompleks karena beragamnya faktor dan dinamika sosial,ekonomi,dan lingkungan.Kesehatan masyarakat merupakan aspek yang sangat penting dalam pembangunan suatu negara. Bagaimana kondisi kesehatan suatu populasi menjadi cerminan dari kemajuan dan kesejahteraan suatu bangsa.

Data

Data yang digunakan berasal dari Kaggle.com. Analisis yang digunakan adalah seluruh provinsi di Indonesia yang berjumlah 34 provinsi. Publikasi tersebut dikeluarkan oleh Kementrian Kesehatan Republik Indonesia. Pada analisis ini tidak diambil semua variabel yang terdapat pada publikasi Profil Kesehata 2021, melainkan hanya mengambil 8 variabel yang dirasa bisa mewakili berbagai variabel yang ada.

variable-variable yang digunakan tertera sebagai berikut :

\(X_1\) : Angka harapan hidup(AHH) \(X_2\) : Rasio puskesmas per kecamatan \(X_3\) : Presentase puskesmas dengan ketersediaan obat esensial \(X_4\) : Presentase puskesmas dengan ketersediaan vaksin IDL \(X_5\) : Presentase bayi yang mendapat ASI eksklusif \(X_6\) : Presentase bayi yang mendapat ASI eksklusif \(X_7\) : Presentase rumah tangga yang memiliki akses terhadap sanitasi layak \(X_8\) : Presentase rumah tangga yang memiliki akses terhadap air minum layak

#Analisis yang Digunakan

PCA

Penggunaan PCA dilakukan untuk mereduksi variabel-variabel yang ada. Selain itu, ada kecurigaan beberapa variabel tersebut tumpang tindih dan memiliki nilai korelasi yang sangat tinggi.

Statistika Deskriptif

library(readxl)
Data_T1 <- read_excel("~/SEMESTER 5/ANMUL/Data T1.xlsx")
View(Data_T1)
summary(Data_T1)

##       AHH              RP             KOE               KV        
##  Min.   :65.25   Min.   :0.300   Min.   :  0.00   Min.   : 70.30  
##  1st Qu.:68.83   1st Qu.:1.325   1st Qu.: 71.72   1st Qu.: 95.88  
##  Median :70.07   Median :1.400   Median : 90.00   Median :100.00  
##  Mean   :70.15   Mean   :1.597   Mean   : 78.39   Mean   : 96.94  
##  3rd Qu.:71.60   3rd Qu.:1.500   3rd Qu.:100.00   3rd Qu.:100.00  
##  Max.   :75.04   Max.   :7.200   Max.   :100.00   Max.   :100.00  
##       ASI              KD             ASL             AML       
##  Min.   :13.00   Min.   : 6.70   Min.   :40.81   Min.   :64.92  
##  1st Qu.:45.50   1st Qu.:22.10   1st Qu.:77.36   1st Qu.:80.57  
##  Median :54.90   Median :29.70   Median :80.67   Median :88.72  
##  Mean   :52.79   Mean   :30.82   Mean   :80.97   Mean   :86.68  
##  3rd Qu.:64.58   3rd Qu.:37.02   3rd Qu.:84.61   3rd Qu.:93.23  
##  Max.   :82.40   Max.   :68.60   Max.   :97.12   Max.   :99.86

Terlihat bahwa setiap variabel memiliki rentang nilai yang sangat jauh, sehingga akan diperlukan standarisasi.

Eksplorasi Korelasi

library(corrplot)

## Warning: package 'corrplot' was built under R version 4.2.3

## corrplot 0.92 loaded

kor <- cor(Data_T1)
corrplot(kor, method="number")

Terdapat korelasi yang tinggi pada corrplot tersebut.

Menampilkan Kumulatif Nilai Eigen dan Vektor Eigen

Dengan Matriks Kovarians

Dekomposisi Eigen

sc <- scale(Data_T1)
sc

##               AHH           RP          KOE          KV         ASI
##  [1,] -0.07549982 -0.383310452 -0.307874761 -0.13963568  0.15986836
##  [2,] -0.36602781 -0.190235558  0.172232583 -0.83440834 -0.65607377
##  [3,] -0.22275373 -0.093698110  0.757472921  0.50551036  1.03715953
##  [4,]  0.60505205 -0.190235558  0.466604969  0.35663051 -0.81558126
##  [5,]  0.42595945 -0.190235558  0.757472921 -0.55319084  0.64452572
##  [6,] -0.06754015 -0.190235558 -0.686353542  0.50551036 -0.45362196
##  [7,] -0.29041094 -0.190235558  0.757472921  0.50551036  0.82857282
##  [8,]  0.23094751 -0.190235558  0.056586288 -0.18926230  0.74881907
##  [9,]  0.23094751 -0.190235558 -0.994743661  0.50551036  0.34391546
## [10,] -0.01182245 -0.383310452 -1.744692358  0.50551036  0.05557501
## [11,]  1.13835000  5.408936379 -2.746960243  0.50551036  0.96967559
## [12,]  1.22590638  0.099376784  0.238816813 -0.71861290  0.40526449
## [13,]  1.71940598 -0.093698110  0.407029605 -2.42246014  0.89605675
## [14,]  1.94625660  0.002839337  0.757472921  0.50551036  1.34390469
## [15,]  0.48963682 -0.093698110 -0.009997942  0.20775065  0.21508249
## [16,] -0.05162081  0.002839337 -1.579983999  0.43934154  0.29483623
## [17,]  0.83190267  0.485526573  0.757472921 -0.18926230  1.11077837
## [18,] -1.37690602 -0.093698110  0.757472921  0.50551036  1.81629224
## [19,] -1.19383359 -0.190235558  0.119666085 -0.73515511  0.30710604
## [20,]  0.24288702 -0.190235558  0.508658167  0.50551036 -0.04258345
## [21,] -0.14315702 -0.093698110 -1.243558416 -0.56973304 -0.49656629
## [22,] -0.52522123 -0.093698110  0.757472921  0.09195521  0.09851933
## [23,]  1.77512368  0.195914231  0.407029605  0.50551036  0.04944010
## [24,]  0.99507592 -0.576385346  0.757472921  0.50551036 -0.22663054
## [25,]  0.64087057 -0.383310452  0.007524224  0.50551036 -1.38612726
## [26,] -0.52522123 -0.383310452  0.487631568  0.50551036 -0.18982112
## [27,]  0.20308866 -0.093698110  0.757472921  0.50551036  1.08623875
## [28,]  0.44585863 -0.286773005  0.140692684  0.50551036  0.07397972
## [29,] -0.77993070 -0.383310452  0.757472921  0.50551036 -1.58244417
## [30,] -1.95000233 -0.190235558  0.757472921  0.50551036 -0.42908235
## [31,] -1.61569615  0.292451678 -0.798495404  0.50551036 -2.44133062
## [32,] -0.67645498 -0.286773005  0.757472921  0.50551036  0.19054288
## [33,] -1.59579697 -1.252147477 -2.746960243 -4.40752489 -1.54563475
## [34,] -1.67937352  0.388989125  0.757472921  0.05887079 -2.41065611
##                 KD           ASL         AML
##  [1,] -0.806214906 -0.3442931036  0.24966040
##  [2,] -1.848703084  0.1060525878  0.49786079
##  [3,]  0.535222088 -1.2379320930 -0.38738728
##  [4,] -0.706565301  0.2692651203  0.36430534
##  [5,]  0.657867756 -0.0611898837 -0.82469274
##  [6,]  0.719190590 -0.3704877075 -0.23373942
##  [7,] -0.131663732 -0.1166015460 -2.27961983
##  [8,] -0.737226718  0.2944522395 -0.76559741
##  [9,] -0.392285776  1.1357020209 -1.56929393
## [10,] -0.399951131  1.0732379653  0.49076935
## [11,]  0.918489800  1.4308950580  1.55803106
## [12,]  0.075300833 -0.9377016320  0.77560886
## [13,]  0.052304770  0.2329956686  0.82052131
## [14,] -1.312128286  1.6273545878  1.06517598
## [15,]  1.240434679  0.0002666871  0.98598824
## [16,]  2.896151197  0.1937037626  0.80752034
## [17,] -0.729561363  1.5094788699  1.28619253
## [18,]  2.620198444  0.1896738236  0.93634816
## [19,] -0.323297588 -0.7664292214 -0.15100596
## [20,] -0.553258216 -0.2596643830 -0.93579197
## [21,] -0.445943256 -0.7251223460 -1.13789800
## [22,] -0.422947193  0.0466109865 -1.21472194
## [23,] -0.039679481  0.8868532832 -0.10372969
## [24,]  0.972147280 -0.1176090307  0.01446098
## [25,] -1.166486556  0.3911707772  0.58768570
## [26,]  0.297596106 -0.4944083340  0.21656701
## [27,] -0.231313337  1.0682005414  0.53213609
## [28,] -0.813880260  0.4687471044  0.62196099
## [29,]  0.006312645 -0.2405221725  0.93280244
## [30,]  0.803509487 -0.0853695182 -0.98425014
## [31,]  0.266934689 -0.4228769155  0.77206314
## [32,]  0.075300833 -0.3886224334  0.23429561
## [33,]  0.243938626 -0.3100386215 -0.59067523
## [34,] -1.319793641 -4.0457921419 -2.57155077
## attr(,"scaled:center")
##       AHH        RP       KOE        KV       ASI        KD       ASL       AML 
## 70.149706  1.597059 78.385294 96.944118 52.794118 30.817647 80.967353 86.677647 
## attr(,"scaled:scale")
##       AHH        RP       KOE        KV       ASI        KD       ASL       AML 
##  2.512667  1.035867 28.535285  6.045143 16.300176 13.045711  9.925708  8.460905

s <- cov(sc)
s_eig <- eigen(s)
s_eig

## eigen() decomposition
## $values
## [1] 2.5786130 1.5126251 1.1852488 0.9668667 0.7186834 0.5195701 0.3624722
## [8] 0.1559207
## 
## $vectors
##             [,1]         [,2]        [,3]        [,4]         [,5]         [,6]
## [1,] -0.44919141 -0.220586697  0.37110369  0.08303009 -0.136771186 -0.257742181
## [2,] -0.32638753  0.299784292 -0.20678178  0.60401342 -0.337853995 -0.348981570
## [3,]  0.08791837 -0.733460336 -0.12349020 -0.11864781  0.104938509 -0.376765522
## [4,] -0.15621748 -0.396982656 -0.54001792  0.48168384  0.223480622  0.361466083
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923 -0.525313983 -0.002755536
## [6,] -0.15061258  0.289123639 -0.67157248 -0.47499983  0.004465565 -0.079465558
## [7,] -0.51068381 -0.008204513  0.21467808 -0.09413054  0.125065780  0.622600987
## [8,] -0.43219561  0.151335621  0.03987159 -0.08713133  0.717339857 -0.381072811
##            [,7]        [,8]
## [1,]  0.7204089 -0.02881353
## [2,] -0.2754182 -0.29020852
## [3,] -0.2261462 -0.46997097
## [4,]  0.1866890  0.28090587
## [5,] -0.3239655  0.46516345
## [6,]  0.3561415 -0.28968508
## [7,] -0.1939088 -0.49326813
## [8,] -0.2230916  0.26750709

Menggambar Scree Plot Berdasarkan Nilai Eigen

plot(s_eig$values, xlab="Eigenvalue Number", ylab = "Eigenvalue Size",
     main = "Scree Plot")
lines(s_eig$values)

Diketahui secara visual, dapat dimanfaatkan sekitar 4 PC. Berdasarkan scree plot diatas, banyaknya komponen utama yang dipilih adalah 5. Hal ini karena titik ekstrim dimana garis kurva mulai melandai ditunjukkan pada komponen ke 4. Berdasarkan informasi ini jumlah komponen yang dipilih berdasarkan metode proporsi kumlatif varians dengan metode scree plot yaitu 4 komponen utama.

Nilai Kumulatif Eigen

for (eg in s_eig$values){
  print(eg / sum(s_eig$values))
}

## [1] 0.3223266
## [1] 0.1890781
## [1] 0.1481561
## [1] 0.1208583
## [1] 0.08983542
## [1] 0.06494626
## [1] 0.04530903
## [1] 0.01949009

Diketahui berdasarkan kumulasi, 4 PC sudah menangkap sekitar 75% keragaman. Sehingga dapat kita susun 4 buah PC

Persamaan PCA

s_eig$vectors[,1:4]

##             [,1]         [,2]        [,3]        [,4]
## [1,] -0.44919141 -0.220586697  0.37110369  0.08303009
## [2,] -0.32638753  0.299784292 -0.20678178  0.60401342
## [3,]  0.08791837 -0.733460336 -0.12349020 -0.11864781
## [4,] -0.15621748 -0.396982656 -0.54001792  0.48168384
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923
## [6,] -0.15061258  0.289123639 -0.67157248 -0.47499983
## [7,] -0.51068381 -0.008204513  0.21467808 -0.09413054
## [8,] -0.43219561  0.151335621  0.03987159 -0.08713133

Hasil di atas dapat dituliskan dalam bentuk persamaan: \[ PC_1 = -0.449X_1-0.326X_2+0.088X_3-0.156X_4-.0.435X_5-0.151X_6-0.510X_7-0.432X_{8}\] \[ PC_2 = -0.220X_1 + 0.299X_2 -0.733X_3 -0.396X_4 -0.243X_5+0.289X_6-0.008X_7+.0.151X_{8} \] \[ PC_3 = 0.371X_1-0.206X_2-0.123X_3-0.540X_4-0.118X_5-0.671X_6+0.214X_7+0.039X_{8}\] \[ PC_4 = 0.083X_1+0.604X_2-0.118X_3+0.481X_4-0.374X_5-0.474X_6-0.094X_7+-0.087X_{8}\] ## Dengan Matriks Korelasi

Dekomposisi Eigen

kor_eig <- eigen(kor)
kor_eig

## eigen() decomposition
## $values
## [1] 2.5786130 1.5126251 1.1852488 0.9668667 0.7186834 0.5195701 0.3624722
## [8] 0.1559207
## 
## $vectors
##             [,1]         [,2]        [,3]        [,4]         [,5]         [,6]
## [1,] -0.44919141 -0.220586697  0.37110369  0.08303009 -0.136771186 -0.257742181
## [2,] -0.32638753  0.299784292 -0.20678178  0.60401342 -0.337853995 -0.348981570
## [3,]  0.08791837 -0.733460336 -0.12349020 -0.11864781  0.104938509 -0.376765522
## [4,] -0.15621748 -0.396982656 -0.54001792  0.48168384  0.223480622  0.361466083
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923 -0.525313983 -0.002755536
## [6,] -0.15061258  0.289123639 -0.67157248 -0.47499983  0.004465565 -0.079465558
## [7,] -0.51068381 -0.008204513  0.21467808 -0.09413054  0.125065780  0.622600987
## [8,] -0.43219561  0.151335621  0.03987159 -0.08713133  0.717339857 -0.381072811
##            [,7]        [,8]
## [1,]  0.7204089 -0.02881353
## [2,] -0.2754182 -0.29020852
## [3,] -0.2261462 -0.46997097
## [4,]  0.1866890  0.28090587
## [5,] -0.3239655  0.46516345
## [6,]  0.3561415 -0.28968508
## [7,] -0.1939088 -0.49326813
## [8,] -0.2230916  0.26750709

Scree Plot

plot(kor_eig$values, xlab="Eigenvalue Number", ylab="Eigenvalue Size",
     main = "Scree Plot")
lines(kor_eig$values)

Proses selanjutnya mengikuti pola yang sama.

Nilai Kumulatif Eigen

for (eg in kor_eig$values){
  print(eg / sum(kor_eig$values))
}

## [1] 0.3223266
## [1] 0.1890781
## [1] 0.1481561
## [1] 0.1208583
## [1] 0.08983542
## [1] 0.06494626
## [1] 0.04530903
## [1] 0.01949009

Diketahui berdasarkan kumulasi, 4 PC sudah menangkap sekitar 75% keragaman. Sehingga dapat kita susun 4 buah PC

Persamaan PCA

kor_eig$vectors[,1:4]

##             [,1]         [,2]        [,3]        [,4]
## [1,] -0.44919141 -0.220586697  0.37110369  0.08303009
## [2,] -0.32638753  0.299784292 -0.20678178  0.60401342
## [3,]  0.08791837 -0.733460336 -0.12349020 -0.11864781
## [4,] -0.15621748 -0.396982656 -0.54001792  0.48168384
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923
## [6,] -0.15061258  0.289123639 -0.67157248 -0.47499983
## [7,] -0.51068381 -0.008204513  0.21467808 -0.09413054
## [8,] -0.43219561  0.151335621  0.03987159 -0.08713133

Hasil di atas dapat dituliskan dalam bentuk persamaan: \[ PC_1 = -0.449X_1-0.326X_2+0.088X_3-0.156X_4-.0.435X_5-0.151X_6-0.510X_7-0.432X_{8} \] \[ PC_2 = -0.220X_1 + 0.299X_2 -0.733X_3 -0.396X_4 -0.243X_5+0.289X_6-0.008X_7+.0.151X_{8} \] \[ PC_3 = 0.371X_1-0.206X_2-0.123X_3-0.540X_4-0.118X_5-0.671X_6+0.214X_7+0.039X_{8}\]
\[ PC_4 = 0.083X_1+0.604X_2-0.118X_3+0.481X_4-0.374X_5-0.474X_6-0.094X_7-0.087X_{8}\]

Fungsi PCA

`prcomp`

PCA1 <- prcomp(x=Data_T1,scale=T,center=T)
PCA1

## Standard deviations (1, .., p=8):
## [1] 1.6058060 1.2298882 1.0886913 0.9832938 0.8477520 0.7208121 0.6020566
## [8] 0.3948680
## 
## Rotation (n x k) = (8 x 8):
##             PC1          PC2         PC3         PC4          PC5          PC6
## AHH  0.44919141 -0.220586697 -0.37110369 -0.08303009 -0.136771186  0.257742181
## RP   0.32638753  0.299784292  0.20678178 -0.60401342 -0.337853995  0.348981570
## KOE -0.08791837 -0.733460336  0.12349020  0.11864781  0.104938509  0.376765522
## KV   0.15621748 -0.396982656  0.54001792 -0.48168384  0.223480622 -0.361466083
## ASI  0.43507421 -0.243617182  0.11818694  0.37429923 -0.525313983  0.002755536
## KD   0.15061258  0.289123639  0.67157248  0.47499983  0.004465565  0.079465558
## ASL  0.51068381 -0.008204513 -0.21467808  0.09413054  0.125065780 -0.622600987
## AML  0.43219561  0.151335621 -0.03987159  0.08713133  0.717339857  0.381072811
##            PC7         PC8
## AHH -0.7204089  0.02881353
## RP   0.2754182  0.29020852
## KOE  0.2261462  0.46997097
## KV  -0.1866890 -0.28090587
## ASI  0.3239655 -0.46516345
## KD  -0.3561415  0.28968508
## ASL  0.1939088  0.49326813
## AML  0.2230916 -0.26750709

print(PCA1$rotation[,1:4],digits=4)

##          PC1       PC2      PC3      PC4
## AHH  0.44919 -0.220587 -0.37110 -0.08303
## RP   0.32639  0.299784  0.20678 -0.60401
## KOE -0.08792 -0.733460  0.12349  0.11865
## KV   0.15622 -0.396983  0.54002 -0.48168
## ASI  0.43507 -0.243617  0.11819  0.37430
## KD   0.15061  0.289124  0.67157  0.47500
## ASL  0.51068 -0.008205 -0.21468  0.09413
## AML  0.43220  0.151336 -0.03987  0.08713

summary(PCA1)

## Importance of components:
##                           PC1    PC2    PC3    PC4     PC5     PC6     PC7
## Standard deviation     1.6058 1.2299 1.0887 0.9833 0.84775 0.72081 0.60206
## Proportion of Variance 0.3223 0.1891 0.1482 0.1209 0.08984 0.06495 0.04531
## Cumulative Proportion  0.3223 0.5114 0.6596 0.7804 0.87025 0.93520 0.98051
##                            PC8
## Standard deviation     0.39487
## Proportion of Variance 0.01949
## Cumulative Proportion  1.00000

Persamaan PCA

Hasil di atas dapat dituliskan dalam bentuk persamaan: \[ PC_1 = 0.449X_1+0.326X_2-0.088X_3+0.156X_4+0.435X_5+0.151X_6+0.510X_7+0.432X_{8} \] \[PC1 menggambarkan ukuran dari angka harapan hidup, presentase bayi yang mendapat asi eksklusif, akses sanitasi layak dan akses air minum layak. Keempat variabel ini merupakan variabel terkuat dalam KU1. Berdasarkan informasi tersebut, maka KU1 dapat dinamakan dengan Perilaku Masyarakat Hidup Sehat\] \[ PC_2 = -0.220X_1 + 0.299X_2 -0.733X_3-0.396X_4-0.243X_5+0.289X_6-0.008X_7+.0.151X_{8}\] \[PC2 menggambarkan ukuran presentase puskesmas dengan ketersediaan obat esensial. Variable tersebut merupakan variable terkuat pada komponen ini. Berdasarkan informasi tersebut, maka KU2 dapat dinamakan sebagai Akses Obat Esensial. \] \[ PC_3 = -0.371X_1+0.206X_2+0.123X_3+0.540X_4+0.118X_5+0.671X_6-0.214X_7-0.039X_{8}\] \[PC3 menggambarkan ukuran presentase puskesmas dengan ketersediaan vaksin IDL dan kasus diare yang dilayani. Kedua variable tersebut merupakan variable terkuat pada komponen ini. Berdasarkan informasi tersebut, maka KU3 dapat dinamakan sebagai Kasus Diare dan Akses Vaksin IDL.\] \[ PC_4 = -0.083X_1-0.604X_2+.118X_3-0.481X_4+0.374X_5+0.475X_6-0.094X_7+0.087X_{8}\] \[ PC4 menggambarkan ukuran rasio puskesmas per kecamatan, presentase puskesmas dengan ketersediaan vaksin IDL dan kasus diare. Ketiga variable tersebut merupakan variable terkuat pada komponen ini. Berdasarkan informasi tersebut, maka KU4 dapat dinamakan sebagai Pelayanan Kesehatan.\] #Kesimpulan Dengan metode analisis komponen utama (PCA), dapat diketahui bahwa data Kesehatan di Indonesia yang terdiri dari 8 variabel dapat direduksi menjadi 4 variabel nmun tetap menggambarkan keragaman dari data awal. Kelima variable tersebut adalah Perilaku Masyarakat Hidup Sehat, Akses Obat Esensial, Kasus Diare dan Akses Vaksin IDL, Pelayanan Kesehatan. Dari empat variable tersebut yang berperan besar dalam menjelaskan Kesehatan di Indonesia adalah Perilaku Masyarakat Hidup Sehat.

```

ANALISIS KOMPONEN UTAMA (PCA) PADA DATA VARIABEL KESEHATAN DI INDONESIA TAHUN 2021

Khalishatinnisaa’

2023-10-23

Pendahuluan

Data

variable-variable yang digunakan tertera sebagai berikut :

PCA

Statistika Deskriptif

Eksplorasi Korelasi

Menampilkan Kumulatif Nilai Eigen dan Vektor Eigen

Dengan Matriks Kovarians

Dekomposisi Eigen

Menggambar Scree Plot Berdasarkan Nilai Eigen

Nilai Kumulatif Eigen

Persamaan PCA

Dekomposisi Eigen

Scree Plot

Nilai Kumulatif Eigen

Persamaan PCA

Fungsi PCA

`prcomp`

Persamaan PCA