Penggunaan statistika sangat diperlukan dalam penelitian di semua bidang ilmu apapun yang menggunakan perhitungan-perhitungan. Hasil sebuah penelitian dipengaruhi oleh penggunaan satatistika dalam mengolah data penelitian. dalam statistika terdapat metode metode analisis yaitu analisis regresi. tujuan dari analisis data adalah untuk memodelkan hubungan variabel dan model tersebut digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen. analisis regresi merupakan sebuah metode statistika yang berguna untuk memahami hubungan antara satu variabel dependen (variabel respon) dan satu atau lebih variabel independen (variabel prediktor).
Indonesia, sebuah negara kepulauan yang megah, tantangan kesehatan menjadi kompleks karena beragamnya faktor dan dinamika sosial,ekonomi,dan lingkungan.Kesehatan masyarakat merupakan aspek yang sangat penting dalam pembangunan suatu negara. Bagaimana kondisi kesehatan suatu populasi menjadi cerminan dari kemajuan dan kesejahteraan suatu bangsa.
Data yang digunakan berasal dari Kaggle.com. Analisis yang digunakan adalah seluruh provinsi di Indonesia yang berjumlah 34 provinsi. Publikasi tersebut dikeluarkan oleh Kementrian Kesehatan Republik Indonesia. Pada analisis ini tidak diambil semua variabel yang terdapat pada publikasi Profil Kesehata 2021, melainkan hanya mengambil 8 variabel yang dirasa bisa mewakili berbagai variabel yang ada.
\(X_1\) : Angka harapan hidup(AHH) \(X_2\) : Rasio puskesmas per kecamatan \(X_3\) : Presentase puskesmas dengan ketersediaan obat esensial \(X_4\) : Presentase puskesmas dengan ketersediaan vaksin IDL \(X_5\) : Presentase bayi yang mendapat ASI eksklusif \(X_6\) : Presentase bayi yang mendapat ASI eksklusif \(X_7\) : Presentase rumah tangga yang memiliki akses terhadap sanitasi layak \(X_8\) : Presentase rumah tangga yang memiliki akses terhadap air minum layak
#Analisis yang Digunakan
Penggunaan PCA dilakukan untuk mereduksi variabel-variabel yang ada. Selain itu, ada kecurigaan beberapa variabel tersebut tumpang tindih dan memiliki nilai korelasi yang sangat tinggi.
library(readxl)
Data_T1 <- read_excel("~/SEMESTER 5/ANMUL/Data T1.xlsx")
View(Data_T1)
summary(Data_T1)
## AHH RP KOE KV
## Min. :65.25 Min. :0.300 Min. : 0.00 Min. : 70.30
## 1st Qu.:68.83 1st Qu.:1.325 1st Qu.: 71.72 1st Qu.: 95.88
## Median :70.07 Median :1.400 Median : 90.00 Median :100.00
## Mean :70.15 Mean :1.597 Mean : 78.39 Mean : 96.94
## 3rd Qu.:71.60 3rd Qu.:1.500 3rd Qu.:100.00 3rd Qu.:100.00
## Max. :75.04 Max. :7.200 Max. :100.00 Max. :100.00
## ASI KD ASL AML
## Min. :13.00 Min. : 6.70 Min. :40.81 Min. :64.92
## 1st Qu.:45.50 1st Qu.:22.10 1st Qu.:77.36 1st Qu.:80.57
## Median :54.90 Median :29.70 Median :80.67 Median :88.72
## Mean :52.79 Mean :30.82 Mean :80.97 Mean :86.68
## 3rd Qu.:64.58 3rd Qu.:37.02 3rd Qu.:84.61 3rd Qu.:93.23
## Max. :82.40 Max. :68.60 Max. :97.12 Max. :99.86
Terlihat bahwa setiap variabel memiliki rentang nilai yang sangat jauh, sehingga akan diperlukan standarisasi.
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.3
## corrplot 0.92 loaded
kor <- cor(Data_T1)
corrplot(kor, method="number")
Terdapat korelasi yang tinggi pada corrplot tersebut.
sc <- scale(Data_T1)
sc
## AHH RP KOE KV ASI
## [1,] -0.07549982 -0.383310452 -0.307874761 -0.13963568 0.15986836
## [2,] -0.36602781 -0.190235558 0.172232583 -0.83440834 -0.65607377
## [3,] -0.22275373 -0.093698110 0.757472921 0.50551036 1.03715953
## [4,] 0.60505205 -0.190235558 0.466604969 0.35663051 -0.81558126
## [5,] 0.42595945 -0.190235558 0.757472921 -0.55319084 0.64452572
## [6,] -0.06754015 -0.190235558 -0.686353542 0.50551036 -0.45362196
## [7,] -0.29041094 -0.190235558 0.757472921 0.50551036 0.82857282
## [8,] 0.23094751 -0.190235558 0.056586288 -0.18926230 0.74881907
## [9,] 0.23094751 -0.190235558 -0.994743661 0.50551036 0.34391546
## [10,] -0.01182245 -0.383310452 -1.744692358 0.50551036 0.05557501
## [11,] 1.13835000 5.408936379 -2.746960243 0.50551036 0.96967559
## [12,] 1.22590638 0.099376784 0.238816813 -0.71861290 0.40526449
## [13,] 1.71940598 -0.093698110 0.407029605 -2.42246014 0.89605675
## [14,] 1.94625660 0.002839337 0.757472921 0.50551036 1.34390469
## [15,] 0.48963682 -0.093698110 -0.009997942 0.20775065 0.21508249
## [16,] -0.05162081 0.002839337 -1.579983999 0.43934154 0.29483623
## [17,] 0.83190267 0.485526573 0.757472921 -0.18926230 1.11077837
## [18,] -1.37690602 -0.093698110 0.757472921 0.50551036 1.81629224
## [19,] -1.19383359 -0.190235558 0.119666085 -0.73515511 0.30710604
## [20,] 0.24288702 -0.190235558 0.508658167 0.50551036 -0.04258345
## [21,] -0.14315702 -0.093698110 -1.243558416 -0.56973304 -0.49656629
## [22,] -0.52522123 -0.093698110 0.757472921 0.09195521 0.09851933
## [23,] 1.77512368 0.195914231 0.407029605 0.50551036 0.04944010
## [24,] 0.99507592 -0.576385346 0.757472921 0.50551036 -0.22663054
## [25,] 0.64087057 -0.383310452 0.007524224 0.50551036 -1.38612726
## [26,] -0.52522123 -0.383310452 0.487631568 0.50551036 -0.18982112
## [27,] 0.20308866 -0.093698110 0.757472921 0.50551036 1.08623875
## [28,] 0.44585863 -0.286773005 0.140692684 0.50551036 0.07397972
## [29,] -0.77993070 -0.383310452 0.757472921 0.50551036 -1.58244417
## [30,] -1.95000233 -0.190235558 0.757472921 0.50551036 -0.42908235
## [31,] -1.61569615 0.292451678 -0.798495404 0.50551036 -2.44133062
## [32,] -0.67645498 -0.286773005 0.757472921 0.50551036 0.19054288
## [33,] -1.59579697 -1.252147477 -2.746960243 -4.40752489 -1.54563475
## [34,] -1.67937352 0.388989125 0.757472921 0.05887079 -2.41065611
## KD ASL AML
## [1,] -0.806214906 -0.3442931036 0.24966040
## [2,] -1.848703084 0.1060525878 0.49786079
## [3,] 0.535222088 -1.2379320930 -0.38738728
## [4,] -0.706565301 0.2692651203 0.36430534
## [5,] 0.657867756 -0.0611898837 -0.82469274
## [6,] 0.719190590 -0.3704877075 -0.23373942
## [7,] -0.131663732 -0.1166015460 -2.27961983
## [8,] -0.737226718 0.2944522395 -0.76559741
## [9,] -0.392285776 1.1357020209 -1.56929393
## [10,] -0.399951131 1.0732379653 0.49076935
## [11,] 0.918489800 1.4308950580 1.55803106
## [12,] 0.075300833 -0.9377016320 0.77560886
## [13,] 0.052304770 0.2329956686 0.82052131
## [14,] -1.312128286 1.6273545878 1.06517598
## [15,] 1.240434679 0.0002666871 0.98598824
## [16,] 2.896151197 0.1937037626 0.80752034
## [17,] -0.729561363 1.5094788699 1.28619253
## [18,] 2.620198444 0.1896738236 0.93634816
## [19,] -0.323297588 -0.7664292214 -0.15100596
## [20,] -0.553258216 -0.2596643830 -0.93579197
## [21,] -0.445943256 -0.7251223460 -1.13789800
## [22,] -0.422947193 0.0466109865 -1.21472194
## [23,] -0.039679481 0.8868532832 -0.10372969
## [24,] 0.972147280 -0.1176090307 0.01446098
## [25,] -1.166486556 0.3911707772 0.58768570
## [26,] 0.297596106 -0.4944083340 0.21656701
## [27,] -0.231313337 1.0682005414 0.53213609
## [28,] -0.813880260 0.4687471044 0.62196099
## [29,] 0.006312645 -0.2405221725 0.93280244
## [30,] 0.803509487 -0.0853695182 -0.98425014
## [31,] 0.266934689 -0.4228769155 0.77206314
## [32,] 0.075300833 -0.3886224334 0.23429561
## [33,] 0.243938626 -0.3100386215 -0.59067523
## [34,] -1.319793641 -4.0457921419 -2.57155077
## attr(,"scaled:center")
## AHH RP KOE KV ASI KD ASL AML
## 70.149706 1.597059 78.385294 96.944118 52.794118 30.817647 80.967353 86.677647
## attr(,"scaled:scale")
## AHH RP KOE KV ASI KD ASL AML
## 2.512667 1.035867 28.535285 6.045143 16.300176 13.045711 9.925708 8.460905
s <- cov(sc)
s_eig <- eigen(s)
s_eig
## eigen() decomposition
## $values
## [1] 2.5786130 1.5126251 1.1852488 0.9668667 0.7186834 0.5195701 0.3624722
## [8] 0.1559207
##
## $vectors
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] -0.44919141 -0.220586697 0.37110369 0.08303009 -0.136771186 -0.257742181
## [2,] -0.32638753 0.299784292 -0.20678178 0.60401342 -0.337853995 -0.348981570
## [3,] 0.08791837 -0.733460336 -0.12349020 -0.11864781 0.104938509 -0.376765522
## [4,] -0.15621748 -0.396982656 -0.54001792 0.48168384 0.223480622 0.361466083
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923 -0.525313983 -0.002755536
## [6,] -0.15061258 0.289123639 -0.67157248 -0.47499983 0.004465565 -0.079465558
## [7,] -0.51068381 -0.008204513 0.21467808 -0.09413054 0.125065780 0.622600987
## [8,] -0.43219561 0.151335621 0.03987159 -0.08713133 0.717339857 -0.381072811
## [,7] [,8]
## [1,] 0.7204089 -0.02881353
## [2,] -0.2754182 -0.29020852
## [3,] -0.2261462 -0.46997097
## [4,] 0.1866890 0.28090587
## [5,] -0.3239655 0.46516345
## [6,] 0.3561415 -0.28968508
## [7,] -0.1939088 -0.49326813
## [8,] -0.2230916 0.26750709
plot(s_eig$values, xlab="Eigenvalue Number", ylab = "Eigenvalue Size",
main = "Scree Plot")
lines(s_eig$values)
Diketahui secara visual, dapat dimanfaatkan sekitar 4 PC. Berdasarkan
scree plot diatas, banyaknya komponen utama yang dipilih adalah 5. Hal
ini karena titik ekstrim dimana garis kurva mulai melandai ditunjukkan
pada komponen ke 4. Berdasarkan informasi ini jumlah komponen yang
dipilih berdasarkan metode proporsi kumlatif varians dengan metode scree
plot yaitu 4 komponen utama.
for (eg in s_eig$values){
print(eg / sum(s_eig$values))
}
## [1] 0.3223266
## [1] 0.1890781
## [1] 0.1481561
## [1] 0.1208583
## [1] 0.08983542
## [1] 0.06494626
## [1] 0.04530903
## [1] 0.01949009
Diketahui berdasarkan kumulasi, 4 PC sudah menangkap sekitar 75% keragaman. Sehingga dapat kita susun 4 buah PC
s_eig$vectors[,1:4]
## [,1] [,2] [,3] [,4]
## [1,] -0.44919141 -0.220586697 0.37110369 0.08303009
## [2,] -0.32638753 0.299784292 -0.20678178 0.60401342
## [3,] 0.08791837 -0.733460336 -0.12349020 -0.11864781
## [4,] -0.15621748 -0.396982656 -0.54001792 0.48168384
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923
## [6,] -0.15061258 0.289123639 -0.67157248 -0.47499983
## [7,] -0.51068381 -0.008204513 0.21467808 -0.09413054
## [8,] -0.43219561 0.151335621 0.03987159 -0.08713133
Hasil di atas dapat dituliskan dalam bentuk persamaan: \[ PC_1 = -0.449X_1-0.326X_2+0.088X_3-0.156X_4-.0.435X_5-0.151X_6-0.510X_7-0.432X_{8}\] \[ PC_2 = -0.220X_1 + 0.299X_2 -0.733X_3 -0.396X_4 -0.243X_5+0.289X_6-0.008X_7+.0.151X_{8} \] \[ PC_3 = 0.371X_1-0.206X_2-0.123X_3-0.540X_4-0.118X_5-0.671X_6+0.214X_7+0.039X_{8}\] \[ PC_4 = 0.083X_1+0.604X_2-0.118X_3+0.481X_4-0.374X_5-0.474X_6-0.094X_7+-0.087X_{8}\] ## Dengan Matriks Korelasi
kor_eig <- eigen(kor)
kor_eig
## eigen() decomposition
## $values
## [1] 2.5786130 1.5126251 1.1852488 0.9668667 0.7186834 0.5195701 0.3624722
## [8] 0.1559207
##
## $vectors
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] -0.44919141 -0.220586697 0.37110369 0.08303009 -0.136771186 -0.257742181
## [2,] -0.32638753 0.299784292 -0.20678178 0.60401342 -0.337853995 -0.348981570
## [3,] 0.08791837 -0.733460336 -0.12349020 -0.11864781 0.104938509 -0.376765522
## [4,] -0.15621748 -0.396982656 -0.54001792 0.48168384 0.223480622 0.361466083
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923 -0.525313983 -0.002755536
## [6,] -0.15061258 0.289123639 -0.67157248 -0.47499983 0.004465565 -0.079465558
## [7,] -0.51068381 -0.008204513 0.21467808 -0.09413054 0.125065780 0.622600987
## [8,] -0.43219561 0.151335621 0.03987159 -0.08713133 0.717339857 -0.381072811
## [,7] [,8]
## [1,] 0.7204089 -0.02881353
## [2,] -0.2754182 -0.29020852
## [3,] -0.2261462 -0.46997097
## [4,] 0.1866890 0.28090587
## [5,] -0.3239655 0.46516345
## [6,] 0.3561415 -0.28968508
## [7,] -0.1939088 -0.49326813
## [8,] -0.2230916 0.26750709
plot(kor_eig$values, xlab="Eigenvalue Number", ylab="Eigenvalue Size",
main = "Scree Plot")
lines(kor_eig$values)
Proses selanjutnya mengikuti pola yang sama.
for (eg in kor_eig$values){
print(eg / sum(kor_eig$values))
}
## [1] 0.3223266
## [1] 0.1890781
## [1] 0.1481561
## [1] 0.1208583
## [1] 0.08983542
## [1] 0.06494626
## [1] 0.04530903
## [1] 0.01949009
Diketahui berdasarkan kumulasi, 4 PC sudah menangkap sekitar 75% keragaman. Sehingga dapat kita susun 4 buah PC
kor_eig$vectors[,1:4]
## [,1] [,2] [,3] [,4]
## [1,] -0.44919141 -0.220586697 0.37110369 0.08303009
## [2,] -0.32638753 0.299784292 -0.20678178 0.60401342
## [3,] 0.08791837 -0.733460336 -0.12349020 -0.11864781
## [4,] -0.15621748 -0.396982656 -0.54001792 0.48168384
## [5,] -0.43507421 -0.243617182 -0.11818694 -0.37429923
## [6,] -0.15061258 0.289123639 -0.67157248 -0.47499983
## [7,] -0.51068381 -0.008204513 0.21467808 -0.09413054
## [8,] -0.43219561 0.151335621 0.03987159 -0.08713133
Hasil di atas dapat dituliskan dalam bentuk persamaan: \[ PC_1 =
-0.449X_1-0.326X_2+0.088X_3-0.156X_4-.0.435X_5-0.151X_6-0.510X_7-0.432X_{8}
\] \[ PC_2 = -0.220X_1 + 0.299X_2
-0.733X_3 -0.396X_4 -0.243X_5+0.289X_6-0.008X_7+.0.151X_{8} \]
\[ PC_3 =
0.371X_1-0.206X_2-0.123X_3-0.540X_4-0.118X_5-0.671X_6+0.214X_7+0.039X_{8}\]
\[ PC_4 =
0.083X_1+0.604X_2-0.118X_3+0.481X_4-0.374X_5-0.474X_6-0.094X_7-0.087X_{8}\]
prcompPCA1 <- prcomp(x=Data_T1,scale=T,center=T)
PCA1
## Standard deviations (1, .., p=8):
## [1] 1.6058060 1.2298882 1.0886913 0.9832938 0.8477520 0.7208121 0.6020566
## [8] 0.3948680
##
## Rotation (n x k) = (8 x 8):
## PC1 PC2 PC3 PC4 PC5 PC6
## AHH 0.44919141 -0.220586697 -0.37110369 -0.08303009 -0.136771186 0.257742181
## RP 0.32638753 0.299784292 0.20678178 -0.60401342 -0.337853995 0.348981570
## KOE -0.08791837 -0.733460336 0.12349020 0.11864781 0.104938509 0.376765522
## KV 0.15621748 -0.396982656 0.54001792 -0.48168384 0.223480622 -0.361466083
## ASI 0.43507421 -0.243617182 0.11818694 0.37429923 -0.525313983 0.002755536
## KD 0.15061258 0.289123639 0.67157248 0.47499983 0.004465565 0.079465558
## ASL 0.51068381 -0.008204513 -0.21467808 0.09413054 0.125065780 -0.622600987
## AML 0.43219561 0.151335621 -0.03987159 0.08713133 0.717339857 0.381072811
## PC7 PC8
## AHH -0.7204089 0.02881353
## RP 0.2754182 0.29020852
## KOE 0.2261462 0.46997097
## KV -0.1866890 -0.28090587
## ASI 0.3239655 -0.46516345
## KD -0.3561415 0.28968508
## ASL 0.1939088 0.49326813
## AML 0.2230916 -0.26750709
print(PCA1$rotation[,1:4],digits=4)
## PC1 PC2 PC3 PC4
## AHH 0.44919 -0.220587 -0.37110 -0.08303
## RP 0.32639 0.299784 0.20678 -0.60401
## KOE -0.08792 -0.733460 0.12349 0.11865
## KV 0.15622 -0.396983 0.54002 -0.48168
## ASI 0.43507 -0.243617 0.11819 0.37430
## KD 0.15061 0.289124 0.67157 0.47500
## ASL 0.51068 -0.008205 -0.21468 0.09413
## AML 0.43220 0.151336 -0.03987 0.08713
summary(PCA1)
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 1.6058 1.2299 1.0887 0.9833 0.84775 0.72081 0.60206
## Proportion of Variance 0.3223 0.1891 0.1482 0.1209 0.08984 0.06495 0.04531
## Cumulative Proportion 0.3223 0.5114 0.6596 0.7804 0.87025 0.93520 0.98051
## PC8
## Standard deviation 0.39487
## Proportion of Variance 0.01949
## Cumulative Proportion 1.00000
Hasil di atas dapat dituliskan dalam bentuk persamaan: \[ PC_1 = 0.449X_1+0.326X_2-0.088X_3+0.156X_4+0.435X_5+0.151X_6+0.510X_7+0.432X_{8} \] \[PC1 menggambarkan ukuran dari angka harapan hidup, presentase bayi yang mendapat asi eksklusif, akses sanitasi layak dan akses air minum layak. Keempat variabel ini merupakan variabel terkuat dalam KU1. Berdasarkan informasi tersebut, maka KU1 dapat dinamakan dengan Perilaku Masyarakat Hidup Sehat\] \[ PC_2 = -0.220X_1 + 0.299X_2 -0.733X_3-0.396X_4-0.243X_5+0.289X_6-0.008X_7+.0.151X_{8}\] \[PC2 menggambarkan ukuran presentase puskesmas dengan ketersediaan obat esensial. Variable tersebut merupakan variable terkuat pada komponen ini. Berdasarkan informasi tersebut, maka KU2 dapat dinamakan sebagai Akses Obat Esensial. \] \[ PC_3 = -0.371X_1+0.206X_2+0.123X_3+0.540X_4+0.118X_5+0.671X_6-0.214X_7-0.039X_{8}\] \[PC3 menggambarkan ukuran presentase puskesmas dengan ketersediaan vaksin IDL dan kasus diare yang dilayani. Kedua variable tersebut merupakan variable terkuat pada komponen ini. Berdasarkan informasi tersebut, maka KU3 dapat dinamakan sebagai Kasus Diare dan Akses Vaksin IDL.\] \[ PC_4 = -0.083X_1-0.604X_2+.118X_3-0.481X_4+0.374X_5+0.475X_6-0.094X_7+0.087X_{8}\] \[ PC4 menggambarkan ukuran rasio puskesmas per kecamatan, presentase puskesmas dengan ketersediaan vaksin IDL dan kasus diare. Ketiga variable tersebut merupakan variable terkuat pada komponen ini. Berdasarkan informasi tersebut, maka KU4 dapat dinamakan sebagai Pelayanan Kesehatan.\] #Kesimpulan Dengan metode analisis komponen utama (PCA), dapat diketahui bahwa data Kesehatan di Indonesia yang terdiri dari 8 variabel dapat direduksi menjadi 4 variabel nmun tetap menggambarkan keragaman dari data awal. Kelima variable tersebut adalah Perilaku Masyarakat Hidup Sehat, Akses Obat Esensial, Kasus Diare dan Akses Vaksin IDL, Pelayanan Kesehatan. Dari empat variable tersebut yang berperan besar dalam menjelaskan Kesehatan di Indonesia adalah Perilaku Masyarakat Hidup Sehat.
```