People vector created by rawpixel.com - www.freepik.com
Salah satu modal dasar dalam pelaksanaan pembangunan nasional adalah kondisi kesehatan masyarakat. Kondisi kesehatan masyarakat mencerminkan kemajuan pembangunan suatu wilayah. Masyarakat yang sehat merupakan prasyarat bagi peningkatan produktivitas suatu wilayah. Masyarakat yang memiliki kesehatan yang baik, tentu dapat beraktivitas dengan optimal sehingga produktivitasnya dapat berjalan optimal pula.
Disebutkan dalam Tujuan Utama Berkelanjutan No 3, bahwa negara Indonesia ingin menjamin kehidupan yang sehat dan mendorong kesejakteraan bagi semua orang di segala usia. Untuk mencapai tujuan tersebut, pemerintah telah menerapkan berbagai program dan kebijakan. Untuk memonitor dan mengevaluasi berbagai kebijakan, diperlukan data di sektor kesehatan yang lengkap dan akurat yang dapat menggambarkan karakteriktik kesehatan di Indonesia.
Permasalahan yang ditemukan adalah terlalu banyak indikator menggambarkan karakteristik kesehatan di Indonesia. Indikator tersebut meliputi sarana kesehatan, pelayanan kesehatan, angka kesakitan, dan sebagainya. Indikator yang banyak ini dapat berujung kepada kesulitan dalam menggambarkan dan menginterpretasikan kesehatan di Indonesia. Ditambah terlalu banyaknya variabel seringkali berakibat kepada masalah multikolinearitas atau terdapat beberarapa variabel yang saling berhubungan sehingga dapat menimbulkan masalah ketika dilakukan analisis regresi dan klasifikasi.
Penelitian ini berfokus pada indikator kesehatan yang berada di Pulau Jawa. karena pertimbangan bahwa pembangunan sarana dan prasarana kesehatan di Pulau Jawa lebih merata dibanding pulau lain. Selain itu, indikator kesehatan di Pulau Jawa dirasa dapat menggambarkan keadaan kesehatan di Indonesia.
Dari latar belakang diatas, penelitian ini bertujuan untuk mereduksi beberapa variabel kesehatan menjadi beberapa variabel baru yang jumlahnya lebih kecil namun tanpa menghilangkan karakteristik dari variabel kesehatan tersebut. Hal ini dilakukan agar lebih mudah untuk menginterpretasikan data-data tersebut. Selain itu, penelitian ini bertujuan untuk mengidentifikasi indikator utama atau indikator yang berperan besar dalam menjelaskan karakteristik kesehatan di Pulau Jawa pada Tahun 2017.
Unit analisis dalam penelitian ini adalah seluruh kabupaten atau kota di Pulau Jawa yang berjumlah 119 kabupaten atau kota. Faktor ketersediaan dan kelengkapan data menyebabkan peneliti memutuskan untuk mengambil data pada tahun 2017. Data pada tahun 2017 dipilih karena dirasa masih menggambarkan karakteristik kesehatan di Pulau Jawa. Data yang digunakan merupakan data sekunder yang bersumber dari publikasi Profil Kesehatan Provinsi pada tahun 2017. Publikasi tersebut dikeluarkan oleh masing-masing Dinas Provinsi di Pulau Jawa yang mencakup di dalamnya data dan indikator dari setiap kabupaten atau kota di provinsi yang bersangkutan.
Pada contoh ini tidak diambil semua indikator yang terdapat pada publikasi Profil Kesehatan Provinsi, melainkan hanya megambil 8 indikator yang dirasa bisa mewakili berbagai indikator yang ada. Adapun indikator-indikator (variabel-variabel) yang digunakan tertera sebagai berikut :
Nama Indikator | Keterangan Indikator |
---|---|
Angka Harapan Hidup (X1) | Rata-rata tahun hidup yang masih akan dijalani oleh seseorang yang telah berhasil mencapai umur x, pada suatu tahun tertentu, dalam situasi mortalitas yang berlaku di lingkngan masyarakatnya. |
Rasio Puskesmas per 30 Ribu Penduduk (X2) | Rasio puskesmas per 30 ribu penduduk |
Rasio Rumah Sakit per 100 Ribu Penduduk (X3) | Rasio rumah sakit per 100 ribu penduduk |
Persentase Rumah Tangga PHBS (X4) | Rumah tangga PHBS adalah rumah tangga yang melaksanakan 10 indikator berperilaku hidup bersih dan sehat (PHBS) |
Persentase RT dengan Sanitasi Layak (X5) | Rumah tangga dengan sanitasi layak adalah rumah tangga yang menggunakan jamban komunal, jamban berleher angsa dan septic tank |
Persentase Bayi dengan Berat Badan Lahir Rendah (X6) | Bayi dengan berat badan lahir rendah (BBLR) adalah bayi yang memiliki berat badan kurang dari 2,5 kilogram saat dilahirkan |
Persentase Bayi yang Mendapat ASI Eksklusif (X7) | ASI Eksklusif adalah pemberian ASI saja tanpa makanan dan minuman lain sampai bayi berusia 6 bulan, kemudian pemberian ASI harus tetap dilanjutkan sampai bayi berusia 2 (dua) tahun walaupun bayi sudah makan |
Angka Kesakitan Diare (per 1000 ribu penduduk) (X8) | Diare merupakan sebuah penyakit yang ditandai dengan frekuensi buang air besar lebih dari tiga kali per hari dengan feses yang encer |
Data yang terdapat dalam contoh ini dapat diunduh disini
Salah satu metode yang digunakan untuk menentukan banyaknya komponen utama adalah dengan melihat proporsi kumulatif varians yang dapat dijelaskan oleh komponen utama. Proporsi varians komponen utama didapatkan dari nilai eigen pada komponen utama yang bersesuaian dibagi dengan total semua nilai eigen. Menurut Johnson, Komponen Utama yang diambil adalah komponen utama yang mencakup minimal 80% kumulatif varians pada data atau dapat dikatakan minimal mampu menangkap 80% keragaman dari data.
pr.out <- prcomp(x = KesehatanJawa[, c(-1)], center = TRUE, scale. = TRUE) #Tidak mengambil kolom Kabupaten/Kota
summary(pr.out)
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 1.4249 1.2722 1.1190 0.9650 0.84134 0.77993 0.70040
## Proportion of Variance 0.2538 0.2023 0.1565 0.1164 0.08848 0.07604 0.06132
## Cumulative Proportion 0.2538 0.4561 0.6126 0.7290 0.81752 0.89355 0.95487
## PC8
## Standard deviation 0.60084
## Proportion of Variance 0.04513
## Cumulative Proportion 1.00000
Berdasarkan informasi dari tabel diatas, banyaknya komponen utama yang dapat diambil sebanyak 5 komponen utama. Hal ini karena 5 komponen utama telah menangkap minimal 80 persen varians data. Kelima komponen utama telah mampu menangkap 81, 752 persen dari total keragaman data.
Selain itu, pendekatan yang dapat digunakan untuk menentukan jumlah komponen utama adalah dengan Scree Plot. Scree Plot merupakan plot antara komponen utama dengan varians nilai eigennya. Banyaknya komponen utama yang diambil adalah pada titik ekstrim dimana garis kurva mulai melandai. Dengan kata lain penambahan komponen utama tidak signifikan dalam menambah total keragaman data yang dapat diambil. Scree Plot yang terbentuk ditunjukkan pada grafik berikut.
KesehatanJawa_cor <- cor(KesehatanJawa[ ,-1]) #tidak mengambil kolom nama kabupaten/kota
KesehatanJawa_eig <- eigen(KesehatanJawa_cor)
scree_data <- data.frame(eigen_value = eigen(KesehatanJawa_cor)$values, PC = 1:8)
plot(x = scree_data$PC, y = scree_data$eigen_value, type = 'b',
xlab = 'Komponen Utama ke-', ylab = 'Varians (Nilai Eigen)', main = 'Scree Plot')
Berdasarkan Scree Plot diatas, banyaknya komponen utama yang dipilih adalah 5. Hal ini karena titik ekstrim dimana garis kurva mulai melandai ditunjukkan pada komponen ke 5. Berdasarkan informasi ini jumlah komponen yang dipilih berdasarkan metode proporsi kumulatif varians dengan metode Scree Plot yaitu 5 komponen utama.
Persamaan komponen utama dibentuk berdasarkan nilai vektor eigen dari data matriks korelasi antar tiap indikator. Matriks korelasi digunakan karena indikator kesehatan memiliki satuan yang berbeda-beda.
#Menggunakan fungsi `prcomp`
pr.out <- prcomp(x = KesehatanJawa[, c(-1)], center = TRUE, scale. = TRUE)
pr.out
## Standard deviations (1, .., p=8):
## [1] 1.4248810 1.2722354 1.1190405 0.9649731 0.8413365 0.7799263 0.7004021
## [8] 0.6008421
##
## Rotation (n x k) = (8 x 8):
## PC1 PC2 PC3 PC4
## AHH 0.57978758 -0.03282887 0.15124815 -0.17105620
## Rasio Puskesmas -0.02277195 0.46260831 -0.32982521 0.66623330
## Rasio Rumah Sakit 0.23996785 0.44120355 0.48126559 0.33240678
## Persentase PHBS 0.50818466 -0.25033356 -0.03641744 0.04578543
## Persentase Sanitasi Layak 0.47646449 0.26410687 0.08980182 -0.09192886
## Persentase BBLR 0.07630812 0.46051464 -0.32931707 -0.50400338
## Persentase Asi Eksklusif -0.25694228 0.49044214 0.23114526 -0.38859130
## Angka Kesakitan Diare -0.22052416 -0.07230971 0.68224211 0.02844066
## PC5 PC6 PC7 PC8
## AHH 0.1423215 -0.28565451 -0.30721407 -0.643737534
## Rasio Puskesmas -0.2042983 -0.05673727 0.16884319 -0.399197433
## Rasio Rumah Sakit 0.1026385 -0.20869622 -0.33125145 0.491759814
## Persentase PHBS -0.3790858 -0.38561201 0.55634835 0.271537817
## Persentase Sanitasi Layak 0.1315183 0.75773136 0.30856795 0.006768762
## Persentase BBLR -0.5623544 -0.01356383 -0.29604262 0.124765980
## Persentase Asi Eksklusif 0.2839850 -0.34449238 0.52174256 -0.132204561
## Angka Kesakitan Diare -0.6079302 0.17296201 0.05281825 -0.278554275
Nilai koeffisien setiap indikator dengan setiap komponen utama yang terbentuk digunakan sebagai alat bantu dalam menginterpretasikan setiap komponen utama. Selain itu, nilai ini juga dapat digunakan untuk memberi nama pada komponen utama. Akibatnya penamaan komponen utama didasarkan pada nilai koeffisien variabel terbesar karena sudah tidak dipengaruhi varians dari variabel yang bersangkutan . Sebagai tambahan, persamaan yang terbentuk merupakan persamaan dari data yang telah distandarisasi.
\[KU_{1} = \ 0.5798 X_{1} \ -0.0228X_{2}\ +0.2400X_{3} \ +0.5082X_{4} \ + 0.4765X_{5} \ +0.0763X_{6} \ - 0.2569 X_{7} \ -0.2205X_{8}\]
KU1 menggambarkan ukuran dari angka harapan hidup, rumah tangga PHBS, dan rumah tangga dengan sanitasi layak. Ketiga indikator ini merupakan indikator terkuat dalam KU1. Berdasarkan informasi tersebut, maka KU1 dapat dinamakan dengan Perilaku Masyarakat Hidup Sehat. Ditambah, komponen ini merupakan komponen yang paling berperan besar dalam menjelaskan indikator kesehatan karena dapat menangkap keragaman data terbesar.
\[KU_{2} = - \ 0.0328 X_{1} \ +0.4626X_{2}\ +0.4414X_{3} \ -0.2503X_{4} \ + 0.2641X_{5} \ +0.4605X_{6} \ + 0.4904 X_{7} \ -0.0723X_{8}\] KU2 menggambarkan ukuran rasio puskesmas terhadap penduduk, bayi dengan berat badan lahir rendah, dan bayi yang mendapat ASI eksklusif. Ketiga indikator ini merupakan indikator terkuat dalam KU2. Berdasarkan informasi tersebut, maka KU2 dapat dinamakan sebagai Akses dan Kondisi Kesehatan Bayi.
\[KU_{3} =\ 0.1512 X_{1} \ -0.3298X_{2}\ +0.4814X_{3} \ -0.0364X_{4} \ + 0.0898X_{5} \ -0.3293X_{6} \ + 0.2311 X_{7} \ +0.6822X_{8}\]
KU3 menggambarkan ukuran rasio puskesmas terhadap penduduk, rasio rumah sakit terhadap penduduk dan angka kesakitan diare . Ketiga indikator ini merupakan indikator terkuat dalam KU3. Berdasarkan informasi tersebut, maka KU3 dapat dinamakan sebagai Pelayanan Kesehatan Penduduk.
\[KU_{4} = -\ 0.1711 X_{1} \ -0.6662X_{2}\ +0.3324X_{3} \ +0.0458X_{4} \ - 0.0919X_{5} \ -0.5040X_{6} \ - 0.3866 X_{7} \ +0.0264X_{8}\]
KU4 menggambarkan ukuran rasio puskesmas terhadap penduduk, rasio rumah sakit terhadap penduduk, dan bayi dengan berat badan lahir rendah. Ketiga indikator ini merupakan indikator terkuat dalam KU4. Berdasarkan informasi tersebut, maka KU4 dapat dinamakan sebagai Fasilitas Kesehatan.
\[KU_{4} = \ 0.1423 X_{1} \ -0.2043X_{2}\ +0.1026X_{3} \ -0.3791X_{4} \ + 0.1315X_{5} \ -0.5624X_{6} \ + 0.2840 X_{7} \ -0.6079X_{8}\] KU5 menggambarkan ukuran rumah tangga PHBS, bayi dengan berat badan lahir rendah dan angka kesakitan diare. Ketiga indikator ini merupakan indikator terkuat dalam KU5. Berdasarkan informasi tersebut, maka KU5 dapat dinamakan sebagai Kesehatan Masyarakat.
Dengan metode analisis komponen utama, dapat diketahui bahwasanya data kesehatan di Pulau Jawa yang terdiri atas 8 indikator dapat direduksi menjadi 5 indikator namun tetap dapat menggambarkan keragaman dari data awal. Kelima indikator tersebut adalah Perilaku Masyarakat Hidup Sehat, Akses dan Kondisi Kesehatan Bayi, Pelayanan Kesehatan Penduduk, Fasilitas Kesehatan, dan Kesehatan Masyarakat. Dari kelima indikator tersebut yang berperan besar dalam menjelaskan kesehatan di Pulau Jawa adalah Perilaku Masyarakat Hidup Sehat. Selain itu indikator baru yang terbentuk ini dapat digunakan untuk analisis lanjutan seperti regresi dan klasifikasi dan telah mengatasi masalah multikolinearitas karena memiliki sifat saling bebas satu sama lain.