PENDAHULUAN

Latar Belakang Kasus

Kematian bayi merupakan salah satu indikator penting yang menggambarkan kondisi kesehatan masyarakat serta kualitas layanan kesehatan suatu wilayah. Tingginya angka kematian bayi sering kali berkaitan dengan berbagai faktor yang saling berhubungan, seperti status gizi, sanitasi lingkungan, akses air bersih, dan ketersediaan fasilitas kesehatan. Bayi yang mengalami kekurangan gizi sejak lahir atau selama masa pertumbuhan awal lebih rentan terhadap infeksi, gangguan perkembangan, dan penyebab kematian lain yang bersifat preventable.

Indonesia, termasuk Provinsi Nusa Tenggara Timur, masih menghadapi tantangan dalam penanggulangan permasalahan gizi dan kesehatan dasar. Persentase stunting dan wasting yang tinggi menunjukkan bahwa sebagian bayi mengalami malnutrisi kronis maupun akut. Di sisi lain, keterbatasan akses puskesmas, sanitasi tidak layak, dan minimnya air bersih dapat memperburuk kondisi kesehatan bayi, terutama pada keluarga dengan tingkat kemiskinan tinggi.

Permasalahan ini tidak hanya bersifat kesehatan, tetapi juga sosial-ekonomi. Oleh karena itu, dibutuhkan analisis multivariat yang mampu melihat pola keterkaitan antar faktor penyebab secara menyeluruh, bukan hanya mengamati satu variabel secara terpisah. Analisis ini penting sebagai dasar dalam merumuskan kebijakan intervensi kesehatan yang tepat sasaran.

Data

Data yang digunakan dalam penelitian ini diambil dari publikasi resmi Badan Pusat Statistik (BPS) yang berjudul “Provinsi Nusa Tenggara Timur Dalam Angka 2025” Badan Pusat Statistik Provinsi Nusa Tenggara Timur. Link : https://ntt.bps.go.id/id/publication/2025/02/28/0486bf7b20576e8f1faa5384/provinsi-nusa-tenggara-timur-dalam-angka-2025.html

## Warning: package 'readxl' was built under R version 4.3.3
## # A tibble: 22 × 7
##    Provinsi      `Stunting (X1)` `Wasting (X2)` `Puskesmas (X3)` `Sanitasi (X4)`
##    <chr>                   <dbl>          <dbl>            <dbl>           <dbl>
##  1 Sumba Barat              1787            698               10            60.8
##  2 Sumba Timur              3365           1215               23            65.9
##  3 Kupang                   3902           2663               26            73.3
##  4 Timor Tengah…            9251           4436               38            70.7
##  5 Timor Tengah…            4802           1624               26            80.8
##  6 Belu                     2351           1817               17            85.8
##  7 Alor                     2260           1869               27            85.8
##  8 Lembata                   673            643               13            88.6
##  9 Flores Timur             3265           1664               21            97.0
## 10 Sikka                    3375           2678               25            85.4
## # ℹ 12 more rows
## # ℹ 2 more variables: `Penduduk Miskin (X5)` <dbl>, `Air Bersih (X6)` <dbl>

Dataset memuat indikator kesehatan dan sosial ekonomi yang berkaitan dengan kematian bayi, dengan variabel utama sebagai berikut: - X1: Stunting - X2: Wasting - X3: Jumlah Puskesmas - X4: Sanitasi layak - X5: Persentase penduduk miskin - X6: Akses air bersih

Seluruh variabel bersifat kuantitatif sehingga cocok digunakan dalam analisis statistik berbasis komponen utama.

Latar Belakang Metode

Penggunaan Principal Component Analysis (PCA) diperlukan karena variabel penyebab kematian bayi seperti stunting, wasting, sanitasi, air bersih, kemiskinan, dan jumlah puskesmas saling berkaitan satu sama lain, sehingga analisis secara terpisah berpotensi menghasilkan interpretasi yang bias. PCA mereduksi variabel-variabel tersebut menjadi beberapa komponen utama yang tidak saling berkorelasi dan mampu menangkap sebagian besar variasi data, sehingga pola hubungan antar faktor dapat terlihat lebih jelas. Dengan demikian, PCA membantu mengidentifikasi faktor dominan yang memengaruhi kematian bayi, menyederhanakan kompleksitas data, dan memberikan dasar yang kuat untuk analisis dan pengambilan keputusan berbasis bukti.

Tinjauan Pustaka

Kematian Bayi

Kematian bayi merupakan indikator kesehatan utama yang menggambarkan tingkat kesejahteraan masyarakat dan efektivitas layanan kesehatan suatu wilayah. Faktor gizi seperti stunting dan wasting terbukti meningkatkan kerentanan bayi terhadap infeksi dan komplikasi pertumbuhan, sehingga meningkatkan risiko mortalitas (WHO, 2018; Victora et al., 2020). Selain itu, sanitasi tidak layak dan akses air bersih terbatas meningkatkan kejadian penyakit diare, infeksi intestinal, dan gangguan kulit yang sering menjadi penyebab utama kematian bayi di negara berkembang. Faktor sosial ekonomi seperti kemiskinan memperburuk kondisi tersebut karena membatasi kemampuan keluarga dalam memperoleh makanan bergizi dan layanan kesehatan dasar seperti puskesmas, yang berperan penting dalam penanganan neonatal, imunisasi, serta pelayanan kesehatan ibu dan anak.

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) adalah teknik analisis multivariat yang mereduksi sekumpulan variabel yang saling berkorelasi menjadi beberapa komponen utama yang tidak berkorelasi satu sama lain (Jolliffe, 2002). PCA menempatkan variabel dengan informasi terbesar pada komponen awal sehingga mampu meringkas struktur data tanpa kehilangan informasi penting. Dalam studi epidemiologi, PCA banyak digunakan untuk memahami faktor laten seperti kondisi sosial ekonomi, akses kesehatan, dan lingkungan yang secara simultan berkontribusi terhadap mortalitas bayi. Metode ini membantu mengidentifikasi pola dominan penyebab kematian bayi antar wilayah serta menyederhanakan interpretasi hasil analisis yang kompleks.

Tujuan

Tujuan penelitian ini adalah sebagai berikut: - Menganalisis faktor utama penyebab variasi kematian bayi berdasarkan variabel stunting, wasting, jumlah puskesmas, sanitasi layak, penduduk miskin, dan akses air bersih. - Mengidentifikasi komponen utama menggunakan PCA untuk mengetahui variabel mana yang paling dominan mempengaruhi perbedaan kondisi antar wilayah. - Menyederhanakan data multivariat menjadi beberapa dimensi utama agar pola keterkaitan antar faktor dapat diinterpretasikan secara lebih mudah dan akurat.

Source Code

Input Library

library(readxl)
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.3.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.3.3
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

Memanggil paket-paket yang diperlukan seperti readxl, dplyr, dan factoextra agar R dapat membaca Excel, mengolah data, dan melakukan visualisasi PCA.

Import Data

data <- read_excel("~/SEMESTER 5/analisis multivariat 1/DataLaprak2Balita.xlsx")
View(data)

Mengimpor file Excel dari folder penyimpanan ke dalam R dan menyimpannya sebagai objek bernama data untuk digunakan dalam analisis.

Mengambil Variabel Numerik

prediktor <- select(data, -Provinsi)

Memilih hanya variabel numerik dengan menghapus kolom Provinsi sehingga data siap digunakan untuk PCA.

PCA

pca_res <- prcomp(prediktor, scale. = TRUE)
summary(pca_res)

Menjalankan analisis PCA dengan menstandarisasi semua variabel agar berada pada skala yang sama sehingga hasil PCA tidak bias.

Eigen Value

eigen_values <- pca_res$sdev^2
eigen_values

Menghitung nilai eigen untuk setiap komponen utama yang menggambarkan besarnya variansi yang dijelaskan oleh masing-masing komponen.

Proporsi Variasi

prop_variance <- eigen_values / sum(eigen_values)
prop_variance

Menentukan proporsi variansi yang dijelaskan setiap komponen utama dengan membagi nilai eigen terhadap total variansi.

Proporsi Kumulatif

cumsum(prop_variance)

Menghitung akumulasi variansi yang berhasil dijelaskan oleh beberapa komponen pertama secara bertahap.

Loading Matriks

pca_res$rotation

Menampilkan nilai loading untuk melihat kontribusi setiap variabel terhadap masing-masing komponen utama dalam PCA.

Visualisasi PCA

ScreePlot (Nilai Eigen)

fviz_eig(
  pca_res,
  addlabels = TRUE,
  xlab = "Komponen Utama",
  ylab = "Nilai Eigen",
  main = "Scree Plot PCA"
)
## Warning in geom_bar(stat = "identity", fill = barfill, color = barcolor, :
## Ignoring empty aesthetic: `width`.

Untuk menampilkan grafik nilai eigen dari setiap komponen utama, sehingga mempermudah melihat penurunan variansi dan menentukan jumlah komponen yang perlu dipertahankan dalam analisis PCA.

Loading plot (hubungan variabel vs komponen)

fviz_pca_var(
  pca_res,
  col.var = "navy",
  repel = TRUE,
  title = "Loading Plot PCA (PC1 vs PC2)"
)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the ggpubr package.
##   Please report the issue at <https://github.com/kassambara/ggpubr/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Untuk memperlihatkan arah dan kekuatan kontribusi setiap variabel terhadap komponen utama, dengan tampilan panah yang saling tidak bertumpuk sehingga hubungan antarvariabel dapat dibaca dengan jelas.

Biplot

fviz_pca_biplot(
  pca_res,
  repel = TRUE,
  col.var = "navy",
  col.ind = "red",
  geom.ind = "point"
) +
  ggtitle("Biplot PCA Komponen Penyusun IKLH 2023") +
  theme_minimal()

Untuk membuat biplot PCA yang menampilkan hubungan antara variabel dan provinsi dalam satu grafik, dengan label yang tidak saling bertumpuk serta penggunaan warna khusus untuk variabel (biru) dan provinsi (merah) agar perbedaan keduanya tampak jelas.

HASIL DAN PEMBAHASAN

Hasil PCA

Hasil analisis PCA menunjukkan bahwa sebagian besar variasi data dapat dijelaskan oleh beberapa komponen utama. Komponen pertama (PC1) merupakan komponen paling dominan dengan kontribusi sebesar 38,27% terhadap total keragaman data. Komponen kedua (PC2) menambah 31,40%, sehingga dua komponen pertama telah mampu menjelaskan 69,67% variasi keseluruhan. Dengan tambahan komponen ketiga (PC3) yang menyumbang 15,64%, tiga komponen pertama secara kumulatif mencakup 85,31% informasi penting dalam data, sedangkan komponen keempat hanya memberikan kontribusi kecil sebesar 6,88%. Secara umum, hasil ini menunjukkan bahwa struktur variabilitas faktor-faktor penyebab kematian bayi dapat diringkas secara efektif menggunakan dua hingga tiga komponen utama tanpa kehilangan informasi yang berarti. Hal ini mengindikasikan bahwa sebagian besar informasi dalam enam variabel penyebab kematian bayi saling berkorelasi dan dapat diproyeksikan ke dalam dimensi yang lebih sederhana untuk keperluan analisis lanjutan.

Eigen Value

Nilai eigen menunjukkan besarnya variasi yang dijelaskan setiap komponen utama. PC1 memiliki nilai eigen terbesar (2,2962) sehingga menjadi komponen paling dominan, disusul PC2 (1,8838) yang masih berada di atas ambang 1 dan dianggap signifikan. PC3 memiliki nilai 0,9385 yang masih memberikan kontribusi meski tidak sekuat dua komponen pertama, sedangkan PC4, PC5, dan PC6 bernilai jauh lebih kecil sehingga kurang berarti dalam struktur data. Berdasarkan kriteria Kaiser, hanya PC1 dan PC2 yang layak dipertahankan, menunjukkan bahwa sebagian besar variasi faktor penyebab kematian bayi dapat diringkas dalam dua dimensi utama saja.

Proportion Of Variance

knitr::include_graphics("C:/Users/RAHMATUL IZZA/OneDrive/Pictures/Screenshots/Screenshot 2025-12-03 171549.png")

Proporsi keragaman menunjukkan bahwa PC1 mampu menjelaskan 38,27% variasi data, diikuti PC2 sebesar 31,40%, PC3 sebesar 15,64%, dan PC4 hanya 6,88%, sehingga informasi utama dalam data terkonsentrasi pada dua komponen pertama. Dalam konteks kematian bayi, besarnya kontribusi PC1 menunjukkan bahwa faktor gizi (stunting dan wasting), sanitasi, akses air bersih, dan kemiskinan memiliki keterkaitan kuat dan membentuk dimensi dominan yang mencerminkan risiko kesehatan bayi. PC2 menambahkan variasi terkait akses layanan kesehatan seperti ketersediaan puskesmas, yang menjadi pembeda penting antar wilayah meskipun kontribusinya lebih kecil. Dengan demikian, PC1 dan PC2 sudah mampu merangkum sebagian besar perbedaan kondisi penyebab kematian bayi, sedangkan komponen berikutnya hanya menambah variasi yang relatif kecil.

Cumulative Proportion

knitr::include_graphics("C:/Users/RAHMATUL IZZA/OneDrive/Pictures/Screenshots/Screenshot 2025-12-03 172715.png")

Berdasarkan hasil cumulative proportion, dua komponen utama pertama (PC1 dan PC2) sudah mampu menjelaskan 69,67% variasi data, dan dengan penambahan PC3 meningkat menjadi 85,31%. Hal ini menunjukkan bahwa tiga komponen utama sudah cukup untuk merangkum sebagian besar informasi penting dari enam variabel penelitian. Dalam konteks studi kasus kematian bayi di NTT, besarnya proporsi kumulatif tersebut mengindikasikan bahwa perbedaan kondisi antar wilayah terutama dipengaruhi oleh faktor dominan seperti gizi buruk (stunting–wasting), kemiskinan, sanitasi dan air bersih (PC1), serta ketersediaan puskesmas sebagai indikator akses layanan kesehatan (PC2). Dengan demikian, tiga komponen ini telah mampu menggambarkan karakteristik utama penyebab kematian bayi di NTT secara efektif.

Loading

knitr::include_graphics("C:/Users/RAHMATUL IZZA/OneDrive/Pictures/Screenshots/Screenshot 2025-12-03 172929.png")

Berdasarkan output loading, komponen utama pertama (PC1) didominasi oleh variabel Wasting (0,62), Stunting (0,57), Puskesmas (0,50), dan Penduduk Miskin (−0,14), yang menunjukkan bahwa PC1 merepresentasikan kombinasi kondisi gizi buruk dan pelayanan kesehatan yang berhubungan erat dengan tingkat kemiskinan. Sementara itu, PC2 dipengaruhi kuat oleh Sanitasi (−0,63) dan Puskesmas (0,10), sehingga komponen ini menggambarkan dimensi akses sanitasi dan fasilitas kesehatan. Pada PC3, variabel yang paling berkontribusi adalah Air Bersih (−0,76) dan Puskesmas (0,41), yang menunjukkan perbedaan wilayah berdasarkan ketersediaan air bersih.

Screeplot PCA

knitr::include_graphics("C:/Users/RAHMATUL IZZA/OneDrive/Pictures/Screenshots/Screenshot 2025-12-03 201207.png")

Berdasarkan scree plot, terlihat bahwa nilai eigen mengalami penurunan tajam dari komponen pertama ke komponen ketiga, yaitu PC1 sebesar 38,3%, PC2 sebesar 31,4%, dan PC3 sebesar 15,6%. Setelah komponen ketiga, grafik menunjukkan kemiringan yang lebih landai (elbow), yang berarti penambahan komponen selanjutnya hanya memberikan kontribusi variasi yang kecil (PC4–PC6 < 7%). Oleh karena itu, titik elbow pada PC3 menunjukkan bahwa tiga komponen utama sudah cukup untuk menjelaskan sebagian besar variasi data, sehingga komponen berikutnya tidak lagi memberikan informasi signifikan.

Loading plot (hubungan variabel vs komponen)

knitr::include_graphics("C:/Users/RAHMATUL IZZA/OneDrive/Pictures/Screenshots/Screenshot 2025-12-03 201215.png")

Berdasarkan loading plot PC1 vs PC2, terlihat bahwa variabel Stunting (X1), Wasting (X2), dan Puskesmas (X3) berada pada arah yang relatif searah, menunjukkan bahwa ketiga variabel tersebut memiliki hubungan yang kuat dan bergerak seiring. Variabel Penduduk Miskin (X5) berada pada arah berlawanan dengan Sanitasi (X4) dan Air Bersih (X6), yang mengindikasikan bahwa wilayah dengan tingkat kemiskinan tinggi cenderung memiliki sanitasi dan akses air bersih yang rendah. Komponen pertama (PC1) terutama menjelaskan perbedaan berdasarkan faktor gizi dan pelayanan kesehatan, sedangkan komponen kedua (PC2) memisahkan wilayah berdasarkan akses sanitasi dan air bersih.

Biplot

knitr::include_graphics("C:/Users/RAHMATUL IZZA/OneDrive/Pictures/Screenshots/Screenshot 2025-12-03 201226.png")

Biplot PCA tersebut menunjukkan hubungan antar variabel penyebab kematian bayi serta pola pengelompokan wilayah berdasarkan dua komponen utama. Pada Dimensi 1 (38,3%), variabel Stunting (X1), Wasting (X2), dan Puskesmas (X3) memiliki vektor yang panjang dan mengarah kuat ke kanan, menunjukkan bahwa ketiga variabel tersebut paling dominan membentuk komponen pertama. Variabel Penduduk Miskin (X5) juga mengarah pada arah yang sama meskipun dengan kontribusi lebih kecil, sehingga mencerminkan bahwa faktor gizi buruk dan kemiskinan berperan besar dalam membedakan kondisi antar wilayah.

Sementara itu, Sanitasi (X4) dan Air Bersih (X6) mengarah ke kiri bawah dan membentuk kelompok tersendiri, menunjukkan bahwa kedua variabel lingkungan tersebut berkorelasi positif satu sama lain namun bergerak berlawanan arah dengan variabel-variabel pada PC1. Hal ini menegaskan bahwa daerah dengan sanitasi dan air bersih yang baik umumnya memiliki tingkat kemiskinan dan masalah gizi yang lebih rendah.

Pada Dimensi 2 (31,4%), sanitasi dan air bersih memiliki kontribusi lebih besar dibanding variabel lain sehingga komponen kedua terutama memisahkan wilayah berdasarkan kualitas sanitasi dan akses fasilitas air bersih. Titik-titik kabupaten/kota yang saling berdekatan menunjukkan wilayah dengan karakteristik kondisi kesehatan dan lingkungan yang serupa, sedangkan titik yang berjauhan menunjukkan perbedaan yang lebih besar sesuai arah vektor variabel dominan.

PENUTUP

Kesimpulan

Analisis PCA menunjukkan bahwa dua komponen utama (PC1 dan PC2) mampu menjelaskan mayoritas variasi data sebesar 69,67%, dan dengan penambahan PC3 meningkat menjadi 85,31%. PC1 merepresentasikan faktor utama penyebab kematian bayi, yaitu gizi buruk (stunting–wasting), kemiskinan, serta akses puskesmas, sedangkan PC2 menggambarkan aspek lingkungan seperti sanitasi dan air bersih. Dengan demikian, penyebab kematian bayi antar wilayah terutama ditentukan oleh kombinasi kondisi sosial, kesehatan, dan lingkungan.

Saran

Upaya penurunan kematian bayi perlu difokuskan pada peningkatan gizi anak, pemerataan fasilitas kesehatan, serta perbaikan sanitasi dan akses air bersih. Penelitian selanjutnya dapat menambah variabel lain atau menggunakan analisis multivariat tambahan untuk mendapatkan gambaran yang lebih komprehensif.

DAFTAR PUSTAKA

  1. Badan Pusat Statistik. (2024). Provinsi Nusa Tenggara Timur Dalam Angka 2025. BPS Provinsi NTT.

  2. Kementerian Kesehatan Republik Indonesia. (2023). Profil Kesehatan Indonesia 2023. Jakarta: Kemenkes RI.

  3. World Health Organization. (2022). Global Nutrition Report 2022. WHO.

  4. Abdi, H., & Williams, L. J. (2022). Principal Component Analysis. In Encyclopedia of Social Measurement (2nd ed.). Elsevier.

  5. Jolliffe, I. T., & Springer, J. (2022). Principal Component Analysis and Factor Analysis (3rd ed.). Springer.

  6. Kuswanto, H., & Yuniarti, D. (2021). Analisis Multivariat Terapan Menggunakan R. UGM Press.

  7. Suharno, P., & Sari, R. (2021). Analisis Komponen Utama dalam Identifikasi Faktor Risiko Kesehatan Masyarakat. Jurnal Statistika Universitas Muhammadiyah Semarang, 9(2), 115–128.