1 Pendahuluan

Penyakit kardiovaskular, termasuk gagal jantung, merupakan penyebab utama kematian di seluruh dunia. WHO melaporkan bahwa penyakit jantung bertanggung jawab atas sekitar 17,9 juta kematian setiap tahunnya, mewakili 31% dari seluruh kematian global.

Gagal jantung adalah kondisi medis serius di mana jantung tidak mampu memompa darah secara efektif untuk memenuhi kebutuhan tubuh, sehingga menyebabkan berbagai komplikasi dan berpotensi fatal.

Tujuan Penelitian:

  • Mengidentifikasi faktor-faktor klinis yang berpengaruh signifikan terhadap kematian pasien gagal jantung
  • Membangun model prediksi kematian menggunakan regresi logistik biner
  • Mengevaluasi dan memilih model terbaik berdasarkan nilai AIC dan kemampuan prediksi

Chicco & Jurman (2020) menunjukkan bahwa hanya dua fitur—fraksi ejeksi dan kreatinin serum—sudah cukup untuk memprediksi kematian dengan akurasi yang baik. Penelitian ini memperkuat temuan tersebut dengan pendekatan statistika inferensial.


2 Bahan dan Metode

2.1 Data dan Peubah Penelitian

Data berasal dari dataset rekam medis klinis pasien gagal jantung yang dipublikasikan oleh Chicco & Jurman (2020) pada UCI Machine Learning Repository. Dataset mencakup 299 pasien yang didiagnosis menderita gagal jantung.

Tabel 1. Peubah Respon Y
Peubah Keterangan Kategori Skala
Y Status Kematian Pasien 0 = Bertahan Hidup 1 = Meninggal Nominal
Tabel 2. Peubah Prediktor X
Peubah Keterangan Satuan Skala
X1 Usia Pasien (Age) Tahun Rasio
X2 Anemia (Anaemia) 0/1 Nominal
X3 Kreatin Fosfokinase (Creatinine Phosphokinase) mcg/L Rasio
X4 Diabetes 0/1 Nominal
X5 Fraksi Ejeksi Jantung (Ejection Fraction) % Rasio
X6 Tekanan Darah Tinggi (High Blood Pressure) 0/1 Nominal
X7 Trombosit (Platelets) kiloplatelets/mL Rasio
X8 Kreatinin Serum (Serum Creatinine) mg/dL Rasio
X9 Natrium Serum (Serum Sodium) mEq/L Rasio
X10 Jenis Kelamin (Sex) 0=Perempuan, 1=Laki-laki Nominal
X11 Merokok (Smoking) 0/1 Nominal
X12 Waktu Tindak Lanjut (Follow-up Time) Hari Rasio

2.2 Prosedur Penelitian

Berikut alur lengkap prosedur penelitian yang dilakukan:

  1. Analisis Deskriptif — mendeskripsikan karakteristik peubah respon dan prediktor
  2. Seleksi Peubah — analisis korelasi Pearson & pemeriksaan nilai VIF untuk mendeteksi multikolinieritas
  3. Pembentukan Model — membangun 4 kandidat model regresi logistik biner:
    • Model Penuh (Full Model)
    • Model Forward Selection
    • Model Backward Elimination
    • Model Prediktor Signifikan
  4. Evaluasi Model — menggunakan akurasi, sensitivitas, spesifisitas, dan akurasi seimbang (BA)
  5. Pengujian Parameter — Uji G (serentak) dan Uji Wald (parsial) pada α = 5%
  6. Uji Kelayakan — Uji Hosmer-Lemeshow
  7. Interpretasi — koefisien model melalui nilai odds ratio

2.3 Regresi Logistik Biner

Model regresi logistik biner menggambarkan hubungan antara peubah respon biner dengan satu atau lebih peubah prediktor. Fungsi logit didefinisikan sebagai:

\[g(\mathbf{x}) = \ln\frac{\pi(\mathbf{x})}{1 - \pi(\mathbf{x})} = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_p x_p\]

Sehingga probabilitas kejadian Y = 1 dapat ditulis:

\[\pi(\mathbf{x}) = \frac{e^{g(\mathbf{x})}}{1 + e^{g(\mathbf{x})}}\]

2.3.1 Pengujian Parameter

Jenis Uji Hipotesis Statistik Uji Kriteria Tolak H₀
Uji G (serentak) H₀: β₁ = β₂ = ⋯ = βₚ = 0 G² = Likelihood Ratio G² > χ²(db; α)
Uji Wald (parsial) H₀: βⱼ = 0 \(W_j = \hat{\beta}_j / SE(\hat{\beta}_j)\)
Hosmer-Lemeshow H₀: Model layak \(\hat{C}\) = Chi-square \(\hat{C}\) > χ²(α, g−2)

3 Hasil dan Pembahasan

3.1 Analisis Deskriptif

Dari total 299 observasi:

  • 🟢 203 pasien bertahan hidup (Y = 0, 67,89%)
  • 🔴 96 pasien meninggal (Y = 1, 32,11%)
Tabel 4. Statistik Deskriptif Peubah Prediktor Kontinu
Peubah Min Q1 Median Rata-rata Q3 Maks Std. Dev
Usia (X1) 40.0 51.0 60.0 60.83 70.0 95.0 11.89
Kr. Fosfokinase (X3) 23.0 116.5 250.0 581.84 582.0 7861.0 970.29
Fraksi Ejeksi (X5) 14.0 30.0 38.0 38.08 45.0 80.0 11.83
Trombosit (X7) 25.1 212.5 262.0 263.40 303.5 850.0 97.80
Kr. Serum (X8) 0.5 0.9 1.1 1.39 1.4 9.4 1.03
Natrium Serum (X9) 113.0 134.0 137.0 136.63 140.0 148.0 4.41
W. Tindak Lanjut (X12) 4.0 73.0 115.0 130.26 203.0 285.0 77.61

Peubah Prediktor Biner:

Distribusi Peubah Prediktor Biner
Peubah Jumlah Persentase
Anemia (X2) 129 43,1%
Diabetes (X4) 125 41,8%
Tekanan Darah Tinggi (X6) 105 35,1%
Laki-laki (X10) 194 64,9%
Merokok (X11) 96 32,1%

3.2 Seleksi Peubah

3.2.1 Analisis Korelasi

Berdasarkan hasil analisis korelasi Pearson antara 12 peubah prediktor:

Tidak ditemukan pasangan peubah dengan korelasi di atas 0,70 (ambang batas kritis). Nilai korelasi tertinggi terdapat antara X10 (jenis kelamin) dan X11 (merokok) sebesar 0,446, yang masih berada di bawah ambang batas sehingga seluruh peubah dapat dipertahankan.

3.2.2 Nilai Variance Inflation Factor (VIF)

Tabel 5. Nilai VIF Model Penuh (Peubah Disentral)
Peubah VIF
X1 (Usia) 1.10
X2 (Anemia) 1.11
X3 (Kreatin Fosfokinase) 1.09
X4 (Diabetes) 1.05
X5 (Fraksi Ejeksi) 1.17
X6 (Tek. Darah Tinggi) 1.06
X7 (Trombosit) 1.05
X8 (Kreatinin Serum) 1.10
X9 (Natrium Serum) 1.07
X10 (Jenis Kelamin) 1.38
X11 (Merokok) 1.28
X12 (W. Tindak Lanjut) 1.15

✅ Seluruh peubah memiliki nilai VIF berkisar antara 1,05 – 1,38, jauh di bawah ambang batas 10. Tidak ada masalah multikolinieritas — semua peubah dipertahankan dalam tahap pemodelan.

3.3 Pembentukan dan Evaluasi Model

3.3.1 Kandidat Model

Tabel 6. Penyusunan Model yang Terbentuk
Model Peubah yang Digunakan AIC Peubah Signifikan (p < 0,05)
1 (Model Penuh) X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12 245.5541 X1, X5, X8, X12
2 (Forward Selection) X1+X5+X8+X9+X12 235.4863 X1, X5, X8, X12
3 (Backward Elimination) X1+X5+X8+X9+X12 235.4863 X1, X5, X8, X12
4 (Prediktor Signifikan) X1+X5+X8+X12 236.3014 X1, X5, X8, X12

3.3.2 Evaluasi Performa Model

Tabel 7. Evaluasi Performa Model
Model AIC Akurasi Sensitivitas Spesifisitas Balanced Acc. Peubah Sig.
1 (Penuh) 245.5541 85,62% 71,88% 92,12% 82,00% 4 dari 12
2 (Forward) ★ 235.4863 83,61% 68,75% 90,64% 79,70% 4 dari 5
3 (Backward) ★ 235.4863 83,61% 68,75% 90,64% 79,70% 4 dari 5
4 (Sig.) 236.3014 83,28% 68,75% 90,15% 79,45% 4 dari 4

🏆 Model Terpilih: Model 2 (Forward Selection)

Model forward dan backward menghasilkan AIC terkecil yang identik (235,49). Berdasarkan prinsip parsimoni, Model Forward (Model 2) dipilih sebagai model akhir. Model ini memuat 5 peubah prediktor: usia (X1), fraksi ejeksi (X5), kreatinin serum (X8), natrium serum (X9), dan waktu tindak lanjut (X12).

3.4 Pengujian Model Terpilih

3.4.1 Persamaan Regresi Logistik Biner

Model terpilih menghasilkan persamaan:

\[\text{Logit}[P(Y=1)] = 9{,}4930 + 0{,}0425\,X_1 - 0{,}0734\,X_5 + 0{,}6860\,X_8 - 0{,}0646\,X_9 - 0{,}0209\,X_{12}\]

3.4.2 Pendugaan Parameter Model

Tabel 8. Pendugaan Parameter Model Terpilih (* signifikan pada α = 5%)
Peubah Koefisien Std. Error z-Statistik Nilai-p Keputusan
Intersep 9.4930 5.4058 1.7561 0,0791 Tidak Tolak H₀
X1 (Usia) 0.0425 0.0150 2.8255 0,0047 Tolak H₀ *
X5 (Fraksi Ejeksi) -0.0734 0.0158 -4.6518 <0,0001 Tolak H₀ *
X8 (Kreatinin Serum) 0.6860 0.1740 3.9415 0,0001 Tolak H₀ *
X9 (Natrium Serum) -0.0646 0.0384 -1.6822 0,0925 Tidak Tolak H₀
X12 (W. Tindak Lanjut) -0.0209 0.0029 -7.1657 <0,0001 Tolak H₀ *

3.4.3 Uji Serentak (Uji G)

Tabel 9. Hasil Uji Serentak Model Terpilih
Nilai G² Chi-square Tabel (α=0,05; df=5) Keputusan
151.8625 11.07 Tolak H₀

G² = 151,8625 > χ²(0,05; df=5) = 11,070 → H₀ ditolak: minimal ada satu peubah prediktor X yang signifikan terhadap Y.

3.4.4 Uji Kelayakan Hosmer-Lemeshow

Tabel 11. Hasil Uji Kelayakan Model Hosmer-Lemeshow
Chi-square Hitung Chi-square Tabel (α=0,05; df=8) Nilai-p Keputusan
12.9581 15.507 0.1133 Tidak Tolak H₀

✅ Nilai-p = 0,1133 > 0,05 → Model layak digunakan. Tidak ada perbedaan signifikan antara nilai observasi dan nilai prediksi model.

3.5 Interpretasi Koefisien — Odds Ratio

Tabel 12. Peubah Signifikan dan Nilai Odds Ratio
Peubah Koefisien Odds Ratio Interpretasi
X1 (Usia) 0.0425 1.0434 Odds kematian meningkat 4,34% setiap kenaikan usia 1 tahun (ceteris paribus).
X5 (Fraksi Ejeksi) -0.0734 0.9292 Odds kematian menurun 7,08% setiap kenaikan fraksi ejeksi 1% (ceteris paribus).
X8 (Kreatinin Serum) 0.6860 1.9857 Odds kematian meningkat ~2× setiap kenaikan kreatinin serum 1 mg/dL (ceteris paribus).
X9 (Natrium Serum) -0.0646 0.9375 Odds kematian menurun 6,25% setiap kenaikan natrium serum 1 mEq/L (ceteris paribus).
X12 (W. Tindak Lanjut) -0.0209 0.9793 Odds kematian menurun 2,07% setiap bertambahnya 1 hari waktu tindak lanjut (ceteris paribus).

⚠️ Faktor Risiko Terpenting — Kreatinin Serum (X8)

Setiap kenaikan 1 mg/dL kreatinin serum meningkatkan odds kematian hampir 2× lipat (OR = 1,9857). Temuan ini mendukung konsep kardio-renal syndrome — keterkaitan erat antara gangguan fungsi ginjal dan peningkatan risiko mortalitas pada pasien gagal jantung.


4 Kesimpulan

📌 Temuan Utama:

  1. Model terbaik diperoleh melalui prosedur forward selection dengan nilai AIC terkecil 235,49, memuat 5 peubah prediktor: usia (X1), fraksi ejeksi (X5), kreatinin serum (X8), natrium serum (X9), dan waktu tindak lanjut (X12).

  2. Berdasarkan Uji Wald pada α = 5%, empat peubah berpengaruh signifikan terhadap kematian pasien:

    • Usia (X1) — semakin tua, risiko meningkat
    • Fraksi Ejeksi Jantung (X5) — semakin rendah, risiko meningkat
    • Kreatinin Serum (X8) — semakin tinggi, risiko meningkat (~2× lipat per satuan)
    • Waktu Tindak Lanjut (X12) — semakin lama, risiko menurun
  3. Natrium Serum (X9) tidak signifikan secara parsial namun tetap dipertahankan karena meningkatkan kualitas model (AIC).

  4. Performa Model:

Metrik Nilai
Akurasi 83,61%
Sensitivitas 68,75%
Spesifisitas 90,64%
Akurasi Seimbang 79,70%
  1. Uji Hosmer-Lemeshow mengkonfirmasi model layak digunakan (nilai-p = 0,1133 > 0,05).

Rekomendasi untuk Penelitian Selanjutnya:

  • Menggunakan dataset yang lebih besar dengan periode tindak lanjut lebih panjang
  • Menambahkan peubah klinis lain seperti BNP, kelas NYHA, tekanan darah sistolik
  • Membandingkan dengan metode ML lain: Random Forest, XGBoost, SVM, Gradient Boosting

5 Referensi

  1. World Health Organization. Cardiovascular Diseases (CVDs). WHO Fact Sheet 2021.
  2. Ponikowski, P. et al. 2016 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure. Eur. Heart J. 2016, 37, 2129–2200.
  3. Reyes, E.B. et al. Heart failure across Asia. Am. Heart J. 2016, 182, 119–128.
  4. Ahmad, T. et al. Clinical implications of chronic heart failure phenotypes. J. Am. Coll. Cardiol. 2014, 64, 1765–1774.
  5. Hosmer, D.; Lemeshow, S.; Sturdivant, R. Applied Logistic Regression, 3rd ed.; 2013.
  6. Agresti, A. An Introduction to Categorical Data Analysis, 3rd ed.; 2018.
  7. Chicco, D.; Jurman, G. Machine learning can predict survival of patients with heart failure. BMC Med. Inform. Decis. Mak. 2020, 20, 16.
  8. Montgomery, D.C. et al. Introduction to Linear Regression Analysis, 5th ed.; 2012.
  9. Aiken, L.S.; West, S.G. Multiple Regression: Testing and Interpreting Interactions; 1991.
  10. Manaf, S.A.R. et al. Faktor-faktor yang memengaruhi permasalahan stunting di Jawa Barat. J. Statistika 2022, 15, 265–274.