Penyakit kardiovaskular, termasuk gagal jantung, merupakan penyebab utama kematian di seluruh dunia. WHO melaporkan bahwa penyakit jantung bertanggung jawab atas sekitar 17,9 juta kematian setiap tahunnya, mewakili 31% dari seluruh kematian global.
Gagal jantung adalah kondisi medis serius di mana jantung tidak mampu memompa darah secara efektif untuk memenuhi kebutuhan tubuh, sehingga menyebabkan berbagai komplikasi dan berpotensi fatal.
Tujuan Penelitian:
Chicco & Jurman (2020) menunjukkan bahwa hanya dua fitur—fraksi ejeksi dan kreatinin serum—sudah cukup untuk memprediksi kematian dengan akurasi yang baik. Penelitian ini memperkuat temuan tersebut dengan pendekatan statistika inferensial.
Data berasal dari dataset rekam medis klinis pasien gagal jantung yang dipublikasikan oleh Chicco & Jurman (2020) pada UCI Machine Learning Repository. Dataset mencakup 299 pasien yang didiagnosis menderita gagal jantung.
| Peubah | Keterangan | Kategori | Skala |
|---|---|---|---|
| Y | Status Kematian Pasien | 0 = Bertahan Hidup 1 = Meninggal | Nominal |
| Peubah | Keterangan | Satuan | Skala |
|---|---|---|---|
| X1 | Usia Pasien (Age) | Tahun | Rasio |
| X2 | Anemia (Anaemia) | 0/1 | Nominal |
| X3 | Kreatin Fosfokinase (Creatinine Phosphokinase) | mcg/L | Rasio |
| X4 | Diabetes | 0/1 | Nominal |
| X5 | Fraksi Ejeksi Jantung (Ejection Fraction) | % | Rasio |
| X6 | Tekanan Darah Tinggi (High Blood Pressure) | 0/1 | Nominal |
| X7 | Trombosit (Platelets) | kiloplatelets/mL | Rasio |
| X8 | Kreatinin Serum (Serum Creatinine) | mg/dL | Rasio |
| X9 | Natrium Serum (Serum Sodium) | mEq/L | Rasio |
| X10 | Jenis Kelamin (Sex) | 0=Perempuan, 1=Laki-laki | Nominal |
| X11 | Merokok (Smoking) | 0/1 | Nominal |
| X12 | Waktu Tindak Lanjut (Follow-up Time) | Hari | Rasio |
Berikut alur lengkap prosedur penelitian yang dilakukan:
Model regresi logistik biner menggambarkan hubungan antara peubah respon biner dengan satu atau lebih peubah prediktor. Fungsi logit didefinisikan sebagai:
\[g(\mathbf{x}) = \ln\frac{\pi(\mathbf{x})}{1 - \pi(\mathbf{x})} = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_p x_p\]
Sehingga probabilitas kejadian Y = 1 dapat ditulis:
\[\pi(\mathbf{x}) = \frac{e^{g(\mathbf{x})}}{1 + e^{g(\mathbf{x})}}\]
| Jenis Uji | Hipotesis | Statistik Uji | Kriteria Tolak H₀ |
|---|---|---|---|
| Uji G (serentak) | H₀: β₁ = β₂ = ⋯ = βₚ = 0 | G² = Likelihood Ratio | G² > χ²(db; α) |
| Uji Wald (parsial) | H₀: βⱼ = 0 | \(W_j = \hat{\beta}_j / SE(\hat{\beta}_j)\) | |
| Hosmer-Lemeshow | H₀: Model layak | \(\hat{C}\) = Chi-square | \(\hat{C}\) > χ²(α, g−2) |
Dari total 299 observasi:
| Peubah | Min | Q1 | Median | Rata-rata | Q3 | Maks | Std. Dev |
|---|---|---|---|---|---|---|---|
| Usia (X1) | 40.0 | 51.0 | 60.0 | 60.83 | 70.0 | 95.0 | 11.89 |
| Kr. Fosfokinase (X3) | 23.0 | 116.5 | 250.0 | 581.84 | 582.0 | 7861.0 | 970.29 |
| Fraksi Ejeksi (X5) | 14.0 | 30.0 | 38.0 | 38.08 | 45.0 | 80.0 | 11.83 |
| Trombosit (X7) | 25.1 | 212.5 | 262.0 | 263.40 | 303.5 | 850.0 | 97.80 |
| Kr. Serum (X8) | 0.5 | 0.9 | 1.1 | 1.39 | 1.4 | 9.4 | 1.03 |
| Natrium Serum (X9) | 113.0 | 134.0 | 137.0 | 136.63 | 140.0 | 148.0 | 4.41 |
| W. Tindak Lanjut (X12) | 4.0 | 73.0 | 115.0 | 130.26 | 203.0 | 285.0 | 77.61 |
Peubah Prediktor Biner:
| Peubah | Jumlah | Persentase |
|---|---|---|
| Anemia (X2) | 129 | 43,1% |
| Diabetes (X4) | 125 | 41,8% |
| Tekanan Darah Tinggi (X6) | 105 | 35,1% |
| Laki-laki (X10) | 194 | 64,9% |
| Merokok (X11) | 96 | 32,1% |
Berdasarkan hasil analisis korelasi Pearson antara 12 peubah prediktor:
✅ Tidak ditemukan pasangan peubah dengan korelasi di atas 0,70 (ambang batas kritis). Nilai korelasi tertinggi terdapat antara X10 (jenis kelamin) dan X11 (merokok) sebesar 0,446, yang masih berada di bawah ambang batas sehingga seluruh peubah dapat dipertahankan.
| Peubah | VIF |
|---|---|
| X1 (Usia) | 1.10 |
| X2 (Anemia) | 1.11 |
| X3 (Kreatin Fosfokinase) | 1.09 |
| X4 (Diabetes) | 1.05 |
| X5 (Fraksi Ejeksi) | 1.17 |
| X6 (Tek. Darah Tinggi) | 1.06 |
| X7 (Trombosit) | 1.05 |
| X8 (Kreatinin Serum) | 1.10 |
| X9 (Natrium Serum) | 1.07 |
| X10 (Jenis Kelamin) | 1.38 |
| X11 (Merokok) | 1.28 |
| X12 (W. Tindak Lanjut) | 1.15 |
✅ Seluruh peubah memiliki nilai VIF berkisar antara 1,05 – 1,38, jauh di bawah ambang batas 10. Tidak ada masalah multikolinieritas — semua peubah dipertahankan dalam tahap pemodelan.
| Model | Peubah yang Digunakan | AIC | Peubah Signifikan (p < 0,05) |
|---|---|---|---|
| 1 (Model Penuh) | X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12 | 245.5541 | X1, X5, X8, X12 |
| 2 (Forward Selection) | X1+X5+X8+X9+X12 | 235.4863 | X1, X5, X8, X12 |
| 3 (Backward Elimination) | X1+X5+X8+X9+X12 | 235.4863 | X1, X5, X8, X12 |
| 4 (Prediktor Signifikan) | X1+X5+X8+X12 | 236.3014 | X1, X5, X8, X12 |
| Model | AIC | Akurasi | Sensitivitas | Spesifisitas | Balanced Acc. | Peubah Sig. |
|---|---|---|---|---|---|---|
| 1 (Penuh) | 245.5541 | 85,62% | 71,88% | 92,12% | 82,00% | 4 dari 12 |
| 2 (Forward) ★ | 235.4863 | 83,61% | 68,75% | 90,64% | 79,70% | 4 dari 5 |
| 3 (Backward) ★ | 235.4863 | 83,61% | 68,75% | 90,64% | 79,70% | 4 dari 5 |
| 4 (Sig.) | 236.3014 | 83,28% | 68,75% | 90,15% | 79,45% | 4 dari 4 |
🏆 Model Terpilih: Model 2 (Forward Selection)
Model forward dan backward menghasilkan AIC terkecil yang identik (235,49). Berdasarkan prinsip parsimoni, Model Forward (Model 2) dipilih sebagai model akhir. Model ini memuat 5 peubah prediktor: usia (X1), fraksi ejeksi (X5), kreatinin serum (X8), natrium serum (X9), dan waktu tindak lanjut (X12).
Model terpilih menghasilkan persamaan:
\[\text{Logit}[P(Y=1)] = 9{,}4930 + 0{,}0425\,X_1 - 0{,}0734\,X_5 + 0{,}6860\,X_8 - 0{,}0646\,X_9 - 0{,}0209\,X_{12}\]
| Peubah | Koefisien | Std. Error | z-Statistik | Nilai-p | Keputusan |
|---|---|---|---|---|---|
| Intersep | 9.4930 | 5.4058 | 1.7561 | 0,0791 | Tidak Tolak H₀ |
| X1 (Usia) | 0.0425 | 0.0150 | 2.8255 | 0,0047 | Tolak H₀ * |
| X5 (Fraksi Ejeksi) | -0.0734 | 0.0158 | -4.6518 | <0,0001 | Tolak H₀ * |
| X8 (Kreatinin Serum) | 0.6860 | 0.1740 | 3.9415 | 0,0001 | Tolak H₀ * |
| X9 (Natrium Serum) | -0.0646 | 0.0384 | -1.6822 | 0,0925 | Tidak Tolak H₀ |
| X12 (W. Tindak Lanjut) | -0.0209 | 0.0029 | -7.1657 | <0,0001 | Tolak H₀ * |
| Nilai G² | Chi-square Tabel (α=0,05; df=5) | Keputusan |
|---|---|---|
| 151.8625 | 11.07 | Tolak H₀ |
G² = 151,8625 > χ²(0,05; df=5) = 11,070 → H₀ ditolak: minimal ada satu peubah prediktor X yang signifikan terhadap Y.
| Chi-square Hitung | Chi-square Tabel (α=0,05; df=8) | Nilai-p | Keputusan |
|---|---|---|---|
| 12.9581 | 15.507 | 0.1133 | Tidak Tolak H₀ |
✅ Nilai-p = 0,1133 > 0,05 → Model layak digunakan. Tidak ada perbedaan signifikan antara nilai observasi dan nilai prediksi model.
| Peubah | Koefisien | Odds Ratio | Interpretasi |
|---|---|---|---|
| X1 (Usia) | 0.0425 | 1.0434 | Odds kematian meningkat 4,34% setiap kenaikan usia 1 tahun (ceteris paribus). |
| X5 (Fraksi Ejeksi) | -0.0734 | 0.9292 | Odds kematian menurun 7,08% setiap kenaikan fraksi ejeksi 1% (ceteris paribus). |
| X8 (Kreatinin Serum) | 0.6860 | 1.9857 | Odds kematian meningkat ~2× setiap kenaikan kreatinin serum 1 mg/dL (ceteris paribus). |
| X9 (Natrium Serum) | -0.0646 | 0.9375 | Odds kematian menurun 6,25% setiap kenaikan natrium serum 1 mEq/L (ceteris paribus). |
| X12 (W. Tindak Lanjut) | -0.0209 | 0.9793 | Odds kematian menurun 2,07% setiap bertambahnya 1 hari waktu tindak lanjut (ceteris paribus). |
⚠️ Faktor Risiko Terpenting — Kreatinin Serum (X8)
Setiap kenaikan 1 mg/dL kreatinin serum meningkatkan odds kematian hampir 2× lipat (OR = 1,9857). Temuan ini mendukung konsep kardio-renal syndrome — keterkaitan erat antara gangguan fungsi ginjal dan peningkatan risiko mortalitas pada pasien gagal jantung.
📌 Temuan Utama:
Model terbaik diperoleh melalui prosedur forward selection dengan nilai AIC terkecil 235,49, memuat 5 peubah prediktor: usia (X1), fraksi ejeksi (X5), kreatinin serum (X8), natrium serum (X9), dan waktu tindak lanjut (X12).
Berdasarkan Uji Wald pada α = 5%, empat peubah berpengaruh signifikan terhadap kematian pasien:
Natrium Serum (X9) tidak signifikan secara parsial namun tetap dipertahankan karena meningkatkan kualitas model (AIC).
Performa Model:
| Metrik | Nilai |
|---|---|
| Akurasi | 83,61% |
| Sensitivitas | 68,75% |
| Spesifisitas | 90,64% |
| Akurasi Seimbang | 79,70% |
Rekomendasi untuk Penelitian Selanjutnya: