1 PENDAHULUAN
1.1 Latar Belakang
Analisis Survival adalah analisis mengenai data yang berhubungan dengan waktu, data berupa waktu pengamatan dari dimulai penelitian sampai dengan terjadinya kejadian khusus seperti kematian pasien. Kejadian itu disebut dengan ‘failures’. Tujuan analisis survival adalah untuk mengetahui hubungan antara waktu kejadian dengan peubah bebas yang terukur pada saat dilakukan penelitian. Selain itu, juga digunakan untuk melihat faktor-faktor yang paling berpengaruh pada suatu peristiwa atau kejadian. Analisis survival banyak digunakan dalam penelitian dibidang kesehatan. Metode yang lumrah digunakan adalah metode regresi Cox Proportional Hazard.
Analisis survival terdiri dari beberapa pendekatan yaitu metode parametrik, semiparametrik, dan nonparametrik. Dalam analisis survival nonparametrik, metode yang sering digunakan adalah metode Kaplan Meier yang dilanjutkan dengan uji Log Rank (Kleinbaum dan Klein, 2005). Sedangkan model semiparametrik yang sering digunakan dalam penelitian analisis survival adalah model Cox propotional hazard yang memiliki asumsi propotional hazard. Asumsi tersebut merupakan asumsi di mana nilai hazard ratio konstan sepanjang waktu. Hazard ratio sebagai pengaruh yang dapat dilihat berupa perbandingan dari dua objek dengan kondisi yang berbeda (Aini, 2011).
Regresi Cox Proportional Hazard digunakan karena model Cox PH tidak bergantung pada asumsi distribusi dari waktu kejadiannya. Hasil dari model Cox hampir sama dengan hasil model parametrik dan dapat mengestimasi hazard rasio tanpa diketahui \(h_0(t)\). Dalam bidang kesehatan, salah satu kasus analisis survival adalah kejadian di mana terjadinya kegagalan pada individu. Dalam pelaksanaannya dilakukan pencatatan waktu ketahanan hidup individu yang diamati. Pada kali ini akan dilakukan pemodelan survival time kesembuhan pasien penderita Demam Berdarah Dengue (DBD) untuk melihat faktor-faktor yang mempengaruhi laju kesembuhan pasien penderita DBD.
2 METODE PENELITIAN
2.1 Analisis Survival
Analisis survival adalah kumpulan dari prosedur statistika yang mana variabel yang diperhatikan adalah waktu sampai kejadian (event) yang dispesifikasikan terjadi. Waktu survival sebagai contoh tahun, bulan, minggu, hari, jam dan sebagainya, diartikan sebagai waktu yang dialami objek dari awal perekrutan dalam penelitian sampai suatu kejadian yang dispesifikasikan terjadi. (Kleinbaum dan Klein, 2005). Waktu survival (T) menunjukkan durasi waktu seorang individu dapat bertahan dalam periode pengamatan tertentu. Kumpulan dari T disebut dengan data survival. Sedangkan event dilambangkan dengan simbol d untuk mendefinisikan status kejadian apakah failure atau tersensor.
Pada data survival biasanya terdapat beberapa informasi mengenai waktu survival individu. Akan tetapi, tidak diketahui waktu survival sebenarnya. Data seperti ini disebut dengan data tersensor (Kleinbaum dan Klein, 2012).
Dalam analisis survival distribusi peluang dari T dapat dinyatakan dalam tiga cara, yaitu:
- Melalui fungsi survival (survival function) S(t).
- Fungsi kepekatan peluang (probability density function).
- Fungsi kegagalan (hazard function).
Fungsi survival S(t) didefinisikan sebagai peluang bahwa waktu survival lebih dari atau sama dengan t, \[ S(t)=P(T \geq t)=1-F(t) \] Fungsi survival dapat digunakan untuk mewakili peluang bahwa suatu individu bertahan dari waktu awal sampai waktu . Kleinbaum dan Klein (2005) menjelaskan bahwa fungsi survival merupakan dasar untuk melakukan analisis survival.
Menurut Lee dan Wang (2003) Fungsi Hazard didefinisikan sebagai peluang kegagalan selama interval, dengan asumsi bahwa individu telah bertahan dari awal interval atau limit dari peluang kegagalan pada interval t sampai \(t+\Delta t\) jika \(\Delta t\) mendekati nol : \[ h(t)=lim_{\Delta t \rightarrow 0} \frac {P(t \leq T<t+ \Delta t|T\geq t)} {\Delta t} \]
Menurut Pourhoseingholi, dkk., (2007) terdapat 3 model untuk menganalisis hubungan satu set variabel prediktor dengan waktu survival, yaitu model dengan pendekatan parametrik, nonparametrik, dan semiparametrik. Model dengan pendekatan parametrik pada analisis survival mengasumsikan bahwa distribusi waktu survival mengikuti distribusi probabilitas tertentu yang diketahui. Misal: distribusi lognormal, eksponensial, dan weibull. Model dengan pendekatan nonparametrik menggunakan metode Kaplan-Meier untuk memperkirakan dan membuat grafik probabilitas survival sebagai fungsi dari waktu. Sedangkan, model dengan pendekatan semiparametrik menggunakan regresi Cox PH, Stratified Cox, dan Extended Cox. Model tersebut dapat mendeskripsikan efek dari kovariat terhadap daya tahan hidup.
2.2 Asumsi Cox Proportional Hazard
Suatu keadaan dikatakan memenuhi asumsi PH apabila keadaan tersebut memiliki nilai hazard ratio yang konstan terhadap waktu (Kleinbaum dan Klein, 2012). Terdapat dua cara yang dapat dilakukan untuk memeriksa asumsi proportional hazard (PH), yaitu secara visual melihat grafis dan perhitungan secara numerik. Pemeriksaan asumsi dengan cara perhitungan numerik memerlukan prosedur yang lebih rumit dibandingkan secara grafis. Sedangkan cara grafis merupakan cara yang lebih mudah meskipun terkadang sulit untuk mengambil keputusan dengan grafik yang ada.
Menurut Dahlan, (2013), pemeriksaan asumsi proportional hazard dapat dilakukan secara visual dengan melihat grafis yang dapat dilakukan dengan membuat plot antara \(log(-log[S(t,X)])\) terhadap waktu survival dan menggunakan metode Kapplan Meier. Selain menggunakan pendekatan visualisasi untuk pengecekan asumsi PH, dapat pula menggunakan pendekatan numerik yakni dengan cara melakukan global test atau Goodness of Fit (GOF). Pengujian global test dapat dilakukan dengan langkah-langkah di bawah ini.
- Menggunakan model Cox PH untuk mendapatkan residual schoenfeld pada setiap variabel prediktor
- Membuat variabel rank waktu survival yaitu mengurutkan waktu terjadi kejadian yang diinginkan. Individu yang mengalami kejadian pertama kali diberi nilai 1, dan seterusnya.
- Melakukan pengujian korelasi antara residual schoenfeld dan rank waktu survival.
Hipotesis yang digunakan dalam pengujian korelasi ini adalah sebagai
berikut.
H0 : \(\rho =0\) (Asumsi PH
terpenuhi, variabel prediktor tidak tergantung pada waktu)
H1 : \(\rho \neq 0\) (Asumsi
PH tidak terpenuhi, variabel prediktor tergantung pada waktu)
Pada penelitian ini menggunakan pengecekan asumsi dengan uji global test. Jika asumsi telah terpenuhi, maka model Cox PH dapat dibentuk. Salah satu tujuan model Cox PH adalah untuk memodelkan hubungan antara waktu survival dengan peubah-peubah yang diduga mempengaruhi waktu survival.
2.3 Regresi Cox Proportional Hazard
Menurut Lee dan Wang (2003), model regresi Cox Proportional Hazard (Cox PH) merupakan model berdistribusi semiparametrik karena model Cox PH tidak memerlukan informasi tentang distribusi yang mendasari waktu survival dan parameter regresi dapat diestimasi dari model.
Model semiparametrik lebih sering digunakan karena walaupun bentuk fungsional \(h_0(t)\) tidak diketahui, tapi model Cox PH ini tetap dapat memberikan informasi berupa hazard ratio (HR) yang tidak bergantung pada \(h_0(t)\). HR didefinisikan sebagai rasio dari hazard rate satu individu dengan hazard rate dari individu lain.
Model Cox PH dapat dituliskan sebagai berikut. \[
h_t(t)=h_0(t)exp(\beta_1x_1+\beta_2x_2+ \dots + \beta_px_p) =
h_0(t)e^{\sum_{j=1}^p \beta_jx_j}
\] Dimana
\(h_t(t)\) = fungsi kegagalan individu
ke-i
\(h_0(t)\) = fungsi kegagalan dasar
(fungsi Hazard)
\(x_j\) = nilai peubah ke-j, dengan
j=1,2,…,p
\(\beta_j\) = koefisien peubah ke-j,
dengan j=1,2,…,p
2.4 Pengujian Parameter
2.4.1 Uji Serentak
Untuk menguji hipotesis satu atau beberapa regresi adalah nol dapat menggunakan uji serentak dengan partial likelihood ratio yang dinotasikan dengan G. Hipotesis yang digunakan adalah sebagai berikut:
\(H_0:\beta_1=\beta_2= \dots
=\beta_k\)
\(H_1:\) minimal ada satu \(\beta_k \neq 0\) dengan k=1,2,3,4,5,6,7
Penolakan H_0 jika \(G \geq \chi^2_{\alpha,db=p}\) atau \(p-value \geq \alpha\) artinya minimal ada satu peubah bebas yang berpengaruh terhadap waktu survival.
2.4.2 Uji Parsial
Uji parsial digunkan untuk melihat apakah terdapat peubah bebas yang tidak signifikan di dalam model. Dengan mengasumsikan data berdistribusi normal baku atau Z-score. Hipotesis yang digunakan yaitu:
\(H_0:\beta_k=0\) dengan k=1,2, …
,p
\(H_1:\beta_k \neq 0\) dengan k=1,2, …
,p
Penolakan H_0 jika \(W>\chi^2_{1,db=p}\) atau p-value < yang artinya bahwa peubah bebas berpengaruh terhadap waktu survival.
Pemilihan model terbaik penelitian ini menggunakan Akaike
Information Criterion (AIC). Model terbaik memiliki nilai AIC
terkecil \[ AIC=-log \widehat{L}+2P\]
dimana:
\(-log \widehat{L}\) = nilai maksimum
fungsi likelihood model regresi Cox PH.
\(P\) = banyaknya peubah bebas dalam
model regresi Cox PH.
(Tustianto, Kris., dan Soehono, 2012)
2.5 Hazard Ratio
Menurut Hosmer dan Lemeshow (1999) Rasio risiko atau Hazard
Ratio (HR) adalah rasio dari fungsi risiko satu individu dengan fungsi
risiko dari individu lain. Persamaan hazard ratio dapat dituliskan
sebagai berikut:
\[HR = \frac{h_A}{h_B}= \frac
{h_0(t)exp[\beta_1x_1=1]}{h_0(t)exp[\beta_1x_1=0]}=exp[\beta_1]\]
2.6 Data
Data yang digunakan adalah data sekunder yang diambil dari penelitian milik Utami (2017) berupa dokumentasi tertulis dan identifikasi peubah-peubah yang ditetapkan sebagai kriteria pasien DBD rekam medis RSUD Kota Makassar tahun 2015. Pada kali ini digunakan data milik 30 pasien untuk kemudian dianalisis
2.6.1 Variabel yang diteliti
Pada analisis kali ini digunakan beberapa variabel yaitu sebagai berikut:
| Peubah | Keterangan |
|---|---|
| Survival | Waktu survival pasien DBD |
| Gender | Jenis Kelamin |
| Hemoglobin | Jumlah hemoglobin pasien \((gram/dl)\) |
| Leukosit | Jumlah leukosit pasien \((ribu/mm^2)\) |
| Hematokrit | Presentase hematokrit pasien (%) |
| Trombosit | Jumlah trombosit pasien \((ribu/mm^3)\) |
| Suhu | Suhu bandan saat awal pemeriksaan \((^0C)\) |
3 SOURCE CODE
3.1 Library yang Dibutuhkan
> library(survival)
> library(survminer)
> library(readxl)
> library(psych)3.2 Memanggil dan menampilkan Data
Berikut merupakan data 30 pasien penderita DBD di RSUD Kota Makassar tahun 2015.
> data <- read_excel("D:/Semester 6/komstat/data prak.xlsx")
> data
# A tibble: 30 × 9
Survival Usia Gender Hemoglobin Leukosit Hematokrit Trombosit Suhu Status
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 5 59 0 13.4 9.49 33.1 0 37.8 1
2 10 11 0 12.2 5.83 34.5 0 40 1
3 3 18 0 12.6 2.9 38.2 0 37.4 1
4 11 50 1 16.3 8.61 36 1 36.1 1
5 3 37 1 15.5 4.02 43.9 0 37.5 1
6 5 11 1 12.2 4.83 35.8 0 37.4 1
7 5 13 0 14.9 2.69 42 0 39.3 1
8 3 8 1 11.6 5.88 34 0 39.8 1
9 3 12 0 15.2 5.17 44.3 0 36 1
10 5 13 0 12.2 6.3 34 1 39 1
# … with 20 more rows3.3 Statistika Deskriptif
> # uji Deskriptif #
> describe(data)
vars n mean sd median trimmed mad min max range skew
Survival 1 30 5.13 2.24 5.00 4.83 1.48 2.00 11.00 9.00 0.94
Usia 2 30 19.17 17.12 13.00 15.33 6.67 5.00 80.00 75.00 2.06
Gender 3 30 0.43 0.50 0.00 0.42 0.00 0.00 1.00 1.00 0.26
Hemoglobin 4 30 13.56 1.63 13.20 13.46 1.63 10.80 17.30 6.50 0.45
Leukosit 5 30 6.03 4.71 5.26 5.25 3.26 1.62 26.13 24.51 2.62
Hematokrit 6 30 38.05 4.20 37.50 37.75 4.00 30.90 48.60 17.70 0.61
Trombosit 7 30 0.17 0.38 0.00 0.08 0.00 0.00 1.00 1.00 1.70
Suhu 8 30 38.08 1.19 38.30 38.12 1.19 36.00 40.00 4.00 -0.30
Status 9 30 0.93 0.25 1.00 1.00 0.00 0.00 1.00 1.00 -3.30
kurtosis se
Survival 0.54 0.41
Usia 3.77 3.13
Gender -2.00 0.09
Hemoglobin -0.73 0.30
Leukosit 8.45 0.86
Hematokrit -0.31 0.77
Trombosit 0.92 0.07
Suhu -1.12 0.22
Status 9.21 0.053.4 Analisis Survival
Asumsi terpenting yang harus dipenuhi dalam regresi Cox PH yaitu asumsi PH. Oleh karena itu, dilakukan pemeriksaan asumsi Cox PH terlebih dahulu. Sebelumnya perlu dibuat pemodelan awal regresi cox ph. Pada Pengujian Asumsi PH, penelitian ini menggunakan uji global test atau Goodness Of Fit (GOF). Jika asumsi terpenuhi maka dapat dilanjutkan dengan pemodelan regresi COx Proportional Hazard. Setelah itu dilakukan analisis kembali untuk mendapatkan pemodelan terbaik.
3.4.1 Uji Asumsi Cox Proportional Hazard
> # Uji Asumsi
> modelcoxph = coxph(Surv(Survival, Status) ~ Usia+Gender+Hemoglobin+Leukosit+Hematokrit+Trombosit+Suhu, data =data)
> uji.ph= cox.zph(modelcoxph)
> uji.ph
chisq df p
Usia 2.5104 1 0.11
Gender 0.7304 1 0.39
Hemoglobin 0.1463 1 0.70
Leukosit 0.3114 1 0.58
Hematokrit 0.0552 1 0.81
Trombosit 0.0797 1 0.78
Suhu 0.2606 1 0.61
GLOBAL 4.4402 7 0.73Pada tahap ini perlu dilakukan pemodelan awal regresi cox ph
menggunakan fungsi coxph, yang nantinya akan digunakan
dalam fungsi cox.zph untuk pengujian asumsi Cox
Proportional Hazard
3.4.2 Pemodelan Regresi Cox Proportional Hazard
Jika asumsi Cox Proportional Hazard terpenuhi maka dapat dilanjutkan pemodelan regresi Cox Proportional Hazard . Berikut merupakan syntax pemodelan regresi Cox Proportional Hazard.
> # Pemodelan Regresi Cox PH
> modelcoxph = coxph(Surv(Survival, Status) ~ Usia+Gender+Hemoglobin+Leukosit+Hematokrit+Trombosit+Suhu, data =data)
> modelcoxph
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Gender + Hemoglobin +
Leukosit + Hematokrit + Trombosit + Suhu, data = data)
coef exp(coef) se(coef) z p
Usia 0.03743 1.03814 0.01449 2.583 0.00979
Gender -0.27160 0.76216 0.43015 -0.631 0.52777
Hemoglobin -1.21325 0.29723 0.44881 -2.703 0.00687
Leukosit -0.05704 0.94456 0.09213 -0.619 0.53584
Hematokrit 0.41685 1.51718 0.16578 2.514 0.01192
Trombosit -0.96932 0.37934 0.59601 -1.626 0.10388
Suhu -0.29168 0.74701 0.19977 -1.460 0.14427
Likelihood ratio test=17.23 on 7 df, p=0.01599
n= 30, number of events= 28
> summary(modelcoxph)
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Gender + Hemoglobin +
Leukosit + Hematokrit + Trombosit + Suhu, data = data)
n= 30, number of events= 28
coef exp(coef) se(coef) z Pr(>|z|)
Usia 0.03743 1.03814 0.01449 2.583 0.00979 **
Gender -0.27160 0.76216 0.43015 -0.631 0.52777
Hemoglobin -1.21325 0.29723 0.44881 -2.703 0.00687 **
Leukosit -0.05704 0.94456 0.09213 -0.619 0.53584
Hematokrit 0.41685 1.51718 0.16578 2.514 0.01192 *
Trombosit -0.96932 0.37934 0.59601 -1.626 0.10388
Suhu -0.29168 0.74701 0.19977 -1.460 0.14427
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
Usia 1.0381 0.9633 1.0091 1.0681
Gender 0.7622 1.3121 0.3280 1.7709
Hemoglobin 0.2972 3.3644 0.1233 0.7163
Leukosit 0.9446 1.0587 0.7885 1.1315
Hematokrit 1.5172 0.6591 1.0963 2.0997
Trombosit 0.3793 2.6361 0.1180 1.2200
Suhu 0.7470 1.3387 0.5050 1.1050
Concordance= 0.797 (se = 0.055 )
Likelihood ratio test= 17.23 on 7 df, p=0.02
Wald test = 13.76 on 7 df, p=0.06
Score (logrank) test = 16.29 on 7 df, p=0.023.4.3 Pemilihan model terbaik
Pada kali ini pemilihan model terbaik dilakukan dengan menggunakan metode backward elimination dan juga melihat nilai AIC model.
Berikut merupakan tahapan pemilihan model terbaik menggunakan backward elimination.
> # Pemodelan Nilai Terbaik dengan Backward
> model1 = coxph(Surv(Survival, Status) ~ Usia+Gender+Hemoglobin+Leukosit+Hematokrit+Trombosit+Suhu, data =data)
> summary(model1)
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Gender + Hemoglobin +
Leukosit + Hematokrit + Trombosit + Suhu, data = data)
n= 30, number of events= 28
coef exp(coef) se(coef) z Pr(>|z|)
Usia 0.03743 1.03814 0.01449 2.583 0.00979 **
Gender -0.27160 0.76216 0.43015 -0.631 0.52777
Hemoglobin -1.21325 0.29723 0.44881 -2.703 0.00687 **
Leukosit -0.05704 0.94456 0.09213 -0.619 0.53584
Hematokrit 0.41685 1.51718 0.16578 2.514 0.01192 *
Trombosit -0.96932 0.37934 0.59601 -1.626 0.10388
Suhu -0.29168 0.74701 0.19977 -1.460 0.14427
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
Usia 1.0381 0.9633 1.0091 1.0681
Gender 0.7622 1.3121 0.3280 1.7709
Hemoglobin 0.2972 3.3644 0.1233 0.7163
Leukosit 0.9446 1.0587 0.7885 1.1315
Hematokrit 1.5172 0.6591 1.0963 2.0997
Trombosit 0.3793 2.6361 0.1180 1.2200
Suhu 0.7470 1.3387 0.5050 1.1050
Concordance= 0.797 (se = 0.055 )
Likelihood ratio test= 17.23 on 7 df, p=0.02
Wald test = 13.76 on 7 df, p=0.06
Score (logrank) test = 16.29 on 7 df, p=0.02
> AIC(model1)
[1] 132.5532
> model2 = coxph(Surv(Survival, Status) ~ Usia+Gender+Hemoglobin+Hematokrit+Trombosit+Suhu, data =data)
> summary(model2)
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Gender + Hemoglobin +
Hematokrit + Trombosit + Suhu, data = data)
n= 30, number of events= 28
coef exp(coef) se(coef) z Pr(>|z|)
Usia 0.03399 1.03458 0.01318 2.578 0.00993 **
Gender -0.28584 0.75139 0.42631 -0.670 0.50254
Hemoglobin -1.22164 0.29475 0.45274 -2.698 0.00697 **
Hematokrit 0.41906 1.52054 0.16664 2.515 0.01191 *
Trombosit -0.95608 0.38440 0.59751 -1.600 0.10958
Suhu -0.26304 0.76871 0.19145 -1.374 0.16946
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
Usia 1.0346 0.9666 1.0082 1.0617
Gender 0.7514 1.3309 0.3258 1.7328
Hemoglobin 0.2947 3.3927 0.1214 0.7158
Hematokrit 1.5205 0.6577 1.0969 2.1079
Trombosit 0.3844 2.6015 0.1192 1.2399
Suhu 0.7687 1.3009 0.5282 1.1187
Concordance= 0.793 (se = 0.051 )
Likelihood ratio test= 16.84 on 6 df, p=0.01
Wald test = 13.32 on 6 df, p=0.04
Score (logrank) test = 16.01 on 6 df, p=0.01
> AIC(model2)
[1] 130.944
> model3 = coxph(Surv(Survival, Status) ~ Usia+Hemoglobin+Hematokrit+Trombosit+Suhu, data =data)
> summary(model3)
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Hemoglobin +
Hematokrit + Trombosit + Suhu, data = data)
n= 30, number of events= 28
coef exp(coef) se(coef) z Pr(>|z|)
Usia 0.03178 1.03229 0.01275 2.493 0.01268 *
Hemoglobin -1.21311 0.29727 0.44654 -2.717 0.00659 **
Hematokrit 0.41022 1.50715 0.16502 2.486 0.01292 *
Trombosit -1.01798 0.36132 0.60235 -1.690 0.09102 .
Suhu -0.28403 0.75274 0.19230 -1.477 0.13966
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
Usia 1.0323 0.9687 1.0068 1.0584
Hemoglobin 0.2973 3.3639 0.1239 0.7133
Hematokrit 1.5071 0.6635 1.0907 2.0827
Trombosit 0.3613 2.7676 0.1110 1.1766
Suhu 0.7527 1.3285 0.5164 1.0973
Concordance= 0.783 (se = 0.051 )
Likelihood ratio test= 16.38 on 5 df, p=0.006
Wald test = 13.04 on 5 df, p=0.02
Score (logrank) test = 15.71 on 5 df, p=0.008
> AIC(model3)
[1] 129.4026
> model4 = coxph(Surv(Survival, Status) ~ Usia+Hemoglobin+Hematokrit+Trombosit, data =data)
> summary(model4)
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Hemoglobin +
Hematokrit + Trombosit, data = data)
n= 30, number of events= 28
coef exp(coef) se(coef) z Pr(>|z|)
Usia 0.02722 1.02760 0.01200 2.269 0.0233 *
Hemoglobin -1.09832 0.33343 0.46357 -2.369 0.0178 *
Hematokrit 0.39277 1.48108 0.17342 2.265 0.0235 *
Trombosit -0.81268 0.44367 0.57949 -1.402 0.1608
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
Usia 1.0276 0.9731 1.0037 1.0520
Hemoglobin 0.3334 2.9991 0.1344 0.8272
Hematokrit 1.4811 0.6752 1.0543 2.0806
Trombosit 0.4437 2.2539 0.1425 1.3814
Concordance= 0.793 (se = 0.056 )
Likelihood ratio test= 14.22 on 4 df, p=0.007
Wald test = 10.92 on 4 df, p=0.03
Score (logrank) test = 13.32 on 4 df, p=0.01
> AIC(model4)
[1] 129.5574
> model5 = coxph(Surv(Survival, Status) ~ Usia+Hemoglobin+Hematokrit, data =data)
> summary(model5)
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Hemoglobin +
Hematokrit, data = data)
n= 30, number of events= 28
coef exp(coef) se(coef) z Pr(>|z|)
Usia 0.02958 1.03002 0.01176 2.515 0.01190 *
Hemoglobin -1.07691 0.34065 0.40911 -2.632 0.00848 **
Hematokrit 0.40409 1.49794 0.15429 2.619 0.00882 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
Usia 1.0300 0.9709 1.0066 1.0540
Hemoglobin 0.3406 2.9356 0.1528 0.7595
Hematokrit 1.4979 0.6676 1.1070 2.0269
Concordance= 0.763 (se = 0.053 )
Likelihood ratio test= 11.98 on 3 df, p=0.007
Wald test = 10.41 on 3 df, p=0.02
Score (logrank) test = 12.64 on 3 df, p=0.005
> AIC(model5)
[1] 129.7974
>
> AIC(model1, model2, model3, model4, model5)
df AIC
model1 7 132.5532
model2 6 130.9440
model3 5 129.4026
model4 4 129.5574
model5 3 129.7974Berikut merupakan cara lain untuk memilih model terbaik, menggunakan
fungsi step yang telah tersedia di RStudio.
> # Pemodelan Nilai Terbaik Cara lain
> step(modelcoxph,direction = "backward")
Start: AIC=132.55
Surv(Survival, Status) ~ Usia + Gender + Hemoglobin + Leukosit +
Hematokrit + Trombosit + Suhu
Df AIC
- Leukosit 1 130.94
- Gender 1 130.96
<none> 132.55
- Suhu 1 132.71
- Trombosit 1 133.65
- Usia 1 136.07
- Hematokrit 1 139.51
- Hemoglobin 1 141.13
Step: AIC=130.94
Surv(Survival, Status) ~ Usia + Gender + Hemoglobin + Hematokrit +
Trombosit + Suhu
Df AIC
- Gender 1 129.40
- Suhu 1 130.83
<none> 130.94
- Trombosit 1 131.94
- Usia 1 134.07
- Hematokrit 1 137.98
- Hemoglobin 1 139.57
Step: AIC=129.4
Surv(Survival, Status) ~ Usia + Hemoglobin + Hematokrit + Trombosit +
Suhu
Df AIC
<none> 129.40
- Suhu 1 129.56
- Trombosit 1 130.72
- Usia 1 132.14
- Hematokrit 1 136.19
- Hemoglobin 1 138.20
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Hemoglobin +
Hematokrit + Trombosit + Suhu, data = data)
coef exp(coef) se(coef) z p
Usia 0.03178 1.03229 0.01275 2.493 0.01268
Hemoglobin -1.21311 0.29727 0.44654 -2.717 0.00659
Hematokrit 0.41022 1.50715 0.16502 2.486 0.01292
Trombosit -1.01798 0.36132 0.60235 -1.690 0.09102
Suhu -0.28403 0.75274 0.19230 -1.477 0.13966
Likelihood ratio test=16.38 on 5 df, p=0.005847
n= 30, number of events= 28 Model terbaik yang didapat adalah model3 karena memiliki nilai AIC terkecil.
> #model terbaik backward
> modelterbaik <- coxph(Surv(Survival, Status) ~ Usia+Hemoglobin+Hematokrit+Trombosit+Suhu, data =data)
> summary(modelterbaik)
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Hemoglobin +
Hematokrit + Trombosit + Suhu, data = data)
n= 30, number of events= 28
coef exp(coef) se(coef) z Pr(>|z|)
Usia 0.03178 1.03229 0.01275 2.493 0.01268 *
Hemoglobin -1.21311 0.29727 0.44654 -2.717 0.00659 **
Hematokrit 0.41022 1.50715 0.16502 2.486 0.01292 *
Trombosit -1.01798 0.36132 0.60235 -1.690 0.09102 .
Suhu -0.28403 0.75274 0.19230 -1.477 0.13966
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
Usia 1.0323 0.9687 1.0068 1.0584
Hemoglobin 0.2973 3.3639 0.1239 0.7133
Hematokrit 1.5071 0.6635 1.0907 2.0827
Trombosit 0.3613 2.7676 0.1110 1.1766
Suhu 0.7527 1.3285 0.5164 1.0973
Concordance= 0.783 (se = 0.051 )
Likelihood ratio test= 16.38 on 5 df, p=0.006
Wald test = 13.04 on 5 df, p=0.02
Score (logrank) test = 15.71 on 5 df, p=0.0084 HASIL DAN PEMBAHASAN
4.1 Asumsi Cox Proportional Hazard
Pengujian asumsi proportional hazard dilakukan dengan menggunakan Uji Global dengan hipotesis pengujian sebagai berikut.
H0 : \(\rho =0\) (Asumsi
PH terpenuhi, variabel prediktor tidak tergantung pada waktu)
H1 : \(\rho \neq 0\) (Asumsi
PH tidak terpenuhi, variabel prediktor tergantung pada waktu)
\(\alpha=0,05\)
chisq df p
Usia 2.5104 1 0.11
Gender 0.7304 1 0.39
Hemoglobin 0.1463 1 0.70
Leukosit 0.3114 1 0.58
Hematokrit 0.0552 1 0.81
Trombosit 0.0797 1 0.78
Suhu 0.2606 1 0.61
GLOBAL 4.4402 7 0.73
Berdasarkan luaran diatas diperoleh bahwa seluruh variabel memiliki nilai nilai \(p-value>0,05\) maka H0 dapat diterima. Maka, dapat disimpulkan bahwa asumsi PH terpenuhi. Variabel yang terlibat tidak tergantung pada waktu, sehingga dapat dilanjutkan ke pemodelan regresi cox proportional hazard
4.2 Pemodelan Regresi Cox Proportional Hazard
Berdasarkan hasil estimasi parameter pada tabel diatas diperoleh model awal regresi Cox Proportional Hazard sebagai berikut \[ h_t(t)=h_0(t)exp(0,03743x_1-0,2716x_2-1,21325x_3-0,05704x_4+0,41685x_5-0,96931x_6-0,29168x_7) \]
4.3 Pemilihan Model Terbaik
Pemilihan model terbaik dengan menggunakan metode backward elimination dengan tahapan manual dapat diringkas pada tabel berikut ini
| Model | Uji Parsial | AIC |
|---|---|---|
| \(X_1,X_2,X_3,X_4,X_5,X_6,X_7\) | \(X_1,X_3,X_5\) Signifikan | 132,55 |
| \(X_1,X_2,X_3,X_5,X_6,X_7\) | \(X_1,X_3,X_5\) Signifikan | 130,94 |
| \(X_1,X_3,X_5,X_6,X_7\) | \(X_1,X_3,X_5\) Signifikan | 129,40 |
| \(X_1,X_3,X_5,X_6\) | \(X_1,X_3,X_5\) Signifikan | 129,56 |
| \(X_1,X_3,X_5\) | \(X_1,X_3,X_5\) Signifikan | 129,80 |
Jika dilihat tingkat signifikansi uji parsial, model ke-5 (model yang memuat \(X_1,X_3,\) dan \(X_5\)) adalah model terbaik karena seluruh variabel prediktornya berpengaruh secara signifikan terhadap lama penyembuhan pasien. Namun nilai AIC model ke-5 bukan nilai AIC terkecil. Nilai AIC terkecil ada pada model ke-3. Maka diputuskan model terbaik adalah model ke-3 atau model yang memuat variabel \(X_1,X_3,X_5,X_6,\) dan \(X_7\) karena memiliki tingkat kesalahan terkecil.
Pemilihan model terbaik jika menggunakan fungsi step
menghasilkan kesimpulan bahwa model yang memuat \(X_1,X_3,X_5,X_6,\) dan \(X_7\) adalah model terbaik. Dapat
disimpulkan bahwa baik dengan pemilihan manual maupun pemilihan dnegan
fungsi `step1 menghasilkan model terbaik yang sama.
Berikut merupakan model regresi Cox proportional hazard
terbaik yang dihasilkan:
\[
h_t(t)=h_0(t)exp(0,03178x_1-1,21311x_3-0,41022x_5-1,01798x_6-0,28403x_7)
\] dengan \(h_0(t)\) adalah
fungsi baseline hazard, \(X_1\) adalah variabel usia pasien, \(X_3\) adalah variabel jumlah hemoglobin,
\(X_5\) adalah variabel presentase
hematokrit, \(X_6\) adalah variabel
jumlah trimbosir, dan \(X_7\) adalah
variabel suhu badan awal pasien.
4.4 Uji Signifikansi Parameter
Untuk mengetahui apakah model awal signifikan atau tidak, dilakukan pengujian terhadap parameter model. Terdapat dua uji yang harus dilakukan, yaitu uji secara serentak dan uji secara parsial
Call:
coxph(formula = Surv(Survival, Status) ~ Usia + Hemoglobin +
Hematokrit + Trombosit + Suhu, data = data)
coef exp(coef) se(coef) z p
Usia 0.03178 1.03229 0.01275 2.493 0.01268
Hemoglobin -1.21311 0.29727 0.44654 -2.717 0.00659
Hematokrit 0.41022 1.50715 0.16502 2.486 0.01292
Trombosit -1.01798 0.36132 0.60235 -1.690 0.09102
Suhu -0.28403 0.75274 0.19230 -1.477 0.13966
Likelihood ratio test=16.38 on 5 df, p=0.005847
n= 30, number of events= 28
4.4.1 Uji Serentak
Pengujian secara serentak dilakukan dengan Uji Rasio Likelihood. Pengujian dilakukan untuk mengetahui apakah ada variabel prediktor yang berpengaruh signifikan dilakukan dengan serentak.
\(H_0:\beta_1=\beta_3=\beta_5=\beta_6=\beta_7\)
\(H_1:\) minimal ada satu \(\beta_k \neq 0\) dengan k=1,3,5,6,7
\(\alpha=0,05\)
Berdasarkan luaran diatas diperoleh statistik uji likelihood ratio test sebesar 16,28 dengan \(p-value=0,005847\). karena nilai \(p-value<0,05\) maka H0 dapat ditolak. Dapat disimpulkan bahwa seluruh variabel prediktor berpengaruh secara serentak terhadap laju kesembuhan Pasien DBD di RSUD Kota Makassar.
4.4.2 UJi Parsial
Pengujian secara parsial dilakukan dengan Uji Wald. Pengujian ini untuk mengetahui apakah setiap variabel prediktor berpengaruh signifikan terhadap model.
\(H_0:\beta_k=0\) dengan
k=1,3,5,6,7
\(H_1:\beta_k \neq 0\) dengan
k=1,3,5,6,7
\(\alpha=0,05\)
Berdasarkan luaran diatas diperoleh tabel berikut. Keputusan diperoleh dengan membandingkan nilai p-value dengan \(\alpha=0,05\)
| Variabel | pvalue | Keputusan |
|---|---|---|
| Usia \((X_1)\) | 0,01268 | Tolak H0 |
| Hemoglobin \((X_3)\) | 0,00659 | Tolak H0 |
| Hematokrit \((X_5)\) | 0,01292 | Tolak H0 |
| Trombosit \((X_6)\) | 0,09102 | Terima H0 |
| Suhu \((X_7)\) | 0,13966 | Terima H0 |
Berdasarkan Tabel diatas dapat disimpulkan bahwa variabel yang berpengaruh signifikan terhadap laju kesembuhan pasien penderita DBD di RSUD Kota Makassar adalah usia pasien, jumlah hemoglobin dan presentase hematokrit. Sedangkan variabel jumlah trombosit dan suhu badan pasien tidak berpengaruh signifikan terhadap laju kesembuhan pasien penderita DBD di RSUD Kota Makassar.
4.4.3 Hazard Ratio
Untuk mengetahui laju keberhasilan kesembuhan pasien penderita DBD di RSUD Makassar berdasarkan variabel usia, jumlah hemoglobin, presentase hematokrit yang berpengaru signifikan, maka dilakukan perhitungan ratio hazard.
4.4.3.1 Usia (X1)
Berikut ditunjukkan rasio hazard pada variabe Usia \((X_1)\), misalkan digunakan \(c=1\) \[\widehat {HR} = \frac{h_A}{h_B}= \frac {h_0(t)exp[\beta_1x_1=1]}{h_0(t)exp[\beta_1x_1=0]}=exp[\beta_1.1]\] \[\widehat {HR} = exp[0,01268(1)]=1,0127\] Interpretasi dari rasio hazard tersebut menyatakan bahwa setiap pertambahan usia pasien DBD sebesar 1 tahun maka akan mengakibatkan laju kesembuhan pasien makin lama, yaitu 1,0127 kali lebih lama.
4.4.3.2 Jumlah Hemoglobin (X3)
Berikut ditunjukkan rasio hazard pada variabel Hemoglobin \((X_3)\), misalkan digunakan \(c=1\) \[\widehat {HR} = \frac{h_A}{h_B}= \frac {h_0(t)exp[\beta_3x_1=1]}{h_0(t)exp[\beta_3x_1=0]}=exp[\beta_3.1]\] \[\widehat {HR} = exp[-1,12311(1)]=0,2972\] Interpretasi dari rasio hazard tersebut menyatakan bahwa setiap pertambahan jumlah hemoglobin pasien sebesar 1 gram/dl akan menyebabkan lama penyembuhan pasien DBD menjadi 0,2972 kali lebih lama, atau dalam kata lain lama penyembuhannya menjadi lebih cepat, yaitu \(0,2972^{-1}=3,363\) kali lebih cepat.
4.4.3.3 Presentase Hematokrit (X6)
Berikut ditunjukkan rasio hazard pada variabel Hematokrit \((X_5)\), misalkan digunakan \(c=1\) \[\widehat {HR} = \frac{h_A}{h_B}= \frac {h_0(t)exp[\beta_5x_1=1]}{h_0(t)exp[\beta_5x_1=0]}=exp[\beta_6.1]\] \[\widehat {HR} = exp[-0,41022(1)]=1,50714\] Interpretasi dari rasio hazard tersebut menyatakan bahwa setiap pertambahan presentase hematokrit pasien sebesar 1% akan menyebabkan lama penyembuhan pasien DBD menjadi 1,50714 kali lebih lama,
5 KESIMPULAN
- Model Cox Proportional Hazard untuk memodelkan laju penyembuhan pasien penderita DBD di RSUD Makassar adalah \[ h_t(t)=h_0(t)exp(0,03178x_1-1,21311x_3-0,41022x_5-1,01798x_6-0,28403x_7) \]
- Faktor yang mempengaruhi laju penyembuhan pasien DBD adalah usia pasien, jumlah hemoglobin, dan presentase hematokrit dalam darah.
- Pertambahan usia pasien DBD sebesar 1 tahun akan mengakibatkan laju kesembuhan pasien makin lama, yaitu 1,0127 kali lebih lama. Pertambahan jumlah hemoglobin pasien sebesar 1 gram/dl akan menyebabkan lama penyembuhan pasien DBD menjadi 3,363 kali lebih cepat. Sedangkan pertambahan presentase hematokrit pasien sebesar 1% akan menyebabkan lama penyembuhan pasien DBD menjadi 1,50714 kali lebih lama.
6 DAFTAR PUSTAKA
Collet, D. 2003. Modelling Survival Data in Medical Research. Second Edition. Chapman and Hall. London.
Dahlan, M. 2013. Analisis Survival “Dasar-Dasar Teori dan Aplikasi Program STATA”. Jakarta: Sagung Seto.
Kleinbaum, D.G. and M. Klein. 2005. Survival Analysis A Self Learning Text 2nd Edition. Springer. New York.
Kleinbaum, D., dan Klein, M. 2012. Kaplan-Meier survival curves and the log-rank test. In Survival analysis. Springer. Springer.
Lee, E.T. and J.W. Wang. 2003. Statistical Methods for Survival Data Analysis. Third Edition. Michigan University. Michigan.
Utami, N. F. (2017). Analisis Survival Dengan Pemodelan Regresi Cox Proportional Hazard (Kasus: Pasien Rawat Inap DBD di RSUD Kota Makassar) (Doctoral dissertation, FMIPA).
Pourhoseingholi, M., E, dan Michael. R, Z. 2007. Comparing Cox Regression and Parametric Models for Survival of Patients with Gastric Carcinoma. Asian Pasific Journal of Cancer Prevention.