Heart photo created by freepik - www.freepik.com

Analisis Ketahanan Hidup (Survival Analysis)

Analisis ketahanan hidup (survival analysis) adalah kumpulan prosedur statistik yang digunakan untuk mengukur dan menganalisis data waktu hingga terjadinya suatu peristiwa (event). Waktu yang dimaksud dapat berupa tahun, bulan, minggu, atau hari dimulai dari objek masuk ke dalam waktu pengamatan; sedangkan peristiwa (event) merupakan peristiwa yang menjadi fokus penelitian seperti : kematian, kesembuhan, terjangkitnya suatu penyakit, atau kejadian menarik yang terjadi pada objek penelitian (Kleinbaum dan Klein, 2012). Selain status event dikenal pula status censored dalam analisis ketahanan hidup. Censored adalah status yang diberikan kepada objek yang tidak mengalami event atau hilang selama penelitian. Kedua informasi ini tetap dimasukkan ke dalam proses analisis. Hal inilah yang membedakan analisis ketahanan hidup dengan metode regresi klasik yang dimana hanya memasukkan objek yang ditekahui statusnya saja ke dalam proses analisis. Pada analisis ketahanan hidup, variabel respons yang digunakan adalah variabel time-to-event, yaitu status objek pengamatan (event atau censored) beserta waktu terjadinya.

Sebagai gambaran perbedaan antara analisis ketahanan hidup dengan metode regresi klasik adalah pada kasus penelitian terhadap pasien kanker di suatu rumah sakit. Misalkan pada saat penelitian berlangsung, terdapat pasien yang melarikan diri dari rumah sakit atau mengalami kematian namun bukan disebabkan akibat kanker yang dideritanya. Pada analisis regresi klasik, informasi dari pasien ini tidak dimasukkan dalam proses analisis sedangkan pada analisis ketahanan hidup informasi ini tetap dimasukkan dalam proses analisis. Pasien yang mengalami kematian diberi label event sedangkan pasien yang tidak mengalami kematian atau mengalami kematian namun bukan karena kankernya atau yang tidak dapat diamati lagi diberi label censored.

Model Cox Proportional Hazard merupakan model yang cukup sering digunakan dalam analisis ketahanan hidup. Pada model ini distribusi dari survival time tidak diasumsikan mengikuti distribusi tertentu dan hazard ratio objek pengamatan konstan sepanjang waktu. Selain itu, terdapat Model parametrik dimana pada model ini, distribusi survival time diasumsikan mengikuti suatu distribusi tertentu. Beberapa model parametrik pada analisis ketahanan hidup yang sering digunakan adalah Weibull, Gompertz, dan Eksponensial.

Studi Kasus : Data Pasien Kanker Usus/Kolorektal

Catatan : Data yang diambil adalah data yang peneliti dapatkan saat mendapat tugas kuliah analisis ketahanan hidup. Data ini digunakan hanya untuk latihan dan kesimpulan yang didapat mungkin saja tidak menggambarkan keadaan pasien kanker kolorektal yang sesungguhnya

Contoh ini menggunakan data 30 pasien kanker kolorektal/usus sebagai unit analisisnya. Peristiwa (event) dalam contoh ini adalah pasien kanker kolorektal yang mengalami kematian selama masa pengamatan. Selain itu ingin diketahui variabel apa saja yang berpengaruh signifikan terhadap status kematian pasien. Variabel tersebut adalah umur pasien dalam tahun, jenis kelamin pasien, stadium awal pada saat terdeteksi kanker usus, dan jenis treatment yang diberikan. Rincian variabel yang digunakan dalam contoh ini terlampir sebagai berikut :

Nama Variabel Keterangan Variabel Kategori
Pasien Nomor urut pasien -
Umur Umur pasien Muda (<= 50 tahun), Tua (> 50 tahun
Kelamin Jenis kelamin pasien Perempuan, Laki-laki
Stadium Stadium awal pada saat terdeteksi kanker Parah, Sangat Parah
Treatment Jenis treatment yang diberikan Baru Standar
Survival_time Waktu hidup pasien dalam bulan -
Status Status pada akhir pengamaattan TRUE (Death/Event), FALSE (Censored)

Pembahasan

Load library yang digunakan

library(dplyr) #Data processing
library(survival) #Cox PH Model and Weibull Model
library(survminer) #Visualisasi KM
## Loading required package: ggplot2
## Loading required package: ggpubr
## Loading required package: magrittr
library(eha) #Survival Analysis Model

Fungsi Survival Kaplan-Meier

Berdasarkan data 30 pasien kanker kolorektal/usus terdapat 10 pasien yang mengalami kematian (event) sedangkan 20 pasien tidak mengalami kematian (censored). Langkah pertama yang bisa digunakan dalam memodelkan dalam survival analysis adalah memodelkan waktu ketahanan hidup pasien kanker kolorektal dengan metode Kaplan Meier. Kaplan Meier adalah metode yang digunakan untuk membuat fungsi ketahanan hidup menurut kategori pada satu variabel. Dalam metode Kaplan Meier dikenal Uji Log Rank yang bertujuan untuk menguji ada/tidaknya perbedaan waktu ketahanan hidup antar kategori pada satu variabel. Kelebihan dari metode ini adalah mudah diterapkan, namun kelemahannya adalah tidak dapat mengetahui pengaruh/signifikansi antar berbagai variabel prediktor. Hasil analisis dengan metode Kaplan Meier pasien kanker kolorektal adalah sebagai berikut :

  • Umur
#Umur
fit1 <- survfit(formula = Surv(Survival_time, Status) ~ Umur, data = mydata)
ggsurvplot(fit1, pval = TRUE, pval.method = TRUE, title ='Kurva Survival Kaplan Meier Pasien Kanker kolorektal 
Berdasarkan Umur')

Berdasarkan kurva diatas, secara umum terlihat bahwasanya kurva survival pasien muda berada diatas kurva survival pasien muda. Namun, hasil pengujian Log Rank menunjukkan bahwa kedua kurva tidak menunjukkan perbedaan yang signifikan. Hal ini mengindikasikan bahwa tidak terdapat perbedaan pada waktu ketahanan hidup penderita kanker kolorektal pada pasien muda maupun pasien tua.

  • Jenis Kelamin
#Jenis Kelamin
fit2 <- survfit(formula = Surv(Survival_time, Status) ~ Kelamin, data = mydata)
ggsurvplot(fit2, pval = TRUE, pval.method = TRUE, title ='Kurva Survival Kaplan Meier Pasien Kanker kolorektal 
Berdasarkan Jenis Kelamin')

Berdasarkan kurva diatas, secara umum terlihat bahwasanya kurva survival pasien perempuan berada diatas kurva survival pasien laki-laki. Namun, hasil pengujian Log Rank menunjukkan bahwa kedua kurva tidak menunjukkan perbedaan yang signifikan. Hal ini mengindikasikan bahwa tidak terdapat perbedaan pada waktu ketahanan hidup penderita kanker kolorektal pada pasien perempuan maupun pasien laki-laki.

  • Treatment
#Treatment
fit3 <- survfit(formula = Surv(Survival_time, Status) ~ Treatment, data = mydata)
ggsurvplot(fit3, pval = TRUE,pval.method = TRUE, title ='Kurva Survival Kaplan Meier Pasien Kanker kolorektal 
Berdasarkan Treatment')

Berdasarkan kurva diatas, secara umum terlihat bahwasanya kurva survival pasien dengan treatment baru berada diatas kurva survival pasien dengan treatment standar. Namun, hasil pengujian Log Rank menunjukkan bahwa kedua kurva tidak menunjukkan perbedaan yang signifikan. Hal ini mengindikasikan bahwa tidak terdapat perbedaan pada waktu ketahanan hidup penderita kanker kolorektal pada pasien dengan treatment baru maupun pasien dengan treatment standar.

  • Stadium
#Stadium
fit4 <- survfit(formula = Surv(Survival_time, Status) ~ Stadium, data = mydata)
ggsurvplot(fit4, pval = TRUE, pval.method = TRUE, title ='Kurva Survival Kaplan Meier Pasien Kanker kolorektal 
Berdasarkan Stadium')

Berdasarkan kurva diatas, secara umum terlihat bahwasanya kurva survival pasien dengan stadium parah berada diatas kurva survival pasien dengan stadium sangat parah. Namun, hasil pengujian Log Rank menunjukkan bahwa kedua kurva tidak menunjukkan perbedaan yang signifikan. Hal ini mengindikasikan bahwa tidak terdapat perbedaan pada waktu ketahanan hidup penderita kanker kolorektal pada pasien dengan stadium parah maupun pasien dengan stadium sangat parah.

Pengujian Asumsi Proportional Hazard (PH)

Pendekatan yang digunakan dalam membentuk model Cox Proportional Hazard maupun Model Parametrik adalah hazard ratio. Hazard ratio adalah kecenderungan pasien untuk mengalami kematian. Hal ini agak berbeda dengan Kaplan-Meier yang menggunakan pendekatan fungsi survival yang menyatakan peluang pasien kanker kolorektal untuk dapat terus hidup.

Sebelum membuat Model Cox Proportional Hazard maupun Model Parametrik, maka dilakukan uji asumsi PH. Pada Model Cox Proportional Hazard diasumsikan bahwa hazard ratio antar individu adalah konstan/sama dari waktu ke waktu. Sedangkan pada Model Parametrik, diasumsikan digunakan model yang dapat mengakomomodir asumsi PH.

#Data Asli
cph <- coxph(formula = Surv(Survival_time, Status) ~ Kelamin + Umur + Stadium + Treatment , data = mydata) 
cox.zph(cph)
##             chisq df     p
## Kelamin   5.65015  1 0.017
## Umur      0.00399  1 0.950
## Stadium   0.19411  1 0.660
## Treatment 0.20798  1 0.648
## GLOBAL    8.23987  4 0.083

Hasil pengujian asumsi PH menunjukkan bahwa dari 4 variabel yang diuji (umur, jenis kelamin, stadium, dan treatment) hanya jenis kelamin yang tidak memenuhi asumsi PH dengan tingkat signifikansi 5 persen. Namun, untuk menghindari kehilangan informasi dari data, diputuskan untuk membuat strata berdasarkan jenis kelamin pasien kemudian melakukan analisis pada masing-masing strata.

Setelah strata terbentuk, kemudian dilakukan pengujian asumsi PH pada masing-masing strata.

#Strata Pasien Laki-laki
mydata_laki <- mydata %>% filter(Kelamin == 'Male')
cph_lk <- coxph(formula = Surv(Survival_time, Status) ~ Umur + Stadium + Treatment, data = mydata_laki) 
cox.zph(cph_lk)
##              chisq df     p
## Umur      3.918820  1 0.048
## Stadium   0.000341  1 0.985
## Treatment 5.866841  1 0.015
## GLOBAL    8.370067  3 0.039
#Strata Perempuan
mydata_pr <- mydata %>% filter(Kelamin == 'Female')

cph_pr <- coxph(formula = Surv(Survival_time, Status) ~ Umur + Stadium + Treatment , data = mydata_pr) 
cox.zph(cph_pr)
##              chisq df    p
## Umur      1.48e-03  1 0.97
## Stadium   8.24e-12  1 1.00
## Treatment 8.34e-12  1 1.00
## GLOBAL    1.48e-03  3 1.00

Hasil pengujian asumsi PH pada masing-masing strata menunjukkan bahwa dengan tingkat signifikansi 5 persen pada strata pasien laki-laki variabel treatment dan umur tidak memenuhi asumsi PH sedangkan pada strata perempuan tidak ada variabel yang tidak memenuhi asumsi PH. Oleh sebab itu, peneliti memutuskan untuk tidak memasukkan variabel treatment dan umur pada strata pasien laki-laki namun memasukkan semua variabel (treatment, umur, dan stadium) pada strata pasien perempuan. Peneliti tidak membuat strata kembali pada pasien laki-laki melihat jumlah observasi yang pada strata pasien laki-laki yang cukup kecil (15 observasi).

Pemilihan Model Terbaik

Pemilihan model terbaik yang didasarkan pada nilai AIC. Model terbaik yang dipilih adalah model dengan nilai AIC terkecil. Hasil masing-masing model pada tiap kelompok ditunjukkan pada tabel berikut :

  • Tabel 1. Nilai AIC pada Strata Pasien Laki-laki
NO MODEL AIC
1 Weibull 59,78006
2 Gompertz 61,06305
3 Eksponensial 63,92940
4 Cox PH 63,75866
  • Tabel 2. Nilai AIC pada Strata Pasien Perempuan
NO MODEL AIC
1 Weibull 33,91756
2 Gompertz 34,27219
3 Eksponensial 34,27210
4 Cox PH 16,54349

Berdasarkan kedua tabel diatas, maka dipilih model parametrik Weibull untuk strata pasien laki-laki dan model Cox PH untuk strata pasien perempuan karena memiliki nilai AIC terkecil dibandingkan model lainnya.

Model Parametrik Weibull untuk Strata Pasien Laki-laki

Di R, untuk membuat model Weibull dapat menggunakan fungsi phreg pada library eha kemudian mengisi argument ‘weibull’ pada parameter dist.

wei_lk <- phreg(formula = Surv(Survival_time, Status) ~
                          Stadium, data = mydata_laki, dist ='weibull')
wei_lk
## Call:
## phreg(formula = Surv(Survival_time, Status) ~ Stadium, data = mydata_laki, 
##     dist = "weibull")
## 
## Covariate          W.mean      Coef Exp(Coef)  se(Coef)    Wald p
## Stadium 
##            Parah    0.877     0         1           (reference)
##     Sangat Parah    0.123     1.819     6.166     0.963     0.059 
## 
## log(scale)                    3.314               0.225     0.000 
## log(shape)                    0.789               0.331     0.017 
## 
## Events                    7 
## Total time at risk           236 
## Max. log. likelihood      -28.89 
## LR test statistic         2.99 
## Degrees of freedom        1 
## Overall p-value           0.0836804

Pengaruh variabel prediktor secara bersama-sama terhadap variabel respons diketahui melalui uji simultan (Likelihood Ratio Test). Dengan menggunakan tingkat signifikansi 5 persen, hasil uji simultan menunjukkan hasil yang tidak signifikan yang artinya tidak terdapat minimal satu variabel prediktor yang mempengaruhi waktu ketahanan hidup pasien kanker kolorektal. Namun, untuk mengetahui informasi lebih mendalam, selanjutnya dilakukan uji parsial (Wald Test) untuk mengetahui pengaruh masing-masing variabel prediktor.

Dari output diatas pula dapat diketahui risiko atau kecenderungan pasien kanker kolorektal untuk mengalami kematian. Nilai Hazard Ratio (HR) untuk variabel stadium sangat parah sebesar 6,166. Hal ini dapat diartikan, dengan menganggap variabel lain konstan, pasien dengan stadium sangat parah memiliki risiko 6,166 kali lebih besar dibandingkan pasien dengan stadium parah untuk mengalami kematian. Namun, dilihat dari nilai p-value variabel stadium sangat parah yang lebih dari 5 persen, dapat dikatakan bahwasanya dengan tingkat signifikansi 5 persen, variabel stadium sangat parah tidak berpengaruh signifikan terhadap risiko kematian pada pasien kanker kolorektal pada laki-laki.

Model Cox PH untuk Strata Pasien Perempuan

Di R, untuk membuat model Cox PH dapat menggunakan fungsi coxph pada library survival.

cph_pr <- coxph(formula = Surv(Survival_time, Status) ~
                   Umur + Treatment + Stadium, data = mydata_pr) 
## Warning in fitter(X, Y, istrat, offset, init, control, weights = weights, :
## Loglik converged before variable 2 ; coefficient may be infinite.
cph_pr
## Call:
## coxph(formula = Surv(Survival_time, Status) ~ Umur + Treatment + 
##     Stadium, data = mydata_pr)
## 
##                           coef  exp(coef)   se(coef)      z     p
## UmurTua             -4.668e-01  6.270e-01  1.229e+00 -0.380 0.704
## TreatmentStandar     2.153e+01  2.236e+09  2.744e+04  0.001 0.999
## StadiumSangat Parah  6.379e-02  1.066e+00  5.354e+04  0.000 1.000
## 
## Likelihood ratio test=5.12  on 3 df, p=0.1632
## n= 15, number of events= 3

Pengaruh variabel prediktor terhadap variabel respons diketahui melalui uji simultan (Likelihood Ratio Test). Dengan menggunakan tingkat signifikansi 5 persen, hasil uji simultan menunjukkan hasil yang tidak signifikan yang artinya tidak terdapat variabel prediktor yang mempengaruhi waktu ketahanan hidup pasien kanker kolorektal. Namun, untuk mengetahui informasi lebih mendalam, selanjutnya dilakukan uji parsial (Wald Test) untuk mengetahui pengaruh masing-masing variabel prediktor.

Dari output diatas pula dapat diketahui risiko atau kecenderungan pasien kanker kolorektal untuk mengalami kematian (nilai Exp(Coef)). Nilai Hazard Ratio (HR) untuk variabel umur tua sebesar 0,627. Hal ini dapat diartikan, dengan menganggap variabel lain konstan, pasien perempuan dengan umur tua memiliki risiko 0,627 kali lebih kecil dibandingkan pasien perempuan dengan umur muda untuk mengalami kematian. Dilihat dari nilai p-value variabel umur tua lebih dari 5 persen, dapat dikatakan bahwasanya dengan tingkat signifikansi 5 persen, variabel umur tua tidak berpengaruh signifikan terhadap risiko kematian pada pasien kanker kolorektal pada perempuan. Selanjutnya nilai Hazard Ratio (HR) untuk variabel stadium sangat parah sebesar 1,066. Hal ini dapat diartikan pula, dengan menganggap variabel lain konstan, pasien perempuan dengan stadium sangat parah memiliki risiko 1,066 kali lebih besar dibandingkan pasien perempuan dengan stadium parah untuk mengalami kematian. Namun, dilihat dari nilai p-value variabel stadium sangat parah yang lebih dari 5 persen, dapat dikatakan bahwasanya dengan tingkat signifikansi 5 persen, variabel stadium sangat parah tidak berpengaruh signifikan terhadap risiko kematian pada pasien kanker kolorektal pada perempuan. Kemudian nilai Hazard Ratio (HR) untuk variabel treatment standar sebesar 302 x 10 ^ 6. Hal ini dapat diartikan pula, dengan menganggap variabel lain konstan, pasien perempuan yang mendapat treatment standar memiliki risiko 302 x 10 ^ 6 kali lebih besar dibandingkan pasien perempuan yang mendapat treatment baru untuk mengalami kematian. Peneliti menduga nilai ini sangat besar sekali disebabkan dari data yang diperoleh , pada pasien perempuan, prevalensi kematian pada pasien yang mendapat treatment standar sebesar 75 persen sedangkan pada pasien yang mendapat treatment baru sebesar 0 persen. Namun, dilihat dari nilai p-value variabel treatment standar yang lebih dari 5 persen, dapat dikatakan bahwasanya dengan tingkat signifikansi 5 persen, variabel treatment standar tidak berpengaruh signifikan terhadap risiko kematian pada pasien kanker kolorektal pada perempuan.

Kesimpulan

Catatan : Data yang diambil adalah data yang peneliti dapatkan saat mendapat tugas kuliah analisis ketahanan hidup. Data ini digunakan hanya untuk latihan dan kesimpulan yang didapat mungkin saja tidak menggambarkan keadaan pasien kanker kolorektal yang sesungguhnya

Berdasarkan hasil penelitian, dari data 30 pasien kanker kolorektal, terdapat 10 pasien yang mengalami kematian (event of interest) sedangkan 20 pasien tidak mengalami kematian (sensor). Kemudian saat pembentukan model analisis ketahanan hidup, peneliti memutuskan untuk merapkan model yang berbeda berdasarkan jenis kelamin pasien kanker. Hal ini dilakukan untuk mengatasi permasalahan terlanggarnya asumsi PH dan meminimalkan kehilangan informasi pada data. Pada pasien laki-laki model terbaik diterapkan adalah model Weibull sedangkan pada pasien perempuan model terbaik yang diterapkan adalah model Cox Proportional Hazard. Pemilihan model terbaik didasarkan pada nilai AIC yang terkecil dibanding model lainnya pada masing-masing strata. Dari model yang terbentuk, ditunjukkan baik pada model pasien laki-laki maupun model pasien perempuan tidak terdapat variabel signifikan yang mempengaruhi waktu ketahanan hidup pasien kanker kolorektal.

Referensi