Laporan dalam format word_document dapat dilihat melalui link berikut

1. Pendahuluan

Analisis survival merupakan metode statistik yang digunakan untuk mempelajari waktu sampai terjadinya suatu peristiwa, seperti kematian, kekambuhan penyakit, atau kejadian lainnya yang relevan dalam penelitian medis. Dalam konteks penelitian ini, analisis survival diterapkan untuk mengevaluasi faktor-faktor yang mempengaruhi lama waktu hidup pasien penderita kanker paru-paru berdasarkan data dari dataset lung. Dataset ini memuat informasi mengenai waktu kelangsungan hidup pasien (time), status kejadian (status), serta beberapa variabel penjelas seperti usia (age), jenis kelamin (sex), dan status performa pasien (ph.ecog) yang menggambarkan kondisi fisik dan kemampuan menjalani aktivitas sehari-hari.

Penelitian ini bertujuan untuk mengetahui bagaimana perbedaan jenis kelamin mempengaruhi peluang kelangsungan hidup pasien, serta menilai apakah usia dan tingkat performa pasien berpengaruh secara signifikan terhadap risiko kematian. Analisis dilakukan dengan beberapa tahap, yaitu estimasi kurva Kaplan-Meier untuk menggambarkan pola kelangsungan hidup berdasarkan jenis kelamin, uji Log-Rank untuk menguji perbedaan signifikan antar kelompok, serta model Cox Proportional Hazards untuk mengidentifikasi variabel yang berpengaruh terhadap risiko kematian pasien kanker paru-paru.

Hasil analisis menunjukkan bahwa terdapat perbedaan tingkat kelangsungan hidup antara pasien laki-laki dan perempuan, di mana pasien perempuan memiliki peluang bertahan hidup yang lebih tinggi. Selain itu, faktor status performa (ph.ecog) terbukti berpengaruh signifikan terhadap risiko kematian, sementara usia tidak menunjukkan pengaruh yang bermakna. Dengan demikian, hasil penelitian ini memberikan gambaran bahwa kondisi fisik pasien dan faktor jenis kelamin merupakan aspek penting yang mempengaruhi prognosis pasien kanker paru-paru.

2. Eksplorasi & Deskriptif

Pada tahap awal, dilakukan pemanggilan library yang diperlukan serta pemuatan dataset(lung). Kemudian dilakukan eksplorasi awal untuk melihat struktur dan ringkasan datanya.

#memanggil library yang digunakan
library(survival)
library(survminer)

#data set
data(lung)
head(lung)
##   inst time status age sex ph.ecog ph.karno pat.karno meal.cal wt.loss
## 1    3  306      2  74   1       1       90       100     1175      NA
## 2    3  455      2  68   1       0       90        90     1225      15
## 3    3 1010      1  56   1       0       90        90       NA      15
## 4    5  210      2  57   1       1       90        60     1150      11
## 5    1  883      2  60   1       0      100        90       NA       0
## 6   12 1022      1  74   1       1       50        80      513       0
#Deskripsi data
summary(lung)
##       inst            time            status           age       
##  Min.   : 1.00   Min.   :   5.0   Min.   :1.000   Min.   :39.00  
##  1st Qu.: 3.00   1st Qu.: 166.8   1st Qu.:1.000   1st Qu.:56.00  
##  Median :11.00   Median : 255.5   Median :2.000   Median :63.00  
##  Mean   :11.09   Mean   : 305.2   Mean   :1.724   Mean   :62.45  
##  3rd Qu.:16.00   3rd Qu.: 396.5   3rd Qu.:2.000   3rd Qu.:69.00  
##  Max.   :33.00   Max.   :1022.0   Max.   :2.000   Max.   :82.00  
##  NA's   :1                                                       
##       sex           ph.ecog          ph.karno        pat.karno     
##  Min.   :1.000   Min.   :0.0000   Min.   : 50.00   Min.   : 30.00  
##  1st Qu.:1.000   1st Qu.:0.0000   1st Qu.: 75.00   1st Qu.: 70.00  
##  Median :1.000   Median :1.0000   Median : 80.00   Median : 80.00  
##  Mean   :1.395   Mean   :0.9515   Mean   : 81.94   Mean   : 79.96  
##  3rd Qu.:2.000   3rd Qu.:1.0000   3rd Qu.: 90.00   3rd Qu.: 90.00  
##  Max.   :2.000   Max.   :3.0000   Max.   :100.00   Max.   :100.00  
##                  NA's   :1        NA's   :1        NA's   :3       
##     meal.cal         wt.loss       
##  Min.   :  96.0   Min.   :-24.000  
##  1st Qu.: 635.0   1st Qu.:  0.000  
##  Median : 975.0   Median :  7.000  
##  Mean   : 928.8   Mean   :  9.832  
##  3rd Qu.:1150.0   3rd Qu.: 15.750  
##  Max.   :2600.0   Max.   : 68.000  
##  NA's   :47       NA's   :14
table(lung$status)
## 
##   1   2 
##  63 165

Berdasarkan hasil eksplorasi awal terhadap dataset(lung) dari paket survival, data ini berisi informasi mengenai pasien penderita kanker paru-paru yang menjalani terapi, dengan total 228 observasi dan sejumlah variabel seperti waktu kelangsungan hidup (time), status kelangsungan hidup (status), usia (age), jenis kelamin (sex), serta kondisi kesehatan (ph.ecog, ph.karno, pat.karno, meal.cal, dan wt.loss). Nilai status menunjukkan bahwa terdapat 165 pasien (sekitar 72,4%) yang meninggal dan 63 pasien (27,6%) yang masih hidup atau tersensor selama masa observasi. Rata-rata waktu kelangsungan hidup pasien adalah sekitar 305 hari dengan median 255,5 hari, menandakan bahwa setengah dari pasien meninggal dalam waktu kurang dari satu tahun setelah pengamatan dimulai. Usia pasien berkisar antara 39 hingga 82 tahun dengan rata-rata 62 tahun, menunjukkan bahwa sebagian besar pasien berada pada usia lanjut. Variabel (sex) memiliki nilai rata-rata 1,39, yang menunjukkan bahwa mayoritas pasien adalah laki-laki (kode 1). Skor (ph.ecog) memiliki median 1, artinya secara umum pasien mengalami keterbatasan aktivitas ringan. Selain itu, terdapat data yang hilang pada beberapa variabel, seperti (meal.cal) (47 nilai hilang) dan (wt.loss) (14 nilai hilang), yang menunjukkan adanya ketidaksempurnaan data yang perlu diperhatikan sebelum dilakukan analisis lanjutan. Secara keseluruhan, dataset ini memberikan gambaran umum tentang karakteristik demografis dan klinis pasien kanker paru-paru yang dapat dianalisis lebih lanjut menggunakan metode survival analysis.

3. Analisis Kaplan–Meier

Analisis Kaplan–Meier digunakan untuk memperkirakan fungsi survival secara non-parametrik. Metode ini menampilkan probabilitas bertahan hidup seiring berjalannya waktu, dan pada tahap ini dilakukan perbandingan berdasarkan jenis kelamin.

#Analisis Kaplan–Meier

#Kurva Kaplan–Meier
km_fit <- survfit(Surv(time, status) ~ sex, data = lung)
ggsurvplot(km_fit, data = lung, pval = TRUE, risk.table = TRUE,
           surv.median.line = "hv",
           title = "Kaplan–Meier Curve by Sex")
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the ggpubr package.
##   Please report the issue at <https://github.com/kassambara/ggpubr/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Ignoring unknown labels:
## • colour : "Strata"

Berdasarkan hasil analisis Kaplan–Meier pada dataset(lung), diperoleh kurva kelangsungan hidup yang membandingkan probabilitas bertahan hidup antara pasien laki-laki (sex = 1) dan perempuan (sex = 2). Dari grafik terlihat bahwa kurva survival untuk perempuan cenderung berada di atas kurva laki-laki hampir di sepanjang waktu pengamatan, yang menunjukkan bahwa perempuan memiliki peluang bertahan hidup lebih tinggi dibandingkan laki-laki. Nilai p-value dari uji Log-Rank sebesar 0.001 mengindikasikan bahwa perbedaan antara kedua kurva survival tersebut signifikan secara statistik pada tingkat kepercayaan 95%. Dengan demikian, dapat disimpulkan bahwa jenis kelamin memiliki pengaruh terhadap waktu kelangsungan hidup pasien kanker paru-paru, di mana perempuan cenderung memiliki masa hidup yang lebih panjang dibandingkan laki-laki setelah menjalani terapi.

4. Uji Log-Rank

Uji Log-Rank digunakan untuk menguji apakah terdapat perbedaan signifikan antara kurva survival pada kelompok laki-laki dan perempuan. Uji ini mengasumsikan bahwa data dari setiap kelompok bersifat independen.

#Uji Log-Rank
survdiff(Surv(time, status) ~ sex, data = lung)
## Call:
## survdiff(formula = Surv(time, status) ~ sex, data = lung)
## 
##         N Observed Expected (O-E)^2/E (O-E)^2/V
## sex=1 138      112     91.6      4.55      10.3
## sex=2  90       53     73.4      5.68      10.3
## 
##  Chisq= 10.3  on 1 degrees of freedom, p= 0.001

Hasil uji Log-Rank menunjukkan nilai statistik chi-square sebesar 10.3 dengan derajat kebebasan 1 dan nilai p = 0.001, yang berarti terdapat perbedaan signifikan antara kurva kelangsungan hidup pasien laki-laki dan perempuan. Secara rinci, kelompok laki-laki (sex = 1) memiliki 112 kejadian kematian dari 138 pasien, sedangkan kelompok perempuan (sex = 2) memiliki 53 kejadian kematian dari 90 pasien. Nilai Expected menunjukkan jumlah kematian yang diharapkan jika tidak ada perbedaan antara kelompok; terlihat bahwa laki-laki mengalami lebih banyak kematian dari yang diharapkan (112 dibanding 91,6), sedangkan perempuan mengalami lebih sedikit (53 dibanding 73,4). Hasil ini memperkuat temuan dari kurva Kaplan–Meier bahwa perempuan memiliki tingkat kelangsungan hidup yang lebih tinggi secara signifikan dibandingkan laki-laki pada dataset kanker paru-paru ini.

5. Pemodelan Cox Proportional Hazards

Model Cox digunakan untuk menilai pengaruh variabel kovariat seperti usia, jenis kelamin, dan skor performa (ph.ecog) terhadap risiko kematian (hazard). Model ini tidak memerlukan asumsi bentuk spesifik fungsi baseline hazard.

#Estimasi Model
fit <- coxph(Surv(time, status) ~ age + sex + ph.ecog, data = lung)
summary(fit)
## Call:
## coxph(formula = Surv(time, status) ~ age + sex + ph.ecog, data = lung)
## 
##   n= 227, number of events= 164 
##    (1 observation deleted due to missingness)
## 
##              coef exp(coef)  se(coef)      z Pr(>|z|)    
## age      0.011067  1.011128  0.009267  1.194 0.232416    
## sex     -0.552612  0.575445  0.167739 -3.294 0.000986 ***
## ph.ecog  0.463728  1.589991  0.113577  4.083 4.45e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##         exp(coef) exp(-coef) lower .95 upper .95
## age        1.0111     0.9890    0.9929    1.0297
## sex        0.5754     1.7378    0.4142    0.7994
## ph.ecog    1.5900     0.6289    1.2727    1.9864
## 
## Concordance= 0.637  (se = 0.025 )
## Likelihood ratio test= 30.5  on 3 df,   p=1e-06
## Wald test            = 29.93  on 3 df,   p=1e-06
## Score (logrank) test = 30.5  on 3 df,   p=1e-06

Hasil estimasi model Cox Proportional Hazards menunjukkan bahwa dari tiga variabel yang diuji, yaitu usia (age), jenis kelamin (sex), dan status performa pasien (ph.ecog), hanya dua variabel yang berpengaruh signifikan terhadap waktu kelangsungan hidup pasien kanker paru-paru, yaitu (sex) dan (ph.ecog), sedangkan (age) tidak signifikan (p = 0.232). Nilai koefisien untuk variabel sex adalah -0.5526 dengan hazard ratio (exp(coef)) sebesar 0.575, yang berarti bahwa pasien perempuan memiliki risiko kematian sekitar 42,5% lebih rendah dibandingkan laki-laki (karena nilai HR < 1). Sementara itu, variabel (ph.ecog) memiliki koefisien positif sebesar 0.4637 dengan hazard ratio sebesar 1.59, menandakan bahwa setiap peningkatan satu unit skor performance status (yang menunjukkan kondisi fisik yang lebih buruk) akan meningkatkan risiko kematian sebesar 59%. Uji keseluruhan model (Likelihood ratio, Wald, dan Score test) semuanya signifikan (p < 0.001), menunjukkan bahwa model secara keseluruhan memiliki kemampuan yang baik dalam menjelaskan variasi waktu kelangsungan hidup. Nilai concordance sebesar 0.637 menunjukkan bahwa model memiliki kemampuan prediksi yang cukup baik dalam membedakan pasien dengan risiko tinggi dan rendah terhadap kematian.

6. Uji Asumsi Proportional Hazards

Salah satu asumsi penting dalam model Cox adalah bahwa rasio hazard antar kelompok tetap konstan sepanjang waktu. Asumsi ini diuji menggunakan fungsi cox.zph() dan divisualisasikan untuk memastikan kestabilan hazard ratio.

#Uji Asumsi Proportional Hazards
ph_test <- cox.zph(fit)
ph_test
##         chisq df    p
## age     0.188  1 0.66
## sex     2.305  1 0.13
## ph.ecog 2.054  1 0.15
## GLOBAL  4.464  3 0.22
ggcoxzph(ph_test)

Hasil uji asumsi proportional hazards menggunakan fungsi cox.zph() menunjukkan bahwa seluruh variabel dalam model, yaitu usia (age), jenis kelamin (sex), dan status performa pasien (ph.ecog), memiliki nilai p-value yang lebih besar dari 0.05 (masing-masing 0.66, 0.13, dan 0.15), serta nilai p-value global sebesar 0.22. Hal ini menandakan bahwa tidak terdapat bukti signifikan untuk menolak asumsi proportional hazards pada model, atau dengan kata lain, rasio hazard antara kelompok tetap konstan sepanjang waktu. Dengan demikian, model Cox Proportional Hazards yang digunakan memenuhi asumsi dasar yang diperlukan, sehingga hasil estimasi koefisien dan interpretasi hazard ratio dapat dianggap valid dan dapat diandalkan untuk analisis kelangsungan hidup pasien kanker paru-paru ini.

7. Kurva Survival Terprediksi

Tahap terakhir adalah menampilkan kurva survival yang telah disesuaikan dengan model Cox. Visualisasi ini menunjukkan probabilitas bertahan hidup berdasarkan jenis kelamin setelah memperhitungkan variabel lain dalam model.

#Kurva Survival Terprediksi
ggadjustedcurves(fit, data = lung, variable = "sex",
                 legend.title = "Sex",
                 title = "Adjusted Survival Curves by Sex")
## Ignoring unknown labels:
## • fill : "Sex"
## • linetype : "Sex"
## • shape : "Sex"

Grafik Adjusted Survival Curves by Sex menampilkan kurva kelangsungan hidup yang telah disesuaikan berdasarkan model Cox Proportional Hazards untuk dua kelompok jenis kelamin. Terlihat bahwa kelompok perempuan (Sex = 2, garis biru) memiliki tingkat kelangsungan hidup yang lebih tinggi dibandingkan kelompok laki-laki (Sex = 1, garis merah) sepanjang waktu pengamatan. Hal ini menunjukkan bahwa pada setiap titik waktu, peluang perempuan untuk bertahan hidup lebih besar daripada laki-laki setelah mengontrol variabel lain seperti usia dan status performa (ph.ecog). Jarak yang konsisten antara kedua kurva memperkuat hasil uji log-rank dan model Cox sebelumnya, yang menyatakan bahwa jenis kelamin berpengaruh signifikan terhadap risiko kematian. Dengan demikian, dapat disimpulkan bahwa perempuan memiliki prognosis kelangsungan hidup yang lebih baik dibandingkan laki-laki pada pasien kanker paru-paru dalam dataset ini.

8. Kesimpulan

Berdasarkan hasil analisis survival terhadap data pasien kanker paru-paru dari dataset(lung), dapat disimpulkan bahwa jenis kelamin berpengaruh signifikan terhadap kelangsungan hidup pasien. Hasil analisis Kaplan–Meier dan uji Log-Rank menunjukkan bahwa pasien perempuan memiliki peluang bertahan hidup yang lebih tinggi dibandingkan laki-laki, dengan perbedaan yang signifikan secara statistik (p = 0.001). Status performa pasien (ph.ecog) memiliki pengaruh yang sangat signifikan terhadap risiko kematian (p < 0.001). Semakin buruk kondisi fisik pasien (semakin tinggi skor ph.ecog), maka semakin besar risiko kematiannya. Usia pasien tidak berpengaruh signifikan terhadap kelangsungan hidup (p = 0.232), sehingga umur bukan faktor utama yang menentukan risiko kematian pada kasus kanker paru-paru dalam dataset ini. Model Cox Proportional Hazards yang digunakan terbukti valid karena memenuhi asumsi proportional hazards (p-value global = 0.22), dengan nilai concordance sebesar 0.637 yang menunjukkan kemampuan model cukup baik dalam memprediksi risiko kematian. Secara keseluruhan, jenis kelamin dan kondisi fisik pasien merupakan dua faktor dominan yang mempengaruhi prognosis kelangsungan hidup penderita kanker paru-paru.

9. Implikasi Hasil

Hasil analisis survival terhadap data pasien kanker paru-paru memberikan beberapa implikasi penting baik dalam konteks medis maupun penelitian lanjutan. Pertama, temuan bahwa jenis kelamin berpengaruh signifikan terhadap kelangsungan hidup menunjukkan bahwa faktor biologis dan hormonal dapat memainkan peran penting dalam respon terhadap pengobatan maupun ketahanan tubuh terhadap perkembangan penyakit. Hal ini dapat mendorong pihak medis untuk mempertimbangkan pendekatan pengobatan yang lebih personalisasi antara pasien laki-laki dan perempuan.

Kedua, variabel status performa pasien (ph.ecog) terbukti sebagai indikator klinis yang sangat penting terhadap risiko kematian. Oleh karena itu, penilaian kondisi fisik pasien perlu dilakukan secara rutin dan dijadikan salah satu dasar utama dalam menentukan strategi terapi. Pasien dengan skor (ph.ecog) tinggi (menunjukkan kondisi fisik yang lemah) perlu mendapatkan perhatian lebih intensif, baik dari segi perawatan suportif maupun pengawasan medis. Ketiga, meskipun usia tidak berpengaruh signifikan, hal ini memberikan wawasan bahwa tingkat keparahan penyakit dan kondisi fisik lebih menentukan prognosis dibanding faktor umur kronologis. Artinya, upaya peningkatan kualitas hidup dan kondisi fisik pasien dapat lebih berpengaruh terhadap ketahanan hidup dibanding sekadar memperhitungkan usia.

Dari sisi metodologis, hasil ini menunjukkan bahwa model Cox Proportional Hazards efektif digunakan dalam analisis data survival medis karena mampu mengidentifikasi faktor risiko utama secara simultan tanpa memerlukan asumsi distribusi khusus. Model ini juga dapat diterapkan untuk penelitian serupa di bidang kesehatan lainnya, misalnya pada penyakit kronis atau studi ketahanan hidup pasien di rumah sakit. Secara keseluruhan, penelitian ini mengimplikasikan bahwa pengelolaan pasien kanker paru-paru sebaiknya memperhatikan faktor non-biologis seperti kondisi fisik dan keseimbangan penanganan antar jenis kelamin, serta bahwa analisis survival dapat menjadi alat statistik yang kuat dalam mendukung pengambilan keputusan berbasis data di bidang medis.

Referensi

Therneau, T. M., & Grambsch, P. M. (2000). Modeling Survival Data: Extending the Cox Model. Springer.