Email:
RPubs: https://rpubs.com/widyaoen/


1 Analisis Survival adalah ?

Analisis Kelangsungan hidup sesuai dengan serangkaian pendekatan statistik yang digunakan untuk menyelidiki waktu yang diperlukan untuk hal yang terjadi. Juga disebut Data Peristiwa yang terdiri dari waktu mulai sampai dengan waktu akhir yang berbeda.

Analisis kelangsungan hidup digunakan dalam berbagai bidang seperti:

  • Analisis Waktu bertahan hidup untuk studi pasien kanker.

  • Analisis Sejarah peristiwa untuk sosiologi

  • Analisis kegagalan Dalam Teknik

Dalam Studi kanker, tipe pertanyaan penelitian seperti :

Apa Karakteristik dampak tertentu pada kelangsungan hidup pasien yang kemungkinan bertahan selama 3 tahun ? Apakah ada perbedaan dalam kelangsungan hidup antara kelompok pasien?

1.1 Contoh dari Bidang Lain

Waktu untuk data peristiwa pada umumnya terjadi di banyak bidang, tetapi tidak terbatas pada

  • Waktu dari infeksi HIV untuk pengembangan AIDS

  • Waktu saat serangan jantung

  • Waktu Saat timbulnya penyalahgunaan zat

  • Waktu Saat memulai aktivitas seksual

  • Waktu untuk kerusakan mesin

1.2 kata lain untuk analisis survival

Karena analisis kelangsungan hidup adalah umum digunakan di banyak bidang lain dengan nama lain :

  • Analisis keandalan

  • Analisis durasi

  • Analisis riwayat peristiwa

  • Analisis waktu ke acara

  • Model Bertahan Hidup

1.3 Tujuan Analisis Kelangsungan Hidup

Tujuan dari bab ini adalah untuk menggambarkan konsep dasar analisis kelangsungan hidup. Dalam studi kanker, sebagian besar analisis kelangsungan hidup menggunakan metode berikut:

  • Kaplan-Meier merencanakan untuk memvisualisasikan kurva kelangsungan hidup

  • Tes peringkat log untuk membandingkan kurva bertahan hidup dari dua kelompok atau lebih

  • Cox proporsional bahaya regresi untuk menggambarkan efek variabel pada kelangsungan hidup. Model Cox dibahas di bab berikutnya: Model bahaya proporsional Cox.

Di sini, kita akan mulai dengan menjelaskan konsep penting analisis kelangsungan hidup, termasuk:

  • Cara menghasilkan dan menafsirkan kurva kelangsungan hidup, dan

  • Cara mengukur dan menguji perbedaan kelangsungan hidup antara dua atau lebih kelompok pasien.

Kemudian, kita akan melanjutkan dengan menggambarkan analisis multivariat menggunakan model bahaya proporsional Cox.

2 Komponen dari Analisis Kelangsungan hidup

untuk subjek \(i\) :

  1. Waktu Peristiwa \(T_i\)

  2. Waktu Pensesoran \(C_i\)

  3. Indikator Peristiwa \(δ_i\) :

  • 1 jika peristiwa yang diamati \((i.e. T_i≤C_i)\)

  • 0 Jika sensor \((i.e. T_i>C_i)\)

  1. Waktu Observasi \(Y_i=min(T_i,C_i)\)

Waktu Observasi dan indikator peristiwa diberikan oleh data \(lung\)

  • Waktu : Waktu kelangsungan hidup dalam hari \((Y_i)\)

  • Status : status sensoring 1 = sensoring, 2 = meninggal \((δ_i)\)

Dataset \(lung\) tersedia dari package \(survival\) dalam \(R\). Data tersebut mengandung subjek dengan kanker paru-paru stadium lanjut dari North Central Cancer Treatment Group. Beberapa variabel yang akan kami gunakan untuk menunjukkan metode ini termasuk :

  • Wakt : Waktu kelangsungan hidup dalam hari

  • Status : status sensoring 1 = sensoring, 2 = meninggal

  • Jenis Kelamin : Pria = 1, wanita = 2

library(survival)
head(lung)
##   inst time status age sex ph.ecog ph.karno pat.karno meal.cal wt.loss
## 1    3  306      2  74   1       1       90       100     1175      NA
## 2    3  455      2  68   1       0       90        90     1225      15
## 3    3 1010      1  56   1       0       90        90       NA      15
## 4    5  210      2  57   1       1       90        60     1150      11
## 5    1  883      2  60   1       0      100        90       NA       0
## 6   12 1022      1  74   1       1       50        80      513       0

3 Sensoring adalah?

library(OpenImageR)
img1=readImage("gambar1.png")
imageShow(img1)

3.1 Tipe dari Sensoring

Subjek dapat disensor karena:

  • Kerugian untuk ditindaklanjuti

  • Penarikan dari studi

  • Tidak ada acara pada akhir periode studi tetap

Secara khusus ini adalah contoh pensesoran kanan.

Penyensoran kiri dan sensor interval juga mungkin terjadi, dan metode yang ada untuk menganalisis jenis data ini, tetapi pelatihan ini akan terbatas pada sensor kanan.

3.2 Data Kelangsungan Hidup yang Disensor

library(OpenImageR)
img2=readImage("gambar2.png")
imageShow(img2)

Dalam contoh ini, bagaimana kita menghitung proporsi siapa yang bebas acara pada 10 tahun?

Subyek 6 dan 7 bebas acara pada usia 10 tahun. Subyek 2, 9, dan 10 memiliki acara sebelum 10 tahun. Subjek 1, 3, 4, 5, dan 8 disensor sebelum 10 tahun, jadi kita tidak tahu apakah mereka memiliki acara atau tidak oleh 10 tahun - bagaimana kita memasukkan subjek ini ke dalam perkiraan kita?

3.3 Distribusi Tindak Lanjut

  • Subjek yang disensor masih memberikan informasi sehingga harus dimasukkan dengan tepat dalam analisis

  • Distribusi waktu tindak lanjut miring, dan mungkin berbeda antara pasien yang disensor dan mereka yang memiliki peristiwa

  • Waktu tindak lanjut selalu positif

library(OpenImageR)
img3=readImage("gambar3.png")
imageShow(img3)

4 Berurusan dengan Tanggal di R

Data akan sering datang dengan tanggal mulai dan berakhir daripada waktu bertahan hidup yang telah dihitung sebelumnya. Langkah pertama adalah memastikan ini diformat sebagai tanggal dalam R.

Mari membuat contoh kecil dari dataset dengan variabel \(sx_date\) untuk tanggal operasi dan \(last_fup_date\) untuk tanggal tindak lanjut terakhir.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v purrr   0.3.4
## v tibble  3.0.6     v stringr 1.4.0
## v tidyr   1.0.3     v forcats 0.5.0
## v readr   1.3.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(rlang)
## 
## Attaching package: 'rlang'
## The following objects are masked from 'package:purrr':
## 
##     %@%, as_function, flatten, flatten_chr, flatten_dbl, flatten_int,
##     flatten_lgl, flatten_raw, invoke, list_along, modify, prepend,
##     splice
library(tibble)
date_ex <- tibble(
    sx_date = c("2007-06-22", "2004-02-13", "2010-10-27"), 
    last_fup_date = c("2017-04-15", "2018-07-04", "2016-10-31")
    )

date_ex
## # A tibble: 3 x 2
##   sx_date    last_fup_date
##   <chr>      <chr>        
## 1 2007-06-22 2017-04-15   
## 2 2004-02-13 2018-07-04   
## 3 2010-10-27 2016-10-31

Kami melihat ini adalah kedua karakter variabel yang sering terjadi, tetapi kami membutuhkannya untuk diformat sebagai tanggal. Cara lain untuk memformat tanggal menggunakan R:

date_ex %>% 
  mutate(
    sx_date = as.Date(sx_date, format = "%Y-%m-%d"), 
    last_fup_date = as.Date(last_fup_date, format = "%Y-%m-%d") 
    )
## # A tibble: 3 x 2
##   sx_date    last_fup_date
##   <date>     <date>       
## 1 2007-06-22 2017-04-15   
## 2 2004-02-13 2018-07-04   
## 3 2010-10-27 2016-10-31
  • Perhatikan bahwa dalam basis format harus menyertakan pemisah serta simbol. misalnya jika tanggal Anda dalam format m/d/Y maka Anda akan membutuhkan format = \("%m/%d/%Y"\)
  • Lihat daftar lengkap simbol format tanggal di https://www.statmethods.net/input/dates.html

Kita juga dapat menggunakan paket \(lubridate\) untuk memformat tanggal. Dalam hal ini, gunakan fungsi \(ymd\)

library (lubridate)
## 
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
date_ex %>% 
  mutate(
    sx_date = ymd(sx_date), 
    last_fup_date = ymd(last_fup_date)
    )
## # A tibble: 3 x 2
##   sx_date    last_fup_date
##   <date>     <date>       
## 1 2007-06-22 2017-04-15   
## 2 2004-02-13 2018-07-04   
## 3 2010-10-27 2016-10-31
  • Perhatikan bahwa tidak seperti opsi dasar R, pemisah tidak perlu ditentukan

  • Halaman bantuan untuk ?dmy akan menampilkan semua opsi format.

4.1 Menghitung Waktu Kelangsungan Hidup

Sekarang tanggal yang diformat, kita perlu menghitung perbedaan antara waktu mulai dan berakhir di beberapa unit, biasanya bulan atau tahun. Di basis \(R\), gunakan \(difftime\) untuk menghitung jumlah hari di antara dua tanggal dan mengonversinya menjadi nilai numerik menggunakan \(as.numerik\). Kemudian konversi ke tahun dengan membagi sebesar 365,25, jumlah rata-rata hari dalam setahun.

date_ex %>% 
  mutate(
    os_yrs = 
      as.numeric(
        difftime(last_fup_date, 
                 sx_date, 
                 units = "days")) / 365.25
    )
## # A tibble: 3 x 3
##   sx_date    last_fup_date os_yrs
##   <chr>      <chr>          <dbl>
## 1 2007-06-22 2017-04-15      9.82
## 2 2004-02-13 2018-07-04     14.4 
## 3 2010-10-27 2016-10-31      6.01

Dengan menggunakan paket \(lubridate\), operator \(%--%\) menunjuk interval waktu, yang kemudian dikonversi ke jumlah detik yang berlalu menggunakan \(as.duration\) dan akhirnya dikonversi ke tahun dengan membagi dengan \(dyears(1)\), yang memberikan jumlah detik dalam setahun.

date_ex %>% 
  mutate(
    os_yrs = 
      as.duration(sx_date %--% last_fup_date) / dyears(1)
    )
## # A tibble: 3 x 3
##   sx_date    last_fup_date os_yrs
##   <chr>      <chr>          <dbl>
## 1 2007-06-22 2017-04-15      9.82
## 2 2004-02-13 2018-07-04     14.4 
## 3 2010-10-27 2016-10-31      6.01

Catatan: kita perlu memuat paket \(lubridate\) menggunakan panggilan ke perpustakaan agar dapat mengakses operator khusus (mirip dengan situasi dengan pipa)

4.2 Indikator Peristiwa

Untuk komponen data kelangsungan hidup saya menyebutkan indikator peristiwa: Indikator Peristiwa \(δi\):

  • 1 Jika observasi peristiwa \((i.e. T_i≤C_i)\)

  • 0 Jika sensoring \((i.e. T_i>C_i)\)

Bagaimana pun, dalam R fungsi \(Surv\) akan menerima TRUE/FALSE (TRUE = peristiwa) atau 1/2 (2 = peristiwa).

dalam data \(lung\), kami memiliki:

  • Status: status sensoring 1=sensoring, 2=meninggal

4.3 Fungsi kelangsungan hidup

Peluang bahwa subjek akan bertahan di luar waktu yang ditentukan

\[S(t)=Pr(T>t)=1−F(t)\]

\(S(t)\) : fungsi kelangsungan hidup \(F(t)=Pr(T≤t)\): fungsi kumulatif distribusi

Secara teori fungsi kelangsungan hidup lancar; dalam praktiknya kami mengamati peristiwa dalam skala waktu diskrit.

4.4 Peluang Kelangsungan hidup

  • Probabilitas kelangsungan hidup pada waktu tertentu, \(S(t)\), adalah probabilitas bersyarat untuk bertahan hidup di luar waktu itu, mengingat bahwa seseorang telah bertahan tepat sebelum waktu itu.

  • Dapat diperkirakan sebagai jumlah pasien yang masih hidup tanpa kehilangan untuk ditindaklanjuti pada saat itu, dibagi dengan jumlah pasien yang masih hidup tepat sebelum waktu itu

  • Perkiraan Kaplan-Meier tentang probabilitas kelangsungan hidup adalah produk dari probabilitas bersyarat ini hingga waktu tersebut

  • Pada waktu 0, peluang kelangsungan hidup adalah 1, \(i.e. S(t_0)=1\)

4.5 Membuat objek kelangsungan hidup

Metode Kaplan-Meier adalah cara paling umum untuk memperkirakan waktu dan probabilitas kelangsungan hidup. Ini adalah pendekatan non-parametrik yang menghasilkan fungsi langkah, di mana ada langkah mundur setiap kali peristiwa terjadi.

  • Fungsi \(Surv\) dari paket \(survival\) menciptakan objek bertahan hidup untuk digunakan sebagai respons dalam rumus model. Akan ada satu entri untuk setiap subjek yang merupakan waktu bertahan hidup, yang diikuti oleh \(+\) jika subjek disensor. Mari kita lihat 10 pengamatan pertama:
library(survival)
Surv(lung$time, lung$status)[1:10]
##  [1]  306   455  1010+  210   883  1022+  310   361   218   166

4.6 Memperkirakan Kurva Kelangsungan Hidup

  • Fungsi \(survfit\) membuat kurva survival pada rumus, Mari kita hasilkan kurva kelangsungan hidup keseluruhan untuk seluruh kohort, tetapkan ke objek \(f1\), dan lihat \(names\) objek itu:
f1 <- survfit(Surv(time, status) ~ 1, data = lung)
names(f1)
##  [1] "n"         "time"      "n.risk"    "n.event"   "n.censor"  "surv"     
##  [7] "std.err"   "cumhaz"    "std.chaz"  "type"      "logse"     "conf.int" 
## [13] "conf.type" "lower"     "upper"     "call"

Beberapa komponen utama objek \(survfit\) ini yang akan digunakan untuk membuat kurva bertahan hidup meliputi:

  • \(time\), yang berisi titik awal dan titik akhir dari setiap interval waktu

  • \(surv\), yang berisi probabilitas kelangsungan hidup yang sesuai dengan masing-masing \(time\)

4.7 Plot Kelangsungan Hidup Kaplan-Meier

Sekarang kita plot objek \(survfit\) di \(R\) dasar untuk mendapatkan plot Kaplan-Meier.

plot(survfit(Surv(time, status) ~ 1, data = lung), 
     xlab = "Days", 
     ylab = "Overall survival probability")

- Plot default di basis R memperlihatkan fungsi langkah (garis solid) dengan interval kepercayaan terkait (garis putus-putus)

  • Garis horizontal mewakili durasi bertahan hidup selama interval

  • Interval diakhiri oleh suatu kejadian

  • Tinggi garis vertikal memperlihatkan perubahan probabilitas kumulatif

  • Pengamatan yang disensor, ditunjukkan oleh tanda centang, mengurangi kelangsungan hidup kumulatif di antara interval. (Perhatikan tanda centang untuk pasien yang disensor tidak ditampilkan secara default, tetapi dapat ditambahkan menggunakan opsi mark.time = TRUE)

Atau, fungsi \(ggsurvplot\) dari paket \(survminer\) dibangun di atas \(ggplot2\), dan dapat digunakan untuk membuat plot Kaplan-Meier. Lihat lembar cheet untuk paket $survminer $.

library(survminer)
## Loading required package: ggpubr
ggsurvplot(
    fit = survfit(Surv(time, status) ~ 1, data = lung), 
    xlab = "Days", 
    ylab = "Overall survival probability")

- Plot default menggunakan \(ggsurvplot\) menunjukkan fungsi langkah (garis solid) dengan pita kepercayaan terkait (area berbayang).

  • Tanda centang untuk pasien yang disensor ditunjukkan secara default, agak mengaburkan garis itu sendiri dalam contoh ini, dan dapat ditekan menggunakan opsi \(censor= FALSE\)

4.8 Estimasi tahun kelangsungan hidup \(x\)

Satu kuantitas yang menarik dalam analisis kelangsungan hidup adalah kemungkinan bertahan hidup di luar angka tertentu \((x)\) tahun.

sebagai contoh untuk mengestimasi kelangsungan hidup pada tahun ke 1 menggunakan \(summary\) dengan argument \(times\) (Perhatikan variabel waktu dalam data \(lung\) sebenarnya dalam beberapa hari, jadi kita perlu menggunakan \(times = 365.25\))

summary(survfit(Surv(time, status) ~ 1, data = lung), times = 365.25)
## Call: survfit(formula = Surv(time, status) ~ 1, data = lung)
## 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##   365     65     121    0.409  0.0358        0.345        0.486

Kami menemukan bahwa probabilitas 1 tahun untuk bertahan hidup dalam penelitian ini adalah 41%.

Batas bawah dan atas terkait dari interval kepercayaan 95% juga ditampilkan.

4.9 x-tahun Probabilitas Kelangsungan Hidup

Probabilitas kelangsungan hidup 1 tahun adalah titik pada sumbu y yang sesuai dengan 1 tahun pada sumbu x untuk kurva bertahan hidup.

library(OpenImageR)
img4=readImage("gambar4.png")
imageShow(img4)

Apa yang terjadi jika kamu menggunakan estimasi “Naive”?

121 dari 228 pasien meninggal 1 tahun jadi: \((1-\frac{121}{228})x100=47%\)

  • Anda mendapatkan perkiraan yang salah tentang probabilitas 1 tahun untuk bertahan hidup ketika Anda mengabaikan fakta bahwa 42 pasien disensor sebelum 1 tahun.

  • Ingat perkiraan yang benar dari probabilitas 1 tahun kelangsungan hidup adalah 41%.

5 Periksa Mengabaikan Penyensoran

  • Bayangkan dua studi, masing-masing dengan 228 mata pelajaran. Ada 165 kematian dalam setiap penelitian. Tidak ada sensor dalam satu (garis oranye), 63 pasien disensor di yang lain (garis biru)

  • Mengabaikan penyensoran menyebabkan overestimate dari probabilitas kelangsungan hidup secara keseluruhan, karena subjek yang disensor hanya menyumbangkan informasi untuk bagian dari waktu tindak lanjut, dan kemudian jatuh dari risiko yang ditetapkan, sehingga menarik probabilitas kumulatif untuk bertahan hidup

library(OpenImageR)
img5=readImage("gambar5.png")
imageShow(img5)

6 Memperkirakan Median Kelangsungan Hidup

Kuantitas lain yang sering menarik dalam analisis kelangsungan hidup adalah waktu bertahan hidup rata-rata, yang kami kuantifikasi menggunakan median. Waktu bertahan hidup tidak diharapkan untuk didistribusikan secara normal sehingga rata-rata bukan ringkasan yang tepat.

Kita bisa mendapatkan ini langsung dari objek \(survfit\)

survfit(Surv(time, status) ~ 1, data = lung)
## Call: survfit(formula = Surv(time, status) ~ 1, data = lung)
## 
##       n  events  median 0.95LCL 0.95UCL 
##     228     165     310     285     363

6.1 Waktu dan peluang

median Kelangsungan hidup adalah waktu yang sesuai dengan probabilitas kelangsungan hidup 0,5:

library(OpenImageR)
img6=readImage("gambar6.png")
imageShow(img6)

6.2 Dampak Mengabaikan Penyensoran

Apa yang terjadi jika Anda menggunakan perkiraan “naif”? Meringkas waktu kelangsungan hidup median di antara 165 pasien yang meninggal

lung %>% 
  filter(status == 2) %>% 
  summarize(median_surv = median(time))
##   median_surv
## 1         226
  • Anda mendapatkan perkiraan waktu kelangsungan hidup median yang salah selama 226 hari ketika Anda mengabaikan fakta bahwa pasien yang disensor juga berkontribusi waktu tindak lanjut.

  • Ingat perkiraan waktu kelangsungan hidup median yang benar adalah 310 hari.

  • Mengabaikan penyensoran menciptakan kurva kelangsungan hidup yang diturunkan secara artifisal karena waktu tindak lanjut yang disensor pasien berkontribusi dikecualikan (garis ungu)

  • kurva kelangsungan hidup untuk data \(lung\) ditunjukkan dalam warna biru untuk perbandingan

library(OpenImageR)
img7=readImage("gambar7.png")
imageShow(img7)

7 Membandingkan Waktu Bertahan Hidup

  • Kami dapat melakukan uji signifikansi antarkelompok menggunakan uji peringkat log

  • Tes peringkat log sama-sama mengtimbang pengamatan selama seluruh waktu tindak lanjut dan merupakan cara paling umum untuk membandingkan waktu bertahan hidup antar kelompok

  • Ada versi yang lebih berat tindak lanjut awal atau terlambat yang bisa lebih tepat tergantung pada pertanyaan penelitian (melihat? \(survdiff\) untuk opsi pengujian yang berbeda)

Kami mendapatkan nilai p peringkat log menggunakan fungsi \(survdiff\) . Misalnya, kita dapat menguji apakah ada perbedaan waktu kelangsungan hidup menurut jenis kelamin di data \(lung\)

survdiff(Surv(time, status) ~ sex, data = lung)
## Call:
## survdiff(formula = Surv(time, status) ~ sex, data = lung)
## 
##         N Observed Expected (O-E)^2/E (O-E)^2/V
## sex=1 138      112     91.6      4.55      10.3
## sex=2  90       53     73.4      5.68      10.3
## 
##  Chisq= 10.3  on 1 degrees of freedom, p= 0.001

8 Mengekstrak informasi

Ini sebenarnya agak rumit untuk mengekstrak nilai p dari hasil \(survdiff\). Berikut adalah baris kode untuk melakukannya

sd <- survdiff(Surv(time, status) ~ sex, data = lung)
1 - pchisq(sd$chisq, length(sd$n) - 1)
## [1] 0.001311165

terdapat fungsi \(sdp\) dalam paket \(ezfun\) , yang mana kamu dapat menginstall menggunakan devtools::install_github(“zabore/ezfun”). Mengembalikan pemformatan \(p-value\)

ezfun::sdp(sd)
## [1] 0.001

9 Model Regresi Cox

Kami mungkin ingin mengukur ukuran efek untuk satu variabel, atau menyertakan lebih dari satu variabel ke dalam model regresi untuk memperhitungkan efek dari beberapa variabel.

Model regresi Cox adalah model semi-parametrik yang dapat digunakan untuk menyesuaikan model regresi yang tidak dapat divariasi dan multivariasi yang memiliki hasil bertahan hidup. \[h(t|X_i)=h_0(t)exp(β_1X_{i1}+⋯+β_{p}X_{ip})\]

\(h(t)\): bahaya, atau laju seketika di mana peristiwa terjadi

\(h_0(t)\): bahaya dasar yang mendasari

Beberapa asumsi utama model:

  • penyensoran non-informatif

  • bahaya proporsional

Catatan: model regresi parametrik untuk hasil bertahan hidup juga tersedia, tetapi tidak akan dibahas dalam pelatihan ini

Kita dapat menyesuaikan model regresi untuk data kelangsungan hidup menggunakan fungsi \(coxph\) yang mengambil objek \(surv\) di sisi kiri dan memiliki sintaks standar untuk rumus regresi dalam \(R\) di sisi kanan.

coxph(Surv(time, status) ~ sex, data = lung)
## Call:
## coxph(formula = Surv(time, status) ~ sex, data = lung)
## 
##        coef exp(coef) se(coef)      z       p
## sex -0.5310    0.5880   0.1672 -3.176 0.00149
## 
## Likelihood ratio test=10.63  on 1 df, p=0.001111
## n= 228, number of events= 165

10 Pemformatan Regresi Cox

Kita dapat melihat versi rapi dari output menggunakan fungsi \(tidy\) dari paket \(broom\)

library(kableExtra)
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
broom::tidy(
  coxph(Surv(time, status) ~ sex, data = lung), 
  exp = TRUE
  ) %>% 
  kable()
term estimate std.error statistic p.value
sex 0.5880028 0.1671786 -3.176385 0.0014912
#coxph(Surv(time, status) ~ sex, data = lung) %>% 
 # gtsummary::tbl_regression(exp = TRUE) 

11 Rasio Bahaya

  • Kuantitas minat dari model regresi Cox adalah rasio bahaya (HR). HR mewakili rasio bahaya antara dua kelompok pada titik waktu tertentu.

  • HR ditafsirkan sebagai tingkat seketika terjadinya peristiwa minat pada mereka yang masih berisiko terhadap peristiwa tersebut. Ini bukan risiko, meskipun umumnya ditafsirkan seperti itu.

  • Jika Anda memiliki parameter regresi \(β\) (dari kolom \(estimate\) di \(coxph\)) maka \(HR = exp(β)\).

  • Sebuah indikator HR < 1 menunjukkan pengurangan bahaya kematian sedangkan HR > 1 menunjukkan peningkatan bahaya kematian.

  • Jadi HR = 0,59 menyiratkan bahwa sekitar 0,6 kali lebih banyak perempuan yang meninggal daripada laki-laki, pada waktu tertentu.

library(OpenImageR)
img8=readImage("gambar8.png")
imageShow(img8)