Survival Model

Tugas 1

Kontak : \(\downarrow\)
Email
GitHub https://github.com/putriangelinaw/
RPubs https://rpubs.com/putriangelinaw/

Introduction for Survival Analysis

What is Survival Analysis

Survival Analysis adalah kumpulan prosedur statistik untuk analisis data di mana variabel outcome yang diinginkan adalah time sampai event terjadi.

Yang dimaksud dengan waktu (time) adalah tahun, bulan, minggu, atau hari dari awal tindak lanjut seseorang hingga suatu peristiwa terjadi; alternatifnya, waktu dapat merujuk pada usia individu ketika suatu peristiwa terjadi.

Yang dimaksud dengan peristiwa (event) adalah kematian, kejadian penyakit, kekambuhan dari remisi, pemulihan (misalnya, kembali bekerja), atau pengalaman menarik yang mungkin terjadi pada seseorang.

Meskipun lebih dari satu peristiwa dapat dipertimbangkan dalam analisis yang sama, kita akan mengasumsikan bahwa hanya satu peristiwa yang menjadi perhatian khusus. Ketika lebih dari satu peristiwa dipertimbangkan (misalnya, kematian dari salah satu dari beberapa penyebab), masalah statistik dapat dicirikan sebagai peristiwa berulang atau competing risk (masalah risiko yang bersaing).

Dalam survival analysis, kita biasanya mengacu pada variabel waktu sebagai survival time, karena memberikan mereka waktu bahwa seorang individu telah “bertahan” selama beberapa periode tindak lanjut. Kami juga biasanya menyebut peristiwa itu sebagai failure, karena peristiwa yang menarik biasanya adalah kematian, kejadian penyakit, atau pengalaman negatif individu lainnya. Namun, survival time bisa saja “waktu untuk kembali bekerja setelah prosedur bedah elektif”, dalam hal ini failure adalah peristiwa positif.

Survival Analysis Problem in Health

  1. Pasien leukemia dalam remisi selama beberapa minggu untuk melihat berapa lama mereka tinggal dalam remisi.

Pada contoh kasus pertama mengenai pasien leukimia, peristiwa (kegagalan) yang dimaskud adalah “selesai/keluar dari remisi”, dan outcomenya adalah “waktu selama beberapa minggu sampai pasien keluar dari remisi”.

  1. Kohort individu bebas penyakit selama beberapa tahun untuk melihat siapa yang mengembangkan penyakit jantung.

Pada contoh kasus kedua, peristiwa yang dimaksud adalah “siapa yang mengembangkan penyakit jantung” dan outcomenya adalah “waktu selama beberapa tahun sampai seseorang mengembangkan penyakit jantung”.

  1. Populasi lansia (60 tahun keatas) untuk melihat berapa lama mereka tetap hidup.

Pada contoh kasus ketiga, peristiwa yang dimaksud adalah “kematian” dan outcomenya adalah “waktu selama beberapa tahun hingga kematian”.

  1. Lama pasien bertahan hidup setelah menerima transplantasi jantung selama beberapa bulan.

Pada contoh kasus keempat, peristiwa yang dimaksud adalah “kematian” dan outcomenya adalah “waktu hingga kematian (selama beberapa bulan sejak transplantasi jantung berlangsung)”.

Survival Analysis Problem in Business

  1. Business Planning : Membuat profil pelanggan yang memiliki tingkat kelangsungan hidup lebih tinggi dan membuat strategi yang sesuai.

  2. Lifetime Value Prediction : Terlibat dengan pelanggan sesuai dengan nilai seumur hidup mereka.

  3. Active customers : Memprediksi kapan pelanggan akan aktif untuk waktu berikutnya dan mengambil intervensi yang sesuai.

  4. Campaign evaluation : Pantau pengaruh kampanye terhadap tingkat kelangsungan hidup pelanggan.

Berikut ini adalah beberapa aplikasi spesifik industri dari analisis kelangsungan hidup:

• Banking – customer lifetime and LTV

• Insurance – time to lapsing on policy

• Mortgages – time to mortgage redemption

• Mail Order Catalog – time to next purchase

• Retail – time till food customer starts purchasing non-food

• Manufacturing – lifetime of a machine component

• Public Sector – time intervals to critical events

Some Articles

Factors Affecting Distant Disease-Free Survival for Primary Invasive Breast Cancer: Use of a Log-Normal Survival Model

Background

Kanker payudara invasif adalah penyakit yang sering didiagnosis yang kini hadir dengan pilihan manajemen terapeutik yang terus berkembang. Kami menilai efek dari 20 faktor prognostik dalam konteks multivariat.

Methods

Kami mengumpulkan data klinis untuk 156 pasien berturut-turut dengan kanker payudara invasif primer stadium 1-3 yang didiagnosis pada 1989-1990 di Henrietta Banting Breast Center dan diikuti hingga 1995. Ada tindak lanjut lengkap untuk 91% pasien (median follow-up sampai 4,9 tahun). Peristiwa yang menarik adalah kekambuhan jauh (untuk kelangsungan hidup bebas penyakit yang jauh, DFS). Kami menggunakan regresi bertahap Cox dan log-normal untuk menilai efek multivariat dari faktor-faktor berikut pada DFS: usia, ukuran tumor, status nodal, histologi, tingkat tumor dan inti, invasi limfovaskular dan perineural (LVPI), karsinoma duktal-in tipe -situ (DCIS), DCIS sejauh, DCIS di tepi tumor, ER dan PgR, ERICA, terapi sistemik adjuvant, ki67, S-phase, indeks DNA, neu onkogen, dan pRb.

Results

Ada bukti kuat yang menentang asumsi Cox tentang proporsional hazard untuk status nodal, dan status nodal tidak ada dalam model langkah-bijaksana Cox. Dengan regresi log-normal bertahap, ukuran tumor besar (P <0,001), nodus positif (P 5,002), tingkat inti tinggi (P 5,01), adanya LVPI (P 5,03), dan karsinoma duktus infiltrasi yang tidak ditentukan (P 5,05) dikaitkan dengan penurunan DFS.

Conclusions

Untuk status nodal, terdapat bukti kuat yang menentang asumsi Cox tentang proporsional hazard, dan tidak termasuk dalam model Cox meskipun dalam model log-normal. Hanya faktor tradisional yang dimasukkan dalam model langkah-bijaksana. Dengan demikian, manajemen statistik penanda prognostik pada kanker payudara tampaknya sangat penting.

Threshold Regression for Survival Analysis: Modeling Event Times by a Stochastic Process Reaching a Boundary

Banyak peneliti telah menyelidiki first-hit time sebagai model untuk data survival. Waktu pukulan pertama muncul secara alami dalam banyak jenis proses stokastik, mulai dari proses Wiener hingga rantai Markov. Dalam konteks kelangsungan hidup, keadaan proses yang mendasari mewakili kekuatan item atau kesehatan individu. Item gagal atau individu mengalami titik akhir klinis ketika proses mencapai keadaan ambang yang merugikan untuk pertama kalinya. Skala waktu dapat berupa waktu kalender atau ukuran operasional lainnya dari degradasi atau perkembangan penyakit. Dalam banyak aplikasi, prosesnya laten (yaitu, tidak dapat diamati). Regresi ambang mengacu pada model pertama kali dengan struktur regresi yang mengakomodasi data kovariat. Parameter proses, status ambang, dan skala waktu mungkin bergantung pada kovariat.

Survival Model for Foot and Leg High Rate Axial Impact Injury Data

Objectives

Memahami perbedaan cedera ekstremitas bawah akibat intrusi otomotif dan underbody blast (UBB) merupakan kunci penting saat menentukan apakah kriteria cedera otomotif dapat diterapkan pada skenario laju ledakan. Artikel ini memberikan tinjauan analisis risiko cedera yang ada dan menguraikan pendekatan untuk meningkatkan prediksi cedera untuk rentang tingkat pemuatan yang diperluas. Analisis ini akan membahas masalah dengan fungsi risiko cedera yang ada termasuk ketidakakuratan karena inersia dan potensi resistensi kental pada tingkat pemuatan yang lebih tinggi.

Methods

Survival analysis ini mencoba untuk meminimalkan kesalahan ini dengan mempertimbangkan statistik lokasi cedera dan proses pemilihan variabel prediktor yang bergantung pada mekanisme kegagalan tulang. Distribusi cedera kaki/pergelangan kaki/kaki yang disebabkan oleh pembebanan dampak aksial pada tingkat karakteristik UBB serta intrusi otomotif dipelajari dan cedera kalkaneus ditemukan sebagai cedera yang paling umum; dengan demikian, gaya footplate dipilih sebagai variabel prediktor utama karena kedekatannya dengan lokasi cedera untuk mencegah ketidakakuratan yang terkait dengan perbedaan inersia karena laju pembebanan. Survival analysis kemudian dilakukan dengan usia, jenis kelamin, sudut dorsofleksi, dan massa sebagai kovariat. Analisis statistik ini menggunakan data dari tes kaki komponen axial postmortem human surrogate (PMHS) sebelumnya untuk memberikan perspektif tentang bagaimana kondisi batas proksimal dan tingkat pembebanan mempengaruhi kemungkinan cedera pada kaki/pergelangan kaki/kaki (n = 82).

Results

Tibia force-at-fracture terbukti hingga 20% tidak akurat dalam analisis sebelumnya karena resistensi kental dan efek inersia dalam kumpulan data yang digunakan, menunjukkan bahwa kriteria cedera sebelumnya hanya akurat untuk tingkat pembebanan dan kondisi batas tertentu. Model statistik yang disajikan dalam artikel ini memprediksi 50% kemungkinan cedera untuk kekuatan plantar 10,2 kN untuk pria persentil ke-50 dengan posisi pergelangan kaki netral. Tingkat gaya ditemukan menjadi kovariat yang tidak signifikan karena kisaran terbatas perbedaan kecepatan pemuatan dalam kumpulan data; namun, kompensasi untuk efek inersia disebabkan oleh pengukuran gaya pada fraktur di lokasi yang lebih dekat dengan lokasi cedera yang diharapkan meningkatkan kemampuan prediksi model untuk seluruh kumpulan data.

Conlusions

Studi ini memberikan kemampuan prediksi cedera yang lebih baik untuk tingkat otomotif dan ledakan karena sensitivitas yang berkurang terhadap efek inersia dan pembagian beban tibia-fibula. Selanjutnya, kerangka kerja disediakan untuk pembuatan kriteria cedera di masa depan untuk skenario pemuatan tingkat tinggi. Analisis ini juga menyarankan perbaikan utama yang harus dilakukan pada anthropomorphic test device (ATD) ekstremitas bawah yang ada untuk memberikan prediksi cedera yang akurat untuk aplikasi tingkat tinggi seperti UBB.

Survival Analysis vs TimeSeries Analysis

Analisis time series diperlukan karena dapat menyajikan nilai berupa angka permintaan produk dalam kurun waktu sebelumnya. Kemudian data diolah menggunakan metode time series dan menghasilkan gambaran berupa permintaan produk untuk satu tahun kedepan. Sedangkan analisis survival diperlukan untuk memerkirakan probabilitas survival time, menyimpulkan status kesehatan penduduk, dan membandingkan “survival time” antar kelompok. Survival analysis memerhatikan jangka waktu dari awal pengamatan suatu peristiwa terjadi dengan melihat variabel-variabel yang memengaruhi peristiwa tersebut.

Reference

McCready, D.R., Chapman, JA.W., Hanna, W.M. et al. Factors Affecting Distant Disease-Free Survival for Primary Invasive Breast Cancer: Use of a Log-Normal Survival Model. Ann Surg Oncol 7, 416–426 (2000). https://doi.org/10.1007/s10434-000-0416-z

Kleinbaum, D.G., Klein, M. (2012). Survival Analysis: A Self-Learning Text (3rd ed.). Springer.

Mei-Ling Ting Lee. G. A. Whitmore. “Threshold Regression for Survival Analysis: Modeling Event Times by a Stochastic Process Reaching a Boundary.” Statist. Sci. 21 (4) 501 - 513, November 2006. https://doi.org/10.1214/088342306000000330

Bailey, A. M., McMurry, T. L., Poplin, G. S., Salzar, R. S., & Crandall, J. R. (2015). Survival model for foot and leg high rate axial impact injury data. Traffic injury prevention, 16(sup2), S96-S102. https://doi.org/10.1080/15389588.2015.1061185