Survival Models

Home Work - Week 1

Email           :
RPubs          : https://rpubs.com/invokerarts/
Github         : https://github.com/invokerarts
Majors         : Business Statistics
Address      : ARA Center, Matana University Tower Jl. CBD Barat Kav, RT.1, Curug Sangereng,
                        Kelapa Dua, Tangerang, Banten 15810.



1 Coba cari artikel mengenai penerapan survival model dalam dunia kesehatan dan bisnis!

1.1 Kesehatan

Sumber :Journal Eksakta

Dalam artikel di atas dapat saya simpulkan bahwa:

  • Kasus pasien diare dapat dianalisis menggunakan analisis survival
  • Analisis survival adalah teknik statistik yang digunakan untuk menganalisis data yang bertujuan untuk mengetahui hasil dari variabel yang mempengaruhi suatu awal kejadian sampai akhir kejadian. Untuk kejadian awal kasus kesehatan awal pasien terjangkit penyakit dan untuk kejadian akhir contohnya kematian pasien dan kesembuhan pasien.
  • Hasil penelitian di atas diharapkan dapat membantu pihak rumah sakit untuk mengetahui peluang serta perbandingan survival pasien Diare sehingga tenaga medis yang menangani pasien Diare dapat mengevaluasi hal-hal yang perlu ditingkatkan.

1.2 Bisnis

Sumber :blog.getcensus.com

Dalam artikel di atas dapat saya simpulkan bahwa:

  • Dalam hal bisnis, analisis survival dapat dilakukan untuk :
    • Tingkat kelangsungan hidup pengguna aktif.
      Analisis kelangsungan hidup dapat membantu Anda memprediksi atau mengidentifikasi pelanggan yang tingkat kelangsungan hidupnya (berapa lama mereka akan menjadi pengguna aktif, bukan masalah hidup dan mati️) rendah atau menurun.
    • Waktu produk untuk membeli.
      Menggunakan analisis kelangsungan hidup juga dapat membantu kita memprediksi dan menilai persentase pelanggan yang akan tetap berlangganan layanan tertentu dari waktu ke waktu.
    • Evaluasi efektivitas campaign.
      Selain itu, analisis survival juga dapat membantu untuk memantau efektivitas campaign tertentu pada tingkat kelangsungan hidup sehingga Anda bisa mendapatkan gambaran lengkap tentang nilai seumur hidup pelanggan (LTV/Customer Lifetime Value).
    • Estimasi keluar karyawan.
      Dengan menghitung tingkat kelangsungan hidup untuk setiap karyawan, kita dapat memperkiraan berapa lama rata-rata karyawan tetap dalam perusahaan kita dan dapat dijaga untuk mencegah pengunduran diri(resign) karyawn dari waktu ke waktu.
    • Pengukuran siklus hidup mesin.
      Perusahaan dapat menerapkan analisis kelangsungan hidup untuk memprediksi kapan bagian tertentu dari proses atau jalur perakitan akan gagal dan perlu diperbaiki.

1.3 Matematika Dasar Dalam Survival Analysis

1.3.1 Survival time

Survival time, atau biasa dinotasikan dengan T, mewakili waktu sampai suatu peristiwa terjadi. Misalnya, ini dapat merujuk pada waktu hingga pelanggan melakukan churn, waktu hingga pelanggan melakukan konversi, atau waktu hingga mesin rusak.

Fungsi kepadatan peluangnya (pdf) adalah \(f(t)\) dan fungsi distribusi kumulatif (cdf) didapat dari

\[F(t) = \text{Pr} \left[ T < t \right] = \int_{-\infty}^{t} f(u) du\]

1.3.2 Survival function

Survival function, dilambangkan sebagai S(t), mewakili probabilitas bahwa peristiwa yang diinginkan tidak terjadi selama beberapa t waktu.

\[ S(t) = 1 - F(t) = \text{Pr} \left[ T \geq t\right]\]

1.3.3 Hazard function

Survival function, dilambangkan sebagai h(t), menyatakan probabilitas bersyarat bahwa peristiwa akan terjadi dalam \([t,t+dt)\), dengan keadaan belum pernah terjadi sebelumnya.

\[h(t) = \lim_{dt \to 0} \frac{\text{Pr} \left[ t \leq T < t + dt\ | T \geq t\right ] }{dt} = \frac{f(t)}{S(t)} = -\frac{d}{dt}\log S(t)\]

Dengan demikian, fungsi hazard dan Survival dihubungkan dengan rumus berikut:

\[S(t) = \exp\left(- \int_{0}^{t} h(u) du \right)\]

Dimana, \(H(t) = \int_{0}^{t} h(u) du\) adalah fungsi hazard kumulatif (cumulative hazard function)

1.4 Metode

1.4.1 Kaplan-Meier

  • Metode Kaplan–Meier adalah modifikasi dari fungsi tahan hidup yang digunakan untuk menangani masalah data tak lengkap (Lawless, 2003)
  • Metode Kaplan-Meier dapat digunakan untuk menangani data tersensor dengan perhitungan yang relatif sederhana, serta dapat digunakan pada data sampel kecil.
  • Jika tidak observasi tersensor maka fungsi tahan hidupnya adalah :

\[S(t)=\frac{banyaknya~objek~yang~masih~hidup \geq t}{n},t\geq0\]

1.4.2 Uji Log Rank

  • Uji Log-Rank ialah uji yang sering digunakan dalam melihat ketahanan hidup dalam suatu kelompok
  • Hipotesis untuk mengetahui perbedaan peluang kumulatif tahan hidup pada pasien anak yang berjenis kelamin laki-laki yaitu \(S_1(t)\) dan perempuan \(S_2(t)\) yaitu sebagai berikut

\[H_0:S_1(t) = S_2(t)\] \[H_1:S_1(t) \neq S_2(t)\]

  • Ekspektasi dan varians banyaknya objek yang mengalami peristiwa dirumuskan sebagai berikut :

\[E(d_{jA})=\frac{n_{jA}n_j}{n_j}\]

  • Statistik uji untuk kesamaan rata-rata kejadian dalam dua kelompok ialah sebagai berikut:

\[\chi^2=\frac{(\sum d_{jA}-\sum E(d_{jS}))^2}{\sum E(d_{jA})}+\frac{(\sum d_{jB}-\sum E(d_{jB}))^2}{\sum E(d_{jB})}\]

dengan kriteria keputusan adalah \(H_0\) ditolak jika \(\chi^2_{hitung} > \chi^2_{\alpha(db)}\)

2 Apa perbedaan model time series dan survival model!

  • Time Series digunakan untuk memprediksi value pada masa depan dari data-data masa lampau sampai sekarang, sedangkan
  • Survival model digunakan untuk memperkirakan waktu yang dibutuhkan untuk suatu kejadian terjadi.