Survival Analysis in Industry Applications

1 Pendahuluan

1.1 Apa itu Analisis Survival?

Analisis Survival (Survival Analysis) adalah cabang statistika yang secara khusus mempelajari waktu hingga terjadinya suatu peristiwa (time-to-event data). Berbeda dengan metode statistik konvensional, analisis survival dirancang untuk menangani satu tantangan utama dalam data dunia nyata. Yaitu, censoring — kondisi di mana peristiwa yang diamati belum terjadi saat periode pengamatan berakhir.

1.1.1 Mengapa Analisis Survival Penting?

Pertimbangkan tiga skenario berikut:

Seorang pasien kanker masih hidup saat riset berakhir → kita tidak tahu kapan ia akan meninggal, tetapi tahu ia bertahan setidaknya hingga titik tersebut
Sebuah mesin masih beroperasi saat audit berakhir → kita tidak tahu kapan akan rusak
Seorang pelanggan masih berlangganan saat data diambil → kita tidak tahu kapan ia akan berhenti

Jika kita menggunakan rata-rata biasa atau regresi linear, data yang “belum selesai” ini harus dibuang atau diperlakukan secara salah — menghasilkan estimasi yang bias. Analisis survival memanfaatkan informasi parsial ini dengan benar.

1.1.2 Konsep Kunci

Konsep	Notasi	Definisi
Survival Function	S(t)	Probabilitas bertahan melewati waktu t: P(T > t)
Hazard Function	h(t)	Risiko sesaat terjadinya event pada waktu t
Censoring	+	Observasi yang belum mengalami event
Event	–	Kejadian yang diamati (relapse, failure, churn)
Median Survival	t₅₀	Waktu di mana 50% subjek telah mengalami event

1.2 Metode yang Digunakan

Dalam praktikum ini digunakan tiga metode utama yang saling melengkapi:

1.2.1 Kaplan-Meier Estimator

Metode non-parametrik untuk mengestimasi fungsi survival dari data. Kurva KM menggambarkan probabilitas bertahan dari waktu ke waktu, dan dapat dibandingkan antar kelompok secara visual.

\[\hat{S}(t) = \prod_{t_i \leq t} \left(1 - \frac{d_i}{n_i}\right)\]

di mana $d_i$ = jumlah event pada waktu $t_i$ dan $n_i$ = jumlah subjek yang berisiko.

1.2.2 Log-Rank Test

Uji hipotesis non-parametrik untuk membandingkan kurva survival dua atau lebih kelompok.

H₀: Tidak ada perbedaan survival antar kelompok
H₁: Terdapat perbedaan survival antar kelompok
Keputusan: Tolak H₀ jika p-value < 0.05

1.2.3 Cox Proportional Hazard Model

Model semi-parametrik yang memungkinkan pemodelan multivariat — menganalisis pengaruh beberapa variabel sekaligus terhadap risiko event, dengan hasil berupa Hazard Ratio (HR).

\[h(t|X) = h_0(t) \cdot e^{\beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_p X_p}\]

Interpretasi Hazard Ratio:

Nilai HR	Interpretasi
HR = 1	Tidak ada perbedaan risiko
HR > 1	Risiko lebih tinggi dibanding referensi
HR < 1	Risiko lebih rendah dibanding referensi

2 INDUSTRI 1 – HEALTHCARE

Konteks Bisnis:

Membandingkan dua jenis treatment kanker dan menentukan mana yang lebih efektif dalam menunda relapse (kekambuhan penyakit).

2.1 STEP 1 – Input Dataset

Dataset ini berisi data 20 pasien kanker yang dibagi ke dalam dua kelompok treatment:

Treatment A (10 pasien)
Treatment B (10 pasien)

Setiap pasien diobservasi selama beberapa bulan untuk melihat apakah terjadi relapse (kekambuhan).

Variabel time merepresentasikan lama waktu (dalam bulan) hingga relapse terjadi atau hingga akhir periode pengamatan (tersensor). Variabel event = 1 menandakan relapse terjadi, sedangkan event = 0 menandakan pasien belum relapse saat data diambil.

Table 1: Table 2: Dataset Healthcare (20 Pasien Kanker)
ID	Treatment	Waktu (Bulan)	Event (Relapse)	Usia	Gender
P1	A	6	1	45	F
P2	A	10	0	50	M
P3	A	4	1	39	F
P4	A	8	1	60	M
P5	A	12	0	47	F
P6	A	7	1	55	M
P7	A	9	0	52	F
P8	A	5	1	41	M
P9	A	11	0	48	F
P10	A	3	1	44	M
P11	B	8	1	46	F
P12	B	12	0	51	M
P13	B	6	1	38	F
P14	B	14	0	62	M
P15	B	9	1	49	F
P16	B	13	0	53	M
P17	B	7	1	57	F
P18	B	15	0	45	M
P19	B	10	1	43	F
P20	B	16	0	54	M
Note:
Kuning = Treatment A \| Biru = Treatment B \| Event: 1 = Relapse terjadi, 0 = Tersensor (belum relapse)

2.1.1 Eksplorasi Deskriptif

Table 3: Table 4: Ringkasan Deskriptif per Treatment
Treatment	N	Relapse	Tersensor	Relapse Rate	Min Waktu	Max Waktu	Mean Waktu	Mean Usia
A	10	6	4	60%	3	12	7.5	48.1
B	10	5	5	50%	6	16	11.0	49.8

Catatan tentang censoring:

Pasien dengan event = 0 adalah pasien yang belum mengalami relapse hingga akhir periode pengamatan. Bukan berarti mereka tidak akan relapse, kita hanya tidak memiliki informasi tersebut. Analisis survival memanfaatkan informasi parsial ini dengan cara yang benar, berbeda dengan metode rata-rata biasa yang harus membuang data ini.

2.2 STEP 2 – Survival Object

Objek survival dibentuk menggunakan pasangan data $(t_i, \delta_i)$, dimana $t_i$ adalah waktu hingga kejadian atau censoring dan $\delta_i$ adalah indikator kejadian dengan:

\[ \delta_i = \begin{cases} 1, & \text{jika event terjadi} \\ 0, & \text{jika tersensor} \end{cases} \]

Objek ini digunakan sebagai dasar untuk menghitung fungsi survival:

\[ S(t) = P(T > t) \]

yang merepresentasikan probabilitas suatu individu belum mengalami kejadian hingga waktu $t$.

## Survival Object untuk Dataset Healthcare:

##  [1]  6  10+  4   8  12+  7   9+  5  11+  3   8  12+  6  14+  9  13+  7  15+ 10 
## [20] 16+

Penjelasan:

Pada output di atas, nilai seperti 6, 4, 8 (tanpa tanda +) berarti pasien mengalami relapse pada bulan tersebut. Nilai seperti 10+, 12+ (dengan tanda +) berarti pasien belum relapse hingga bulan tersebut — data mereka tersensor. Inilah keunggulan utama analisis survival: kita tidak membuang informasi dari pasien yang belum mengalami event.

2.3 STEP 3 – Kaplan-Meier Curve

Estimasi fungsi survival dihitung menggunakan estimator Kaplan-Meier:

\[ \hat{S}(t) = \prod_{t_i \le t} \left(1 - \frac{d_i}{n_i}\right) \]

dengan:

$t_i$ adalah waktu terjadinya event
$d_i$ adalah jumlah kejadian pada waktu $t_i$
$n_i$ adalah jumlah individu yang masih berisiko sebelum waktu $t_i$

Pada penelitian ini estimasi dilakukan secara terpisah berdasarkan kelompok perlakuan (treatment), sehingga diperoleh fungsi survival untuk masing-masing kelompok.

## === Ringkasan Kaplan-Meier – Healthcare ===

## Call: survfit(formula = Surv_health ~ treatment, data = healthcare)
## 
##              n events median 0.95LCL 0.95UCL
## treatment=A 10      6    7.5       5      NA
## treatment=B 10      5   10.0       8      NA

2.3.1 Student Tasks – Healthcare (KM)

Tugas 1: Treatment mana yang menunjukkan probabilitas survival lebih tinggi?

## Median Survival Time (bulan relapse 50% pasien):

##   Treatment A: 7.5 bulan

##   Treatment B: 10 bulan

Jawaban:

Treatment B menunjukkan probabilitas survival (bebas relapse) yang lebih tinggi secara konsisten sepanjang waktu pengamatan.
Kurva biru (B) berada di atas kurva merah (A), artinya pada setiap titik waktu, lebih banyak pasien Treatment B yang masih bebas relapse dibanding Treatment A.
Median survival Treatment B adalah 10 bulan, dibanding Treatment A 7.5 bulan — menunjukkan Treatment B lebih efektif dalam menunda kekambuhan.

Tugas 2: Berapa probabilitas bebas relapse pada bulan ke-8?

Table 5: Table 6: Probabilitas Bebas Relapse pada Bulan ke-8
Treatment	S(t=8)	CI Bawah (95%)	CI Atas (95%)
treatment=A	0.4	0.187	0.855
treatment=B	0.7	0.467	1.000

Jawaban:

Pada bulan ke-8, probabilitas bebas relapse untuk Treatment A adalah 0.4 (40%), sedangkan untuk Treatment B adalah 0.7 (70%). Perbedaan ini menunjukkan bahwa Treatment B memberikan peluang bebas relapse yang lebih tinggi pada bulan ke-8.

Tugas 3: Apakah kurva menunjukkan perbedaan yang bermakna?

Jawaban:

Secara visual, kurva Treatment B berada konsisten di atas kurva Treatment A, mengindikasikan perbedaan yang nyata dari perspektif klinis. Nilai p-value yang ditampilkan pada plot memberikan penilaian statistik awal — jika p < 0.05, perbedaan tersebut signifikan secara statistik. Konfirmasi formal dilakukan melalui Log-Rank Test pada Step 4. Pada sampel kecil (n=20), p-value mungkin di atas 0.05, namun tren klinisnya tetap jelas menunjukkan superioritas Treatment B.

2.4 STEP 4 – Log-Rank Test

Uji Log-Rank digunakan untuk membandingkan kurva survival antar kelompok perlakuan. Hipotesis yang diuji adalah:

\[ H_0 : S_1(t) = S_2(t) \]

Statistik uji dihitung dengan membandingkan jumlah kejadian yang diamati (Observed) dan yang diharapkan (Expected):

\[ E_{ij} = \frac{n_{ij}}{n_i} d_i \]

Statistik uji Log-Rank mengikuti distribusi Chi-Square:

\[ \chi^2 = \sum \frac{(O_j - E_j)^2}{V_j} \]

dengan derajat kebebasan $k-1$, dimana $k$ adalah jumlah kelompok.

## Call:
## survdiff(formula = Surv_health ~ treatment, data = healthcare)
## 
##              N Observed Expected (O-E)^2/E (O-E)^2/V
## treatment=A 10        6     4.51     0.494     0.879
## treatment=B 10        5     6.49     0.343     0.879
## 
##  Chisq= 0.9  on 1 degrees of freedom, p= 0.3

## ==========================================
##   HASIL LOG-RANK TEST – HEALTHCARE
## ==========================================
##   Chi-square (χ²)   : 0.879
##   Degrees of Freedom : 1
##   P-value            : 0.3485
##   Alpha (α)          : 0.05
## ------------------------------------------
##   Keputusan: GAGAL TOLAK H₀ → Perbedaan belum signifikan secara statistik
## ==========================================

Table 7: Table 8: Observed vs Expected Events (Log-Rank Test)
Treatment	Observed (O)	Expected (E)	Rasio O/E
A	6	4.51	1.331
B	5	6.49	0.770
Note:
Rasio O/E > 1: lebih banyak event dari yang diharapkan (prognosis lebih buruk) \| O/E < 1: lebih sedikit event (prognosis lebih baik)

2.4.1 Interpretasi Log-Rank Test

Hipotesis:

H₀: Tidak ada perbedaan distribusi survival antara Treatment A dan Treatment B
H₁: Terdapat perbedaan distribusi survival antara Treatment A dan Treatment B

Interpretasi Chi-square:

Nilai χ² yang besar mengindikasikan perbedaan yang besar antara observed (event yang benar-benar terjadi) dan expected (event yang diharapkan jika H₀ benar). Semakin besar χ², semakin kuat bukti untuk menolak H₀.

Rasio O/E:

Treatment dengan O/E > 1 mengalami lebih banyak event dari yang diharapkan → prognosis lebih buruk.
Treatment dengan O/E < 1 → prognosis lebih baik.

Apakah Treatment B secara statistik lebih baik?

Belum terbukti signifikan secara statistik (p ≥ 0.05) pada sampel kecil n=20 ini. Namun tren klinis jelas menunjukkan Treatment B lebih unggul — diperlukan sampel yang lebih besar untuk konfirmasi statistik yang kuat.

2.5 STEP 5 – Cox PH Model

Model Cox Proportional Hazards digunakan untuk menganalisis pengaruh beberapa kovariat terhadap risiko terjadinya kejadian. Model Cox dinyatakan sebagai:

\[ h(t|X) = h_0(t) \exp(\beta_1 X_1 + \beta_2 X_2 + \dots + \beta_p X_p) \]

dimana $h_0(t)$ adalah baseline hazard dan $X_j$ merupakan kovariat.

Pada penelitian ini model yang digunakan adalah:

\[ h(t|X) = h_0(t) \exp(\beta_1 \, treatment + \beta_2 \, age + \beta_3 \, gender) \]

Nilai $\exp(\beta)$ merepresentasikan Hazard Ratio (HR) yang menunjukkan seberapa besar perubahan risiko kejadian akibat perubahan kovariat.

## Call:
## coxph(formula = Surv_health ~ treatment + age + gender, data = healthcare)
## 
##   n= 20, number of events= 11 
## 
##                coef exp(coef) se(coef)      z Pr(>|z|)  
## treatmentB -0.68540   0.50389  0.63846 -1.074   0.2830  
## age        -0.13534   0.87341  0.07543 -1.794   0.0728 .
## genderM     0.03021   1.03067  0.69187  0.044   0.9652  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##            exp(coef) exp(-coef) lower .95 upper .95
## treatmentB    0.5039     1.9846    0.1442     1.761
## age           0.8734     1.1449    0.7534     1.013
## genderM       1.0307     0.9702    0.2656     4.000
## 
## Concordance= 0.693  (se = 0.102 )
## Likelihood ratio test= 5.36  on 3 df,   p=0.1
## Wald test            = 4.25  on 3 df,   p=0.2
## Score (logrank) test = 4.59  on 3 df,   p=0.2

Table 9: Table 10: Hazard Ratio Cox PH Model (Healthcare)
Variabel	β	HR = exp(β)	CI 95% Bawah	CI 95% Atas	SE	Z	P-value	Signifikan
treatmentB	-0.685	0.504	0.144	1.761	0.638	-1.074	0.2830	idak
age	-0.135	0.873	0.753	1.013	0.075	-1.794	0.0728	idak
genderM	0.030	1.031	0.266	4.000	0.692	0.044	0.9652	idak
Note:
Merah = HR > 1 (risiko lebih tinggi) \| Hijau = HR < 1 (risiko lebih rendah)

2.5.1 Jawaban Student Tasks – Healthcare (Cox PH)

Tugas 1: Interpretasi Hazard Ratio untuk Treatment B

## Treatment B vs Treatment A (referensi):
##   Hazard Ratio (HR) : 0.504
##   95% CI            : [0.144, 1.761]
##   P-value           : 0.283
##   Interpretasi      : HR < 1 → Treatment B mengurangi risiko relapse sebesar 49.6% dibanding Treatment A

Jawaban:

HR untuk Treatment B = 0.504 (95% CI: [0.144, 1.761], p = 0.283). Karena HR < 1, Treatment B mengurangi risiko relapse sebesar 49.6%dibanding Treatment A, setelah dikontrol usia dan jenis kelamin.
Meskipun belum signifikan secara statistik (p ≥ 0.05) karena keterbatasan sampel, arah HR memberikan indikasi klinis yang jelas.

Tugas 2: Apakah usia meningkatkan risiko relapse?

## HR usia: 0.8734 | P-value: 0.0728

## Interpretasi: Setiap penambahan 1 tahun usia MENURUNKAN risiko relapse sebesar 12.66%

Jawaban:

HR untuk age = 0.8734 (p = 0.0728).
Dalam model ini, usia justru sedikit menurunkan risiko relapse (HR < 1) — kemungkinan karena konfounding dengan variabel lain.
Namun efek ini tidak signifikan secara statistik (p ≥ 0.05) pada sampel kecil ini.

Tugas 3: Variabel mana yang signifikan?

Table 11: Table 12: Ranking Signifikansi Variabel Cox Model (Healthcare)
Variabel	HR	P-value	Signifikan
age	0.873	0.0728	idak
treatmentB	0.504	0.2830	idak
genderM	1.031	0.9652	idak

Jawaban:

Lihat kolom Signifikan pada tabel di atas. Variabel yang memiliki p-value < 0.05 dianggap signifikan secara statistik. Pada sampel kecil (n=20), power statistik terbatas sehingga wajar jika tidak semua variabel mencapai signifikansi formal. Namun, arah HR tetap memberikan informasi klinis yang berharga — khususnya treatment dan usia yang secara konsisten menunjukkan pola yang sesuai dengan ekspektasi medis.

3 INDUSTRI 2 – MANUFACTURING

Konteks Bisnis:

Menentukan apakah mesin tipe Premium memiliki ketahanan (waktu sebelum failure/kerusakan) yang lebih panjang dibanding mesin Standard.

3.1 STEP 1 – Input Dataset

Dataset ini berisi data observasi 20 mesin industri — 10 mesin Standard dan 10 mesin Premium. Variabel time adalah jam operasi hingga mesin rusak (failure) atau tersensor, dan temp adalah suhu operasi rata-rata mesin dalam derajat Celsius.

Asumsi: semakin tinggi suhu operasi, semakin besar kemungkinan mesin mengalami overheat dan failure lebih awal. Kita akan menguji asumsi ini melalui model Cox.

Table 13: Table 14: Dataset Manufacturing (20 Mesin Industri)
ID	Tipe Mesin	Waktu Operasi (Jam)	Status Failure	Suhu (°C)
M1	Standard	200	1	75
M2	Standard	350	0	72
M3	Standard	180	1	78
M4	Standard	260	1	80
M5	Standard	300	0	74
M6	Standard	220	1	77
M7	Standard	310	0	73
M8	Standard	190	1	79
M9	Standard	280	1	76
M10	Standard	340	0	72
M11	Premium	400	0	70
M12	Premium	320	1	68
M13	Premium	410	0	69
M14	Premium	290	1	71
M15	Premium	360	0	67
M16	Premium	330	1	72
M17	Premium	420	0	66
M18	Premium	310	1	70
M19	Premium	390	0	68
M20	Premium	305	1	73
Note:
Oranye = Standard \| Hijau = Premium \| Status: 1 = Mesin Rusak (failure), 0 = Tersensor (masih beroperasi)

3.1.1 Eksplorasi Deskriptif

Table 15: Table 16: Ringkasan Deskriptif per Tipe Mesin
Tipe	N	Failure	Tersensor	Failure Rate	Min Jam	Max Jam	Mean Jam	Mean Suhu (°C)
Premium	10	5	5	50%	290	420	353.5	69.4
Standard	10	6	4	60%	180	350	263.0	75.6

Observasi awal:

Mesin Premium memiliki rata-rata jam operasi dan suhu yang berbeda dari Standard. Perlu diingat bahwa rata-rata ini belum memperhitungkan censoring — mesin yang masih beroperasi (status=0) belum diketahui kapan akan rusak. Kaplan-Meier dan Cox akan memberikan estimasi yang lebih akurat.

3.2 STEP 2 – Survival Object

## Survival Object untuk Dataset Manufacturing:

##  [1] 200  350+ 180  260  300+ 220  310+ 190  280  340+ 400+ 320  410+ 290  360+
## [16] 330  420+ 310  390+ 305

Penjelasan Censoring dalam Konteks Manufaktur:

Mesin dengan tanda + (misal 350+) adalah mesin yang masih beroperasi saat periode observasi berakhir. Ini bisa terjadi karena proyek pengamatan selesai sebelum mesin rusak, atau mesin dinonaktifkan karena alasan non-failure (upgrade, penjualan). Data ini tetap berharga — kita tahu mesin tersebut bertahan setidaknya selama X jam.

3.3 STEP 3 – Kaplan-Meier Curve

## === Ringkasan Kaplan-Meier – Manufacturing ===

## Call: survfit(formula = Surv_machine ~ type, data = manufacturing)
## 
##                n events median 0.95LCL 0.95UCL
## type=Premium  10      5    330     310      NA
## type=Standard 10      6    270     200      NA

3.3.1 Jawaban Student Tasks – Manufacturing (KM)

Tugas 1: Tipe mesin mana yang bertahan lebih lama?

## Median Survival Time (jam operasi saat 50% mesin rusak):

##   Premium : 330 jam

##   Standard: 270 jam

##   Selisih : 60 jam

Jawaban:

Mesin Premium bertahan jauh lebih lama. Median survival Premium adalah 330 jam vs Standard hanya 270 jam, selisih 60 jam operasi. Ini berarti setengah mesin Standard sudah rusak pada saat setengah mesin Premium belum menunjukkan tanda kerusakan.

Tugas 2: Probabilitas survival pada 300 jam operasi?

Table 17: Table 18: Probabilitas Bebas Failure pada 300 Jam
Tipe Mesin	S(t=300)	CI Bawah (95%)	CI Atas (95%)
type=Premium	0.9	0.732	1.000
type=Standard	0.4	0.187	0.855

Jawaban:

Pada jam operasi ke-300, probabilitas mesin Premium masih beroperasi adalah 0.9 (90%), sedangkan mesin Standard hanya 0.4 (40%). Dari 10 mesin Standard, diperkirakan hanya sekitar 4 yang masih beroperasi pada 300 jam, sementara mesin Premium jauh lebih banyak yang masih aktif.

Tugas 3: Apakah mesin Premium tampak lebih andal?

Jawaban:

Ya, mesin Premium tampak jauh lebih andal berdasarkan kurva Kaplan-Meier. Kurva hijau (Premium) berada signifikan di atas kurva oranye (Standard) di semua titik waktu. Mesin Premium memiliki median survival lebih tinggi, probabilitas bertahan pada 300 jam lebih tinggi, dan kurva yang turun lebih lambat (laju kegagalan lebih rendah). Konfirmasi statistik diperoleh melalui Log-Rank Test dan Cox Model berikut.

3.4 STEP 4 Cox – Cox Model

## Call:
## coxph(formula = Surv_machine ~ type + temp, data = manufacturing)
## 
##   n= 20, number of events= 11 
## 
##                 coef exp(coef) se(coef)      z Pr(>|z|)    
## typeStandard -1.4100    0.2441   0.9467 -1.489 0.136386    
## temp          0.5467    1.7275   0.1510  3.620 0.000294 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##              exp(coef) exp(-coef) lower .95 upper .95
## typeStandard    0.2441     4.0959   0.03818     1.561
## temp            1.7275     0.5789   1.28495     2.323
## 
## Concordance= 0.872  (se = 0.034 )
## Likelihood ratio test= 17.99  on 2 df,   p=1e-04
## Wald test            = 13.69  on 2 df,   p=0.001
## Score (logrank) test = 19.69  on 2 df,   p=5e-05

Table 19: Table 20: Hazard Ratio Cox PH Model (Manufacturing)
Variabel	β	HR = exp(β)	CI 95% Bawah	CI 95% Atas	P-value	Signifikan
typeStandard	-1.410	0.244	0.038	1.561	0.1364	Tidak
temp	0.547	1.728	1.285	2.323	0.0003	Ya

3.4.1 Jawaban Student Tasks – Manufacturing (Cox PH)

Tugas 1: Interpretasi Hazard Ratio untuk mesin Premium

## 
## 
## Premium vs Standard (dibalik dari Standard):
## HR: 4.096
## 95% CI: [0.641, 26.192]
## p: 0.1364

Jawaban:

HR untuk typeStandard = 4.096 (95% CI: [0.641, 26.192], p = 0.1364). Secara numerik, mesin Premium menunjukkan peningkatan risiko failure sebesar 309.6% dibanding Standard. Namun, karena p > 0,05 dan interval kepercayaan mencakup angka 1, maka efek tersebut tidak signifikan secara statistik setelah mengontrol suhu operasi.

Tugas 2: Apakah suhu yang lebih tinggi meningkatkan risiko failure?

## HR suhu (per 1°C naik): 1.7275 | P-value: 3e-04

## Interpretasi: Setiap kenaikan 1°C suhu operasi MENINGKATKAN risiko failure sebesar 72.75%

Jawaban:

HR untuk temp = 1.7275 per 1°C kenaikan suhu (p = 3^{-4}). - HR > 1 — setiap kenaikan 1°C suhu operasi meningkatkan risiko failure sebesar 72.75%. Ini konsisten dengan logika teknis: suhu lebih tinggi mempercepat degradasi komponen mesin.

Efek suhu signifikan secara statistik.

Tugas 3: Implikasi manajerial

Implikasi Manajerial:

Investasi mesin Premium: Layak dipertimbangkan. HR yang lebih rendah berarti lebih sedikit downtime, lebih jarang perbaikan darurat, dan efisiensi biaya operasional jangka panjang yang lebih baik
Jadwal Predictive Maintenance: Dapat dioptimalkan berdasarkan kurva survival, misalnya lakukan inspeksi intensif mendekati median survival time masing-masing tipe mesin
Monitoring suhu real-time: Sebagai early warning indicator failure. Pasang sensor suhu dan trigger alarm jika melebihi threshold tertentu
Kalkulasi ROI: Bandingkan selisih harga Premium vs Standard dengan penghematan dari berkurangnya downtime dan biaya perbaikan berdasarkan perbedaan hazard rate

4 INDUSTRI 3 – CUSTOMER ANALYTICS

Konteks Bisnis:

Mengevaluasi perbedaan retensi pelanggan antara paket Basic dan Pro, serta mengidentifikasi faktor-faktor yang mempengaruhi keputusan churn.

4.1 STEP 1 – Input Dataset

Dataset ini berisi data 20 pelanggan layanan berlangganan dengan dua jenis paket:

Basic (10 pelanggan, biaya $20/bulan) dan Pro (10 pelanggan, biaya $35/bulan).
Variabel tenure adalah lama berlangganan (bulan) hingga churn atau tersensor.
Variabel support_calls mencatat berapa kali pelanggan menghubungi layanan pelanggan selama masa berlangganan — proxy untuk tingkat kepuasan atau masalah yang dihadapi.

Table 21: Table 22: Dataset Customer Analytics (20 Pelanggan)
ID	Plan	Tenure (Bln)	Churn	Fee ($/bln)	Support Calls
C1	Basic	3	1	20	5
C2	Basic	8	0	20	2
C3	Basic	5	1	20	4
C4	Basic	6	1	20	3
C5	Basic	9	0	20	1
C6	Basic	4	1	20	6
C7	Basic	7	1	20	3
C8	Basic	10	0	20	2
C9	Basic	2	1	20	7
C10	Basic	11	0	20	1
C11	Pro	10	0	35	1
C12	Pro	6	1	35	2
C13	Pro	12	0	35	0
C14	Pro	8	1	35	2
C15	Pro	14	0	35	1
C16	Pro	7	1	35	3
C17	Pro	15	0	35	0
C18	Pro	9	1	35	2
C19	Pro	13	0	35	1
C20	Pro	16	0	35	0
Note:
Pink = Basic \| Ungu = Pro \| Churn: 1 = Berhenti berlangganan, 0 = Masih aktif (tersensor)

4.1.1 Eksplorasi Deskriptif

Table 23: Table 24: Ringkasan Deskriptif per Plan
Plan	N	Churn	Aktif	Churn Rate	Min Tenure	Max Tenure	Mean Tenure	Mean Calls	Fee
Basic	10	6	4	60%	2	11	6.5	3.4	$20/bln
Pro	10	4	6	40%	6	16	11.0	1.2	$35/bln

Observasi awal:

Pelanggan Basic menunjukkan churn rate yang lebih tinggi dan tenure rata-rata yang lebih pendek, serta jumlah support calls yang lebih banyak. Analisis survival akan mengkonfirmasi dan mengkuantifikasi perbedaan ini secara statistik sambil memperhitungkan pelanggan yang masih aktif (tersensor).

4.2 STEP 2 – Survival Object

## Survival Object untuk Dataset Customer Analytics:

##  [1]  3   8+  5   6   9+  4   7  10+  2  11+ 10+  6  12+  8  14+  7  15+  9  13+
## [20] 16+

Penjelasan Censoring dalam Konteks Customer Analytics:

Pelanggan dengan tanda + (misal 8+, 10+) adalah pelanggan yang masih aktif berlangganan saat data diambil. Jika kita mengabaikan mereka dan hanya menganalisis pelanggan yang sudah churn, kita akan sangat overestimate churn rate dan underestimate customer lifetime value bisnis.

4.3 STEP 3 – Kaplan-Meier Curve

## === Ringkasan Kaplan-Meier – Customer Analytics ===

## Call: survfit(formula = Surv_customer ~ plan, data = customer)
## 
##             n events median 0.95LCL 0.95UCL
## plan=Basic 10      6    6.5       4      NA
## plan=Pro   10      4     NA       8      NA

4.3.1 Jawaban Student Tasks – Customer Analytics (KM)

Tugas 1: Plan mana yang menunjukkan retensi lebih baik?

## Median Tenure (bulan hingga 50% pelanggan churn):

##   Basic: 6.5 bulan

##   Pro  : NA bulan

Jawaban:

Plan Pro menunjukkan retensi yang lebih baik. Kurva ungu (Pro) berada di atas kurva pink (Basic) sepanjang waktu pengamatan. Median tenure Pro adalah NA bulan vs Basic hanya 6.5 bulan — perbedaan signifikan yang berdampak langsung pada customer lifetime value dan pendapatan bisnis.

Tugas 2: Probabilitas bertahan ≥ 6 bulan?

Table 25: Table 26: Probabilitas Tidak Churn hingga Bulan ke-6
Plan	S(t=6)	CI Bawah (95%)	CI Atas (95%)
plan=Basic	0.5	0.269	0.929
plan=Pro	0.9	0.732	1.000

Jawaban:

Probabilitas pelanggan Basic bertahan ≥ 6 bulan adalah 0.5 (50%), sedangkan pelanggan Pro adalah 0.9 (90%). Perbedaan ini menunjukkan pelanggan Pro jauh lebih mungkin untuk tetap berlangganan melewati bulan ke-6 — titik kritis retensi dalam banyak bisnis berlangganan.

Tugas 3: Apakah perbedaan signifikan secara statistik?

## Call:
## survdiff(formula = Surv_customer ~ plan, data = customer)
## 
##             N Observed Expected (O-E)^2/E (O-E)^2/V
## plan=Basic 10        6     3.93     1.094      1.88
## plan=Pro   10        4     6.07     0.707      1.88
## 
##  Chisq= 1.9  on 1 degrees of freedom, p= 0.2

## 
## ==========================================
##   HASIL LOG-RANK TEST – CUSTOMER
## ==========================================
##   Chi-square (χ²)    : 1.882
##   P-value            : 0.1701
##   Keputusan: GAGAL TOLAK H₀ → Perbedaan belum signifikan secara statistik
## ==========================================

Jawaban:

Log-Rank Test menghasilkan χ² = 1.882, p = 0.1701. Perbedaan belum mencapai signifikansi statistik (p ≥ 0.05) pada sampel kecil n=20. Namun tren yang konsisten pada kurva KM menunjukkan Pro jauh lebih baik — perlu sampel lebih besar untuk konfirmasi.

4.4 STEP 4 – Cox Model

## Call:
## coxph(formula = Surv_customer ~ plan + support_calls + fee, data = customer)
## 
##   n= 20, number of events= 10 
## 
##                  coef exp(coef) se(coef)     z Pr(>|z|)   
## planPro        0.6690    1.9523   0.8219 0.814  0.41564   
## support_calls  2.3029   10.0031   0.7092 3.247  0.00116 **
## fee                NA        NA   0.0000    NA       NA   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##               exp(coef) exp(-coef) lower .95 upper .95
## planPro           1.952    0.51222    0.3899     9.775
## support_calls    10.003    0.09997    2.4917    40.158
## fee                  NA         NA        NA        NA
## 
## Concordance= 0.958  (se = 0.023 )
## Likelihood ratio test= 32.54  on 2 df,   p=9e-08
## Wald test            = 10.63  on 2 df,   p=0.005
## Score (logrank) test = 33.94  on 2 df,   p=4e-08

Table 27: Table 28: Hazard Ratio Cox PH Model (Customer Analytics)
Variabel	β	HR = exp(β)	CI 95% Bawah	CI 95% Atas	P-value	Signifikan
planPro	0.669	1.952	0.390	9.775	0.4156	Tidak
support_calls	2.303	10.003	2.492	40.158	0.0012	Ya
fee	NA	NA	NA	NA	NA	NA

4.4.1 Jawaban Student Tasks – Customer Analytics (Cox PH)

Tugas 1: Interpretasi Hazard Ratio untuk Pro Plan

## Pro vs Basic (referensi):
##   HR    : 1.952
##   95% CI: [0.39, 9.775]
##   p     : 0.4156
##   Interpretasi: HR > 1 → Pro meningkatkan risiko churn sebesar 95.2% dibanding Basic

Jawaban:

HR untuk planPro = 1.952 (95% CI: [0.39, 9.775], p = 0.4156). Karena HR > 1, pelanggan Pro memiliki risiko churn 95% lebih tinggi dibanding pelanggan Basic, setelah dikontrol support calls dan fee. Efek belum signifikan secara statistik pada sampel kecil ini (p ≥ 0.05), namun arahnya konsisten dengan temuan KM.

Tugas 2: Apakah support calls meningkatkan risiko churn?

## HR support_calls: 10.003 | P-value: 0.0012

## Interpretasi: Setiap tambahan 1 support call MENINGKATKAN risiko churn sebesar 900.3%

Jawaban:

HR untuk support_calls = 10.003 per tambahan satu panggilan (p = 0.0012).
HR > 1 — setiap tambahan satu panggilan ke customer support meningkatkan risiko churn sebesar 900.3%. Ini adalah sinyal penting: pelanggan yang sering mengeluh kemungkinan besar mengalami masalah berulang dan rentan untuk berhenti berlangganan.
Efek ini signifikan secara statistik.

Tugas 3: Strategi retensi apa yang dapat disimpulkan?

Strategi Retensi berdasarkan Model:

Upgrade Campaign Basic → Pro: Karena Pro memiliki HR churn lebih rendah, program insentif upgrade (diskon bulan pertama, trial Pro gratis) dapat meningkatkan retensi pelanggan Basic yang menunjukkan gejala churn
Early Warning System berbasis Support Calls: Pelanggan yang melakukan ≥ 3 support calls dalam 3 bulan pertama harus segera didekati secara proaktif (proactive outreach) sebelum mereka memutuskan untuk churn
Fokus pada 3–6 bulan pertama: Kurva KM menunjukkan penurunan survival paling tajam terjadi di bulan-bulan awal — program onboarding yang lebih intensif di fase ini sangat krusial untuk membangun loyalitas jangka panjang4. Segmentasi Program Retensi: Pelanggan Basic dan Pro memiliki profil risiko churn berbeda dan membutuhkan strategi retensi yang berbeda pula — jangan gunakan pendekatan one-size-fits-all

5 CRITICAL ANALYSIS (REQUIRED)

5.1 Industri 1 – Healthcare

1. Apa yang dimaksud censoring dalam konteks ini?

Dalam studi relapse kanker, censoring terjadi ketika pasien belum mengalami relapse saat periode studi berakhir. Dalam dataset ini, pasien dengan event = 0, seperti P2 (10 bulan+), P5 (12 bulan+), P7 (9 bulan+) adalah pasien yang masih bebas relapse saat pengamatan dihentikan. Ini bisa terjadi karena studi klinis berakhir, pasien meninggal akibat sebab lain (competing event), atau pasien berhenti mengikuti studi (lost to follow-up). Censoring bukan data buruk — kita tahu pasien ini bebas relapse setidaknya selama periode tersebut, informasi berharga yang harus dimanfaatkan.

2. Mengapa rata-rata waktu tidak cukup?

Jika kita menghitung rata-rata waktu relapse secara sederhana, kita harus membuang data tersensor (50% data dibuang!) atau memperlakukannya seolah relapse terjadi di waktu terakhir — keduanya menghasilkan estimasi yang bias. Selain itu, rata-rata sangat sensitif terhadap outlier: satu pasien yang sangat lama bebas relapse akan mendistorsi rata-rata secara dramatis. Median survival dari Kaplan-Meier jauh lebih robust dan bermakna secara klinis: “50% pasien akan relapse sebelum bulan X” — pernyataan yang dapat langsung diterjemahkan ke keputusan klinis.

3. Keputusan strategis apa yang dapat dibuat manajemen?

Jika Treatment B terbukti superior, rumah sakit dapat menjadikannya standard of care. Profil HR dari model Cox memungkinkan alokasi sumber daya yang lebih tepat — pasien dengan risiko tinggi (usia, kondisi klinis) diprioritaskan untuk intervensi lebih intensif. Hasil ini juga menjadi dasar power calculation untuk studi konfirmasi dengan sampel yang lebih besar dan metodologi yang lebih kuat.

4. Apa yang terjadi jika menggunakan regresi linear?

Regresi linear tidak dapat menangani censoring — data tersensor harus dibuang atau diisi paksa, menghasilkan estimasi yang bias. Asumsi normalitas dilanggar karena waktu survival selalu positif dan biasanya right-skewed. Model bisa menghasilkan prediksi negatif yang tidak masuk akal secara medis. Tidak ada cara untuk mengestimasi S(t) atau h(t) yang dibutuhkan untuk keputusan klinis dan perencanaan follow-up.

5.2 Industri 2 – Manufacturing

1. Apa yang dimaksud censoring dalam konteks ini?

Dalam konteks mesin industri, censoring terjadi ketika mesin masih beroperasi dengan baik saat periode observasi berakhir. Mesin M2 (350+), M5 (300+), M7 (310+) tersensor karena proyek pengamatan selesai sebelum mesin rusak, atau mesin dinonaktifkan bukan karena failure (upgrade, dijual, perubahan lini produksi). Kita tahu mesin-mesin ini tahan setidaknya selama jam tersebut — informasi sangat berharga untuk pemodelan reliabilitas dan perencanaan maintenance.

2. Mengapa rata-rata waktu tidak cukup?

Rata-rata jam operasi yang dihitung sederhana akan underestimate durasi ketahanan mesin Premium karena mesin yang masih berjalan tidak diperhitungkan dengan benar. Lebih krusial lagi, rata-rata tidak menggambarkan distribusi dan pola failure. Kita tidak tahu apakah failure lebih sering di awal (infant mortality), stabil (random failure), atau meningkat seiring waktu (wear-out). Informasi ini kritis untuk menentukan strategi maintenance yang tepat. Kurva hazard dari survival analysis menjawab pertanyaan ini secara langsung.

3. Keputusan strategis apa yang dapat dibuat manajemen?

Gunakan percentile ke-10 survival (waktu di mana 10% mesin pertama rusak) sebagai trigger inspeksi mandatori, bukan jadwal tetap yang arbitrary. Lakukan kalkulasi TCO (Total Cost of Ownership) Premium vs Standard dengan memperhitungkan biaya downtime dan perbaikan berdasarkan perbedaan hazard rate. Data survival juga menjadi bukti objektif yang kuat dalam negosiasi garansi dan SLA dengan pemasok mesin.

4. Apa yang terjadi jika menggunakan regresi linear?

Mesin yang masih beroperasi (tersensor) harus dibuang dari analisis. Kehilangan data justru dari mesin-mesin paling tahan lama, membuat estimasi MTTF (Mean Time to Failure) bias ke bawah secara dramatis. Tidak dapat menghasilkan reliability curve yang dibutuhkan untuk maintenance planning. Heteroskedastisitas parah karena waktu failure sangat bervariasi antar mesin. Pilihan yang lebih tepat adalah model survival parametrik (Weibull, Exponential) yang dirancang khusus untuk reliability engineering.

5.3 Industri 3 – Customer Analytics

1. Apa yang dimaksud censoring dalam konteks ini?

Pelanggan dengan churn = 0 — seperti C2 (8+), C5 (9+), C8 (10+) adalah pelanggan yang masih aktif berlangganan saat data dikumpulkan. Mereka tersensor karena snapshot data diambil pada tanggal tertentu sementara sebagian pelanggan belum churn, atau mereka berhenti karena alasan yang tidak terkait layanan (competing event). Jika kita hanya menganalisis pelanggan yang sudah churn, kita akan sangat overestimate churn rate dan underestimate customer lifetime value — kesalahan serius dalam perencanaan bisnis.

2. Mengapa rata-rata waktu tidak cukup?

Rata-rata tenure yang dihitung dari pelanggan yang sudah churn saja sangat bias karena pelanggan loyal yang masih aktif tidak dihitung. Distribusi tenure biasanya bimodal: ada yang sangat cepat churn (bulan 1-3) dan sangat loyal (12+ bulan), rata-rata tidak menggambarkan dua kelompok ini dengan baik. Yang lebih penting, rata-rata tidak memberikan probabilitas churn pada titik waktu spesifik — padahal pertanyaan bisnis sesungguhnya adalah “berapa persen pelanggan saya yang akan churn sebelum bulan ke-6?”, bukan sekadar “berapa rata-rata lama berlangganan?”

3. Keputusan strategis apa yang dapat dibuat manajemen?

Segmentasikan pelanggan berdasarkan profil risiko churn dari model Cox — pelanggan Basic dengan banyak support calls adalah prioritas intervensi tertinggi. Rancang program proactive outreach yang dipicu oleh ambang support calls tertentu, bukan menunggu sinyal churn eksplisit. Tawarkan insentif upgrade Basic → Pro di bulan ke-3 hingga ke-5 (sebelum inflection point churn tertinggi pada kurva KM). Alokasikan tim Customer Success secara proporsional sesuai profil risiko, bukan merata ke semua pelanggan.

4. Apa yang terjadi jika menggunakan regresi linear?

Regresi linear memprediksi nilai kontinu yang bisa negatif. Tenure tidak bisa < 0. Seluruh pelanggan yang masih aktif harus dibuang, kehilangan 40% informasi. Regresi logistik (churn = ya/tidak) lebih baik dari linear, tetapi tetap tidak menangkap dimensi waktu — tidak bisa menjawab “kapan”, hanya “apakah”. Analisis survival adalah satu-satunya pendekatan yang secara simultan menjawab: “Berapa probabilitas pelanggan ini masih berlangganan pada bulan ke-6, ke-12, atau ke-24?” — informasi yang jauh lebih actionable untuk strategi retensi berbasis waktu.

6 Ringkasan Akhir

Table 29: Table 30: Tabel Ringkasan – Analisis Survival Tiga Industri
Industri	Event	Kelompok Perbandingan	Makna Censoring	Temuan Utama KM	Temuan Utama Cox
Healthcare	Relapse kanker	Treatment A vs B	Pasien masih bebas relapse	Treatment B: survival lebih tinggi, median relapse lebih lama	Treatment B: HR < 1 (risiko relapse lebih rendah)
Manufacturing	Kerusakan mesin	Standard vs Premium	Mesin masih beroperasi	Mesin Premium: median failure jauh lebih tinggi, S(t=300) lebih baik	Premium: HR < 1 (risiko failure lebih rendah); suhu berpengaruh
Customer Analytics	Churn pelanggan	Basic vs Pro	Pelanggan masih aktif	Plan Pro: retensi lebih kuat, median tenure lebih panjang	Pro: HR < 1; support_calls: HR > 1 (risiko churn lebih tinggi)

Table 31: Table 32: Perbandingan Metode Statistik untuk Data Time-to-Event
Aspek	Kaplan-Meier	Log-Rank Test	Cox PH Model	Regresi Linear
Tujuan	Estimasi kurva survival	Uji perbedaan antar grup	Pemodelan multivariat	Prediksi nilai kontinu
Tangani Censoring	Ya	Ya	Ya	Tidak
Output Utama	S(t), Median Survival	χ², p-value	Hazard Ratio (HR)	Koefisien β
Kontrol Kovariat	Tidak	Tidak	Ya	Ya
Kesesuaian	Visualisasi & deskripsi grup	Hipotesis 2 atau lebih grup	Analisis faktor risiko berganda	TIDAK cocok untuk data survival

Survival Analysis in Industry Applications

Practical Module – Introduction to Survival Model

1 Pendahuluan

1.1 Apa itu Analisis Survival?

1.1.1 Mengapa Analisis Survival Penting?

1.1.2 Konsep Kunci

1.2 Metode yang Digunakan

1.2.1 Kaplan-Meier Estimator

1.2.2 Log-Rank Test

1.2.3 Cox Proportional Hazard Model

2 INDUSTRI 1 – HEALTHCARE

2.1 STEP 1 – Input Dataset

2.1.1 Eksplorasi Deskriptif

2.2 STEP 2 – Survival Object

2.3 STEP 3 – Kaplan-Meier Curve

2.3.1 Student Tasks – Healthcare (KM)

2.4 STEP 4 – Log-Rank Test

2.4.1 Interpretasi Log-Rank Test

2.5 STEP 5 – Cox PH Model

2.5.1 Jawaban Student Tasks – Healthcare (Cox PH)

3 INDUSTRI 2 – MANUFACTURING

3.1 STEP 1 – Input Dataset

3.1.1 Eksplorasi Deskriptif

3.2 STEP 2 – Survival Object

3.3 STEP 3 – Kaplan-Meier Curve

3.3.1 Jawaban Student Tasks – Manufacturing (KM)

3.4 STEP 4 Cox – Cox Model

3.4.1 Jawaban Student Tasks – Manufacturing (Cox PH)

4 INDUSTRI 3 – CUSTOMER ANALYTICS

4.1 STEP 1 – Input Dataset

4.1.1 Eksplorasi Deskriptif

4.2 STEP 2 – Survival Object

4.3 STEP 3 – Kaplan-Meier Curve

4.3.1 Jawaban Student Tasks – Customer Analytics (KM)

4.4 STEP 4 – Cox Model

4.4.1 Jawaban Student Tasks – Customer Analytics (Cox PH)

5 CRITICAL ANALYSIS (REQUIRED)

5.1 Industri 1 – Healthcare

5.2 Industri 2 – Manufacturing

5.3 Industri 3 – Customer Analytics

6 Ringkasan Akhir