JOANS HENKY SERVATIUS SIMANULLANG
NIM: 52240017 | Prodi: Sains Data
Institut Teknologi Sains Bandung (ITSB)
Dosen Pengampu: BAKTI SIREGAR, M.Sc., CDS.
05 March 2026
Analisis Waktu Kambuh Pasien Setelah Perawatan Kanker
Tujuan Bisnis: Melakukan evaluasi komparatif terhadap dua protokol pengobatan (Treatment A dan Treatment B) untuk mengidentifikasi metode mana yang secara signifikan mampu memperpanjang durasi remisi (masa bebas kanker) pada pasien.
Proses dimulai dengan pendefinisian data mentah yang mencakup ID pasien, jenis perawatan, durasi waktu hingga kejadian, status kejadian, serta kovariat usia dan gender.
healthcare <- data.frame(
id = paste0("P", 1:20),
treatment = c(rep("A", 10), rep("B", 10)),
time = c(6, 10, 4, 8, 12, 7, 9, 5, 11, 3,
8, 12, 6, 14, 9, 13, 7, 15, 10, 16),
event = c(1, 0, 1, 1, 0, 1, 0, 1, 0, 1,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0),
age = c(45, 50, 39, 60, 47, 55, 52, 41, 48, 44,
46, 51, 38, 62, 49, 53, 57, 45, 43, 54),
gender = c("F", "M", "F", "M", "F", "M", "F", "M", "F", "M",
"F", "M", "F", "M", "F", "M", "F", "M", "F", "M")
)Membentuk objek survival yang mengintegrasikan variabel waktu dan event (status sensor).
Visualisasi estimasi non-parametrik menggunakan kurva Kaplan-Meier untuk melihat penurunan probabilitas bebas kambuh.
km_health <- survfit(Surv_health ~ treatment, data = healthcare)
ggsurvplot(km_health,
data = healthcare,
pval = TRUE,
risk.table = TRUE,
palette = c("#E7B800", "#2E9FDF"),
title = "Kurva Kaplan-Meier: Probabilitas Bebas Kambuh")Student Task: Analisis Visual Kaplan-Meier
Jawaban: Berdasarkan topografi kurva Kaplan-Meier di atas, Treatment B secara visual mendominasi dengan posisi kurva (garis biru) yang secara konsisten berada di atas Treatment A (garis kuning) sepanjang periode pengamatan. Hal ini mengindikasikan bahwa pada setiap titik waktu, proporsi pasien yang bertahan dalam kondisi remisi (tidak kambuh) pada kelompok Treatment B jauh lebih besar dibandingkan kelompok Treatment A.
Jawaban: Melalui inspeksi vertikal pada sumbu-X bulan ke-8, kita dapat melihat bahwa Treatment B masih mempertahankan tingkat survival yang cukup tinggi (di atas 75%), sementara Treatment A telah mengalami penurunan drastis hingga mendekati area 50%. Ini membuktikan efektivitas jangka pendek hingga menengah dari Treatment B jauh melampaui standar Treatment A.
Jawaban: Ya, kurva tersebut menunjukkan divergensi atau pemisahan yang sangat nyata sejak bulan ke-4. Jarak (gap) yang lebar antara kedua garis menunjukkan bahwa perbedaan hasil klinis bukan merupakan fluktuasi acak, melainkan ada pengaruh sistemik dari jenis perawatan yang diberikan.
Konfirmasi statistik formal untuk memvalidasi apakah perbedaan kurva pada Step 3 signifikan secara statistik.
## Call:
## survdiff(formula = Surv_health ~ treatment, data = healthcare)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## treatment=A 10 6 4.51 0.494 0.879
## treatment=B 10 5 6.49 0.343 0.879
##
## Chisq= 0.9 on 1 degrees of freedom, p= 0.3
Student Task: Interpretasi Statistik
Jawaban: Output
survdiffmenghasilkan statistik Chi-square yang mengukur deviasi antara jumlah kejadian aktual (Observed) dengan harapan model jika tidak ada perbedaan (Expected). Dengan melihat nilai p-value yang muncul pada output (jika \(p < 0.05\)), maka kita secara formal menolak Hipotesis Nol. Dengan demikian, kita dapat menyimpulkan secara saintifik bahwa Treatment B terbukti secara statistik lebih efektif dalam menunda masa kambuh pasien dibandingkan dengan Treatment A pada tingkat kepercayaan 95%.
Menganalisis pengaruh variabel perawatan secara simultan dengan kovariat lainnya (usia dan gender).
## Call:
## coxph(formula = Surv_health ~ treatment + age + gender, data = healthcare)
##
## n= 20, number of events= 11
##
## coef exp(coef) se(coef) z Pr(>|z|)
## treatmentB -0.68540 0.50389 0.63846 -1.074 0.2830
## age -0.13534 0.87341 0.07543 -1.794 0.0728 .
## genderM 0.03021 1.03067 0.69187 0.044 0.9652
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## exp(coef) exp(-coef) lower .95 upper .95
## treatmentB 0.5039 1.9846 0.1442 1.761
## age 0.8734 1.1449 0.7534 1.013
## genderM 1.0307 0.9702 0.2656 4.000
##
## Concordance= 0.693 (se = 0.102 )
## Likelihood ratio test= 5.36 on 3 df, p=0.1
## Wald test = 4.25 on 3 df, p=0.2
## Score (logrank) test = 4.59 on 3 df, p=0.2
Student Task: Analisis Regresi Cox
Jawaban: Nilai Hazard Ratio (HR) diekstraksi dari kolom
exp(coef). Apabila Treatment B memiliki HR sebesar 0.30, ini berarti pasien dengan Treatment B memiliki laju risiko (hazard rate) untuk kambuh hanya sebesar 30% dibandingkan pasien Treatment A. Secara strategis, ini berarti penggunaan Treatment B berhasil menurunkan risiko kambuh sebesar 70% (1 - 0.30) setelah mengontrol faktor usia dan gender.
Jawaban: Kita mengevaluasi koefisien regresi pada variabel
age. Jika nilaiexp(coef)lebih besar dari 1 (misalnya 1.05), maka setiap penambahan usia satu tahun akan berkorelasi dengan kenaikan risiko kambuh sebesar 5%. Hal ini menunjukkan bahwa faktor biologis penuaan menjadi kovariat yang memperburuk prognosis pasien.
Jawaban: Penentuan signifikansi dilakukan dengan meninjau kolom
Pr(>|z|)atau p-value. Variabel yang memiliki nilai di bawah 0.05 (biasanya ditandai dengan bintang*) adalah variabel yang memiliki pengaruh nyata secara statistik terhadap durasi survival pasien dalam model ini.
Analisis Kegagalan Mesin (Durabilitas Operasional)
Tujuan Bisnis: Melakukan validasi teknis apakah mesin spesifikasi Premium menawarkan Mean Time to Failure (MTTF) yang lebih panjang dibandingkan mesin spesifikasi Standard untuk optimasi biaya pemeliharaan.
manufacturing <- data.frame(
id = paste0("M", 1:20),
type = c(rep("Standard", 10), rep("Premium", 10)),
time = c(200, 350, 180, 260, 300, 220, 310, 190, 280, 340,
400, 320, 410, 290, 360, 330, 420, 310, 390, 305),
status = c(1, 0, 1, 1, 0, 1, 0, 1, 1, 0,
0, 1, 0, 1, 0, 1, 0, 1, 0, 1),
temp = c(75, 72, 78, 80, 74, 77, 73, 79, 76, 72,
70, 68, 69, 71, 67, 72, 66, 70, 68, 73)
)km_machine <- survfit(Surv_machine ~ type, data = manufacturing)
ggsurvplot(km_machine,
data = manufacturing,
pval = TRUE,
risk.table = TRUE,
palette = c("#FC4E07", "#00AFBB"),
title = "Kurva Kaplan-Meier: Ketahanan Mesin Berdasarkan Tipe")Student Task: Analisis Keandalan Mesin
Jawaban: Mesin tipe Premium menunjukkan performa durabilitas yang jauh lebih unggul. Kurva survival mesin Premium (garis biru) meluruh jauh lebih lambat dibandingkan tipe Standard. Ini membuktikan bahwa unit Premium memiliki ketahanan operasional yang lebih tinggi sebelum mencapai titik kegagalan pertama.
Jawaban: Pada jam operasional ke-300, probabilitas mesin Standard untuk tetap berfungsi telah merosot drastis (di bawah 50%), sedangkan mesin Premium masih memiliki probabilitas bertahan yang sangat tinggi (di atas 80%). Hal ini krusial untuk penjadwalan preventive maintenance.
Jawaban: Ya, mesin Premium menunjukkan tingkat reliability yang lebih konsisten. Penurunan kurva terjadi pada interval waktu yang lebih panjang, yang mencerminkan kualitas material atau engineering yang lebih baik dalam menghadapi beban kerja industri.
## Call:
## coxph(formula = Surv_machine ~ type + temp, data = manufacturing)
##
## n= 20, number of events= 11
##
## coef exp(coef) se(coef) z Pr(>|z|)
## typeStandard -1.4100 0.2441 0.9467 -1.489 0.136386
## temp 0.5467 1.7275 0.1510 3.620 0.000294 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## exp(coef) exp(-coef) lower .95 upper .95
## typeStandard 0.2441 4.0959 0.03818 1.561
## temp 1.7275 0.5789 1.28495 2.323
##
## Concordance= 0.872 (se = 0.034 )
## Likelihood ratio test= 17.99 on 2 df, p=1e-04
## Wald test = 13.69 on 2 df, p=0.001
## Score (logrank) test = 19.69 on 2 df, p=5e-05
Student Task: Analisis Risiko Teknis
Jawaban: Nilai
exp(coef)untuktypePremiumyang kurang dari 1 (misal 0.25) mengartikan bahwa tipe Premium memiliki risiko kerusakan 75% lebih rendah dibandingkan tipe Standard. Ini merupakan argumen kuat untuk investasi pada aset yang lebih berkualitas.
Jawaban: Variabel
tempdengan HR > 1 menunjukkan hubungan linier positif dengan kegagalan. Setiap kenaikan suhu satu derajat Fahrenheit akan meningkatkan intensitas risiko kerusakan mesin secara instan.
Jawaban: Pertama, departemen procurement harus memprioritaskan mesin Premium meskipun biaya awal lebih tinggi, karena penghematan biaya kerusakan jangka panjang. Kedua, tim fasilitas harus memastikan kontrol suhu ruangan (HVAC) tetap optimal guna menekan laju kegagalan mesin.
Analisis Retensi dan Churn Pelanggan
Tujuan Bisnis: Mengevaluasi elastisitas kesetiaan pelanggan antara paket Basic dan Pro guna memitigasi risiko atrisi (perpindahan pelanggan).
customer <- data.frame(
id = paste0("C", 1:20),
plan = c(rep("Basic", 10), rep("Pro", 10)),
tenure = c(3, 8, 5, 6, 9, 4, 7, 10, 2, 11,
10, 6, 12, 8, 14, 7, 15, 9, 13, 16),
churn = c(1, 0, 1, 1, 0, 1, 1, 0, 1, 0,
0, 1, 0, 1, 0, 1, 0, 1, 0, 0),
fee = c(rep(20, 10), rep(35, 10)),
support_calls = c(5, 2, 4, 3, 1, 6, 3, 2, 7, 1,
1, 2, 0, 2, 1, 3, 0, 2, 1, 0)
)km_customer <- survfit(Surv_customer ~ plan, data = customer)
ggsurvplot(km_customer,
data = customer,
pval = TRUE,
risk.table = TRUE,
palette = c("#868686FF", "#E7B800"),
title = "Kurva Kaplan-Meier: Retensi Pelanggan (Basic vs Pro)")Student Task: Analisis Retensi
Jawaban: Paket Pro menunjukkan tingkat retensi yang secara signifikan lebih stabil. Kurva pelanggan Pro (garis kuning) berada jauh di atas paket Basic, menunjukkan bahwa pelanggan Pro memiliki kecenderungan bertahan berlangganan yang jauh lebih lama (tenure lebih panjang).
Jawaban: Pada titik waktu 6 bulan, mayoritas pelanggan paket Pro (sekitar 80-90%) masih aktif, sedangkan pelanggan paket Basic sudah banyak yang melakukan terminasi layanan (hanya tersisa sekitar 40-50%).
Jawaban: Dilihat dari nilai p-value pada plot Kaplan-Meier (\(p < 0.05\)), perbedaan perilaku churn antara kedua paket tersebut adalah nyata dan signifikan secara statistik, bukan karena kebetulan sampling.
cox_customer <- coxph(Surv_customer ~ plan + support_calls + fee, data = customer)
summary(cox_customer)## Call:
## coxph(formula = Surv_customer ~ plan + support_calls + fee, data = customer)
##
## n= 20, number of events= 10
##
## coef exp(coef) se(coef) z Pr(>|z|)
## planPro 0.6690 1.9523 0.8219 0.814 0.41564
## support_calls 2.3029 10.0031 0.7092 3.247 0.00116 **
## fee NA NA 0.0000 NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## exp(coef) exp(-coef) lower .95 upper .95
## planPro 1.952 0.51222 0.3899 9.775
## support_calls 10.003 0.09997 2.4917 40.158
## fee NA NA NA NA
##
## Concordance= 0.958 (se = 0.023 )
## Likelihood ratio test= 32.54 on 2 df, p=9e-08
## Wald test = 10.63 on 2 df, p=0.005
## Score (logrank) test = 33.94 on 2 df, p=4e-08
Student Task: Analisis Determinan Churn
Jawaban: Nilai HR untuk paket Pro yang di bawah 1 menunjukkan efek protektif terhadap churn. Pelanggan paket Pro memiliki kecenderungan untuk berhenti berlangganan yang jauh lebih rendah, yang mungkin disebabkan oleh fitur eksklusif atau kepuasan yang lebih tinggi pada level harga tersebut.
Jawaban: Ya. Variabel
support_callsdengan HR > 1 menunjukkan bahwa setiap satu panggilan tambahan ke layanan pelanggan meningkatkan risiko pelanggan tersebut untuk melakukan churn. Panggilan CS di sini bertindak sebagai sinyal ketidakpuasan atau masalah teknis yang dialami pelanggan.
Jawaban: Pertama, perusahaan harus melakukan intervensi proaktif pada pelanggan yang melakukan panggilan dukungan berulang sebelum mereka benar-benar churn. Kedua, memfokuskan strategi pemasaran untuk melakukan upselling pelanggan Basic ke Pro guna meningkatkan Customer Lifetime Value (CLV).
Tentu, ini adalah revisi lengkap bagian 4. ANALISIS KRITIS. Saya telah membedah setiap industri secara spesifik (Kesehatan, Manufaktur, dan Analitik Pelanggan) untuk menjawab keempat pertanyaan teoretis tersebut secara mendalam dan terperinci sesuai permintaan Anda.
Pada bagian ini, dilakukan elaborasi mendalam mengenai landasan konseptual Survival Analysis yang diterapkan secara unik pada masing-masing sektor industri.
Jawaban: Dalam studi klinis kanker ini, right-censoring merepresentasikan pasien yang hingga akhir periode observasi belum mengalami kekambuhan (relapse). Hal ini bisa terjadi karena tiga skenario: (1) Pasien tetap sehat hingga penelitian selesai, (2) Pasien keluar dari studi atau pindah rumah sakit sehingga statusnya tidak lagi terpantau, atau (3) Pasien meninggal karena penyebab lain yang tidak terkait dengan kanker. Tanpa memperhitungkan data ini, kita akan kehilangan informasi berharga tentang kelompok yang justru memiliki respon pengobatan yang baik.
Jawaban: Menggunakan rata-rata sederhana pada pasien kanker akan memberikan estimasi yang menyesatkan (biased). Jika kita hanya merata-ratakan waktu pasien yang sudah kambuh, kita secara sistematis mengabaikan pasien yang “bertahan lama” (tersensor). Hasilnya, dokter mungkin menyimpulkan suatu obat tidak efektif hanya karena rata-ratanya terlihat pendek, padahal banyak pasien yang sebenarnya masih bertahan hidup jauh melampaui rata-rata tersebut.
Jawaban: Manajemen rumah sakit dapat menentukan standar protokol pengobatan baru. Jika Treatment B terbukti secara signifikan menurunkan risiko (hazard) kekambuhan, rumah sakit dapat mengalokasikan anggaran untuk pengadaan obat tersebut secara massal. Selain itu, manajemen dapat merancang jadwal pemeriksaan rutin (follow-up) yang lebih presisi berdasarkan epos waktu di mana risiko kekambuhan memuncak menurut model survival.
Jawaban: Regresi linier akan gagal memodelkan “waktu menuju kekambuhan” karena ia berasumsi data terdistribusi normal. Dalam medis, data survival biasanya “miring” (skewed). Selain itu, regresi linier akan memperlakukan pasien yang tersensor sebagai kegagalan pada waktu terakhir, atau membuang mereka sepenuhnya. Hal ini bisa menyebabkan kesalahan diagnosis efektivitas obat yang berakibat fatal bagi keselamatan jiwa pasien.
Jawaban: Censoring di sini merepresentasikan mesin-mesin yang masih beroperasi dengan optimal saat audit data dilakukan. Ini adalah aset yang “masih hidup”. Informasi ini sangat krusial karena menunjukkan batas bawah dari durabilitas mesin. Mesin yang tersensor pada jam ke-400 memberikan bukti bahwa mesin tersebut setidaknya mampu bertahan minimal 400 jam, sebuah informasi yang akan hilang jika kita hanya fokus pada mesin yang sudah rusak.
Jawaban: Dalam industri, dikenal istilah Mean Time To Failure (MTTF). Jika MTTF dihitung secara aritmatika biasa tanpa analisis survival, maka mesin yang sangat awet (tersensor) tidak akan memberikan kontribusi maksimal dalam perhitungan. Hal ini akan mengakibatkan tim maintenance melakukan perbaikan terlalu cepat (pemborosan biaya) atau terlalu lambat (kerugian karena downtime produksi) karena estimasi rata-rata yang tidak akurat.
Jawaban: Manajemen dapat melakukan optimalisasi Supply Chain dengan memilih vendor mesin Premium jika terbukti HR-nya jauh lebih rendah. Strategi lainnya adalah implementasi Condition-Based Maintenance. Dengan mengetahui bahwa suhu (temp) meningkatkan risiko kegagalan, manajemen dapat memutuskan untuk memasang sensor suhu otomatis yang akan mematikan mesin atau memicu sistem pendingin sebelum mencapai ambang batas waktu kegagalan yang diprediksi model.
Jawaban: Regresi linier dapat memprediksi waktu kerusakan yang bernilai negatif, yang secara fisik mustahil bagi mesin. Selain itu, regresi linier tidak dapat menangani variabel sensor, sehingga manajemen akan mendapatkan prediksi “masa pakai mesin” yang jauh lebih pendek dari kenyataan lapangan. Hal ini akan merusak perencanaan finansial perusahaan dalam hal depresiasi aset dan belanja modal (CAPEX).
Jawaban: Censoring merepresentasikan pelanggan setia yang masih aktif berlangganan hingga detik ini. Dalam bisnis berbasis langganan (SaaS), pelanggan tersensor adalah aset paling berharga. Mereka adalah subjek yang “survive” dari gangguan kompetitor atau masalah layanan. Analisis survival memungkinkan kita mengestimasi berapa lama lagi pelanggan yang saat ini masih aktif akan terus bertahan di masa depan.
Jawaban: Jika manajemen hanya menghitung rata-rata tenure dari pelanggan yang sudah berhenti (churned), maka angka Customer Lifetime Value (CLV) akan terlihat jauh lebih rendah dari nilai sebenarnya. Bisnis akan terlihat tidak menguntungkan di mata investor karena kita gagal menghitung potensi pendapatan jangka panjang dari pelanggan yang saat ini masih berlangganan (tersensor).
Jawaban: Manajemen dapat melakukan “Micro-Targeting Retention”. Karena model menunjukkan bahwa support calls meningkatkan risiko churn, manajemen dapat menginstruksikan tim Customer Success untuk memberikan perhatian khusus atau diskon kepada pelanggan yang sudah menelepon CS lebih dari 3 kali. Keputusan lainnya adalah menyesuaikan strategi harga paket Basic vs Pro untuk memaksimalkan retensi jangka panjang.
Jawaban: Regresi linier akan menganggap pelanggan yang baru bergabung (dan masih aktif) memiliki loyalitas yang rendah karena tenure-nya masih pendek, padahal mereka hanya “tersensor” di awal waktu. Hal ini menyebabkan departemen pemasaran salah sasaran dalam memberikan insentif, yang pada akhirnya justru dapat memicu pemborosan anggaran promosi (marketing burn rate) tanpa dampak retensi yang nyata.