Assignment Week2

1 INDUSTRY 1 – HEALTHCARE

1.1 Business Objective

1.1.1 Student Tasks Step 1-3

1.1.1.1 Which treatment shows a higher survival probability?

Secara hasil visualisasi yang ada, Treatment B menunjukkan bahwa performanya yang jauh lebih unggul dibandingan dengan Treatment A. Dimana kurva Treatment B berada di atas Treatment A hampir di seluruh titik waktu setelah bulan ke 4. Ini mengindikasikan bahwa kelompok pasien yang menerima perlakuan B memiliki peluang untuk tetap bebas dari gejala (event free) yang lebih besar sepanjang periode observasi berjalan.

1.1.1.2 What is the probability of being relapse-free at month 8?

Jika dengan menarik garis vertikal dari angka 8 pada sumbu “Time” maka akan ditemukan perbedaan yang sangat mencolok. Dimana pada Treatment A probabilitasnya menurun drastis ke angka 0.40 (40%), yang berarti 60% pasien dalam grub ini sudah mengalami kekambuhan. Sementara itu, pada Treatment B probabilitasnya masih bertahan di angka 0.70 (70%). Sehingga dapat disimpulkan bahwa terdapat selisih keuntungan klinis sebesar 30% bagi pengguna Treatment B pada titik waktu tersebut.

1.1.1.3 Does the curve suggest a meaningful difference?

Dilihat secara klinis jawaban nya iya, namun tidak secara statistik. Celah / gap yang lebar diantara kedua kurva memberikan kesan adanya efektifitas obat yang berbeda. Namun, munculnya sebuah nilai \(p = 0.35\) pada grafik adalah lampu kuning yang menunjukkan bahwa perbedaan visual ini mungkin hanya terjadi karena adanya faktor kebetulan (random change), dimana mengingat ukuran sampel yang sangat kecil yakni \(n = 20\).

1.1.2 Tasks Step 4

## Call:
## survdiff(formula = Surv_health ~ treatment, data = healthcare)
## 
##              N Observed Expected (O-E)^2/E (O-E)^2/V
## treatment=A 10        6     4.51     0.494     0.879
## treatment=B 10        5     6.49     0.343     0.879
## 
##  Chisq= 0.9  on 1 degrees of freedom, p= 0.3

1.1.2.1 Interpret the Chi-square result.

Dari output yang dihasilkan terdapat nilai Chi-square sebesar 0.9 dimana nilai ini mengukur seberapa jauh perbedaan antara jumlah kejadian yang benar-benar terjadi (Observed) dengan jumlah kejadian yang seharusnya terjadi jika kedua perlakuan dianggap identik (Expected). Nilai 0.9 tergolong nilai kecil, didukung juga dengan nilai \(p = 0.3\). Karena p-value nya jauh lebih besar dari ambang batas standar 0.05 maka kita gagal untuk menolak hipotesis nol.

1.1.2.2 Is Treatment B statistically better?

Belum terbukti. Meskipun data sudah menunjukkan bahwa Treatment B memiliki jumlah kejadian lebih sedikit dari yang diharapkan (Observed vs Expected 6.49) dan Treatment A lebih banyak (Observed 6 vs Expected 4.51),perbedaan ini tidak cukup signifikan untuk dianggap sebagai bukti yang kuat di mata statistika. Hal ini sering terjadi pada penelitian dengan jumlah subjek yang sangat terbatas, dimana variasi individu mengaburkan efek asli dari obat.

1.1.3 Tasks Step 5

## Call:
## coxph(formula = Surv_health ~ treatment + age + gender, data = healthcare)
## 
##   n= 20, number of events= 11 
## 
##                coef exp(coef) se(coef)      z Pr(>|z|)  
## treatmentB -0.68540   0.50389  0.63846 -1.074   0.2830  
## age        -0.13534   0.87341  0.07543 -1.794   0.0728 .
## genderM     0.03021   1.03067  0.69187  0.044   0.9652  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##            exp(coef) exp(-coef) lower .95 upper .95
## treatmentB    0.5039     1.9846    0.1442     1.761
## age           0.8734     1.1449    0.7534     1.013
## genderM       1.0307     0.9702    0.2656     4.000
## 
## Concordance= 0.693  (se = 0.102 )
## Likelihood ratio test= 5.36  on 3 df,   p=0.1
## Wald test            = 4.25  on 3 df,   p=0.2
## Score (logrank) test = 4.59  on 3 df,   p=0.2

1.1.3.1 Interpret the Hazard Ratio for Treatment B.

Nilai HR diperoleh dari exp(coef) pada variabel Treatment B yaitu sebanyak 0.5039. Artinya, pasien yang menggunakan Treatment B memiliki risiko kekambuhan 0.50 kali lipat (50% lebih rendah) dibandingan dengan pasien Treatment A pada waktu kapan pun, setelah dikontrol oleh usia dan jenis kelamin.Meskipun risiko berkurang setengahnya, hasil ini tetap dianggap tidak signifikan secara statistik karena Confidence Interval bawah dan atasnya melewati angka 1, yaitu 0.14-1.76.

1.1.3.2 Does age increase relapse risk?

Berdasarkan nilai untuk variabel age yakni sebesar 0.8734 dan koefisien negatif (-0.135), ditemukan nya anomali yang menarik. Dimana setiap kenaikan satu tahun usia, risiko kekambuhan justru menurun sebesar kurang lebih 12.6% (1-0.8734). Jadi, di dalam dataset ini usia yang lebih tua justru berperan sebagai faktor pelindung (protective factor) bagi pasien, bukan meningkatkan risiko. Hal ini terlihat dari nilai hasil p-value usia sebesar 0.07 yang merupakan variabel paling mendekati signifikan dalam model ini.

1.1.3.3 Which variables are significant?

Jika merujuk pada standar signifikansi \(\alpha = 0.05\), maka tidak ada satu pun variabel yang signifikan dalam model ini dikarenakan alasan pendukung dibawah ini :

Treatment B dengan \(p = 0.28\) dan genderM \(p = 0.96\) memiliki pengaruh yang sangat lemah terhadap sebuah model.
age dengan \(p = 0.07\) adalah variabel yang paling dominan dan hampir signifikan, menunjukkan bahwa umur pasien lebih menentukan kecepatan kekambuhan daripada jenis pengobatannya dalam suatu kelompok kecil ini.

1.1.4 Final Conclusion

Analisis survival ini memberikan indikasi klinis yang kuat mengenai efektivitas superior Treatment B yang mampu mereduksi risiko kekambuhan hingga sebesar 49.6%, serta mengungkap peran protektif usia yang menurunkan laju hazard sebesar 12.6% per tahun. Meskipun temuan ini memiliki nilai praktis yang signifikan, secara inferensial hasil tersebut masih bersifat inkonklusif karena nilai p belum melampaui ambang batas signifikansi statistik \(\alpha = 0,05\).

Fenomena ini tidak merepresentasikan ketiadaan efek dari perlakuan, melainkan merupakan suatu konsekuensi dari keterbatasan statistical power akibat ukuran sampel yang sangat kecil yakni \(N = 20\), sehingga memicu tingginya Standard Error serta melebarnya interval kepercayaan. Kondisi tersebut menciptakan risiko Error Tipe II, dimana efek nyata yang terobservasi secara klinis gagal untuk divalidasi secara statistik.

Oleh karena itu, sebagai langkah strategis untuk mentransformasi potensi klinis ini menjadi salah satu bukti ilmiah yang kredibel, maka diperlukan ekspansi ukuran sampel secara substansial guna untuk memitigasi variabilitas data dan memperkuat presisi estimasi sebuah parameter, sehingga menghasilkan signifikansi statistik yang valid secara akademis untuk mudah tercapai.

2 INDUSTRY 2 – MANUFACTURING

2.1 Business Objective

2.1.1 Student Tasks Step 1-3

2.1.1.1 Which machine type lasts longer?

Mesin dengan tipe Premium secara jelas menunjukkan masa pakai yang lebih lama dibandingkan dengan tipe Standard. Hal ini dapat diobservasi dari posisi garis Premium yang secara konsisten berada di atas garis Standard. Mesin dengan tipe Standard mengalami kegagalan pertama kali sebelum menyentuh angka 200 jam, sementara mesin tipe Premium mampu menjaga probabilitas ketahanan nya tetap di angka 1.00 (100%) hingga hampir menyentuh durasi 300 jam sebelum akhirnya mengalami penurunan yang pertama.

2.1.1.2 What is survival probability at 300 hours?

Pada titik waktu 300 jam, mesin dengan tipe Standard menunjukkan adanya penurunan drastis dengan probabilitas ketahanan yang dihasilkan berada di sekitar 0.4 atau 40%. Ini menginterpretasikan bahwa mayoritas mesin Standard sudah mengalami kerusakan sebelum mencapai waktu tersebut. Tapi di sisi lain, mesin dengan tipe Premium masih memiliki probabilitas bertahan di angka 0.9 atau 90%. Maka terdapat celah/ gap efektivitas sebesar 50% yang menunjukkan bahwa adanya perbedaan kualitas material atau desain mesin yang sangat kontras di antara keduanya.

2.1.1.3 Does Premium appear more reliable?

Sangat jelas bahwa Premium jauh lebih andal. Namun, harus memperhatikan nilai \(p = 0.16\) pada grafik. Meskipun secara visual gapnya lebar, akan tetapi secara statistik (Loh-Rank test) nilai ini belum bisa menembus ambang batas signifikansi standar yakni \(\alpha = 0.05\). Hal ini kemungkinan besar disebabkan oleh ukuran sampel yang kecil (\(n=20\)), sehingga variasi data individu masih cukup tinggi untuk dianggap sebagai keunggulan mutlak secara statistik walaupun secara praktis keunggulannya sudah terlihat nyata.

2.1.2 Tasks Step 4

## Call:
## coxph(formula = Surv_machine ~ type + temp, data = manufacturing)
## 
##   n= 20, number of events= 11 
## 
##                 coef exp(coef) se(coef)      z Pr(>|z|)    
## typeStandard -1.4100    0.2441   0.9467 -1.489 0.136386    
## temp          0.5467    1.7275   0.1510  3.620 0.000294 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##              exp(coef) exp(-coef) lower .95 upper .95
## typeStandard    0.2441     4.0959   0.03818     1.561
## temp            1.7275     0.5789   1.28495     2.323
## 
## Concordance= 0.872  (se = 0.034 )
## Likelihood ratio test= 17.99  on 2 df,   p=1e-04
## Wald test            = 13.69  on 2 df,   p=0.001
## Score (logrank) test = 19.69  on 2 df,   p=5e-05

2.1.2.1 Interpret Hazard Ratio for Premium.

Pada output Cox, variabel yang ditampilkan adalah type Standard dengan nilai exp(coef) sebanyak 0.2441. Ini berarti dengan asumsi suhu tetap, mesin Standard memiliki risiko kegagalan hanya 0.24 kali lipat dari Premium. Namun, ketika melihat kolom exp(-coef) yang bernilai 4.0959 ini di interpretasikan yang paling kuat yakni mesin Standard memiliki risiko gagal 4,1 kali lebih tinggi dibandingan dengan mesin Premium. Secara teknis, mesin Premium mampu mereduksi risiko kegagalan hingga lebih dari 75% dibandingan dengan unit Standard dalam kondisi operasional yang sama.

2.1.2.2 Does higher temperature increase failure risk?

Variabel suhu menunjukkan pengaruh yang sangar destruktif dan signifikan secara statistik dengan nilai \(p = 0.000294\). Dan juga dengna nilai exp(coef) sebesar 1.7275 dapat disimpulkan bahwa setiap kenaikan suhu sebesar 1 derajat maka risiko kegagalan mesin itu akan meningkat sebesar 72.75%. Sehingga suhu bukan sekedar variabel tambahan saja, melainkan salah satu faktor risiko utama yang dapat mempercepat kerusakan suatu mesin secara eksponensial.

2.1.2.3 What is the managerial implication?

Dari prespektif manajemen, hasil ini dapat memberikan dua arahan yang strategis yakni :

Standardisasi Aset : Perusahaan harus dapat mempertimbangkan untuk beralih sepenuhnya ke mesin tipe Premium untuk lini produksi kritis, mengingat risikonya 4 kali lebih rendah sehingga akan dapat meminimalisir biaya downtime suatu produksi.
Kontrol Lingkungan Operasional : Mengingat senstivitas mesin terhadap suhu sangat tinggi (peningkatan risiko >70% per derajat), manajemen wajib menginvestasikan sumber daya pada sistem pendingan (cooling system) atau sensor suhu otomatis. Dengan menjaga suhu tetap stabil jauh lebih krusial untuk memperpanjang usia mesin daripada hanya sekedar memilih tipe mesin tertentu saja.

2.1.3 Final Conclusion

Analisis reliabilitas ini mengonfirmasi efektivitas superior mesin tipe Premium yang secara model mereduksi risiko kegagalan hingga 75.6% (\(HR = 0,244\)) dibandingkan dengan tipe Standard. Data Kaplan-Meier mempertegas dominasi ini dengan probabilitas ketahanan 90% pada jam ke 300, berbanding terbalik dengan tipe Standard yang anjlok ke angka 40%. Namun, variabel paling destruktif ditemukan pada aspek termal yakni setiap kenaikan suhu 1°C meningkatkan laju hazard secara signifikan sebesar 72.75% (\(p = 0,000294\)), memposisikan suhu sebagai determinan utama kegagalan mekanis.

Meskipun keunggulan visual tipe Premium sangat kontras, nilai \(p = 0,16\) pada strata perlakuan mengindikasikan adanya keterbatasan statistical power akibat ukuran sampel yang minimal. Kondisi ini memicu Standard Error yang tinggi dan risiko Error Tipe II, dimana efek nyata yang terobservasi gagal mencapai validasi statistik formal. Sebaliknya, signifikansi ekstrem pada variabel suhu memberikan bukti ilmiah yang lebih pasti mengenai pengaruh faktor eksternal termal terhadap integritas mesin pada dataset ini.

Untuk mentransformasi indikasi ini menjadi salah satu bukti ilmiah yang kredibel, diperlukan ekspansi ukuran sampel guna untuk memitigasi variabilitas data dan meningkatkan presisi estimasi parameter. Secara manajerial, prioritas penggunaan unit Premium harus difokuskan pada lini produksi dengan beban termal tinggi yang didukung oleh implementasi sistem regulasi suhu otomatis untuk menekan laju hazard dan mengoptimalkan efisiensi siklus hidup aset secara valid.

3 INDUSTRY 3 – CUSTOMER ANALYTICS

3.1 Business Objective

3.1.1 Student Tasks Step 1-3

3.1.1.1 Which plan shows better retention?

Paket Pro menunjukkan peforma retensi yang secara konsisten lebih tinggi dibandingan dengan paket Basic. Hal ini sangat terlihat jelas dari posisi kurva paket Pro yang berada di atas paket Basic sepanjang durasi waktu. Pelanggan paket Basic mulai mengalami penurunan probabilitas bertahan/ churn lebih awal dan lebih curam dibandingkan dengan paket Pro.

3.1.1.2 What is the probability of surviving ≥ 6 months?

Pada paket Basic, probabilitas bertahan tepat pada bulan ke-6 atau lebih adalah sekitar 0.60 atau 60%. Artinya, 40% pelanggan paket ini sudah berhenti berlangganan sebelum menyentuh setengah tahun. Namun sebaliknya, pada paket Pro menunjukkan ketahanan yang jauh lebih solid dengan probabilitas bertahan mencapai 0.90 atau 90% pada titik waktu yang sama. Terdapat celah reliabilitas sebesar 30% yang mengindikasikan bahwa paket Pro memiliki daya pikat atau loyalitas yang lebih kuat di awal masa berlangganan.

3.1.1.3 Is the difference statistically significant?

Meskipun secara visual terdapat celah yang lebar, harus memperhatikan nilai \(p = 0.17\) yang tertera pada grafik. Dalam standar \(\alpha = 0.05\), nilai ini belum mencapai ambang batas signifikansi statistik. Ketidaksignifikanan ini kemungkinan besar dipicu oleh ukuran sampel yang kecil, sehingga variansi data individu masih cukup dominan dan belum cukup kuat untuk menggeneralisasi keunggulan dari paket Pro sebagai kepastian absolut tanpa ada penambahan data lebih lanjut.

3.1.2 Task Step 4

## Call:
## coxph(formula = Surv_customer ~ plan + support_calls + fee, data = customer)
## 
##   n= 20, number of events= 10 
## 
##                  coef exp(coef) se(coef)     z Pr(>|z|)   
## planPro        0.6690    1.9523   0.8219 0.814  0.41564   
## support_calls  2.3029   10.0031   0.7092 3.247  0.00116 **
## fee                NA        NA   0.0000    NA       NA   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##               exp(coef) exp(-coef) lower .95 upper .95
## planPro           1.952    0.51222    0.3899     9.775
## support_calls    10.003    0.09997    2.4917    40.158
## fee                  NA         NA        NA        NA
## 
## Concordance= 0.958  (se = 0.023 )
## Likelihood ratio test= 32.54  on 2 df,   p=9e-08
## Wald test            = 10.63  on 2 df,   p=0.005
## Score (logrank) test = 33.94  on 2 df,   p=4e-08

3.1.2.1 Interpret Hazard Ratio for Pro plan.

Nilai pada Hazard Ratio untuk Paket Pro adalah sebesar 1.9523. Secara teknis, ini mengindikasikan bahwa pelanggan paket Pro memiliki risiko churn sekitar 1.95 kali lipat lebih tinggi dibandingkan dengan pelanggan paket Basic jika variabel lain dianggap konstan. Namun, perlu diketahui bahwa variabel ini tidak signifikan secara statistik (\(p = 0.415\)). Sehingga menunjukkan bahwa jenis paket sendiri bukanlah pemicu utama atas kegagalan retensi, melainkan salah satu faktor perilaku pelanggan di dalamnya.

3.1.2.2 Do support calls increase churn risk?

Variabel support_calls muncul sebagai faktor risiko yang sangat signifikan secara statistik ( \(p = 0.00116\) dengan nilai Hazard Ratio (exp(coef)) mencapai sekitar 10.0031. Temuan ini sangat krusial karena setiap kenaikan satu panggilan dukungan teknis maka risiko pelanggan untuk churn meningkat secara eksponensial sebesar 10 kali lipat. Ini merupakan suatu sinyal bahaya yang menunjukkan bahwa panggilan dukungan kemungkinan besar bukan merupakan bentuk interaksi positif, melainkan indikator adanya frustasi atau masalah teknis yang tidak terselesaikan sehingga secara langsung dapat mendorong pelanggan untuk berhenti berlangganan.

3.1.2.3 What retention strategy can be derived?

Berdasarkan hasil diatas, strategi retensi tidak boleh hanya berfokus pada menjual paket Pro saja, melainkan pada mitigasi masalah teknis juga. Dengan hasil nilai Concordance = 0.958, model ini dapat memiliki akurasi prediksi yang sangat tinggi sehingga memiliki rekomendasi strategis sebagai berikut :

Proactive Problem Solving : Karena panggilan dukungan meningkatkan risiko churn 10 kali lipat, perusahaan harus mengalihkan sumber daya dari sekedar melayani keluhan menjadi penyelesaian masalah secara tuntas pada kontak pertama.
Monitoring High-Risk Customers : Pelanggan yang melakukan lebih dari 2 atau 3 panggilan dukungan dalam periode singkat harus dikategorikan sebagai risiko tinggi dan diberikan penangganan khusus atau kompensasi untuk mencegah adanya churn yang hampir pasti terjadi.
Evaluasi Paket Pro : Mengingat paket Pro secara visual lebih baik namun secara model memiliki kecenderungan risiko lebih tinggi meskipun tidak signifikan, perlu dilakukan audit apakah pelanggan Pro mendapatkan masalah teknis yang lebih kompleks sehingga membutuhkan dukungan lebih sering.

3.1.3 Final Conclusion

Analisis ini membuktikan adanya kesejangan antara persepsi visual dan kepastian statistik dalam struktur retensi pelanggan. Secara deksriptif, paket Pro menunjukkan reliabilitas superior dengan probabilitas bertahan mencapai 90% pada bulan ke-6 yang berbanding terbalik dengan paket Basic yang merosot. Namun, Pemodelan Cox mengungkap bahwa variabel yang jauh lebih kursial adalah intensitas support calls yakni merupakan determinan utama kegagalan retensi, dimana setiap panggilan tambahan memicu eskalasi risiko churn sebesar 10 kali lipat (\(p = 0.001\)). Sementara itu, meskipun perbedaan paket terlihat kontras secara visual, nilai p = 0.17 mengindikasikan bahwa keunggulan paket Pro belum mencapai signifikansi statistik akibat keterbatasan daya uji pada sampel kecil.

Kondisi inkonklusif ini mencerminkan adanya risiko Error Tipe II dimana potensi keuntungan paket Pro tenggelam oleh Standard Error yang tinggi. Maka, diperlukan ekspansi ukuran sampel untuk mentransformasikan temuan praktis ini menjadi bukti ilmiah yang valid. Strategi perusahaan wajib bergeser dari sekedar diferensiasi paket menuju mitigasi proaktif terhadap keluhan pelanggan. Mengingat setiap panggilan dukungan memiliki efek destruktif yang masif, penyelesaian masalah pada kontak pertama menjadi salah satu kunci absolut untuk menstabilkan loyalitas dan menjamin efisiensi siklus hidup pelanggan secara akademis maupun operasional.

4 CRITICAL ANALYSIS (REQUIRED)

4.1 INDUSTRY 1 – HEALTHCARE

4.1.1 What does censoring represent in this context?

Karena censoring merepresentasikan pasien yang hingga akhir masa observasi (bulan ke-8 hingga ke-10) belum mengalami kekambuhan (relapse-free), atau pasien yang keluar dari studi (drop-out) karena alasan non-medis sebelum peristiwa terjadi. Censoring di sini adalah simbol keberhasilan parsial dimana data ini memberikan pandangan bahwa simbol Treatment B mampu menjaga pasien tetap sehat setidaknya sampai titik waktu terakhir. Tanpa adanya censoring, maka akan kehilangan informasi mengenai durasi kesehatan pasien yang paling sukses dalam analisis ini, yang akan mengakibatkan estimasi efektivitas obat menjadi bias dan jauh lebih rendah dari kenyataannya.

4.1.2 Why is the average time insufficient?

Mengandalkan rata-rata aritmatika (mean) dalam suatu data survival adalah kesalahan metodologis yang cukup fatal. Rata-rata hanya bisa dihitung secara akurat jika seluruh pasien sudah mengalami kekambuhan. Karena dengan adanya data tersensor (pasien yang masih sehat), rata-rata hanya akan dapat menangkap yang cepat kambuh saja, sehingga menciptakan bias pesimistis. Analisis survival menggunakan fungsi step (Kaplan-Meier) yang memperhitungkan risiko setiap individu pada setiap titik waktu, memberikan gambaran terhadap probabilitas kumulatif yang jauh lebih akurat daripada angka rata-rata tunggal yang menyesatkan.

4.1.3 What strategic decision can management make?

Manajemen medis harus mengambil keputusan untuk memperluas skala penelitian yakni Fase III. Meskipun secara visual Treatment B terlihat superior dan usia memiliki peran yang protektif dengan nilai \(HR = 0.87\), nilai \(p = 0.35\) menunjukkan hasil yang secara statistik belum konklusif akibat keterbatasan sampel. Strategi utamanya bukan langsung mengklaim obat ini sukses, melainkan menambah subjek uji secara substansial untuk memperkuat statistical power agar potensi klinis ini dapat divalidasi secara legal dan ilmiah sebagai standar pengobatan baru.

4.1.4 What would happen if we used linear regression instead?

Jika menggunakan regresi linier, model akan buta terhadap data tersensor dimana pasien yang belum kambuh akan dianggap kampuh pada akhir bulan studi atau bahkan dibuang dari dataset. Hal ini akan menghancurkan validitas model. Selain itu, risiko biologis kekambuhan nya tidaklah linier dimana bisa melonjak dibulan ke-2 dan melandai dibulan ke-8. Regresi linier hanya akan menarik garis lurus yang gagal menangkap dinamika risiko yang berubah-ubah seiring dengan berjalan nya waktu (non proportional risk).

4.2 INDUSTRY 2 – MANUFACTURING

4.2.1 What does censoring represent in this context?

Censoring dalam manufaktur mencerminkan unit mesin yang masih beroperasi secara normal hingga pengambilan data terakhir dilakukan. Ini adalah indikator reliabilitas rill aset. Mesin dengan status 0 adalah unit yang berhasil bertahan melewati tekanan operasional. Mengabaikan data ini akan membuat departemen pemeliharaan berasumsi bahwa semua mesin memiliki usia pakai yang pendek, dimana bisa memicu penggantian komponen terlalu dini (over maintenance) dan pemborosan biaya operasional, padahal unit terbaik (mayoritas tipe Premium) justru masih berfungsi melampui masa observasi.

4.2.2 Why is the average time insufficient?

Rata-rata waktu kegagalan tidak mampu mendeteksi penyebab kegagalan (etiologi). Dua mesin bisa memiliki rata-rata waktu rusak yang sama, namun satu mesin rusak karena kausan mekanis alami, sementara yang lain rusak akibat lonjakan suhu. Analisis Survival melalui Model Cox memungkinkan manajemen memisahkan risiko internal (desain mesin) dan risiko eksternal (suhu). Angka rata-rata akan menyamaratakan semua kondisi ini sehingga manajemen gagal mengidentifikasi bahwa suhu adalah faktor krusial utama mesin mereka.

4.2.3 What strategic decision can management make?

Keputusan kritis adalah investasi pada sistem regulasi suhu otomatis dan sensor IoT. Mengingat kenaikan suhu \(1^\circ\text{C}\) meningkatkan risiko kegagalan sebesar 72.75% (\(p = 0.000294\)), pengendalian lingkungan operasional jauh lebih mendesak daripada sekedar mengganti jenis mesin. Namun, untuk pengadaan jangka panjang, manajemen harus menstrandarisasi tipe Premium untuk area beban kerja panas tinggi karena risikop kegagalannya secara model 4 kali lebih rendah dibandingkan tipe Standard.

4.2.4 What would happen if we used linear regression instead?

Regresi linier akan menghasilkan error yang sangat tinggi karena hubungan antara suhu dan kerusakan mesin bersifat eksponensial, bukan linier. Model linier mungkin memprediksi mesin akan rusak dalam 100 jam ke depan, padahal dengan kenaikan suhu yang kecil namun mendadak, mesin bisa rusak dalam hitungan menit. Regresi linear juga tidak mampu menangani mesin yang belum rusak, sehingga gagal memprediksi usia pakai aset yang paling andal secara akurat.

4.3 INDUSTRY 3 – CUSTOMER ANALYTICS

4.3.1 What does censoring represent in this context?

Dalam retensi pelanggan, censoring mewakili pelanggan yang masih aktif berlangganan (loyal) hingga saat ini. Dalam bisnis berbasis langganan (SaaS) ini adalah aset hidup yang memberikan Monthly Recurring Revenue (MRR). Menghilangkan data tersensor dalam analisis akan membuat tingkat churn perusahaan terlihat jauh lebih buruk dari aslinya, karena model hanya akan fokus pada pelanggan yang sudah pergi dan mengabaikan mereka yang justru paling puas dengan layanan perusahaan.

4.3.2 Why is the average time insufficient?

Tenure rata-rata bersifat pasif dan tidak memberikan wawasan mengenai pemicu (trigger) pembatalan. Rata-rata tidak bisa mengungkap fakta kritis bahwa setiap panggilan dukungan teknis meningkatkan risiko churn secara masih yakni 10 kali lipat. Analisis survival bersifat prediktif dan proaktif sehingga dapat memberitahu manajemen bukan hanya berapa lama pelanggan bertahan, tapi variabel perilaku apa yang secara instan dapat menggangu loyalitas mereka.

4.3.3 What strategic decision can management make?

Manajemen harus membangun sebuah sistem “Intervensi Proaktif” yang dipicu oleh jumlah panggilan dukungan. Karena panggilan dukungan ini adalah salah satu indikator utama frustrasi pelanggan dengan nilai \(p = 0.001\), sehingga strategi retensi harus bergeser dan setiap pelanggan yang melakukan lebih dari satu panggilan dukungan harus segera dikontak oleh tim Customer Success untuk diberikan sebuah penanganan prioritas atau kompensasi loyalitas. Fokusnya bukan lagi pada promosi fitur paket Pro saja, melainkan pada stabilitas layanan dan resolusi masalah pada kontak pertama.

4.3.4 What would happen if we used linear regression instead?

Regresi linier akan memberikan prediksi yang sangat menyesatkan karena churn sering kali terjadi secara tiba-tiba akibat adanya peristiwa tunggal seperti masalah teknis yang tidak terselesaikan. Regresi linier akan mencoba untuk meratakan risiko ini sepanjang waktu berlangganan, padahal risiko churn bisa melonjak secara drastis hanya dalam satu hari saja. Selain itu juga, regresi linier tidak bisa menangani pelanggan yang masih aktif, sehingga gagal untuk membedakan antara pelanggan yang benar-benar setia dengan mereka yang baru saja bergabung.