Study Cases
Statistical Inferences~ Week 14
Answers to the Week 14 ~ Statistical Inference case study
https://rpubs.com/dsciencelabs/Statistical_Inferences, By: Bakti Siregar, M.Sc., CDS.
1 Case Study 1
Answers to Case Study 1, One-Sample Z-Test (Statistical Hypothesis):
1.Formulasi Hipotesis
Hipotesis nol (\(H_0\)) mengasumsikan klaim perusahaan benar, sedangkan hipotesis alternatif (\(H_1\)) menguji apakah ada perbedaan yang signifikan.
Hipotesis Nol (\(H_0\)): \(\mu = 120\) (Rata-rata waktu belajar harian pengguna adalah 120 menit).
Hipotesis Alternatif (\(H_1\)): \(\mu \neq 120\) (Rata-rata waktu belajar harian pengguna tidak sama dengan 120 menit).
2.Identifikasi Uji Statistik
Uji statistik yang paling tepat adalah One-Sample Z-Test.Justifikasi:
Standar deviasi populasi (\(\sigma\)) diketahui, yaitu 15 menit.
Ukuran sampel besar (\(n = 64\)), yang memenuhi syarat Teorema Limit Pusat (Central Limit Theorem) karena \(n \geq 30\).
3.Komputasi Statistik Uji dan p-value
Diketahui data: \(\mu_0 = 120\), \(\sigma = 15\), \(n = 64\), \(\bar{x} = 116\), \(\alpha = 0.05\).
A.Menghitung Nilai Z (Test Statistic):
\[Z = \frac{\bar{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}}\]
\[Z = \frac{116 - 120}{\frac{15}{\sqrt{64}}} = \frac{-4}{\frac{15}{8}} = \frac{-4}{1.875}\]\(Z \approx -2.13\)
B.Menghitung p-value:
Untuk uji dua arah dengan \(Z = -2.13\):
\(P(Z < -2.13) \approx 0.0166\)
Karena dua arah, maka \(p\text{-value} = 2 \times 0.0166 = \mathbf{0.0332}\)
4.Keputusan Statistik
Bandingkan \(p\text{-value}\) dengan \(\alpha\):
\(p\text{-value} = 0.0332\)
\(\alpha = 0.05\)
Keputusan: Karena \(p\text{-value} < \alpha\) (\(0.0332 < 0.05\)), maka kita Tolak Hipotesis Nol (\(H_0\)).
5.Interpretasi dalam Konteks Business Analytics
Dalam konteks bisnis, hasil ini menunjukkan bahwa terdapat bukti statistik yang cukup kuat untuk menyatakan bahwa klaim platform pembelajaran digital tersebut (rata-rata waktu belajar 120 menit) tidak akurat.
Kenyataannya, rata-rata waktu belajar sampel sebesar 116 menit secara signifikan lebih rendah dari yang diklaim. Bagi perusahaan, ini bisa menjadi sinyal untuk mengevaluasi strategi keterlibatan pengguna (user engagement) atau merevisi klaim pemasaran mereka agar lebih sesuai dengan data penggunaan aktual di lapangan.
2 Case Study 2
Answers to Case Study 2, One-Sample T-Test (σ Unknown, Small Sample):
1.Definisi Hipotesis (\(H_0\) dan \(H_1\))
Karena pengujian ini adalah dua arah (two-tailed) untuk melihat apakah rata-rata berbeda dari 10 menit:
Hipotesis Nol (\(H_0\)): \(\mu = 10\) (Rata-rata waktu penyelesaian tugas adalah 10 menit).
Hipotesis Alternatif (\(H_1\)): \(\mu \neq 10\) (Rata-rata waktu penyelesaian tugas tidak sama dengan 10 menit).
2.Penentuan Uji Hipotesis yang Tepat
Uji yang paling sesuai adalah One-Sample T-Test.Justifikasi:
Standar deviasi populasi (\(\sigma\)) tidak diketahui.
Ukuran sampel kecil (\(n = 10\)), yaitu kurang dari 30.
Data diasumsikan terdistribusi normal.
3.Perhitungan Statistik-t dan p-value (\(\alpha = 0.05\))
Pertama, kita hitung statistik deskriptif dari data sampel: \(9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5\).
Rata-rata sampel (\(\bar{x}\)): \(9.86\)
Standar deviasi sampel (\(s\)): \(\approx 0.386\)
Ukuran sampel (\(n\)): \(10\)
Derajat Kebebasan (\(df\)): \(n - 1 = 9\)
A.Menghitung Statistik-t:
\[t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}}\]
\[t = \frac{9.86 - 10.0}{\frac{0.386}{\sqrt{10}}} = \frac{-0.14}{0.122} \approx \mathbf{-1.147}\]
B.Menentukan p-value:
Menggunakan tabel distribusi-t atau kalkulator dengan \(df = 9\) dan \(t = -1.147\):
\(p\text{-value} \approx \mathbf{0.281}\) (untuk uji dua arah).
4.Keputusan Statistik
Bandingkan \(p\text{-value}\) dengan tingkat signifikansi \(\alpha = 0.05\):
\(p\text{-value} (0.281) > \alpha (0.05)\).
Keputusan: Gagal Tolak \(H_0\) (Terima \(H_0\)). Tidak ada bukti yang cukup kuat untuk menyatakan bahwa rata-rata waktu penyelesaian tugas berbeda secara signifikan dari 10 menit.
5.Pengaruh Ukuran Sampel terhadap Keandalan Inferensial
Ukuran sampel memiliki peran krusial dalam reliabilitas statistik:
Margin of Error: Semakin besar sampel, semakin kecil standar error (\(s/\sqrt{n}\)), yang membuat estimasi parameter populasi menjadi lebih presisi.
Kekuatan Uji (Statistical Power): Sampel yang lebih besar meningkatkan kemampuan uji untuk mendeteksi perbedaan nyata jika memang ada.
Stabilitas: Sampel kecil (seperti \(n=10\)) lebih rentan terhadap pengaruh outlier dan memiliki variabilitas yang tinggi, sehingga hasil inferensinya kurang stabil dibandingkan sampel besar.
3 Case Study 3
Answers to Case Study 3, Two-Sample T-Test (A/B Testing):
1.Formulasi Hipotesis
Pengujian ini bertujuan membandingkan dua kelompok independen (Versi A dan Versi B).
Hipotesis Nol (\(H_0\)): \(\mu_A = \mu_B\) (Tidak ada perbedaan rata-rata durasi sesi antara Versi A dan Versi B).
Hipotesis Alternatif (\(H_1\)): \(\mu_A \neq \mu_B\) (Terdapat perbedaan rata-rata durasi sesi antara Versi A dan Versi B).
2.Identifikasi Jenis Uji-t
Uji yang digunakan adalah Independent Two-Sample T-Test.
- Justifikasi: Kita membandingkan rata-rata dari dua kelompok yang berbeda (A/B testing) di mana standar deviasi populasi tidak diketahui dan ukuran sampel masing-masing kelompok relatif kecil (\(n = 25\)).
3.Komputasi Statistik Uji dan p-value
Data yang diketahui:
Versi A: \(n_1 = 25\), \(\bar{x}_1 = 4.8\), \(s_1 = 1.2\)
Versi B: \(n_2 = 25\), \(\bar{x}_2 = 5.4\), \(s_2 = 1.4\)
A.Menghitung Standard Error (SE):
\[SE = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} = \sqrt{\frac{1.2^2}{25} + \frac{1.4^2}{25}} = \sqrt{\frac{1.44}{25} + \frac{1.96}{25}} = \sqrt{0.136} \approx 0.3688\]
B.Menghitung Nilai t (Test Statistic):
\[t = \frac{\bar{x}_1 - \bar{x}_2}{SE} = \frac{4.8 - 5.4}{0.3688} = \frac{-0.6}{0.3688} \approx \mathbf{-1.627}\]
C.Menentukan p-value:
Dengan \(df \approx 48\) (menggunakan asumsi varians tidak sama/Welch atau \(n_1+n_2-2\) jika diasumsikan sama), nilai \(t = -1.627\) memberikan:
- \(p\text{-value} \approx \mathbf{0.110}\) (untuk uji dua arah).
4.Kesimpulan Statistik (\(\alpha = 0.05\))
Bandingkan: \(p\text{-value} (0.110) > \alpha (0.05)\).
Keputusan: Gagal Tolak \(H_0\).
Secara statistik, perbedaan antara rata-rata 4.8 dan 5.4 menit pada sampel ini tidak cukup signifikan untuk menyatakan bahwa kedua versi tersebut benar-benar berbeda di tingkat populasi.
5.Interpretasi untuk Pengambilan Keputusan Produk
Bagi tim product analytics, hasil ini menunjukkan bahwa perubahan pada landing page (Versi B) memang menunjukkan angka yang lebih tinggi secara nominal, namun belum terbukti secara signifikan memberikan dampak yang berbeda dibanding Versi A.
Rekomendasi:
Jangan terburu-buru mengganti desain: Karena perbedaan bisa jadi hanya karena faktor kebetulan (random chance).
Tambah Ukuran Sampel: Jika selisih 0.6 menit dianggap penting secara bisnis, tim sebaiknya menjalankan tes lebih lama untuk mengumpulkan lebih banyak sampel guna meningkatkan kekuatan uji statistik.
4 Case Study 4
Answers to Case Study 4, Chi-Square Test of Independence:
1.Pernyataan Hipotesis
Hipotesis Nol (\(H_0\)): Jenis perangkat dan preferensi metode pembayaran bersifat independen (tidak ada hubungan).
Hipotesis Alternatif (\(H_1\)): Jenis perangkat dan preferensi metode pembayaran bersifat dependen (ada hubungan yang signifikan).
2.Identifikasi Uji Statistik yang Tepat
Uji yang digunakan adalah Chi-Square Test of Independence. Uji ini dipilih karena kita sedang menganalisis hubungan antara dua variabel kategorikal (Jenis Perangkat dan Metode Pembayaran).
3.Komputasi Statistik Chi-Square (\(\chi^2\))
A.Total Data (Grand Total):
Total Pengguna Mobile: 250 (120 E-Wallet + 80 Credit Card + 50 COD).
Total Pengguna Desktop: 190 (60 E-Wallet + 90 Credit Card + 40 COD).
Total E-Wallet: 180.
Total Credit Card: 170.
Total COD: 90.
Total Keseluruhan (N): 440.
B.Nilai Ekspektasi (\(E\)):
Dihitung dengan rumus \((\text{Total Baris} \times \text{Total Kolom}) / N\).
Mobile, E-Wallet: \(250 \times 180 / 440 = 102.27\).
Mobile, Credit Card: \(250 \times 170 / 440 = 96.59\).
Mobile, COD: \(250 \times 90 / 440 = 51.14\).
Desktop, E-Wallet: \(190 \times 180 / 440 = 77.73\).
Desktop, Credit Card: \(190 \times 170 / 440 = 73.41\).
Desktop, COD: \(190 \times 90 / 440 = 38.86\).
C.Perhitungan Statistik \(\chi^2\):
Dihitung dengan rumus \(\sum \frac{(O - E)^2}{E}\).
Kontribusi Mobile: \(3.07 (\text{E-Wallet}) + 2.85 (\text{Credit Card}) + 0.03 (\text{COD}) = 5.95\).
Kontribusi Desktop: \(4.04 (\text{E-Wallet}) + 3.75 (\text{Credit Card}) + 0.03 (\text{COD}) = 7.82\).
Total \(\chi^2 = 13.77\).
4.Penentuan p-value (\(\alpha = 0.05\))
Derajat Kebebasan (\(df\)): \((2-1) \times (3-1) = 2\).
p-value: Untuk \(\chi^2 = 13.77\) dengan \(df = 2\), nilainya adalah 0.001.
Keputusan Statistik: Karena \(p\text{-value} (0.001) < \alpha (0.05)\), maka kita Menolak \(H_0\).
5.Interpretasi dalam Strategi Pembayaran Digital
Hasil ini menunjukkan bahwa perusahaan e-commerce tersebut tidak bisa menganggap preferensi pembayaran pelanggan sama di semua perangkat.
Pengguna Mobile lebih cenderung menggunakan E-Wallet daripada yang diperkirakan secara acak.
Pengguna Desktop memiliki kecenderungan lebih tinggi pada penggunaan Credit Card.
Strategi: Perusahaan harus memberikan promosi khusus E-Wallet pada tampilan Mobile dan memperkuat fitur keamanan Credit Card pada tampilan Desktop untuk memaksimalkan kepuasan pelanggan.
5 Case Study 5
Answers to Case Study 5, Type I and Type II Errors (Conceptual):
1.Type I Error (\(\alpha\)):
- Menyimpulkan bahwa algoritma baru berhasil mengurangi penipuan, padahal kenyataannya tidak. (Positif Palsu).
2.Type II Error (\(\beta\)):
- Menyimpulkan bahwa algoritma tidak berhasil mengurangi penipuan, padahal sebenarnya algoritma tersebut efektif. (Negatif Palsu).
3.Error yang Lebih Mahal:
- Secara bisnis, Type II Error seringkali lebih mahal karena startup akan kehilangan kesempatan untuk mencegah kerugian finansial akibat penipuan yang sebenarnya bisa diatasi oleh algoritma tersebut.
4.Pengaruh Sampel terhadap Type II Error:
- Semakin besar ukuran sampel, semakin kecil risiko terjadinya Type II Error (\(\beta\)) karena sensitivitas uji meningkat.
5.Hubungan \(\alpha, \beta,\) dan Power:
- \(\text{Statistical Power} = 1 - \beta\). Jika Anda memperketat \(\alpha\) (memperkecil risiko Type I), biasanya \(\beta\) akan meningkat (Power menurun) kecuali jika ukuran sampel ditambah.
6 Case Study 6
Answers to Case Study 6, P-Value and Statistical Decision Making:
1. Arti p-value: Probabilitas mendapatkan hasil tes seekstrim hasil yang diamati, dengan asumsi hipotesis nol benar.
2. Keputusan Statistik: Tolak \(H_0\). Karena \(p\text{-value} (0.021) < \alpha (0.05)\).
3. Bahasa Non-teknis: “Model prediksi churn kita terbukti efektif secara statistik dan bukan sekadar kebetulan.”
4. Risiko jika Sampel Tidak Representatif: Keputusan bisa salah arah (biased) dan tidak dapat diterapkan pada seluruh populasi pelanggan, sehingga strategi bisnis bisa gagal.
5. Mengapa p-value Bukan Ukuran Effect Size: p-value hanya menunjukkan apakah ada perbedaan, bukan seberapa besar atau seberapa penting secara praktis perbedaan tersebut.