Tugas Statistik Minggu ke 14
1. Studi Kasus 1
Uji-Z Satu Sampel (Hipotesis Statistik)
Soal : Sebuah platform pembelajaran digital mengklaim bahwa rata-rata waktu belajar harian penggunanya adalah 120 menit. Berdasarkan catatan historis, standar deviasi populasi diketahui sebesar 15 menit. Sebuah sampel acak dari 64 pengguna menunjukkan rata-rata waktu belajar 116 menit.
\(\mu_0 = 120\)
\(\sigma = 15\)
\(n = 64\)
\(\bar{x} = 116\)
Jawaban :
1. Rumuskan Hipotesis Nol dan Hipotesis Alternatif :
\(H_0: \mu = 120\) (Rata-rata waktu belajar adalah 120 menit).
\(H_1: \mu \neq 120\) (Rata-rata waktu belajar tidak sama dengan 120 menit).
2. Identifikasi uji statistik yang tepat dan berikan alasannya :
- Uji-Z satu sampel
- Alasan: Ukuran sampel besar (\(n>30\)) dan standar deviasi populasi (\(\sigma\)) diketahui.
3. Hitung statistik uji dan p-value menggunakan \(\alpha = 0.05\): Rumus \(Z: Z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}\) Perhitungan: \(Z = \frac{116 - 120}{15 / \sqrt{64}} = \frac{-4}{15 / 8} = \frac{-4}{1.875} \approx -2.13\) P-value: Untuk \(Z = -2.13\) (dua sisi), \(p-value\) adalah sekitar 0.033 (atau 3.3%.)
4. Nyatakan keputusan statistik: Karena \(p-value (0.033) < \alpha (0.05)\), maka kita Tolak Hipotesis Nol \((H_0)\).
5. Interpretasikan hasil dalam konteks analitik bisnis : Ada bukti statistik yang cukup untuk menyatakan bahwa rata-rata waktu belajar pengguna berbeda secara signifikan dari klaim 120 menit. Secara spesifik, pengguna menghabiskan waktu lebih sedikit (116 menit) daripada yang diklaim perusahaan.
2. Studi Kasus 2
Uji-T satu sampel (\(\sigma\) tidak diketahui, sampel kecil)
- Soal : Sebuah Tim Riset UX menyelidiki apakah rata-rata waktu penyelesaian tugas dari aplikasi baru berbeda dari 10 menit. Data berikut dikumpulkan dari 10 pengguna: \[9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5\]
Jawaban :
1. Tentukan \(H_0\) dan \(H_1\) (dua sisi):
- \(H_0: \mu = 10\)
- \(H_1: \mu \neq 10\)
2. Tentukan uji hipotesis yang tepat : Uji-T Satu Sampel.
- Alasan: Standar deviasi populasi tidak diketahui dan ukuran sampel kecil \((n < 30).\)
3. Hitung statistik-t dan \(p-value\) pada \(\alpha = 0.05:\) - Mean Sampel \((\bar{x}): (9.2+...+9.5)/10 = 9.86\)
Standar Deviasi Sampel \((s)\): Sekitar \(0.386\)
Hitung \(T: t = \frac{9.86 - 10}{0.386 / \sqrt{10}} = \frac{-0.14}{0.122} \approx -1.15\)
\(P-value\): Dengan derajat kebebasan \((df) = 9\), \(p-value\) sekitar 0.28 (28%).
4. Buat keputusan statistik :
- Karena \(p-value\) (0.28) > \(\alpha\) (0.05), maka kita Gagal Menolak Hipotesis Nol.
5. Jelaskan bagaimana ukuran sampel memengaruhi reliabilitas inferensial :
- Ukuran sampel yang sangat kecil (hanya 10) membuat pengujian memiliki kekuatan (power) yang rendah. Artinya, sulit untuk mendeteksi perbedaan nyata jika perbedaannya kecil. Sampel yang lebih besar akan memberikan hasil yang lebih andal dan presisi.
3. Studi Kasus 3
Uji-T dua sampel (A/B Testing)
Soal : Sebuah tim analitik produk melakukan A/B test untuk membandingkan rata-rata durasi sesi (menit) antara dua versi halaman landas.
Versi A: \(n=25\), Mean=\(4.8\), SD=\(1.2\)
Versi B: \(n=25\), Mean=\(5.4\), SD=\(1.4\)
Jawaban :
1. Rumuskan hipotesis nol dan alternatif :
\(H_0: \mu_A = \mu_B\) (Tidak ada perbedaan durasi rata-rata antara versi A dan B).
\(H_1: \mu_A \neq \mu_B\) (Ada perbedaan durasi rata-rata).
2. Identifikasi jenis uji-t yang diperlukan :
- Uji T dua sampel independen.
3. Hitung statistik uji dan \(p-value\) :
Standard Error (estimasi): \(\sqrt{\frac{1.2^2}{25} + \frac{1.4^2}{25}} \approx \sqrt{0.0576 + 0.0784} \approx 0.369\)
T-score: \(t = \frac{5.4 - 4.8}{0.369} = \frac{0.6}{0.369} \approx 1.62\)
\(P-value\): Dengan \(df \approx 48\), \(p-value\) sekitar 0.11 (11%).
4. Tarik kesimpulan statistik pada \(\alpha = 0.05\):
- Karena \(p-value\) (0.11) > 0.05, Gagal Menolak Hipotesis Nol. Perbedaan tersebut tidak signifikan secara statistik.
5. Interpretasikan hasil untuk pengambilan keputusan produk:
- Meskipun Versi B memiliki rata-rata lebih tinggi, perbedaannya belum cukup kuat untuk dikatakan bukan karena kebetulan. Tim produk tidak boleh langsung menyimpulkan bahwa Versi B lebih baik. Disarankan melanjutkan tes dengan sampel lebih banyak atau melihat metrik lain.
4. Studi Kasus 4
Uji Chi-Square Independensi
- Soal : Sebuah perusahaan e-commerce memeriksa apakkah jenis perangkat (device type) berhubungan dengan preferensi metode pembayaran.
| Device | E-Wallet | Credit Card | COD | Total |
|---|---|---|---|---|
| Mobile | 120 | 80 | 50 | 250 |
| Desktop | 60 | 90 | 40 | 190 |
| Total | 180 | 170 | 90 | 440 |
Jawaban :
1. Nyatakan \(H_0\) dan \(H_1\):
\(H_0\): Jenis perangkat dan metode pembayaran adalah independen (tidak ada hubungan).
\(H_1\): Jenis perangkat dan metode pembayaran adalah dependen (ada hubungan/asosiasi).
2. Identifikasi uji statistik yang tepat:
- Uji Chi-Square Test of Independence (Uji Chi-Kuadrat untuk Independensi).
3. Hitung statistik Chi-Square (\(\chi^2\)):
Kita membandingkan Nilai Observasi \((O)\) dengan Nilai Ekspektasi \((E)\).
Contoh \(E\) untuk Mobile/E-Wallet: (\(250 \times 180) / 440 = 102.3.\) (Observasi \(= 120\)).
Setelah menghitung selisih kuadrat untuk semua sel, didapatkan \(\chi^2 \approx 13.5.\)
4. Tentukan p-value pada \(\alpha = 0.05\):
Derajat kebebasan (\(df\)) = (2-1) (3-1) = 2.
Nilai kritis untuk \(df=2\) pada \(\alpha=0.05\) adalah \(5.99.\)
Karena \(13.5 > 5.99\), maka \(p-value < 0.001\).
5. Interpretasikan hasil dalam strategi pembayaran digital:
- Terdapat hubungan yang signifikan antara perangkat dan cara bayar. Pengguna Mobile cenderung lebih suka E-Wallet (120 vs ekspektasi 102), sedangkan pengguna Desktop lebih suka Kartu Kredit. Strategi: Optimalkan UI E-Wallet di aplikasi mobile dan promosi Kartu Kredit di web desktop.
5. Studi Kasus 5
Error tipe I dan Tipe II (Konseptual)
Soal : Sebuah starup fintech menguji apakah algoritma deteksi penipuan baru mengurangi tranksaksi curang.
\(H_0\): Algoritma baru tidak mengurangi penipuan.
\(H_1\): Algoritma baru mengurangi penipuan.
Jawaban :
1. Jelaskan Error Tipe I (\(\alpha\)) dalam konteks ini:
- Menyimpulkan bahwa algoritma baru efektif mengurangi penipuan, padahal sebenarnya tidak. (False Positive / Kesalahan positif palsu).
2. Jelaskan Error Tipe II (\(\beta\)) dalam konteks ini:
- Menyimpulkan bahwa algoritma baru tidak efektif, padahal sebenarnya algoritma itu berhasil mengurangi penipuan. (False Negative / Kesalahan negatif palsu).
3. Identifikasi error mana yang lebih merugikan dari perspektif bisnis:
Tergantung pada biaya implementasi. Namun, biasanya Error Tipe II (Gagal mendeteksi solusi yang bagus) bisa dianggap kehilangan peluang efisiensi (opportunity cost). Tetapi, jika implementasi algoritma itu mahal, Error Tipe I (Membeli algoritma sampah) adalah kerugian finansial langsung.
Dalam konteks fraud: Biasanya Tipe II lebih berbahaya jika konteksnya “Mendeteksi Transaksi Fraud” (meloloskan penipu). Namun di sini konteksnya “Efektivitas Algoritma”.
4. Diskusikan bagaimana ukuran sampel memengaruhi Error Tipe II:
- Meningkatkan ukuran sampel akan menurunkan Error Tipe II. Semakin banyak data, semakin besar kemungkinan kita mendeteksi efek yang sebenarnya ada (Power statistik naik).
5. Jelaskan hubungan antara \(\alpha\), \(\beta\), dan statistical power:
- Statistical Power = \(1 - \beta\). Jika kita ingin menurunkan \(\beta\) (meningkatkan Power), kita biasanya harus menaikkan sampel atau menaikkan \(\alpha\) (kompromi risiko).
6. Studi Kasus 6
\(P-Value\) dan pengambilan keputusan statistik.
Soal : Evaluasi model prediksi churn (pelanggan berhenti berlanggan) menghasilkan:
Test Statistik =\(2.31\)
\(P-Value\) = \(0.021\)
Significance level \(a\) = \(0.05\)
Jawaban :
1. Jelaskan arti dari p-value:
- \(P-value 0.021\) berarti ada peluang sebesar \(2.1%\) untuk mendapatkan hasil seperti ini (atau lebih ekstrem) JIKA hipotesis nol itu benar. Karena peluangnya sangat kecil (jarang terjadi karena kebetulan), ini menjadi bukti kuat melawan hipotesis nol.
2. Buat keputusan statistik:
- Karena \(P-Value\) (\(0.021\)) < \(\alpha\) (\(0.05\)), keputusannya adalah Tolak Hipotesis Nol (\(H_0\)).
3. Terjemahkan keputusan ke dalam bahasa non-teknis untuk manajemen:
- “Model prediksi churn kita menunjukkan hasil yang valid dan signifikan. Hasil yang kita lihat bukan karena faktor kebetulan, sehingga model ini bisa diandalkan untuk digunakan.”
4. Diskusikan risikonya jika sampel tidak representatif:
- Meskipun \(P-Value\) bagus, jika sampelnya bias (misal: hanya mengambil data pelanggan lama saja), maka hasilnya tidak valid untuk seluruh populasi. Keputusan bisnis bisa salah total (bias).
5. Jelaskan mengapa p-value tidak mengukur effect size (besaran efek):
- \(P-Value\) hanya memberitahu apakah ada efek (signifikan atau tidak), tetapi tidak memberitahu seberapa besar efeknya. Contoh: Kita bisa tahu obat A berbeda dengan obat B (\(P-Value\) kecil), tapi bedanya mungkin hanya sembuh 1 detik lebih cepat (effect size kecil, tidak penting secara bisnis).
Tentang Penulis
Morris Alexander Pangaribuan, Mahasiswa di Institut Teknologi
Sains Bandung