CONFIDENCE INTERVAL
Assigment ~ Week 13
1 The first case study
Confidence Interval untuk Mean, σ Diketahui
Sebuah platform e-commerce ingin memperkirakan rata-rata jumlah transaksi harian per pengguna setelah meluncurkan fitur baru. Berdasarkan data historis skala besar, simpangan baku populasi diketahui.
σ = 3.2 (simpangan baku populasi) n = 100 (ukuran sampel) x̄ = 12.6 (rata-rata sampel)
Tugas
Identifikasi uji statistik yang tepat dan berikan alasan pemilihannya.
Hitung Confidence Interval untuk:
- 90%
- 95%
- 99%
Buat visualisasi perbandingan dari ketiga confidence interval tersebut.
Interpretasikan hasilnya dalam konteks business analytics.
1.1 Uji Statistik yang Digunakan dan Alasan
Kita menggunakan Confidence Interval (CI) dengan distribusi Z (Normal) karena:
Alasan:
- Simpangan baku populasi (σ) sudah diketahui = 3.2
- Ukuran sampel besar (n = 100)
- Kita ingin memperkirakan rata-rata transaksi seluruh pengguna (populasi) berdasarkan data sampel
Rumus Confidence Interval:
\[ CI = \bar{x} \ \pm \ Z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \]
di mana:
- \(\bar{x}\) = rata-rata sampel (12.6)
- \(Z_{\alpha/2}\) = nilai Z dari tabel distribusi normal
- \(\sigma\) = simpangan baku populasi (3.2)
- \(n\) = ukuran sampel (100)
1.2 Perhitungan Confidence Interval
Data yang diketahui:
\[ \sigma = 3.2, \quad n = 100, \quad \bar{x} = 12.6 \]
Standard Error adalah simpangan baku dari distribusi rata-rata sampel:
\[ SE = \frac{\sigma}{\sqrt{n}} = \frac{3.2}{\sqrt{100}} = \frac{3.2}{10} = 0.32 \]
a. 90% Confidence Interval
- Tingkat kepercayaan 90% → α = 0.10 → α/2 = 0.05
- Nilai Z dari tabel: \(Z_{0.05} = 1.645\) \[ ME = Z \times SE = 1.645 \times 0.32 = 0.5264 \] \[ \begin{aligned} \text{Batas Bawah} &= \bar{x} - ME = 12.6 - 0.5264 = 12.0736 \\ \text{Batas Atas} &= \bar{x} + ME = 12.6 + 0.5264 = 13.1264 \end{aligned} \] 90% CI = (12.07, 13.13)
b. 95% Confidence Interval
- Tingkat kepercayaan 95% → α = 0.05 → α/2 = 0.025
- Nilai Z dari tabel: \(Z_{0.025} = 1.96\) \[ ME = Z \times SE = 1.96 \times 0.32 = 0.6272 \] \[ \begin{aligned} \text{Batas Bawah} &= 12.6 - 0.6272 = 11.9728 \\ \text{Batas Atas} &= 12.6 + 0.6272 = 13.2272 \end{aligned} \] 95% CI = (11.97, 13.23)
c. 99% Confidence Interval
- Tingkat kepercayaan 99% → α = 0.01 → α/2 = 0.005
- Nilai Z dari tabel: \(Z_{0.005} = 2.576\) \[ ME = Z \times SE = 2.576 \times 0.32 = 0.82432 \] \[ \begin{aligned} \text{Batas Bawah} &= 12.6 - 0.82432 = 11.77568 \\ \text{Batas Atas} &= 12.6 + 0.82432 = 13.42432 \end{aligned} \] 99% CI = (11.78, 13.42)
Ringkasan Hasil Perhitungan:
| Tingkat Kepercayaan | Z-Score | Margin Error (±) | Confidence Interval |
|---|---|---|---|
| 90% | 1.645 | 0.53 | (12.07, 13.13) |
| 95% | 1.960 | 0.63 | (11.97, 13.23) |
| 99% | 2.576 | 0.82 | (11.78, 13.42) |
1.3 Visualisasi Perbandingan CI
1.4 Hasil Analisis Performa Fitur Baru Platform E-commerce
Dari 100 pengguna sampel, rata-rata transaksi harian tercatat 12.6 transaksi menghasilkan estimasi berikut:
Tingkat Kepercayaan 90%: Rata-rata transaksi sebenarnya berada antara 12.07 hingga 13.13 transaksi dengan margin error ±0.53. Artinya, jika penelitian ini diulang 100 kali, 90 kali hasilnya akan jatuh dalam rentang ini.
Tingkat Kepercayaan 95% (standar industri): Rentang estimasi lebih luas menjadi 11.97 hingga 13.23 transaksi dengan margin error ±0.63. Tingkat kepercayaan ini memberikan keseimbangan optimal antara keyakinan dan presisi.
Tingkat Kepercayaan 99%: Untuk kepastian maksimal, estimasi berada antara 11.78 hingga 13.42 transaksi dengan margin error ±0.82.
1.5 Interpretasi Bisnis
Hasil analisis menunjukkan indikasi positif terhadap efektivitas fitur baru. Bahkan pada tingkat kepercayaan tertinggi (99%), batas bawah estimasi masih mencapai 11.78 transaksi, yang secara logika bisnis kemungkinan lebih tinggi dari performa sebelum implementasi fitur.
Implikasi untuk Pengambilan Keputusan:
Validasi Fitur: Data mendukung keberlanjutan fitur baru karena menunjukkan peningkatan atau setidaknya pempertahanaan tingkat transaksi.
Perencanaan Operasional:
- Untuk target harian: gunakan angka 12.6 transaksi
- Untuk proyeksi revenue realistis: gunakan rentang 11.97-13.23 transaksi (95% CI)
- Untuk skenario konservatif: siapkan dengan asumsi 11.78 transaksi (batas bawah 99% CI)
Manajemen Risiko: Margin error yang relatif kecil (±0.63 untuk 95% CI) menunjukkan estimasi yang cukup akurat, mengurangi ketidakpastian dalam perencanaan.
Rekomendasi Strategis
Jangka Pendek: Pertahankan fitur baru dan lakukan monitoring intensif selama 30 hari ke depan untuk memastikan konsistensi pola.
Jangka Menengah: Bandingkan hasil ini dengan data periode sebelumnya untuk mengukur peningkatan secara kuantitatif. Jika tersedia data baseline, uji signifikansi statistik perbedaannya.
Jangka Panjang: Kembangkan fitur berdasarkan feedback pengguna dan analisis segmentasi untuk mengoptimalkan dampaknya terhadap berbagai kelompok pengguna.
Pengukuran Berkelanjutan: Tetapkan sistem tracking yang memantau metrik ini secara rutin, dengan pengambilan sampel periodik untuk memastikan performa tetap terjaga.
1.6 Kesimpulan
Fitur baru platform e-commerce menunjukkan hasil yang menjanjikan dengan estimasi rata-rata transaksi harian per pengguna sebesar 12.6 transaksi. Dengan tingkat kepercayaan 95% yang menjadi standar dalam penelitian bisnis, kami yakin performa sebenarnya berada dalam rentang 11.97 hingga 13.23 transaksi. Rentang yang relatif sempit ini menunjukkan estimasi yang cukup presisi.
Rekomendasi akhir: Lanjutkan implementasi fitur, alokasikan sumber daya untuk optimisasi berdasarkan data pengguna, dan integrasikan metrik ini ke dalam dashboard performa bisnis untuk monitoring berkelanjutan. Hasil ini memberikan dasar yang kuat untuk pengambilan keputusan berbasis data dalam pengembangan produk selanjutnya.
2 The second case study
Confidence Interval untuk Mean, σ Tidak Diketahui
Tim UX Research menganalisis waktu penyelesaian tugas (dalam menit) untuk aplikasi mobile baru. Data dikumpulkan dari 12 pengguna:
8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3
Tasks
Identifikasi uji statistik yang tepat dan jelaskan alasannya.
Hitung Confidence Interval untuk:
- 90%
- 95%
- 99%
Visualisasikan ketiga interval tersebut dalam satu grafik.
Jelaskan bagaimana ukuran sampel dan tingkat kepercayaan memengaruhi lebar interval.
2.1 Identifikasi Uji Statistik
Uji: Confidence Interval menggunakan distribusi t (Student’s t-distribution)
Alasan:
- Simpangan baku populasi (σ) tidak diketahui
- Ukuran sampel kecil (n = 12 < 30)
- Data diasumsikan berasal dari distribusi normal atau mendekati normal
2.2 Perhitungan Dasar
Data: 8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3
a. Jumlah Data (Σx)
\[ \begin{aligned} \Sigma x &= 8.4 + 7.9 + 9.1 + 8.7 + 8.2 + 9.0 + 7.8 + 8.5 + 8.9 + 8.1 + 8.6 + 8.3 \\ &= 101.5 \end{aligned} \]
b. Rata-rata (x̄)
\[ \bar{x} = \frac{\Sigma x}{n} = \frac{101.5}{12} = 8.458333... \approx 8.4583 \]
c. Kuadrat Data (Σx²)
\[ \begin{aligned} \Sigma x^2 &= 8.4^2 + 7.9^2 + 9.1^2 + 8.7^2 + 8.2^2 + 9.0^2 + 7.8^2 \\ &\quad + 8.5^2 + 8.9^2 + 8.1^2 + 8.6^2 + 8.3^2 \\ &= 70.56 + 62.41 + 82.81 + 75.69 + 67.24 + 81.00 + 60.84 \\ &\quad + 72.25 + 79.21 + 65.61 + 73.96 + 68.89 \\ &= 860.47 \end{aligned} \]
d. Simpangan Baku Sampel (s)
\[ \begin{aligned} s &= \sqrt{\frac{n\Sigma x^2 - (\Sigma x)^2}{n(n-1)}} \\ &= \sqrt{\frac{12 \times 860.47 - (101.5)^2}{12 \times 11}} \\ &= \sqrt{\frac{10325.64 - 10302.25}{132}} \\ &= \sqrt{\frac{23.39}{132}} \\ &= \sqrt{0.177197} \\ &= 0.42095 \approx 0.4210 \end{aligned} \]
e. Standard Error (SE)
\[ SE = \frac{s}{\sqrt{n}} = \frac{0.4210}{\sqrt{12}} = \frac{0.4210}{3.4641} = 0.1215 \]
f. Derajat Kebebasan (df)
\[ df = n - 1 = 12 - 1 = 11 \]
2.3 Perhitungan Confidence Interval
Rumus Umum: \[ CI = \bar{x} \pm t_{\alpha/2, df} \times SE \]
a. 90% Confidence Interval
\[ \begin{aligned} \alpha &= 1 - 0.90 = 0.10 \\ \alpha/2 &= 0.05 \\ t_{0.05, 11} &= 1.796 \\ \text{Margin Error} &= 1.796 \times 0.1215 = 0.2182 \\ \text{Lower Limit} &= 8.4583 - 0.2182 = 8.2401 \\ \text{Upper Limit} &= 8.4583 + 0.2182 = 8.6765 \\ 90\%\ CI &= (8.240,\ 8.677) \end{aligned} \]
b. 95% Confidence Interval
\[ \begin{aligned} \alpha &= 1 - 0.95 = 0.05 \\ \alpha/2 &= 0.025 \\ t_{0.025, 11} &= 2.201 \\ \text{Margin Error} &= 2.201 \times 0.1215 = 0.2674 \\ \text{Lower Limit} &= 8.4583 - 0.2674 = 8.1909 \\ \text{Upper Limit} &= 8.4583 + 0.2674 = 8.7257 \\ 95\%\ CI &= (8.191,\ 8.726) \end{aligned} \]
c. 99% Confidence Interval
\[ \begin{aligned} \alpha &= 1 - 0.99 = 0.01 \\ \alpha/2 &= 0.005 \\ t_{0.005, 11} &= 3.106 \\ \text{Margin Error} &= 3.106 \times 0.1215 = 0.3774 \\ \text{Lower Limit} &= 8.4583 - 0.3774 = 8.0809 \\ \text{Upper Limit} &= 8.4583 + 0.3774 = 8.8357 \\ 99\%\ CI &= (8.081,\ 8.836) \end{aligned} \]
2.4 Visualisasi Perbandingan
2.5 Hasil Analisis
Ukuran Sampel (n) yaitu
n = jumlah user yang diuji
Dalam soal: n = 12 user
Tingkat Kepercayaan (CL)? yaitu
CL = seberapa yakin kita dengan hasil Biasanya: 90%, 95%, atau 99%
Kita mengetahui bahwa:
Dengan n = 12 user: Rata-rata waktu: 8.46 menit
Rentang estimasi:
- 90% yakin: 8.24 - 8.68 menit (lebar 0.44 menit)
- 95% yakin: 8.19 - 8.73 menit (lebar 0.54 menit)
- 99% yakin: 8.08 - 8.84 menit (lebar 0.76 menit)
2.5.1 Pengaruh Ukuran Sampel:
Semakin BANYAK user diuji → Rentang semakin SEMPIT
Contoh:
- n = 12 → rentang 0.54 menit (untuk 95% CL)
- n = 48 → rentang ≈ 0.27 menit (2× lebih sempit!)
Dengan data lebih banyak, kita lebih tahu pasti tentang populasi.
2.5.2 Pengaruh Tingkat Kepercayaan:
Semakin TINGGI keyakinan → Rentang semakin LEBAR
Contoh dari hasil kita:
- 90% yakin → rentang 0.44 menit
- 95% yakin → rentang 0.54 menit (lebih lebar 23%)
- 99% yakin → rentang 0.76 menit (lebih lebar 73%)
Jika mau lebih yakin tidak salah, harus kasih ruang lebih lebar untuk jaga-jaga.
Kalau mau rentang Sempit: Pilih Satu:
- Tambah jumlah user (n naik) → Tapi butuh waktu & biaya
- Turunkan tingkat keyakinan (CL turun) → Tapi risiko lebih besar salah
Kalau mau sangat Yakin: Pilih Satu:
- Naikkan tingkat keyakinan (CL naik) → Tapi rentang jadi lebar
- Tambah jumlah user (n naik) → Supaya yakin tapi rentang tetap sempit
2.5.3 Keputusan dari Hasil Kita:
Situasi: Target UX = waktu < 8.5 menit
Dengan hasil kita (n=12):
- 90% CL: Rentang 8.24-8.68 → Batas atas 8.68 > 8.5 (mungkin melebihi)
- 95% CL: Rentang 8.19-8.73 → Batas atas 8.73 > 8.5 (lebih jelas melebihi)
- 99% CL: Rentang 8.08-8.84 → Batas atas 8.84 > 8.5 (sangat jelas melebihi)
Keputusan yang mungkin:
- Dengan 90% CL: “Mungkin masih aman, amati saja”
- Dengan 95% CL: “Kemungkinan melebihi target, perlu perbaikan”
- Dengan 99% CL: “Jelas melebihi target, harus perbaiki sekarang”
Pentikng Untuk UX Research karena:
Problem dengan n = 12:
- Rentang terlalu lebar → susah ambil keputusan pasti
- Beda CL beda kesimpulan → bingung mau pilih yang mana
Solusinya:
Tambah jumlah user
Dengan n lebih besar, rentang akan lebih sempit, dan kesimpulan lebih
jelas, apapun CL-nya.
2.6 Kesimpulan:
Untuk hasil UX Research yang baik:
- Test dengan user cukup banyak (minimal 20-30)
- Pakai 95% CL sebagai standar
- Jangan cuma andalkan CL tinggi kalau data sedikit
Dalam kasus ini:
Karena cuma test 12 user, rentang estimasi lebar. Mau pake CL berapapun,
hasilnya kurang meyakinkan. Solusinya: test lebih banyak user.
3 The third case study
Confidence Interval untuk Proporsi (A/B Testing)
Tim data science menjalankan A/B testing pada desain tombol Call-To-Action (CTA) baru. Hasil eksperimen menunjukkan:
n = 400 (total pengguna) x = 156 (pengguna yang mengklik CTA)
Tasks
Hitung proporsi sampel (p̂).
Hitung Confidence Interval untuk proporsi pada:
- 90%
- 95%
- 99%
Visualisasikan dan bandingkan ketiga interval tersebut.
Jelaskan bagaimana tingkat kepercayaan memengaruhi pengambilan keputusan dalam eksperimen produk.
3.1 Analisis Uji Statistik
Uji: Confidence Interval proporsi menggunakan
distribusi Normal (Z)
Alasan:
- Mengestimasi proporsi populasi (persentase klik)
- Sampel besar (n = 400 > 30)
- Data binomial (klik/tidak klik)
3.2 Perhitungan Dasar:
Data: - n = 400 (total pengguna) - x = 156 (pengguna yang mengklik)
1. Proporsi sampel (p̂): \[ \hat{p} = \frac{x}{n} = \frac{156}{400} = 0.39 = 39\% \]
2. Standard Error (SE): \[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.39 \times 0.61}{400}} = \sqrt{0.00059475} = 0.02439 \]
3.3 Perhitungan Cofidence Interval
a. 90% Confidence Interval:
\[ \begin{aligned} Z_{0.05} &= 1.645 \\ ME &= 1.645 \times 0.02439 = 0.04012 \\ \text{Lower} &= 0.39 - 0.04012 = 0.34988 \\ \text{Upper} &= 0.39 + 0.04012 = 0.43012 \\ 90\%\ CI &= (0.350,\ 0.430) \ \text{atau}\ (35.0\%,\ 43.0\%) \end{aligned} \]
b. 95% Confidence Interval:
\[ \begin{aligned} Z_{0.025} &= 1.96 \\ ME &= 1.96 \times 0.02439 = 0.04780 \\ \text{Lower} &= 0.39 - 0.04780 = 0.34220 \\ \text{Upper} &= 0.39 + 0.04780 = 0.43780 \\ 95\%\ CI &= (0.342,\ 0.438) \ \text{atau}\ (34.2\%,\ 43.8\%) \end{aligned} \]
c. 99% Confidence Interval:
\[ \begin{aligned} Z_{0.005} &= 2.576 \\ ME &= 2.576 \times 0.02439 = 0.06283 \\ \text{Lower} &= 0.39 - 0.06283 = 0.32717 \\ \text{Upper} &= 0.39 + 0.06283 = 0.45283 \\ 99\%\ CI &= (0.327,\ 0.453) \ \text{atau}\ (32.7\%,\ 45.3\%) \end{aligned} \]
3.4 Visualisasi Perbandingan
Yang terlihat:
- Semua rentang simetris di sekitar 39%
- Semakin tinggi CL, semakin lebar rentang
- Target 35% berada di dalam semua rentang
3.5 Analisis Hasil
Situasi: CTR versi lama = 35%
Dengan hasil kita:
90% Confidence Level:
- Rentang: 35.0% - 43.0%
- Batas bawah = 35.0% (tepat di baseline)
- Analisis: Ambigu, tidak jelas lebih baik
- Keputusan: Tidak cukup bukti untuk launch
95% Confidence Level:
- Rentang: 34.2% - 43.8%
- Batas bawah = 34.2% < 35%
- Analisis: Mungkin lebih buruk dari versi lama
- Keputusan: Jangan launch, perlu perbaikan
99% Confidence Level:
- Rentang: 32.7% - 45.3%
- Batas bawah = 32.7% < 35%
- Analisis: Jelas tidak lebih baik
- Keputusan: Pasti tidak launch, pertahankan versi lama
3.6 Aturan Pengambilan Keputusan
Cek posisi baseline (35%):
- Jika seluruh rentang di atas baseline → Lauch (luncurkan)
- Jika seluruh rentang di bawah baseline → Reject (tolak)
- Jika rentang mencakup baseline → Need More Data (butuh data lagi)
Dalam kasus ini:
- 95% CI = 34.2% - 43.8% → mencakup 35%
- Keputusan: Butuh Data Lebih Banyak
3.7 Kesimpulan Untuk Tim Produk
Fakta dari analisis:
- Proporsi klik CTA baru = 39% (terlihat bagus)
- Tapi dengan 95% confidence: hanya bisa jamin 34.2% - 43.8%
- Karena baseline 35% ada di dalam rentang: tidak bisa bilang lebih baik
Keputusan:
JANGAN LAUNCH CTA BARU
Alasan:
- Data tidak cukup kuat untuk buktikan lebih baik dari versi lama
- Ada kemungkinan sebenarnya lebih buruk
- Lebih baik konservatif dalam perubahan produk
Langkah berikut:
- Test dengan lebih banyak pengguna
- Coba varian desain yang berbeda
- Analisis segmentasi pengguna
INTINYA: CTA baru belum terbukti lebih baik secara statistik. Perlu testing lebih lanjut sebelum bisa diputuskan untuk diluncurkan.
4 The fourth case study
Perbandingan Presisi (Z-Test vs t-Test)
Dua tim data mengukur latensi API (dalam milidetik) pada kondisi yang berbeda.
Team A: n = 36 (ukuran sampel) x̄ = 210 (rata-rata sampel) σ = 24 (simpangan baku populasi diketahui)
Team B: n = 36 (ukuran sampel) x̄ = 210 (rata-rata sampel) s = 24 (simpangan baku sampel)
Tasks
Identifikasi uji statistik yang digunakan oleh masing-masing tim.
Hitung Confidence Interval untuk:
- 90%
- 95%
- 99%
Buat visualisasi yang membandingkan seluruh interval.
Jelaskan mengapa lebar interval berbeda, meskipun datanya serupa.
4.1 Analisis Uji Statistik Masing-Masing Tim
TEAM A:
Uji statistik: Z-test menggunakan
distribusi Normal
Alasan: Simpangan baku populasi (σ) diketahui = 24
ms
TEAM B:
Uji statistik: t-test menggunakan
distribusi t-Student
Alasan: Simpangan baku populasi tidak diketahui, hanya
tahu simpangan baku sampel (s) = 24 ms
4.2 Perhitungan Cofidence Interval
Data yang Sama untuk Kedua Tim:
- n = 36 (ukuran sampel)
- x̄ = 210 ms (rata-rata sampel)
- Variabilitas = 24 ms
- Standard Error = 24/√36 = 24/6 = 4.0 ms
1. TEAM A (Z-TEST) - σ DIKETAHUI
90% Confidence Interval:
\[ \begin{aligned} Z_{0.05} &= 1.645 \\ ME &= 1.645 \times 4.0 = 6.58 \text{ ms} \\ LL &= 210 - 6.58 = 203.42 \text{ ms} \\ UL &= 210 + 6.58 = 216.58 \text{ ms} \\ 90\%\ CI &= (203.42,\ 216.58) \text{ ms} \end{aligned} \]
95% Confidence Interval:
\[ \begin{aligned} Z_{0.025} &= 1.96 \\ ME &= 1.96 \times 4.0 = 7.84 \text{ ms} \\ LL &= 210 - 7.84 = 202.16 \text{ ms} \\ UL &= 210 + 7.84 = 217.84 \text{ ms} \\ 95\%\ CI &= (202.16,\ 217.84) \text{ ms} \end{aligned} \]
99% Confidence Interval:
\[ \begin{aligned} Z_{0.005} &= 2.576 \\ ME &= 2.576 \times 4.0 = 10.30 \text{ ms} \\ LL &= 210 - 10.30 = 199.70 \text{ ms} \\ UL &= 210 + 10.30 = 220.30 \text{ ms} \\ 99\%\ CI &= (199.70,\ 220.30) \text{ ms} \end{aligned} \]
2. TEAM B (t-TEST) - σ TIDAK DIKETAHUI
Derajat Kebebasan: df = n - 1 = 36 - 1 = 35
90% Confidence Interval:
\[ \begin{aligned} t_{0.05,35} &= 1.690 \\ ME &= 1.690 \times 4.0 = 6.76 \text{ ms} \\ LL &= 210 - 6.76 = 203.24 \text{ ms} \\ UL &= 210 + 6.76 = 216.76 \text{ ms} \\ 90\%\ CI &= (203.24,\ 216.76) \text{ ms} \end{aligned} \]
95% Confidence Interval:
\[ \begin{aligned} t_{0.025,35} &= 2.030 \\ ME &= 2.030 \times 4.0 = 8.12 \text{ ms} \\ LL &= 210 - 8.12 = 201.88 \text{ ms} \\ UL &= 210 + 8.12 = 218.12 \text{ ms} \\ 95\%\ CI &= (201.88,\ 218.12) \text{ ms} \end{aligned} \]
99% Confidence Interval:
\[ \begin{aligned} t_{0.005,35} &= 2.724 \\ ME &= 2.724 \times 4.0 = 10.90 \text{ ms} \\ LL &= 210 - 10.90 = 199.10 \text{ ms} \\ UL &= 210 + 10.90 = 220.90 \text{ ms} \\ 99\%\ CI &= (199.10,\ 220.90) \text{ ms} \end{aligned} \]
Tabel Perbandingan Hasil
| Confidence Level | Team A (Z-test) CI | Lebar | Team B (t-test) CI | Lebar | Perbedaan Lebar |
|---|---|---|---|---|---|
| 90% | (203.42, 216.58) ms | 13.16 ms | (203.24, 216.76) ms | 13.52 ms | +0.36 ms |
| 95% | (202.16, 217.84) ms | 15.68 ms | (201.88, 218.12) ms | 16.24 ms | +0.56 ms |
| 99% | (199.70, 220.30) ms | 20.60 ms | (199.10, 220.90) ms | 21.80 ms | +1.20 ms |
4.3 Visualisasi Perbandingan
Pola yang Terlihat:
- CI Team B selalu lebih lebar dari Team A
- Semakin tinggi CL, semakin besar perbedaannya
- Semua CI simetris di sekitar 210 ms
4.4 Analisis Mengapa Lebar Interval Berbeda
Penyebab Utama:
1. Informasi yang Berbeda:
- Team A tahu σ populasi → informasi lengkap
- Team B tidak tahu σ, hanya tahu s sampel → informasi terbatas
2. Nilai Kritis yang Berbeda:
Untuk tingkat kepercayaan 90%, Team A menggunakan nilai Z sebesar 1.645, sedangkan Team B menggunakan nilai t sebesar 1.690. Nilai t Team B lebih besar 2.7% dari nilai Z Team A.
Untuk tingkat kepercayaan 95%, Team A menggunakan nilai Z sebesar 1.960, sedangkan Team B menggunakan nilai t sebesar 2.030. Nilai t Team B lebih besar 3.6% dari nilai Z Team A.
Untuk tingkat kepercayaan 99%, Team A menggunakan nilai Z sebesar 2.576, sedangkan Team B menggunakan nilai t sebesar 2.724. Nilai t Team B lebih besar 5.7% dari nilai Z Team A.
3. Distribusi yang Berbeda:
- Team A pakai distribusi Normal → kurva ramping
- Team B pakai distribusi t-Student → kurva lebih gemuk di ekor
4. Tingkat Konservatisme:
- t-test lebih konservatif karena mengakomodasi ketidakpastian
- σ tidak diketahui = ada ketidakpastian tambahan
4.5 Dampak Pada Pengambilan Keputusan
Contoh: Target performa API = maksimal 215 ms Dengan 95% CI:
- Team A (Z): CI = (202.16, 217.84)
- Batas atas = 217.84 ms (> 215)
- Kesimpulan: Mungkin melebihi target
- Keputusan: Monitor saja dulu
- Team B (t): CI = (201.88, 218.12)
- Batas atas = 218.12 ms (lebih tinggi dari Team A)
- Kesimpulan: Lebih jelas melebihi target
- Keputusan: Perlu optimasi segera
Perbedaan keputusan: Team B lebih hati-hati dan konservatif.
4.6 Kesimpulan
Mengapa Lebar Interval Berbeda Meski Data Sama:
- Team A tahu σ populasi → lebih pasti → CI lebih sempit
- Team B tidak tahu σ → ada ketidakpastian → CI lebih lebar
- t-value selalu lebih besar dari Z-value untuk CL yang sama
- Distribusi t lebih konservatif karena mengakomodasi error estimasi
Intinya: Meski data n, x̄, dan variabilitas sama, CI berbeda karena informasi yang dimiliki berbeda. Team A lebih percaya diri karena tahu σ, Team B lebih hati-hati karena hanya estimasi dari sampel.
5 The fifth case study
Confidence Interval Satu Arah (One-Sided)
Sebuah perusahaan Software as a Service (SaaS) ingin memastikan bahwa setidaknya 70% pengguna aktif mingguan menggunakan fitur premium.
Dari hasil eksperimen:
n = 250 (total pengguna) x = 185 (pengguna aktif premium)
Manajemen hanya tertarik pada batas bawah dari estimasi.
Tasks
Identifikasi jenis Confidence Interval dan uji statistik yang sesuai.
Hitung Confidence Interval satu arah (batas bawah) pada:
- 90%
- 95%
- 99%
Visualisasikan batas bawah untuk semua tingkat kepercayaan.
Tentukan apakah target 70% tersebut terpenuhi secara statistik.
5.1 Analisis Uji Statistik
Jenis CI: One-Sided Confidence Interval (Batas
Bawah)
Uji Statistik: Z-test untuk Proporsi
Alasan:
- Hanya perlu tahu batas minimal penggunaan
- Data proporsi (persentase pengguna)
- Sampel besar (n = 250)
- Untuk menjawab “apakah minimal 70%?”
5.2 Perhitungan Dasar
Data:
- n = 250 (total pengguna)
- x = 185 (pengguna aktif premium)
Proporsi Sampel:
\[ \hat{p} = \frac{x}{n} = \frac{185}{250} = 0.74 = 74\% \]
Standard Error:
\[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.74 \times 0.26}{250}} = 0.02774 \]
5.3 Perhitungan Cofidence Interval
A. 90% LOWER BOUND:
\[ \begin{aligned} Z &= 1.282 \\ ME &= 1.282 \times 0.02774 = 0.03556 \\ LB &= 0.74 - 0.03556 = 0.70444 \\ &= 70.4\% \end{aligned} \]
B. 95% LOWER BOUND:
\[ \begin{aligned} Z &= 1.645 \\ ME &= 1.645 \times 0.02774 = 0.04564 \\ LB &= 0.74 - 0.04564 = 0.69436 \\ &= 69.4\% \end{aligned} \]
C. 99% LOWER BOUND:
\[ \begin{aligned} Z &= 2.326 \\ ME &= 2.326 \times 0.02774 = 0.06454 \\ LB &= 0.74 - 0.06454 = 0.67546 \\ &= 67.6\% \end{aligned} \]
| Confidence Level | Z-value | Margin Error | Lower Bound | One-Sided CI |
|---|---|---|---|---|
| 90% | 1.282 | 3.56% | 70.4% | 70.4% - 100% |
| 95% | 1.645 | 4.56% | 69.4% | 69.4% - 100% |
| 99% | 2.326 | 6.45% | 67.6% | 67.6% - 100% |
5.4 Visualisasi Perbandingan
5.5 Analisis Pencapaian Target 70%
Aturan: Target terpenuhi jika 70% ≤ Batas Bawah
90% CONFIDENCE LEVEL:
- Batas Bawah: 70.4%
- 70% ≤ 70.4% ✓
- Status: TERPENUHI
- Keyakinan: 90%
95% CONFIDENCE LEVEL:
- Batas Bawah: 69.4%
- 70% > 69.4% ✗
- Status: TIDAK TERPENUHI
- Keyakinan: 95%
99% CONFIDENCE LEVEL:
- Batas Bawah: 67.6%
- 70% > 67.6% ✗
- Status: JELAS TIDAK TERPENUHI
- Keyakinan: 99%
5.6 Kesimpulan
Target 70% TIDAK TERPENUHI dengan standar 95% CL.
Alasan:
- Proporsi sampel 74% > 70% (terlihat bagus)
- Tapi dengan 95% CL, hanya bisa jamin minimal 69.4%
- Standar industri menggunakan 95% CL
Rekomendasi:
- Laporkan: “Target belum tercapai (minimal 69.4% dengan 95% CL)”
- Analisis mengapa 26% pengguna tidak pakai fitur premium
- Lakukan program peningkatan penggunaan