Study Cases
Confidence Interval ~ Week 13
Naisya Hafizh Mufidah
NIM = 52250040
Dosen Pengampu = Mr. Bakti Siregar, M.Sc., CDS.
1 Case Study 1
Confidence Interval for Mean, \(\sigma\) Known: An e-commerce platform wants to estimate the average number of daily transactions per user after launching a new feature. Based on large-scale historical data, the population standard deviation is known.
\[ \begin{eqnarray*} \sigma &=& 3.2 \quad \text{(population standard deviation)} \\ n &=& 100 \quad \text{(sample size)} \\ \bar{x} &=& 12.6 \quad \text{(sample mean)} \end{eqnarray*} \]
Tasks
- Identify the appropriate statistical test and justify your choice.
- Compute the Confidence Intervals for:
- \(90\%\)
- \(95\%\)
- \(99\%\)
- Create a comparison visualization of the three confidence intervals.
- Interpret the results in a business analytics context.
1.1 Jawaban
1.1.1 Identify the appropriate statistical test.
Uji statistik yang tepat adalah confidence interval untuk mean berbasis distribusi Z, karena:
- Standar deviasi populasi diketahui (σ = 3,2),
- Ukuran sampel cukup besar (n = 100)
1.1.2 Compute the Confidence Intervals, Create a Visualization and Interpretation.
Diketahui:
\[ \begin{eqnarray*} \sigma &=& 3.2 \quad \text{(Standar Deviasi Populasi)} \\ n &=& 100 \quad \text{(Ukuran Sampel)} \\ \bar{x} &=& 12.6 \quad \text{(Rata-rata Sampel)} \end{eqnarray*} \]
Nilai α \[ \alpha = 1 - 0.90 = 0.10 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.05} \approx 1.645 \]
Standard Error \[ SE = \frac{\sigma}{\sqrt{n}} = \frac{3.2}{\sqrt{100}} = 0.32 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 1.645 \times 0.32 \approx 0.526 \]
Lower & Upper Confidence Limit \[ LCL = \bar{x} - ME = 12.6 - 0.526 = 12.07 \]
Visualisasi
Interpretasi
Pada tingkat kepercayaan 90%, rata-rata transaksi harian per pengguna berada di kisaran 12,07 hingga 13,13 transaksi. Rentang ini cukup sempit, sehingga cocok untuk analisis cepat atau evaluasi awal fitur baru.
Nilai α \[ \alpha = 1 - 0.95 = 0.05 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.025} \approx 1.96 \]
Standard Error \[ SE = \frac{\sigma}{\sqrt{n}} = \frac{3.2}{\sqrt{100}} = 0.32 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 1.96 \times 0.32 \approx 0.627 \]
Lower & Upper Confidence Limit \[ LCL = 12.6 - 0.627 = 11.97 \]
Visualisasi
Interpretasi
Nilai α \[ \alpha = 1 - 0.99 = 0.01 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.005} \approx 2.575 \]
Standard Error \[ SE = \frac{\sigma}{\sqrt{n}} = \frac{3.2}{\sqrt{100}} = 0.32 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 2.575 \times 0.32 = 0.824 \]
Lower & Upper Confidence Limit \[ LCL = 12.6 - 0.824 = 11.78 \]
Visualisasi
Interpretasi
1.1.3 Kesimpulan
2 Case Study 2
Confidence Interval for Mean, \(\sigma\) Unknown: A UX Research team analyzes task completion time (in minutes) for a new mobile application. The data are collected from 12 users:
\[ 8.4,\; 7.9,\; 9.1,\; 8.7,\; 8.2,\; 9.0,\; 7.8,\; 8.5,\; 8.9,\; 8.1,\; 8.6,\; 8.3 \]
Tasks:
- Identify the appropriate statistical test and explain why.
- Compute the Confidence Intervals for:
- \(90\%\)
- \(95\%\)
- \(99\%\)
- Visualize the three intervals on a single plot.
- Explain how sample size and confidence level influence the interval width.
2.1 Jawaban
2.1.1 Identify the appropriate statistical test and explain why.
Uji statistik yang tepat adalah confidence interval untuk mean menggunakan distribusi t (uji t satu sampel). Hal ini karena penelitian bertujuan untuk:
- Memperkirakan rata-rata waktu penyelesaian tugas dari satu kelompok pengguna.
- Selain itu, simpangan baku populasi tidak diketahui.
- Jumlah sampel relatif kecil (12 pengguna).
2.1.2 Compute the Confidence intervals.
Diketahui:
\[ n = 12 \quad \text{(Ukuran Sampel)} \] - Cari Mean
\[ \bar{x} = \frac{\sum x_i}{n} \quad \text{(Rata-rata Sampel)} \] \[ \bar{x} = \frac{8.4+\; 7.9+\; 9.1+\; 8.7+\; 8.2+\; 9.0+\; 7.8+\; 8.5+\; 8.9+\; 8.1+\; 8.6+\; 8.3}{12} \] \[ \bar{x} = 8.46 \]
- Cari Standar Deviasi Sampel
\[ s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n - 1}} \quad \text{(Standar Deviasi)} \] \[ \begin{eqnarray*} x_1 - \bar{x} &=& 8.4 - 8.46 = (-0.06)^2 &=& 0.0036 \\ x_2 - \bar{x} &=& 7.9 - 8.46 = (-0.56)^2 &=& 0.3136 \\ x_3 - \bar{x} &=& 9.1 - 8.46 = (0.64)^2 &=& 0.4096 \\ x_4 - \bar{x} &=& 8.7 - 8.46 = (0.24)^2 &=& 0.0576 \\ x_5 - \bar{x} &=& 8.2 - 8.46 = (-0.26)^2 &=& 0.0676 \\ x_6 - \bar{x} &=& 9.0 - 8.46 = (0.54)^2 &=& 0.2916\\ x_7 - \bar{x} &=& 7.8 - 8.46 = (-0.66)^2 &=& 0.4356\\ x_8 - \bar{x} &=& 8.5 - 8.46 = (0.04)^2 &=& 0.0016 \\ x_9 - \bar{x} &=& 8.9 - 8.46 = (0.44)^2 &=& 0.1936\\ x_{10} - \bar{x} &=& 8.1 - 8.46 = (-0.36)^2 &=& 0.1296\\ x_{11} - \bar{x} &=& 8.6 - 8.46 = (0.14)^2 &=& 0.0196\\ x_{12} - \bar{x} &=& 8.3 - 8.46 = (-0.16)^2 &=& 0.0256 \end{eqnarray*} \]
\[ \sum_{i=1}^{12} (x_i - \bar{x})^2 \approx 1.9492 \]
\[ \frac{\sum (x_i - \bar{x})^2}{n - 1} = \frac{1.949}{11} \approx 0.1772 \]
\[ s = \sqrt{0.1772} \approx 0.42 \]
Artinya: waktu pengguna rata-rata menyimpang sekitar 0.42 menit dari mean.
- Menghitung Derajat Bebas (degrees of freedom)
\[ df = n - 1 \] \[ df = 12 - 1 \] \[ df = 11 \]
Nilai α \[ \alpha = 1 - 0.90 = 0.10 \]
Nilai \(t\) (t-distribution, \(df = 11\)) (Lihat pada tabel t-distribution) \[ t_{\alpha/2} = t_{0.05,\,11} \approx 1.796 \]
Standard Error \[ SE = \frac{s}{\sqrt{n}} = \frac{0.42}{\sqrt{12}} \approx 0.121 \]
Margin of Error \[ ME = t_{\alpha/2} \times SE = 1.796 \times 0.121 \approx 0.217 \]
Lower & Upper Confidence Limit \[ LCL = 8.46 - 0.217 = 8.243 \] \[ UCL = 8.46 + 0.217 = 8.677 \]
Dengan tingkat kepercayaan 90%, rata-rata waktu penyelesaian tugas pengguna diperkirakan berada di antara 8,24 hingga 8,68 menit.
Nilai α \[ \alpha = 1 - 0.95 = 0.05 \]
Nilai \(t\) (t-distribution, \(df = 11\)) (Lihat pada tabel t-distribution) \[ t_{\alpha/2} = t_{0.025,\,11} \approx 2.201 \]
Standard Error \[ SE = \frac{s}{\sqrt{n}} = \frac{0.42}{\sqrt{12}} \approx 0.121 \]
Margin of Error \[ ME = t_{\alpha/2} \times SE = 2.201 \times 0.121 \approx 0.266 \]
Lower & Upper Confidence Limit \[ LCL = 8.46 - 0.266 = 8.194 \] \[ UCL = 8.46 + 0.266 = 8.726 \]
Dengan tingkat kepercayaan 95%, rata-rata waktu penyelesaian tugas pengguna diperkirakan berada di antara 8,19 hingga 8,73 menit.
Nilai α \[ \alpha = 1 - 0.99 = 0.01 \]
Nilai \(t\) (t-distribution, \(df = 11\)) (Lihat pada tabel t-distribution) \[ t_{\alpha/2} = t_{0.005,\,11} \approx 3.106 \]
Standard Error \[ SE = \frac{s}{\sqrt{n}} = \frac{0.42}{\sqrt{12}} \approx 0.121 \]
Margin of Error \[ ME = t_{\alpha/2} \times SE = 3.106 \times 0.121 \approx 0.376 \]
Lower & Upper Confidence Limit \[ LCL = 8.46 - 0.376 = 8.084 \] \[ UCL = 8.46 + 0.376 = 8.836 \]
Dengan tingkat kepercayaan 99%, rata-rata waktu penyelesaian tugas pengguna diperkirakan berada di antara 8,08 hingga 8,84 menit.
2.1.3 Visualize the three intervals on a single plot.
Interpretasi
Grafik menampilkan confidence interval 90%, 95%, dan 99% untuk rata-rata waktu penyelesaian tugas.
Titik pada setiap garis menunjukkan nilai rata-rata sampel.
Panjang garis menunjukkan rentang kemungkinan nilai rata-rata populasi.
Semakin tinggi tingkat kepercayaan, confidence interval semakin lebar.
Interval yang lebih lebar menunjukkan bahwa kita lebih yakin terhadap perkiraan rata-rata, tetapi rentang nilainya menjadi lebih luas.
Confidence interval 90% memiliki rentang paling sempit, sehingga perkiraannya lebih sempit, namun tingkat keyakinannya lebih rendah dibandingkan 95% dan 99%.
2.1.4 Explain how sample size and confidence level influence the interval width.
Ukuran sampel (n)
Semakin besar ukuran sampel, confidence interval semakin sempit, karena rata-rata sampel menjadi lebih stabil dan mendekati rata-rata populasi. Sebaliknya, sampel kecil membuat interval lebih lebar.
Tingkat kepercayaan (confidence level)
Semakin tinggi tingkat kepercayaan (misalnya dari 90% ke 99%), confidence interval semakin lebar, karena dibutuhkan rentang nilai yang lebih luas agar lebih yakin rata-rata populasi berada di dalamnya.
3 Case Study 3
Confidence Interval for a Proportion, A/B Testing: A data science team runs an A/B test on a new Call-To-Action (CTA) button design. The experiment yields:
\[ \begin{eqnarray*} n &=& 400 \quad \text{(total users)} \\ x &=& 156 \quad \text{(users who clicked the CTA)} \end{eqnarray*} \]
Tasks:
- Compute the sample proportion \(\hat{p}\).
- Compute Confidence Intervals for the proportion at:
- \(90\%\)
- \(95\%\)
- \(99\%\)
- Visualize and compare the three intervals.
- Explain how confidence level affects decision-making in product experiments.
3.1 Jawaban
3.1.1 Compute the sample proportion \(\hat{p}\).
Diketahui:\[ \begin{eqnarray*} n &=& 400 \quad \text{(total users)} \\ x &=& 156 \quad \text{(users who clicked the CTA)} \end{eqnarray*} \]
Ditanya:
\[ \hat{p} = \frac{x}{n} \] \[ \hat{p} = \frac{156}{400} \] \[ \hat{p} = 0.39 \]
Jadi, sekitar 39% pengguna mengklik tombol CTA pada eksperimen A/B testing tersebut.
3.1.2 Compute Confidence Intervals and Visualization.
Karena data berupa proporsi dan ukuran sampel cukup besar, maka perhitungan memakai Confidence Interval Proporsi (pendekatan Normal).
- Standard Error (SE) \[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \] \[ SE = \sqrt{\frac{0.39(1-0.39)}{400}} \] \[ SE = \sqrt{0.00059475} \approx{0.02439} \]
Didapat Standard Error \(SE \approx 0.02439\)
Nilai α \[ \alpha = 1 - 0.90 = 0.10 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.05} \approx 1.645 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 1.645 \times 0.0244 \approx 0.0401 \]
Confidence Interval 90% \[ CI_{90\%} = \hat{p} \pm ME = 0.39 \pm 0.0401 \approx (0.35, 0.43) \]
Visualisasi
Interpretasi
- Standard Error (SE) \[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \] \[ SE = \sqrt{\frac{0.39(1-0.39)}{400}} \] \[ SE = \sqrt{0.00059475} \approx{0.02439} \]
Didapat Standard Error \(SE \approx 0.02439\)
Nilai α \[ \alpha = 1 - 0.95 = 0.05 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.025} \approx 1.96 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 1.96 \times 0.0244 \approx 0.0478 \]
Confidence Interval 95% \[ CI_{95\%} = \hat{p} \pm ME = 0.39 \pm 0.0478 \approx (0.34, 0.44) \]
Visualisasi
Interpretasi
- Standard Error (SE) \[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \] \[ SE = \sqrt{\frac{0.39(1-0.39)}{400}} \] \[ SE = \sqrt{0.00059475} \approx{0.02439} \]
Didapat Standard Error \(SE \approx 0.02439\)
Nilai α \[ \alpha = 1 - 0.99 = 0.01 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.005} \approx 2.575 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 2.575 \times 0.0244 \approx 0.0629 \]
Confidence Interval 99% \[ CI_{99\%} = \hat{p} \pm ME = 0.39 \pm 0.0629 \approx (0.33, 0.45) \]
Visualisasi
Interpretasi
3.1.3 Kesimpulan
Interpretasi
Interval semakin melebar seiring meningkatnya level kepercayaan:
- 90% CI: (0.35, 0.43) → paling sempit
- 95% CI: (0.34, 0.44) → lebih lebar
- 99% CI: (0.33, 0.45) → paling lebar
Semua interval mencakup proporsi sampel 0.39, menunjukkan estimasi stabil.
Maknanya secara bisnis / statistik:
Jika kita mau lebih yakin (misal 99%) bahwa proporsi sebenarnya termasuk di dalam interval, kita harus menerima interval yang lebih luas.
Level kepercayaan lebih rendah (90%) memberi interval lebih sempit, tapi risiko “salah” lebih tinggi.
3.1.4 Explain how confidence level affects decision-making in product experiments.
| Tingkat_Kepercayaan | Kelebihan | Kekurangan | Dampak_pada_Keputusan |
|---|---|---|---|
| 90% | Lebih mudah mendeteksi perbedaan kecil | Risiko positif palsu lebih tinggi (Type I error) | Bisa cepat mengambil keputusan meluncurkan sesuatu, tapi berisiko jika efeknya sebenarnya tidak nyata |
| 95% | Standar umum, cukup seimbang | Perlu data lebih untuk deteksi perbedaan kecil | Keputusan lebih aman dan kemumgkinan besar dapat diterima tim/perusahaan |
| 99% | Sangat yakin hasil nyata | Sulit mendeteksi perubahan kecil, perlu lebih banyak pengguna | Keputusan sangat hati-hati; hanya fitur dengan efek kuat yang diterapkan |
Kesimpulannya,
Tingkat kepercayaan tinggi -> keputusan lebih aman dan konservatif.
Tingkat kepercayaan rendah -> keputusan lebih cepat tapi berisiko.
Pemilihan tingkat kepercayaan tergantung pada toleransi risiko, dampak bisnis, dan ukuran sampel.
4 Case Study 4
Precision Comparison (Z-Test vs t-Test): Two data teams measure API latency (in milliseconds) under different conditions.
\[\begin{eqnarray*} \text{Team A:} \\ n &=& 36 \quad \text{(sample size)} \\ \bar{x} &=& 210 \quad \text{(sample mean)} \\ \sigma &=& 24 \quad \text{(known population standard deviation)} \\[6pt] \text{Team B:} \\ n &=& 36 \quad \text{(sample size)} \\ \bar{x} &=& 210 \quad \text{(sample mean)} \\ s &=& 24 \quad \text{(sample standard deviation)} \end{eqnarray*}\]
Tasks
- Identify the statistical test used by each team.
- Compute Confidence Intervals for 90%, 95%, and 99%.
- Create a visualization comparing all intervals.
- Explain why the interval widths differ, even with similar data.
4.1 Jawaban
4.1.1 Identify the statistical test used by each team.
Team A
Diketahui:
- \(n \text{(sample size)} = 36\)
- \(\bar{x} \text{(sample mean)} = 210\)
- \(\sigma \text{(Standar Deviasi Populasi)}= 24\)
Ciri-ciri:
- Mereka mengetahui populasi standar deviasi (\(\sigma\)).
- Sample size (\(n\)) juga lebih dari 30.
- Saat \(\sigma\) diketahui, uji Z (Z-Test) digunakan untuk menguji rata-rata.
Team B
Diketahui:
- \(n \text{(sample size)} = 36\)
- \(\bar{x} \text{(sample mean)} = 210\)
- \(s \text{(Standar Deviasi Populasi)}= 24\)
Ciri-ciri:
- Hanya diketahui standar deviasi sampel (\(s\)), bukan standar deviasi populasi.
- Saat \(\sigma\) tidak diketahui dan kita menggunakan \(s\) dari sampel, uji t (t-Test) digunakan, terutama untuk sampel kecil atau sedang (meskipun \(n = 36\) cukup besar, t-Test tetap sah jika \(\sigma\) tidak diketahui).
4.1.2 Compute Confidence Intervals for 90%, 95%, and 99% and Create a Visualization.
\[Team A\]
Diketahui:
- \(n \text{(sample size)} = 36\)
- \(\bar{x} \text{(sample mean)} = 210\)
- \(\sigma \text{(Standar Deviasi Populasi)}= 24\)
Nilai α \[ \alpha = 1 - 0.90 = 0.10 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.05} \approx 1.645 \]
Standard Error \[ SE = \frac{\sigma}{\sqrt{n}} = \frac{24}{\sqrt{36}} = 4 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 1.645 \times 4 = 6.58 \]
Lower & Upper Confidence Limit \[ LCL = \bar{x} - ME = 210 - 6.58 = 203.42 \]
\[ UCL = \bar{x} + ME = 210 + 6.58 = 216.58 \]
Visualisasi
Interpretasi
Team A 90% yakin bahwa rata-rata latency API berada di antara 203.42 ms hingga 216.58 ms. Interval ini paling sempit, sehingga estimasi paling presisi, tetapi tingkat keyakinannya lebih rendah.
Nilai α \[ \alpha = 1 - 0.95 = 0.05 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.025} \approx 1.96 \]
Standard Error \[ SE = \frac{\sigma}{\sqrt{n}} = \frac{24}{\sqrt{36}} = 4 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 1.96 \times 4 = 7.84 \]
Lower & Upper Confidence Limit \[ LCL = 210 - 7.84 = 202.16 \]
\[ UCL = 210 + 7.84 = 217.84 \]
Visualisasi
Interpretasi
Team A 95% yakin bahwa rata-rata latency API berada di antara 202.16 ms hingga 217.84 ms. Interval ini memberikan keseimbangan terbaik antara keyakinan dan presisi, sehingga paling umum digunakan.
Nilai α \[ \alpha = 1 - 0.99 = 0.01 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{\alpha/2} = Z_{0.005} \approx 2.575 \]
Standard Error \[ SE = \frac{\sigma}{\sqrt{n}} = \frac{24}{\sqrt{36}} = 4 \]
Margin of Error \[ ME = Z_{\alpha/2} \times SE = 2.575 \times 4 = 10.3 \]
Lower & Upper Confidence Limit \[ LCL = 210 - 10.3 = 119.7 \]
\[ UCL = 210 + 10.3 = 220.3 \]
Visualisasi
Interpretasi
Team A 99% yakin bahwa rata-rata latency API berada di antara 199.70 ms hingga 220.30 ms. Interval ini paling lebar, sehingga paling aman, namun estimasinya kurang presisi.
\[Kesimpulan\]
Interpretasi
Grafik menunjukkan bahwa semua confidence interval berpusat pada rata-rata yang sama (210 ms), namun memiliki lebar yang berbeda.
- Interval 90% adalah yang paling sempit, sehingga memberikan estimasi paling presisi tetapi dengan tingkat keyakinan lebih rendah.
- Interval 95% lebih lebar dan memberikan keseimbangan antara presisi dan keyakinan.
- Interval 99% adalah yang paling lebar, menunjukkan tingkat keyakinan tertinggi namun dengan ketidakpastian paling besar.
\[Team B\]
Diketahui:
\(n \text{(sample size)} = 36\)
\(\bar{x} \text{(sample mean)} = 210\)
\(s \text{(Standar Deviasi Populasi)}= 24\)
Cari Standar Error
\[ SE = \frac{\sigma}{\sqrt{n}} = \frac{24}{\sqrt{36}} = 4 \]
- Menghitung Derajat Bebas (degrees of freedom)
\[ df = n - 1 \] \[ df = 36 - 1 \] \[ df = 35 \]
Nilai α \[ \alpha = 1 - 0.90 = 0.10 \]
Nilai \(t\) (t-distribution, \(df = 35\)) (Lihat pada tabel t-distribution) \[ t_{\alpha/2} = t_{0.05,\,35} \approx 1.697 \]
Margin of Error \[ ME = t_{\alpha/2} \times SE = 1.697 \times 4 = 6.788 \]
Lower & Upper Confidence Limit \[ LCL = 210 - 6.788 = 203.212 \] \[ UCL = 210 + 6.788 = 216.788 \]
Visualisasi
Interpretasi
Dengan tingkat kepercayaan 90%, rata-rata waktu penyelesaian tugas populasi diperkirakan berada di antara 203.212 ms hingga 216.788 ms.
Interval ini paling sempit, sehingga estimasinya lebih presisi, tetapi tingkat keyakinannya lebih rendah dibandingkan 95% dan 99%.
Nilai α \[ \alpha = 1 - 0.95 = 0.05 \]
Nilai \(t\) (t-distribution, \(df = 35\)) (Lihat pada tabel t-distribution) \[ t_{\alpha/2} = t_{0.025,\,35} \approx 2.042 \]
Margin of Error \[ ME = t_{\alpha/2} \times SE = 2.042 \times 4 = 8.168 \]
Lower & Upper Confidence Limit \[ LCL = 210 - 8.168 = 201.832 \] \[ UCL = 210 + 8.168 = 218.168 \]
Visualisasi
Interpretasi
Dengan tingkat kepercayaan 95%, rata-rata waktu penyelesaian tugas populasi diperkirakan berada di antara 201.832 ms hingga 218.168 ms.
Interval ini memberikan keseimbangan antara presisi dan tingkat keyakinan, sehingga paling umum digunakan dalam analisis statistik.
Nilai α \[ \alpha = 1 - 0.99 = 0.01 \]
Nilai \(t\) (t-distribution, \(df = 35\)) (Lihat pada tabel t-distribution) \[ t_{\alpha/2} = t_{0.005,\,35} \approx 2.75 \]
Margin of Error \[ ME = t_{\alpha/2} \times SE = 2.75 \times 4 = 11 \]
Lower & Upper Confidence Limit \[ LCL = 210 - 11 = 199 \] \[ UCL = 210 + 11 = 221 \]
Visualisasi
Interpretasi
Dengan tingkat kepercayaan 99%, rata-rata waktu penyelesaian tugas populasi diperkirakan berada di antara 199 ms hingga 221 ms.
Interval ini paling lebar, menunjukkan tingkat keyakinan tertinggi, namun dengan ketidakpastian yang lebih besar.
Kesimpulan
Interpretasi
Grafik menampilkan rentang estimasi rata-rata waktu penyelesaian tugas pada tingkat kepercayaan 90%, 95%, dan 99%.
Seluruh interval berpusat pada rata-rata sampel sebesar 210 ms.
Confidence interval 90% perkiraannya lebih sempit tapi tingkat yakin lebih rendah.
Confidence interval 99% memiliki rentang paling lebar, menunjukkan tingkat keyakinan yang lebih tinggi.
Secara umum, semakin tinggi tingkat kepercayaan, semakin lebar confidence interval.
4.1.3 Explain why the interval widths differ, even with similar data.
Lebar confidence interval berbeda karena tingkat kepercayaan yang digunakan berbeda.
Walaupun data yang dipakai sama (ukuran sampel, rata-rata, dan variasi data), tingkat kepercayaan yang lebih tinggi menuntut cakupan yang lebih luas agar rata-rata populasi benar-benar berada di dalam interval tersebut. Hal ini menyebabkan nilai kritis (Z atau t) menjadi lebih besar, sehingga margin of error meningkat dan interval menjadi lebih lebar.
5 Case Study 5
One-Sided Confidence Interval: A Software as a Service (SaaS) company wants to ensure that at least 70% of weekly active users utilize a premium feature.
From the experiment:
\[ \begin{eqnarray*} n &=& 250 \quad \text{(total users)} \\ x &=& 185 \quad \text{(active premium users)} \end{eqnarray*} \]
Management is only interested in the lower bound of the estimate.
Tasks:
- Identify the type of Confidence Interval and the appropriate test.
- Compute the one-sided lower Confidence Interval at:
- \(90\%\)
- \(95\%\)
- \(99\%\)
- Visualize the lower bounds for all confidence levels.
- Determine whether the 70% target is statistically satisfied.
5.1 Jawaban
5.1.1 Identify the type of Confidence Interval and the appropriate test.
Jenis Confidence Interval yang cocok untuk soal diatas adalah One-Sided (Lower) Confidence Interval untuk proporsi.
Karena:
- Parameternya adalah proporsi (\(p\)).
- Hanya ingin batas bawah (Management is only interested in the lower bound of the estimate).
- Tidak peduli batas atas.
Tes yang sesuai adalah One-sided Z-test untuk proporsi.
Karena:
- Data berupa proporsi.
- Ukuran sampel cukup besar (\(n = 250\)).
- Fokus ke satu arah (apakah ≥ 70%).
5.1.2 Compute the one-sided lower Confidence Interval and Visualization.
Diketahui:
\(n \text{(sample size)} = 250\)
\({x} \text{(active premium users)} = 185\)
Cari Proporsi Sampel
\[ \hat{p} = \frac{x}{n} \] \[ \hat{p} = \frac{185}{250} \] \[ \hat{p} = 0.74 \]
- Cari Standard Error (SE)
\[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \] \[ SE = \sqrt{\frac{0.74(1-0.74)}{250}} \] \[ SE = \sqrt{0.0007696} \approx{0.0277} \]
Nilai α \[ \alpha = 1 - 0.90 = 0.10 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{1- \alpha} \approx 1.289 \]
Margin of Error \[ ME = Z_{1 - \alpha} \times SE = 1.289 \times 0.0277 \approx 0.0357 \]
Lower Bound Confidence 90% \[ LCL = \hat{p} - ME = 0.74 - 0.0357 = 0.7043 \]
Visualisasi
Interpretasi
Pada tingkat kepercayaan 90%, batas bawah confidence interval adalah 70,43%, sehingga target minimal 70% pengguna premium dapat dinyatakan tercapai.
Nilai α \[ \alpha = 1 - 0.95 = 0.05 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{1 - \alpha} \approx 1.645 \]
Margin of Error \[ ME = Z_{1 - \alpha} \times SE = 1.645 \times 0.0277 \approx 0.0456 \]
Lower Bound Confidence 95% \[ LCL = 0.74 - 0.0456 = 0.6944 \]
Visualisasi
Interpretasi
Pada tingkat kepercayaan 95%, batas bawah confidence interval sebesar 69,44%, yang berada di bawah target 70%, sehingga klaim belum dapat dipastikan.
Nilai α \[ \alpha = 1 - 0.99 = 0.01 \]
Nilai Z (Lihat pada tabel Z-distribution) \[ Z_{1 - \alpha} \approx 2.323 \]
Margin of Error \[ ME = Z_{1 - \alpha} \times SE = 2.323 \times 0.0277 \approx 0.0643 \]
Lower & Upper Confidence Limit \[ LCL = 0.74 - 0.0643 = 0.6757 \]
Visualisasi
Interpretasi
Pada tingkat kepercayaan 99%, batas bawah confidence interval sebesar 67,57%, sehingga target tidak dapat didukung oleh data.
5.1.3 Determine whether the 70% target is statistically satisfied.
Evaluasi
- 90% confidence level: dari grafik terlihat bahwa batas paling rendahnya masih di atas 70%, jadi target minimal 70% pengguna premium masih aman.
- 95% confidence level: batas paling rendahnya sudah sedikit di bawah 70%, artinya belum bisa yakin sepenuhnya kalau target tercapai.
- 99% confidence level: batas paling rendahnya jauh di bawah 70%, sehingga tidak cukup bukti untuk bilang target 70% tercapai.
Kesimpulan
- Target 70% hanya dapat diklaim tercapai dengan tingkat keyakinan 90%, tapi jika kita ingin lebih yakin (95% atau 99%), data belum cukup kuat untuk menyatakan target tercapai.
- Artinya, secara statistik, pencapaian target tidak konsisten di semua tingkat kepercayaan.
6 References
[1] Siregar, B. (2025). 8 Confidence Interval in Introduction to Statistics: A Data Science Perspective with R. DScienceLabs. https://bookdown.org/dsciencelabs/intro_statistics/08-Confidence_Interval.html
[2] Holmes, A., Illowsky, B., & Dean, S. (2023). Introductory business statistics (Sec. 8.1). OpenStax. https://openstax.org/books/introductory-business-statistics-2e/pages/8-1-a-confidence-interval-when-the-population-standard-deviation-is-known-or-large-sample-size
[3] OpenStax. (n.d.). 8.2 Confidence interval when the population standard deviation is unknown and small sample case. In Introductory Business Statistics. https://openstax.org/books/introductory-business-statistics-2e/pages/8-2-a-confidence-interval-when-the-population-standard-deviation-is-unknown-and-small-sample-case
[4] Holmes, A., Illowsky, B., & Dean, S. (2017). Introductory business statistics (Sec. 8.3). OpenStax. https://openstax.org/books/introductory-business-statistics/pages/8-3-a-confidence-interval-for-a-population-proportion
[5] Pearson. (n.d.). One-sided confidence interval: A one-sided claim about a population proportion. https://www.pearson.com/channels/statistics/asset/dbf5d3df/one-sided-confidence-interval-a-one-sided-claim-about-a-population-proportion-is