Program Studi
Sains Data
Universitas
INSTITUT TEKNOLOGI SAINS BANDUNG
Dosen Pengampu
Bakti Siregar, M Sc., CSD
STUDY CASES
Confidence Interval - Week 13
Case Study 1
Confidence Interval for Mean, \(\sigma\) Known: An
e-commerce platform wants to estimate the
average number of daily transactions per user after
launching a new feature. Based on large-scale historical data, the
population standard deviation is known.
\[
\begin{eqnarray*}
\sigma &=& 3.2 \quad \text{(population standard deviation)} \\
n &=& 100 \quad \text{(sample size)} \\
\bar{x} &=& 12.6 \quad \text{(sample mean)}
\end{eqnarray*}
\]
Identify the
appropriate statistical test and justify your choice.
Karena tujuan analisisnya adalah mengestimasi mean populasi
\(\mu\) dan nilai standar deviasi
populasi \(\sigma\) diketahui
(\(\sigma = 3.2\)), maka metode yang
sesuai adalah confidence interval berbasis Z untuk
mean:
\[
\bar{x} \pm z_{\alpha/2} \left(\frac{\sigma}{\sqrt{n}}\right)
\]
Compute the
Confidence Intervals for:
- \(90\%\)
- \(95\%\)
- \(99\%\)
Data:
\[
\sigma = 3.2, \quad n = 100, \quad \bar{x} = 12.6
\]
- Hitung Standard Error (SE):
\[
SE = \frac{\sigma}{\sqrt{n}}
= \frac{3.2}{\sqrt{100}}
= \frac{3.2}{10}
= 0.32
\]
- Rumus CI (karena \(\sigma\)
known → Z):
\[
CI = \bar{x} \pm z_{\alpha/2} \cdot SE
\]
1. Confidence Interval 90%
Nilai kritis: \[
z_{0.95} = 1.645
\]
Margin of Error: \[
ME = 1.645 \times 0.32 = 0.526
\]
CI 90%: \[
12.6 \pm 0.526 \;\Rightarrow\; (12.074,\; 13.126)
\]
2. Confidence Interval 95%
Nilai kritis: \[
z_{0.975} = 1.960
\]
Margin of Error: \[
ME = 1.960 \times 0.32 = 0.627
\]
CI 95%: \[
12.6 \pm 0.627 \;\Rightarrow\; (11.973,\; 13.227)
\]
3. Confidence Interval 99%
Nilai kritis: \[
z_{0.995} = 2.576
\]
Margin of Error: \[
ME = 2.576 \times 0.32 \approx 0.824
\]
CI 99%: \[
12.6 \pm 0.824 \;\Rightarrow\; (11.776,\; 13.424)
\]
comparison
visualization of the three confidence intervals.

Interpret the
results in a business analytics context.
Visualisasi ini menunjukkan perkiraan rata-rata transaksi
harian per user berada di sekitar \(\bar{x} = 12.6\) (garis vertikal/titik
tengah).lalu tiga confidence interval (garis horizontal) memberi rentang
nilai mean populasi yang masuk akal. yaitu: - CL 90% =
(12.074, 13.126) paling sempit. - CL 95%
= (11.973, 13.227) lebih lebar. - CL
99% = (11.776, 13.424) paling lebar.
Intinya, semakin tinggi tingkat
kepercayaan, rentang makin melebar karena kita
ingin “lebih yakin” mean sebenarnya ada di dalam rentang
itu.
jadi, toleransi ketidakpastian
diperbesar. akibatnya 90% paling presisi tapi kurang
konservatif, sedangkan 99% paling aman/konservatif tapi
paling tidak presisi.
Case Study 2
Confidence Interval for Mean, \(\sigma\) Unknown: A UX
Research team analyzes task completion time (in
minutes) for a new mobile application. The data are collected
from 12 users:
\[
8.4,\; 7.9,\; 9.1,\; 8.7,\; 8.2,\; 9.0,\;
7.8,\; 8.5,\; 8.9,\; 8.1,\; 8.6,\; 8.3
\]
Identify the
appropriate statistical test
Metode yang tepat adalah confidence interval berbasis
distribusi t (one-sample t-interval) untuk mean, karena yang
ingin diestimasi adalah rata-rata populasi waktu
penyelesaian tugas, sementara standar deviasi populasi (σ) tidak
diketahui sehingga harus diganti dengan standar deviasi
sampel (s), dan ukuran sampel juga kecil (n =
12) sehingga pendekatan yang paling sesuai menggunakan
t-Student dengan derajat bebas df = 11.
Compute the
Confidence Intervals for:
- \(90\%\)
- \(95\%\)
- \(99\%\)
Data:
\[
n = 12,\quad df = n - 1 = 11
\]
\[
x = (8.4,\; 7.9,\; 9.1,\; 8.7,\; 8.2,\; 9.0,\; 7.8,\; 8.5,\; 8.9,\;
8.1,\; 8.6,\; 8.3)
\]
- Hitung rata-rata sampel (\(\bar{x}\)):
\[
\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} = 8.4583
\]
- Hitung standar deviasi sampel (\(s\)):
\[
s = 0.4209
\]
- Hitung Standard Error (SE):
\[
SE = \frac{s}{\sqrt{n}}
= \frac{0.4209}{\sqrt{12}}
= 0.1215
\]
- Rumus CI (karena \(\sigma\)
unknown \(\rightarrow\) pakai
distribusi t):
\[
CI = \bar{x} \pm t_{\alpha/2,\,df} \cdot SE
\]
1. Confidence Interval 90%
Nilai kritis: \[
t_{0.95,\,11} = 1.796
\]
Margin of Error: \[
ME = 1.796 \times 0.1215 = 0.2182
\]
CI 90%: \[
8.4583 \pm 0.2182 \;\Rightarrow\; (8.2401,\; 8.6766)
\]
2. Confidence Interval 95%
Nilai kritis: \[
t_{0.975,\,11} = 2.201
\]
Margin of Error: \[
ME = 2.201 \times 0.1215 = 0.2675
\]
CI 95%: \[
8.4583 \pm 0.2675 \;\Rightarrow\; (8.1909,\; 8.7258)
\]
3.Confidence Interval 99%
Nilai kritis: \[
t_{0.995,\,11} = 3.106
\]
Margin of Error: \[
ME = 3.106 \times 0.1215 = 0.3774
\]
CI 99%: \[
8.4583 \pm 0.3774 \;\Rightarrow\; (8.0809,\; 8.8357)
\]
Visualize the
three intervals on a single plot.

Explain
sample size and confidence level influence the interval
width.
Lebar confidence interval untuk mean (\(\sigma\) unknown) ditentukan oleh:
\[
CI = \bar{x} \pm t_{\alpha/2,\,df}\left(\frac{s}{\sqrt{n}}\right)
\]
Jadi “lebar” CI bergantung pada dua hal utama:
(1) Sample size
Kalau \(n\) makin
besar, maka \(\dfrac{s}{\sqrt{n}}\) (standard
error) makin kecil. \(\rightarrow\) interval makin sempit (lebih
presisi).
Kalau \(n\)
kecil (kayak di kasus ini \(n =
12\)), standard error masih relatif besar \(\rightarrow\) interval lebih
lebar.
(2) Confidence level (90% vs 95% vs 99%)
Semakin tinggi confidence level, nilai kritis
\(t_{\alpha/2,\,df}\) makin besar \(\rightarrow\) interval makin
lebar.
Makanya urutannya selalu: \[
\text{CI 90\% (paling sempit)}
< \text{ CI 95\% }
< \text{ CI 99\% (paling lebar)}
\]
Intinya: \(n\)
besar bikin CI menyempit, sedangkan confidence level tinggi bikin CI
melebar (lebih aman tapi kurang presisi).
Case Study 3
Confidence Interval for a Proportion, A/B Testing: A
data science team runs an A/B test on a new
Call-To-Action (CTA) button design. The experiment yields:
\[
\begin{eqnarray*}
n &=& 400 \quad \text{(total users)} \\
x &=& 156 \quad \text{(users who clicked the CTA)}
\end{eqnarray*}
\]
Compute the
sample proportion \(\hat{p}\).
Diketahui:
\[
n = 400 \quad \text{(total users)}
\] \[
x = 156 \quad \text{(users yang klik CTA)}
\]
Proporsi sampel:
\[
\hat{p} = \frac{x}{n} = \frac{156}{400} = 0.39
\]
Jadi sample proportion / CTR sampel = 0.39 (atau 39%).
- Compute Confidence Intervals for the proportion at:
- \(90\%\)
- \(95\%\)
- \(99\%\)
Data:
\[
n = 400,\quad x = 156,\quad \hat{p} = \frac{156}{400} = 0.39
\]
- Hitung Standard Error (SE) untuk proporsi:
\[
SE = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}
= \sqrt{\frac{0.39(1 - 0.39)}{400}}
= \sqrt{\frac{0.39 \cdot 0.61}{400}}
= \sqrt{\frac{0.2379}{400}}
= \sqrt{0.00059475}
\approx 0.0244
\]
\[
CI = \hat{p} \pm z_{\alpha/2} \cdot SE
\]
1. Confidence Interval 90%
Nilai kritis: \[
z_{0.95} = 1.645
\]
Margin of Error: \[
ME = 1.645 \times 0.0244 = 0.0401
\]
CI 90%: \[
0.39 \pm 0.0401 \;\Rightarrow\; (0.3499,\; 0.4301)
\]
2. Confidence Interval 95%
Nilai kritis: \[
z_{0.975} = 1.960
\]
Margin of Error: \[
ME = 1.960 \times 0.0244 = 0.0478
\]
CI 95%: \[
0.39 \pm 0.0478 \;\Rightarrow\; (0.3422,\; 0.4378)
\]
3. Confidence Interval 99%
Nilai kritis: \[
z_{0.995} = 2.576
\]
Margin of Error: \[
ME = 2.576 \times 0.0244 = 0.0628
\]
CI 99%: \[
0.39 \pm 0.0628 \;\Rightarrow\; (0.3272,\; 0.4528)
\]
Visualize and
compare the three intervals.

Explain
confidence level affects decision-making in product
experiments.
Dalam eksperimen produk (misalnya A/B testing CTA),
confidence level menentukan seberapa “ketat” kita saat
menyimpulkan CTR sebenarnya. Dari visualisasi, terlihat bahwa
CI 90% paling sempit, CI 95% lebih
lebar, dan CI 99% paling lebar. artinya
semakin tinggi confidence level, semakin lebar rentang CTR yang
dianggap masuk akal, karena kita ingin keyakinan yang
lebih tinggi.
Rekomendasi untuk pengambilan keputusan:
Confidence level tinggi (99%) → interval lebih
lebar → keputusan lebih konservatif/aman (risiko salah klaim lebih
kecil), tetapi bisa lebih sering “belum cukup bukti” untuk
mengambil keputusan cepat.
Confidence level lebih rendah (90%) → interval
lebih sempit → keputusan lebih cepat dan responsif, tetapi
risikonya lebih besar dibanding 95%/99%.
Rekomendasi:
Untuk keputusan high-risk (rollout besar, dampak revenue
besar, biaya tinggi) → lebih cocok pakai 95%–99%.
Untuk keputusan low-risk (iterasi UI kecil, eksplorasi
awal) → 90%–95% biasanya sudah cukup.
Case Study 4
Precision Comparison (Z-Test vs t-Test): Two data
teams measure API latency (in milliseconds) under
different conditions.
\[\begin{eqnarray*}
\text{Team A:} \\
n &=& 36 \quad \text{(sample size)} \\
\bar{x} &=& 210 \quad \text{(sample mean)} \\
\sigma &=& 24 \quad \text{(known population standard deviation)}
\\[6pt]
\text{Team B:} \\
n &=& 36 \quad \text{(sample size)} \\
\bar{x} &=& 210 \quad \text{(sample mean)} \\
s &=& 24 \quad \text{(sample standard deviation)}
\end{eqnarray*}\]
Identify the
statistical test used by each team.
Team A menggunakan Z confidence
interval untuk mean karena standar deviasi populasi
diketahui (\(\sigma =
24\)).
Sedangkan Team B menggunakan t confidence
interval untuk mean karena standar deviasi populasi
tidak diketahui dan digantikan oleh standar deviasi sampel
(\(s = 24\)) dengan derajat bebas \(df = n - 1 = 35\).
Compute
Confidence Intervals for 90%, 95%, and 99%.
Data
Team A: \(n = 36,\
\bar{x} = 210,\ \sigma = 24\) (\(\sigma\) diketahui)
Team B: \(n = 36,\
\bar{x} = 210,\ s = 24\) (\(\sigma\) tidak diketahui)
Standard error (keduanya sama):
\[
SE = \frac{24}{\sqrt{36}} = \frac{24}{6} = 4
\]
Team A (Z-interval, \(\sigma\) known)
\[
CI = \bar{x} \pm z_{\alpha/2} \cdot SE
\]
90%: \[
210 \pm 1.645(4)
\;\Rightarrow\;
(203.421,\; 216.579)
\]
95%: \[
210 \pm 1.960(4)
\;\Rightarrow\;
(202.160,\; 217.840)
\]
99%: \[
210 \pm 2.576(4)
\;\Rightarrow\;
(199.696,\; 220.304)
\]
Team B (t-interval, \(\sigma\) unknown, \(df = 35\))
\[
CI = \bar{x} \pm t_{\alpha/2,35} \cdot SE
\]
90%: \[
210 \pm 1.690(4)
\;\Rightarrow\;
(203.242,\; 216.758)
\]
95%: \[
210 \pm 2.030(4)
\;\Rightarrow\;
(201.880,\; 218.120)
\]
99%: \[
210 \pm 2.724(4)
\;\Rightarrow\;
(199.105,\; 220.895)
\]
Visualization
comparing all intervals.

Explain why
the interval widths differ, even with similar data.
Meskipun Team A dan Team B punya ringkasan data yang terlihat
sama (\(n = 36\), \(\bar{x} = 210\), dan ukuran sebaran 24),
lebar intervalnya tetap berbeda karena sumber
ketidakpastiannya beda. Team A memakai Z-interval karena \(\sigma\) populasi benar-benar
diketahui, sehingga ketidakpastian hanya berasal dari proses
sampling.
Sementara itu Team B memakai t-interval karena \(\sigma\) tidak diketahui dan harus
diperkirakan dari sampel (pakai \(s\)),
sehingga ada ketidakpastian tambahan.
Akibatnya, nilai kritis distribusi t untuk level
kepercayaan yang sama sedikit lebih besar daripada nilai
z, sehingga margin of error menjadi lebih besar dan
interval Team B jadi lebih lebar.
Jadi, perbedaan lebar interval terutama karena
t-interval lebih konservatif saat \(\sigma\) tidak diketahui.
Case Study 5
One-Sided Confidence Interval: A Software as
a Service (SaaS) company wants to ensure that at least
70% of weekly active users utilize a premium feature.
From the experiment:
\[
\begin{eqnarray*}
n &=& 250 \quad \text{(total users)} \\
x &=& 185 \quad \text{(active premium users)}
\end{eqnarray*}
\]
Management is only interested in the lower bound of
the estimate.
Identify the type of
Confidence Interval and the appropriate test.
Case Study 5 menggunakan confidence interval satu sisi
(one-sided) dengan fokus pada batas bawah itu sebagai proporsi
pengguna aktif yang memakai fitur premium.
Metode yang tepat adalah , karena parameter yang diestimasi
adalah proporsi \(p\) dan ukuran sampel
cukup besar (\(n = 250\))
sehingga pendekatan normal dapat digunakan.
Karena perusahaan ingin memastikan “minimal 70%”,
analisis ini juga sejalan dengan pengujian satu arah untuk target, yaitu
\[
H_0 : p \le 0.70
\quad \text{versus} \quad
H_1 : p > 0.70.
\]
Compute the
one-sided lower Confidence Interval
- \(90\%\)
- \(95\%\)
- \(99\%\)
Data:
\[
n = 250,\quad x = 185,\quad \hat{p} = \frac{x}{n} = \frac{185}{250} =
0.74
\]
- Hitung Standard Error (SE) proporsi:
\[
SE = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}
= \sqrt{\frac{0.74(1 - 0.74)}{250}}
= \sqrt{\frac{0.74 \cdot 0.26}{250}}
= \sqrt{0.0007696}
\approx 0.02774
\]
- Rumus one-sided lower CI (Z):
Pada confidence interval dua sisi, kita biasanya menghitung dua
batas:
\[
CI = \hat{p} \pm z_{\alpha/2} \cdot SE
\]
Namun pada kasus ini manajemen hanya tertarik pada
batas bawah (“minimal proporsinya berapa”).
Karena itu digunakan , sehingga kita hanya menghitung batas
bawah yang dinotasikan dengan \(L\), di mana \(L\) adalah singkatan dari (batas
bawah).
Untuk confidence level \(C\), batas
bawah one-sided ditulis:
\[
L = \hat{p} - z_C \cdot SE
\]
dan interval one-sided dapat dituliskan sebagai:
\[
(L,\, 1)
\]
karena nilai proporsi maksimum adalah 1.
1. One-sided lower CI 90%
Nilai kritis: \[
z_{0.90} = 1.282
\]
Margin of Error: \[
ME = 1.282 \times 0.02774 = 0.03555
\]
Lower bound 90%: \[
L = 0.74 - 0.03555 = 0.70445
\]
Jadi one-sided lower CI 90%: \[
(0.70445,\; 1)
\]
2. One-sided lower CI 95%
Nilai kritis: \[
z_{0.95} = 1.645
\]
Margin of Error: \[
ME = 1.645 \times 0.02774 = 0.04563
\]
Lower bound 95%: \[
L = 0.74 - 0.04563 = 0.69437
\]
Jadi one-sided lower CI 95%: \[
(0.69437,\; 1)
\]
Visualize the
lower bounds for all confidence levels.

Determine whether the
70% target is statistically satisfied.
Untuk menentukan apakah target 70% “terpenuhi secara
statistik”, kita bandingkan batas bawah (lower bound) one-sided
CI dengan 0.70. Jika \(L \ge
0.70\), maka kita bisa yakin (sesuai tingkat confidence)
bahwa proporsi sebenarnya setidaknya 70%.
Dari hasil yang sudah dihitung:
Lower bound 90%: \[
L_{90} = 0.70445
\] lebih besar dari 0.70 \(\Rightarrow\) target pada 90%
confidence.
Lower bound 95%: \[
L_{95} = 0.69437
\] lebih kecil dari 0.70 \(\Rightarrow\) target pada 95%
confidence.
Lower bound 99%: \[
L_{99} = 0.67546
\] lebih kecil dari 0.70 \(\Rightarrow\) target pada 99%
confidence.
Kesimpulannya, target 70% hanya dapat dinyatakan
terpenuhi secara statistik pada tingkat kepercayaan 90%, tetapi tidak
terpenuhi jika perusahaan mensyaratkan keyakinan yang lebih ketat
seperti 95% atau 99%.
