Confidence Interval

Tugas Week 11

Ni.MD Aurora Sekarningrum

Mahasiswa Institut Teknologi Sains Bandung

Prodi: Sains Data

NIM: 5225072

Tanggal: 2025-12-07

R Programming
Statistics
Data Science

1 Case Study 1

Confidence Interval for Mean, σ Known: An e-commerce platform wants to estimate the average number of daily transactions per user after launching a new feature. Based on large-scale historical data, the population standard deviation is known.

Data: \[ \begin{align*} \sigma &= 3.2 \quad \text{(population standard deviation)} \\ n &= 100 \quad \text{(sample size)} \\ \bar{x} &= 12.6 \quad \text{(sample mean)} \end{align*} \]

Tasks

  1. Identify the appropriate statistical test and justify your choice. Z-confidence interval for mean. Justification: σ known, n ≥ 30 (CLT applies), estimating population mean.

  2. Compute the Confidence Intervals for:

  • 90%
  • 95%
  • 99%
  1. Create a comparison visualization of the three confidence intervals.

  2. Interpret the results in a business analytics context.

Jawaban

1.1 Statistical Test Selection and Justification

Uji statistik yang digunakan dalam analisis ini adalah uji Z (Z-confidence interval untuk mean).

Metode ini dipilih karena memenuhi beberapa kriteria berikut:

  • Tujuan analisis adalah mengestimasi rata-rata populasi (rata-rata jumlah transaksi harian per user), bukan membandingkan dua kelompok atau menguji hipotesis.
  • Simpangan baku populasi (σ) sudah diketahui (σ = 3,2), sehingga memenuhi syarat utama penggunaan distribusi Z.
  • Ukuran sampel besar
    \[n = 100 \ge 30\]
    Sehingga asumsi Central Limit Theorem terpenuhi.

Dengan mempertimbangkan hal tersebut, interval kepercayaan berbasis distribusi normal standar (uji Z) merupakan metode yang paling tepat digunakan pada kasus ini.

1.2 Confidence Interval Estimation

Rumus umum Confidence Interval (σ diketahui)

\[CI = \bar{x} \pm z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}\]

Keterangan simbol:

  • \(\bar{x}\) = sample mean (rata-rata sampel)
  • \(z_{\alpha/2}\) = nilai kritis z (batas distribusi normal standar)
  • \(\sigma\) = population standard deviation (standar deviasi populasi, diketahui)
  • \(n\) = sample size (ukuran sampel)

Diketahui :

  • Rata-rata sampel: \(\bar{x} = 12.6\)
  • Standar deviasi populasi: \(\sigma = 3.2\)
  • Ukuran sampel: \(n = 100\)

Langkah 1: Hitung Standard Error (SE) \[SE = \frac{\sigma}{\sqrt{n}} = \frac{3.2}{\sqrt{100}} = \frac{3.2}{10} = 0.32\]

A. Interval Kepercayaan 90%

  1. Nilai kritis Z (\(z_{\alpha/2}\))
    \[\alpha = 1 - 0.90 = 0.10\]
    \[z_{\alpha/2} = z_{0.05} = 1.645\]

  2. Standard Error (SE)
    \[SE = 0.32\]

  3. Margin of Error (ME)
    \[ME = z_{\alpha/2} \times SE = 1.645 \times 0.32 = 0.5264\]

  4. Confidence Interval
    \[\text{Lower bound} = \bar{x} - ME = 12.6 - 0.5264 = 12.0736\]
    \[\text{Upper bound} = \bar{x} + ME = 12.6 + 0.5264 = 13.1264\]
    90% CI = [12.0736, 13.1264]

B. Confidence Interval 95%

  1. Nilai kritis Z (\(z_{\alpha/2}\))
    \[\alpha = 1 - 0.95 = 0.05\]
    \[z_{\alpha/2} = z_{0.025} = 1.96\]

  2. Standard Error (SE)
    \[SE = 0.32\]

  3. Margin of Error (ME)
    \[ME = 1.96 \times 0.32 = 0.6272\]

  4. Confidence Interval
    \[\text{Lower bound} = 12.6 - 0.6272 = 11.9728\]
    \[\text{Upper bound} = 12.6 + 0.6272 = 13.2272\]
    95% CI = [11.9728, 13.2272]

C. Confidence Interval 99%

  1. Nilai kritis Z (\(z_{\alpha/2}\))
    \[\alpha = 1 - 0.99 = 0.01\]
    \[z_{\alpha/2} = z_{0.005} = 2.576\]

  2. Standard Error (SE)
    \[SE = 0.32\]

  3. Margin of Error (ME)
    \[ME = 2.576 \times 0.32 = 0.8243\]

  4. Confidence Interval
    \[\text{Lower bound} = 12.6 - 0.8243 = 11.7757\]
    \[\text{Upper bound} = 12.6 + 0.8243 = 13.4243\]
    99% CI = [11.7757, 13.4243]

Tabel Perbandingan

Confidence Level \(z_{\alpha/2}\) SE ME Lower Bound Upper Bound
90% 1.645 0.32 0.5264 12.0736 13.1264
95% 1.960 0.32 0.6272 11.9728 13.2272
99% 2.576 0.32 0.8243 11.7757 13.4243

1.3 Comparative Visualization of Confidence Intervals

1.4 Business Analytics Interpretation

Rata-rata transaksi harian per user setelah fitur baru: ~12.6 transaksi/hari (stabil 12-13).

Confidence Intervals & Aplikasi Bisnis:

  • 90% CI (12.07-13.13): Presisi tinggi → cocok untuk keputusan operasional cepat
  • 95% CI (11.97-13.23): Standar bisnis → evaluasi performa & perencanaan kapasitas
  • 99% CI (11.78-13.42): Konservatif → keputusan strategis berisiko tinggi

Kesimpulan: Fitur baru konsisten & layak dikembangkan. Visualisasi tunjukkan trade-off: confidence level ↑ = interval melebar. Hasil ini memberikan keyakinan bahwa peluncuran fitur baru tidak hanya stabil secara statistik, tetapi juga relevan secara bisnis.

2 Case Study 2

Confidence Interval for Mean, σ Unknown A UX Research team analyzes task completion time (in minutes) for a new mobile application. The data are collected from 12 users:

\[8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3\]

Tasks:

  1. Identify the appropriate statistical test and explain why.
  2. Compute the Confidence Intervals for:
    • 90%
    • 95%
    • 99%
  3. Visualize the three intervals on a single plot.
  4. Explain how sample size and confidence level influence the interval width.

Jawaban

2.1 Identifying the Statistical Test

Uji statistik yang digunakan dalam analisis ini adalah uji t (t-confidence interval untuk mean).

Metode ini dipilih karena:

  • Tujuan analisis adalah mengestimasi rata-rata waktu penyelesaian tugas (mean populasi) untuk aplikasi mobile baru.
  • Simpangan baku populasi (σ) tidak diketahui, sehingga harus diestimasi dari data sampel.
  • Ukuran sampel kecil (n = 12 < 30), sehingga penggunaan distribusi normal standar (Z) tidak tepat dan Central Limit Theorem belum cukup kuat untuk diandalkan.
  • Dalam kondisi σ tidak diketahui dan sampel kecil, distribusi t-Student lebih sesuai karena memperhitungkan ketidakpastian dalam estimasi simpangan baku.

Oleh karena itu, interval kepercayaan dihitung menggunakan distribusi t dengan derajat bebas \(df = n-1 = 11\) pada kasus ini.

Rumus umum t-confidence interval: \[CI = \bar{x} \pm t_{\alpha/2, df} \times \frac{s}{\sqrt{n}}\]

Keterangan: - \(\bar{x}\) = rata-rata sampel - \(t_{\alpha/2, df}\) = nilai kritis distribusi t dengan \(df = n-1\) derajat kebebasan - \(s\) = standar deviasi sampel - \(n\) = ukuran sampel


2.2 Calculating Confidence Intervals

Data Waktu Penyelesaian Tugas (menit):

\[8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3\]
\[n = 12\]

Langkah 1: Hitung Rata-rata Sampel (\(\bar{x}\)) \[\bar{x} = \frac{\sum x_i}{n} = \frac{8.4 + 7.9 + 9.1 + 8.7 + 8.2 + 9.0 + 7.8 + 8.5 + 8.9 + 8.1 + 8.6 + 8.3}{12}\] \[\bar{x} = \frac{101.5}{12} = 8.4583 \text{ menit}\]

Langkah 2: Hitung Standar Deviasi Sampel (\(s\))

Varians sampel: \[s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}\]

Tabel Perhitungan Selisih Kuadrat:

No. Data (\(x_i\)) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\)
1 8.4 -0.0583 0.0034
2 7.9 -0.5583 0.3117
3 9.1 0.6417 0.4117
4 8.7 0.2417 0.0584
5 8.2 -0.2583 0.0667
6 9.0 0.5417 0.2934
7 7.8 -0.6583 0.4334
8 8.5 0.0417 0.0017
9 8.9 0.4417 0.1951
10 8.1 -0.3583 0.1284
11 8.6 0.1417 0.0201
12 8.3 -0.1583 0.0251
Total 1.9491

\[\sum (x_i - \bar{x})^2 = 1.9491\] \[s^2 = \frac{1.9491}{12-1} = \frac{1.9491}{11} = 0.1772\] \[s = \sqrt{0.1772} = 0.4209 \text{ menit}\]

Langkah 3: Hitung Standard Error (SE) \[SE = \frac{s}{\sqrt{n}} = \frac{0.4209}{\sqrt{12}} = \frac{0.4209}{3.4641} = 0.1215\]

Langkah 4: Derajat Kebebasan (df) \[df = n-1 = 12-1 = 11\]


A. Interval Kepercayaan 90%

  1. Nilai kritis t (\(t_{\alpha/2, df}\))
    \[\alpha = 1 - 0.90 = 0.10\]
    \[t_{\alpha/2, df} = t_{0.05, 11} = 1.796\]

  2. Standard Error (SE)
    \[SE = 0.1215\]

  3. Margin of Error (ME)
    \[ME = t_{\alpha/2, df} \times SE = 1.796 \times 0.1215 = 0.2182\]

  4. Confidence Interval
    \[\text{Lower bound} = \bar{x} - ME = 8.4583 - 0.2182 = 8.2401\]
    \[\text{Upper bound} = \bar{x} + ME = 8.4583 + 0.2182 = 8.6765\]
    90% CI = [8.2401, 8.6765] menit


B. Interval Kepercayaan 95%

  1. Nilai kritis t (\(t_{\alpha/2, df}\))
    \[\alpha = 1 - 0.95 = 0.05\]
    \[t_{\alpha/2, df} = t_{0.025, 11} = 2.201\]

  2. Standard Error (SE)
    \[SE = 0.1215\]

  3. Margin of Error (ME)
    \[ME = t_{\alpha/2, df} \times SE = 2.201 \times 0.1215 = 0.2674\]

  4. Confidence Interval
    \[\text{Lower bound} = \bar{x} - ME = 8.4583 - 0.2674 = 8.1909\]
    \[\text{Upper bound} = \bar{x} + ME = 8.4583 + 0.2674 = 8.7257\]
    95% CI = [8.1909, 8.7257] menit


C. Interval Kepercayaan 99%

  1. Nilai kritis t (\(t_{\alpha/2, df}\))
    \[\alpha = 1 - 0.99 = 0.01\]
    \[t_{\alpha/2, df} = t_{0.005, 11} = 3.106\]

  2. Standard Error (SE)
    \[SE = 0.1215\]

  3. Margin of Error (ME)
    \[ME = t_{\alpha/2, df} \times SE = 3.106 \times 0.1215 = 0.3774\]

  4. Confidence Interval
    \[\text{Lower bound} = \bar{x} - ME = 8.4583 - 0.3774 = 8.0809\]
    \[\text{Upper bound} = \bar{x} + ME = 8.4583 + 0.3774 = 8.8357\]
    99% CI = [8.0809, 8.8357] menit


Tabel Ringkasan Hasil

Confidence Level \(t_{\alpha/2, 11}\) SE ME Lower Bound Upper Bound Width
90% 1.796 0.1215 0.2182 8.2401 8.6765 0.4364
95% 2.201 0.1215 0.2674 8.1909 8.7257 0.5348
99% 3.106 0.1215 0.3774 8.0809 8.8357 0.7548

2.3 Visualizing Confidence Intervals

2.4 Sample Size & Confidence Level Impact

Interpretation based on the visualization: Dari visualisasi confidence interval, terlihat bahwa interval pada confidence level yang lebih tinggi (95% dan 99%) semakin melebar, sedangkan interval 90% paling sempit. Hal ini konsisten dengan teori margin of error, di mana peningkatan confidence level meningkatkan nilai kritis sehingga memperlebar interval. Visualisasi juga menunjukkan bahwa semua interval tetap berpusat pada mean sampel yang sama, sehingga perubahan lebar interval hanya mencerminkan tingkat ketidakpastian, bukan perubahan estimasi mean.

Fenomena yang terlihat pada grafik tersebut dapat dijelaskan secara matematis melalui konsep margin of error (ME). Lebar confidence interval ditentukan oleh rumus:

\[ME = t_{\alpha/2, df} \times \frac{s}{\sqrt{n}}\]

Dari rumus ini terlihat bahwa interval dipengaruhi oleh ukuran sampel (n) dan confidence level melalui nilai \(t_{\alpha/2, df}\).

a. Pengaruh Ukuran Sampel (Sample Size) Ukuran sampel masuk lewat komponen standard error \(\frac{s}{\sqrt{n}}\).

  • Saat \(n\) meningkat, \(\sqrt{n}\) membesar sehingga standard error mengecil.
  • Standard error yang lebih kecil membuat margin of error turun dan interval kepercayaan menjadi lebih sempit (estimasi mean populasi lebih presisi).
  • Pada sampel kecil seperti kasus ini (\(n = 12\)), standard error relatif besar sehingga interval menjadi lebih lebar dan estimasi kurang presisi.

b. Pengaruh Confidence Level Confidence level memengaruhi nilai kritis \(t_{\alpha/2, df}\).

  • Semakin tinggi confidence level, nilai \(t\) semakin besar, sehingga margin of error dan lebar interval ikut membesar.
  • Hasil perhitungan menunjukkan:
    • 90% CI → lebar paling kecil (0.4364)
    • 95% CI → lebar menengah (0.5348)
    • 99% CI → lebar paling besar (0.7548)

Ini menggambarkan trade-off: confidence level lebih tinggi memberi keyakinan lebih besar bahwa interval mencakup mean populasi yang sebenarnya, tetapi harus “dibayar” dengan interval yang lebih lebar.

Kesimpulan

  • Ukuran sampel lebih besar → interval lebih sempit → estimasi mean lebih presisi.
  • Confidence level lebih tinggi → interval lebih lebar → tingkat keyakinan lebih tinggi.

3 Case Study 3

Confidence Interval for a Proportion, A/B Testing: A data science team runs an A/B test on a new Call-To-Action (CTA) button design. The experiment yields:

\(n = 400\) (total users)
\(x = 156\) (users who clicked the CTA)

Tasks:

  1. Compute the sample proportion \(\hat{p}\).
  2. Compute Confidence Intervals for the proportion at:
    • 90%
    • 95%
    • 99%
  3. Visualize and compare the three intervals.
  4. Explain how confidence level affects decision-making in product experiments.

Jawaban

3.1 Calculating the Sample Proportion

Diketahui:

  • Total users: \(n = 400\)
  • Users who clicked: \(x = 156\)

Rumus sample proportion: \[\hat{p} = \frac{x}{n}\]

Perhitungan: \[\hat{p} = \frac{156}{400} = 0.39\]

Interpretasi:

  • Sample proportion \(\hat{p} = 0.39\) atau 39%
  • Artinya: 39% dari user yang ditest melakukan klik pada CTA button baru

3.2 Calculating Confidence Intervals

Karena ukuran sampel besar dan memenuhi syarat:

  • \(n\hat{p} = 400(0.39) = 156 \ge 10\)
  • \(n(1-\hat{p}) = 400(0.61) = 244 \ge 10\)

maka Z-confidence interval untuk proporsi dapat digunakan.

Rumus Confidence Interval untuk Proporsi: \[CI = \hat{p} \pm z_{\alpha/2} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]

Keterangan:

  • \(\hat{p}\) = sample proportion
  • \(z_{\alpha/2}\) = nilai kritis z
  • \(n\) = sample size

Langkah 1: Hitung Standard Error (SE) untuk Proporsi \[SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.39 \times (1-0.39)}{400}}\] \[SE = \sqrt{\frac{0.39 \times 0.61}{400}} = \sqrt{\frac{0.2379}{400}} = \sqrt{0.00059475}\] \[SE = 0.02439\]


A. 90% Confidence Interval

  1. Nilai kritis \(z_{\alpha/2}\)
    \[\alpha = 1 - 0.90 = 0.10\]
    \[z_{\alpha/2} = z_{0.05} = 1.645\]

  2. Standard Error (SE)
    \[SE = 0.02439\]

  3. Margin of Error (ME)
    \[ME = z_{\alpha/2} \times SE = 1.645 \times 0.02439 = 0.04012\]

  4. Confidence Interval
    \[\text{Lower bound} = \hat{p} - ME = 0.39 - 0.04012 = 0.34988\]
    \[\text{Upper bound} = \hat{p} + ME = 0.39 + 0.04012 = 0.43012\]
    90% CI = [0.3499, 0.4301] atau [34.99%, 43.01%]


B. 95% Confidence Interval

  1. Nilai kritis \(z_{\alpha/2}\)
    \[\alpha = 1 - 0.95 = 0.05\]
    \[z_{\alpha/2} = z_{0.025} = 1.960\]

  2. Standard Error (SE)
    \[SE = 0.02439\]

  3. Margin of Error (ME)
    \[ME = z_{\alpha/2} \times SE = 1.960 \times 0.02439 = 0.04780\]

  4. Confidence Interval
    \[\text{Lower bound} = \hat{p} - ME = 0.39 - 0.04780 = 0.34220\]
    \[\text{Upper bound} = \hat{p} + ME = 0.39 + 0.04780 = 0.43780\]
    95% CI = [0.3422, 0.4378] atau [34.22%, 43.78%]


C. 99% Confidence Interval

  1. Nilai kritis \(z_{\alpha/2}\)
    \[\alpha = 1 - 0.99 = 0.01\]
    \[z_{\alpha/2} = z_{0.005} = 2.576\]

  2. Standard Error (SE)
    \[SE = 0.02439\]

  3. Margin of Error (ME)
    \[ME = z_{\alpha/2} \times SE = 2.576 \times 0.02439 = 0.06283\]

  4. Confidence Interval
    \[\text{Lower bound} = \hat{p} - ME = 0.39 - 0.06283 = 0.32717\]
    \[\text{Upper bound} = \hat{p} + ME = 0.39 + 0.06283 = 0.45283\]
    99% CI = [0.3272, 0.4528] atau [32.72%, 45.28%]


Tabel Ringkasan Hasil

Confidence Level \(z_{\alpha/2}\) SE ME Lower Bound Upper Bound Width
90% 1.645 0.02439 0.04012 0.3499 0.4301 0.0802
95% 1.960 0.02439 0.04780 0.3422 0.4378 0.0956
99% 2.576 0.02439 0.06283 0.3272 0.4528 0.1256

3.3 Visualizing Confidence Intervals

3.4 Impact of Confidence Level on Decisions

Visualisasi confidence interval memperjelas bahwa seluruh interval tetap berpusat pada nilai proporsi yang sama (\(\hat{p} = 0.39\)), sementara perbedaan confidence level hanya memengaruhi lebar interval. Hal ini membantu tim produk memahami trade-off antara kecepatan pengambilan keputusan dan tingkat keyakinan terhadap hasil eksperimen.

Berdasarkan pemahaman tersebut, pengaruh confidence level terhadap pengambilan keputusan dalam eksperimen produk dapat dijelaskan sebagai berikut.

Dalam konteks A/B testing dan eksperimen produk, confidence level menentukan seberapa yakin tim terhadap hasil sebelum mengambil keputusan.

  • Confidence level lebih rendah (misalnya 90%) → interval lebih sempit, keputusan dapat diambil lebih cepat, tetapi risiko kesalahan (false positive) lebih besar.

  • Confidence level lebih tinggi (misalnya 99%) → keyakinan terhadap hasil lebih kuat, namun interval lebih lebar sehingga keputusan menjadi lebih konservatif dan implementasi perubahan produk dapat tertunda.

  • Confidence level 95% sering dipakai sebagai kompromi antara risiko dan ketelitian estimasi dalam praktik eksperimen produk.

Dalam studi kasus ini, meskipun semua interval mencakup nilai sekitar 39% click-through rate, perbedaan confidence level dapat memengaruhi keputusan bisnis, misalnya:

  • Apakah desain CTA baru langsung diterapkan?
  • Perlu uji lanjut?
  • Risikonya masih dianggap dapat diterima?

Kesimpulan: semakin tinggi confidence level, keputusan cenderung lebih hati-hati dan konservatif; confidence level yang lebih rendah memungkinkan keputusan lebih cepat, tetapi dengan risiko yang lebih besar.

4 Case Study 4

Precision Comparison (Z-Test vs t-Test): Two data teams measure API latency (in milliseconds) under different conditions.

Team A: \[ \begin{align*} n &= 36 \quad \text{(sample size)} \\ \bar{x} &= 210 \quad \text{(sample mean)} \\ \sigma &= 24 \quad \text{(known population standard deviation)} \end{align*} \]

Team B: \[ \begin{align*} n &= 36 \quad \text{(sample size)} \\ \bar{x} &= 210 \quad \text{(sample mean)} \\ s &= 24 \quad \text{(sample standard deviation)} \end{align*} \]

Tasks:

  1. Identify the statistical test used by each team.
  2. Compute Confidence Intervals for 90%, 95%, and 99%.
  3. Create a visualization comparing all intervals.
  4. Explain why the interval widths differ, even with similar data.

Jawaban

4.1 Identifying the Statistical Test

Team A Uji statistik yang digunakan oleh Team A adalah Z-confidence interval untuk mean.

Alasan:

  • Tujuan analisis adalah mengestimasi rata-rata populasi (mean latency API).
  • Standar deviasi populasi diketahui (\(\sigma = 24\)).
  • Ukuran sampel cukup besar (\(n = 36 \ge 30\)), sehingga asumsi normalitas terpenuhi.

Karena \(\sigma\) diketahui, maka distribusi Z digunakan.

Team B Uji statistik yang digunakan oleh Team B adalah t-confidence interval untuk mean.

Alasan:

  • Tujuan analisis sama, yaitu mengestimasi mean populasi.
  • Standar deviasi populasi tidak diketahui, sehingga harus diestimasi dari sampel (\(s = 24\)).
  • Meskipun ukuran sampel cukup besar (\(n = 36\)), ketidaktahuan terhadap \(\sigma\) mengharuskan penggunaan distribusi t-Student.

Karena \(\sigma\) tidak diketahui, maka distribusi t dengan derajat bebas \(df = n - 1 = 35\) digunakan.


4.2 Calculating Confidence Intervals

Data Umum:

  • Sample mean: \(\bar{x} = 210\) ms
  • Sample size: \(n = 36\)
  • Standard Error (SE) untuk kedua tim: \[SE = \frac{24}{\sqrt{36}} = \frac{24}{6} = 4 \text{ ms}\]

TEAM A: Z-INTERVAL (σ diketahui)

A. 90% Confidence Interval 1. Nilai kritis \(z_{\alpha/2}\)
\[z_{0.05} = 1.645\]

  1. Standard Error (SE)
    \[SE = 4 \text{ ms}\]

  2. Margin of Error (ME)
    \[ME = 1.645 \times 4 = 6.58 \text{ ms}\]

  3. Confidence Interval
    \[\text{Lower bound} = 210 - 6.58 = 203.42 \text{ ms}\]
    \[\text{Upper bound} = 210 + 6.58 = 216.58 \text{ ms}\]
    90% CI = [203.42, 216.58] ms

B. 95% Confidence Interval 1. Nilai kritis \(z_{\alpha/2}\)
\[z_{0.025} = 1.960\]

  1. Margin of Error (ME)
    \[ME = 1.960 \times 4 = 7.84 \text{ ms}\]

  2. Confidence Interval
    \[\text{Lower bound} = 210 - 7.84 = 202.16 \text{ ms}\]
    \[\text{Upper bound} = 210 + 7.84 = 217.84 \text{ ms}\]
    95% CI = [202.16, 217.84] ms

C. 99% Confidence Interval 1. Nilai kritis \(z_{\alpha/2}\)
\[z_{0.005} = 2.576\]

  1. Margin of Error (ME)
    \[ME = 2.576 \times 4 = 10.304 \text{ ms}\]

  2. Confidence Interval
    \[\text{Lower bound} = 210 - 10.304 = 199.696 \text{ ms}\]
    \[\text{Upper bound} = 210 + 10.304 = 220.304 \text{ ms}\]
    99% CI = [199.70, 220.30] ms


TEAM B: t-INTERVAL (σ Tidak Diketahui)

Langkah-langkah Perhitungan: 1. Standard Error (SE):
\[SE = \frac{s}{\sqrt{n}} = \frac{24}{\sqrt{36}} = 4 \text{ ms}\]

  1. Derajat Kebebasan (df):
    \[df = n - 1 = 36 - 1 = 35\]

A. 90% Confidence Interval 1. Nilai kritis \(t_{\alpha/2, df}\)
\[t_{0.05, 35} = 1.690 \text{ (dari tabel t)}\]

  1. Margin of Error (ME)
    \[ME = 1.690 \times 4 = 6.76 \text{ ms}\]

  2. Confidence Interval
    \[\text{Lower bound} = 210 - 6.76 = 203.24 \text{ ms}\]
    \[\text{Upper bound} = 210 + 6.76 = 216.76 \text{ ms}\]
    90% CI = [203.24, 216.76] ms

B. 95% Confidence Interval 1. Nilai kritis \(t_{\alpha/2, df}\)
\[t_{0.025, 35} = 2.030 \text{ (dari tabel t)}\]

  1. Margin of Error (ME)
    \[ME = 2.030 \times 4 = 8.12 \text{ ms}\]

  2. Confidence Interval
    \[\text{Lower bound} = 210 - 8.12 = 201.88 \text{ ms}\]
    \[\text{Upper bound} = 210 + 8.12 = 218.12 \text{ ms}\]
    95% CI = [201.88, 218.12] ms

C. 99% Confidence Interval 1. Nilai kritis \(t_{\alpha/2, df}\)
\[t_{0.005, 35} = 2.724 \text{ (dari tabel t)}\]

  1. Margin of Error (ME)
    \[ME = 2.724 \times 4 = 10.896 \text{ ms}\]

  2. Confidence Interval
    \[\text{Lower bound} = 210 - 10.896 = 199.104 \text{ ms}\]
    \[\text{Upper bound} = 210 + 10.896 = 220.896 \text{ ms}\]
    99% CI = [199.10, 220.90] ms

4.3 Visualizing Confidence Intervals

4.4 Explaining Interval Width Differences

Analisis Nilai Kritis:

Conf. Level \(z_{\alpha/2}\) \(t_{\alpha/2,35}\) Difference
90% 1.645 1.690 +0.045
95% 1.960 2.030 +0.070
99% 2.576 2.724 +0.148

Visualisasi confidence interval memperlihatkan bahwa seluruh interval, baik yang menggunakan distribusi Z maupun t, tetap berpusat pada nilai mean yang sama (210 ms).

Perbedaan yang terlihat jelas pada grafik adalah lebar interval, di mana interval berbasis t-test konsisten lebih lebar dibandingkan interval berbasis Z-test, terutama pada confidence level yang lebih tinggi.

Berdasarkan visualisasi tersebut, perbedaan lebar confidence interval dapat dijelaskan melalui karakteristik distribusi statistik yang digunakan oleh masing-masing tim.

Dalam konteks estimasi rata-rata (mean) latency API, jenis distribusi yang digunakan menentukan seberapa besar ketidakpastian yang diperhitungkan dalam interval kepercayaan.

  • Z-interval (Team A) → digunakan ketika standar deviasi populasi diketahui. Distribusi Z memiliki ekor yang lebih tipis, sehingga nilai kritis lebih kecil dan menghasilkan confidence interval yang lebih sempit.

  • t-interval (Team B) → digunakan ketika standar deviasi populasi tidak diketahui dan harus diestimasi dari sampel. Distribusi t memiliki ekor yang lebih tebal untuk mengakomodasi ketidakpastian tambahan, sehingga nilai kritis lebih besar dan interval menjadi lebih lebar.

Pengaruh confidence level → semakin tinggi confidence level (misalnya 99%), perbedaan lebar antara Z dan t semakin terlihat karena nilai kritis distribusi t meningkat lebih cepat dibandingkan distribusi Z.

Meskipun ukuran sampel dan standard error sama, perbedaan nilai kritis inilah yang menyebabkan interval berbasis t selalu lebih lebar dibandingkan interval berbasis Z, sebagaimana ditunjukkan pada tabel perbandingan nilai kritis.

5 Case Study 5

One-Sided Confidence Interval: A Software as a Service (SaaS) company wants to ensure that at least 70% of weekly active users utilize a premium feature.

From the experiment:

\[ \begin{align*} n &= 250 \quad \text{(total users)} \\ x &= 185 \quad \text{(active premium users)} \end{align*} \]

Management is only interested in the lower bound of the estimate.

Tasks:

  1. Identify the type of Confidence Interval and the appropriate test.
  2. Compute the one-sided lower Confidence Interval at:
    • 90%
    • 95%
    • 99%
  3. Visualize the lower bounds for all confidence levels.
  4. Determine whether the 70% target is statistically satisfied.

Jawaban

5.1 Identifying the Confidence Interval and Test

Jenis confidence interval:
One-sided lower confidence interval untuk proporsi populasi.

Alasan pemilihan:

  • Parameter yang diestimasi adalah proporsi pengguna yang menggunakan fitur premium (data berupa jumlah/proporsi, bukan mean), dengan ukuran sampel besar (\(n = 250\)) sehingga pendekatan normal (z-approximation) layak digunakan.
  • Manajemen hanya tertarik pada batas bawah (lower bound), karena ingin memastikan bahwa minimal 70% user menggunakan fitur premium; pertanyaan yang dijawab bersifat satu arah: “Apakah proporsi user ≥ 70%?” dan fokus pada performa agar tidak lebih buruk dari threshold tersebut.

Uji yang digunakan:
One-sample z-based one-sided lower confidence interval for a population proportion.

Rumus:
\[\hat{p}_L = \hat{p} - z_\alpha \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]

Keterangan: - \(\hat{p}\) = proporsi sampel - \(z_\alpha\) = nilai kritis distribusi normal standar untuk confidence level satu sisi - \(n\) = ukuran sampel


5.2 Calculating One-Sided Lower Confidence Intervals

Data: - Total users: \(n = 250\) - Active premium users: \(x = 185\)

Langkah 1: Hitung Sample Proportion (\(\hat{p}\)) \[\hat{p} = \frac{x}{n} = \frac{185}{250} = 0.74 \text{ atau } 74\%\]

Langkah 2: Hitung Standard Error (SE) \[SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.74 \times 0.26}{250}} = \sqrt{\frac{0.1924}{250}} = \sqrt{0.0007696}\] \[SE = 0.02774\]


A. 90% One-Sided Lower Confidence Interval

  1. Nilai kritis \(z_\alpha\)
    Confidence level = 90% → \(\alpha = 0.10\)
    One-sided lower: \(z_{0.10} = 1.282\)

  2. Margin of Error (ME)
    \[ME = z_\alpha \times SE = 1.282 \times 0.02774 = 0.03556\]

  3. One-Sided Lower Bound
    \[\text{Lower bound} = \hat{p} - ME = 0.74 - 0.03556 = 0.70444\]

  4. 90% One-Sided Lower CI:
    \(\hat{p} \geq 0.7044\) atau \(\geq 70.44\%\)

Interpretasi: Dengan keyakinan 90%, kita yakin bahwa minimal 70.44% user menggunakan fitur premium.


B. 95% One-Sided Lower Confidence Interval

  1. Nilai kritis \(z_\alpha\)
    Confidence level = 95% → \(\alpha = 0.05\)
    One-sided lower: \(z_{0.05} = 1.645\)

  2. Margin of Error (ME)
    \[ME = 1.645 \times 0.02774 = 0.04564\]

  3. One-Sided Lower Bound
    \[\text{Lower bound} = 0.74 - 0.04564 = 0.69436\]

  4. 95% One-Sided Lower CI:
    \(\hat{p} \geq 0.6944\) atau \(\geq 69.44\%\)

Interpretasi: Dengan keyakinan 95%, kita yakin bahwa minimal 69.44% user menggunakan fitur premium.


C. 99% One-Sided Lower Confidence Interval

  1. Nilai kritis \(z_\alpha\)
    Confidence level = 99% → \(\alpha = 0.01\)
    One-sided lower: \(z_{0.01} = 2.326\)

  2. Margin of Error (ME)
    \[ME = 2.326 \times 0.02774 = 0.06453\]

  3. One-Sided Lower Bound
    \[\text{Lower bound} = 0.74 - 0.06453 = 0.67547\]

  4. 99% One-Sided Lower CI:
    \(\hat{p} \geq 0.6755\) atau \(\geq 67.55\%\)

Interpretasi: Dengan keyakinan 99%, kita yakin bahwa minimal 67.55% user menggunakan fitur premium.

5.3 Visualizing Lower Bounds

5.4 Assessing the 70% Target

Prinsip keputusan: Karena yang digunakan adalah one-sided lower confidence interval, aturannya:

  • Jika lower bound ≥ 70% → target 70% terpenuhi secara statistik.
  • Jika lower bound < 70% → belum cukup bukti untuk menyatakan target tercapai.

Hasil perhitungan:

Confidence Level Lower Bound Keputusan terhadap target 70%
90% 70.44% Target satisfied
95% 69.44% Target not satisfied
99% 67.55% Target not satisfied

Kesimpulan statistik:

  1. Pada confidence level 90%, lower bound berada di atas 70%, sehingga target 70% dapat diklaim tercapai.

  2. Pada confidence level 95% dan 99%, lower bound berada di bawah 70%, sehingga tidak ada cukup bukti statistik bahwa target benar-benar tercapai pada tingkat keyakinan yang lebih tinggi.

Hubungan dengan visualisasi:

Garis lower bound 90% CI berada di kanan garis target 70%, sedangkan 95% dan 99% berada di kiri, sehingga makin tinggi confidence level, makin konservatif kesimpulan yang bisa diambil.

Walaupun \(\hat{p} = 74\% > 70\%\), keputusan tetap didasarkan pada posisi lower bound terhadap target, bukan hanya nilai titik estimasinya.

6 References

[1] Dsciencelabs. (n.d.). 8 Confidence Interval – Introduction to Statistics. Bookdown. https://bookdown.org/dsciencelabs/intro_statistics/08-Confidence_Interval.html

[2] Diez, D. M., Barr, C. D., & Çetinkaya-Rundel, M. (2019). OpenIntro Statistics. OpenIntro. https://www.openintro.org/book/os/

[3] Khan Academy. (n.d.). Confidence intervals: introduction. https://www.khanacademy.org/math/statistics-probability/confidence-intervals-one-sample/a/confidence-intervals-intro