Assignment Week 13 ~ Study Cases

ITSB

Syafif Azmi Lontoh (52250060)

Student Major in Data Science

1 Case study 1

Confidence Interval untuk Mean, σ Diketahui

Sebuah platform e-commerce ingin memperkirakan rata-rata jumlah transaksi harian per pengguna setelah meluncurkan fitur baru. Berdasarkan data historis skala besar, simpangan baku populasi diketahui.

  • σ = 3.2 (simpangan baku populasi)
  • n = 100 (ukuran sampel)
  • x̄ = 12.6 (rata-rata sampel)

Tugas

Identifikasi uji statistik yang tepat dan berikan alasan pemilihannya.

Hitung Confidence Interval untuk:

90%

95%

99%

Buat visualisasi perbandingan dari ketiga confidence interval tersebut.

Interpretasikan hasilnya dalam konteks business analytics.

1.1 Pembahasan

1.1.1 uji statistik

Interval Z untuk rata rata populasi

Alasan:

  • Simpangan baku populasi (σ) sudah diketahui = 3.2
  • Ukuran sampel besar (n = 100)
  • Memperkirakan rata rata transaksi (Populasi)

1.1.2 Perhitungan Interval Kepercayaan

Rumus untuk interval kepercayaan ketika σ diketahui:

CI = x ¯ ± z × σ n

Diketahui:

  • \(\bar{x}\) = 12.6
  • \(\sigma\) = 3.2
  • \(n\) = 100

Standard Error (SE)

SE = σ n = 3.2 100 = 0.32

1.1.3 Nilai Kritis dan Perhitungan:

  1. Interval Kepercayaan 90%:
Langkah 1: Tentukan tingkat signifikansi

α = 1 0.90 = 0.10

α 2 = 0.10 2 = 0.05

Langkah 2: Temukan nilai kritis Z

Z ( 0.05 ) = 1.645

Langkah 3: Hitung margin kesalahan (E)

E = 1.645 × 3.2 100

E = 1.645 × 0.32 = 0.5264

Langkah 4: Menentukan batas interval kepercayaan

Batas Bawah:

x ¯ E = 12.6 0.5264 = 12.07

Batas Atas:

x ¯ + E = 12.6 + 0.5264 = 13.13

b. Interval Kepercayaan 95%

Langkah 1: Tentukan tingkat signifikansi

α = 1 0.95 = 0.05 α 2 = 0.05 2 = 0.025

Langkah 2: Temukan nilai kritis Z

\(Z(0.025)=−1.96\)

Langkah 3: Hitung margin kesalahan (E)

E = 1.96 × 3.2 100 E = 1.96 × 0.32 = 0.6272

Langkah 4: Menentukan batas interval kepercayaan

Batas Bawah:

x E = 12.6 0.6272 = 11.97

Batas Atas:

x + E = 12.6 + 0.6272 = 13.23

c. Interval Kepercayaan 99%

Langkah 1: Tentukan tingkat signifikansi

α = 1 0.99 = 0.01 α 2 = 0.01 2 = 0.005

Langkah 2: Temukan nilai kritis Z

Z ( 0.005 ) = 2.576

Langkah 3: Hitung margin kesalahan (E)

E = 2.576 × 3.2 100 E = 2.576 × 0.32 = 0.8243

Langkah 4: Menentukan batas interval kepercayaan

Batas Bawah:

x ¯ E = 12.6 0.8243 = 11.78

Batas Atas:

x ¯ + E = 12.6 + 0.8243 = 13.42

1.1.4 Visualisasi

1.1.5 Insight

Visualisasi menunjukkan hubungan antara lebar interval kepercayaan dan tingkat kepercayaan (90%, 95%, 99%) pada distribusi normal standar. Semakin tinggi tingkat kepercayaan, semakin lebar interval yang digambar di sekitar mean 0. ​

Makna tiga interval Garis 90% adalah interval paling pendek, artinya prosedur ini memberikan estimasi yang lebih sempit tetapi dengan keyakinan “hanya” 90% bahwa parameter sebenarnya (μ) berada di dalam interval tersebut. ​

Garis 95% lebih panjang dari 90%, menunjukkan bahwa untuk meningkatkan keyakinan menjadi 95%, interval harus diperlebar sehingga mencakup lebih banyak kemungkinan nilai μ. ​

Garis 99% paling panjang; ini menggambarkan bahwa untuk sangat yakin (99%), interval harus sangat lebar sehingga mencakup hampir semua nilai yang mungkin dari distribusi normal tersebut. ​

Hubungan lebar interval dan informasi Lebar interval mencerminkan ketidakpastian: interval sempit berarti estimasi lebih presisi, tetapi dengan tingkat kepercayaan lebih rendah; interval lebar berarti lebih aman (lebih yakin) tetapi informasinya kurang spesifik. ​

Visualisasi ini membantu menjelaskan trade‑off klasik: naikkan confidence level → critical value z z membesar → margin of error dan lebar interval ikut membesar.

2 Study Cases 2

Confidence Interval for Mean, σ Unknown: A UX Research team analyzes task completion time (in minutes) for a new mobile application. The data are collected from 12 users:

8.4,7.9,9.1,8.7,8.2,9.0,7.8,8.5,8.9,8.1,8.6,8.3

Tasks:

Identify the appropriate statistical test and explain why. Compute the Confidence Intervals for:

90% 95% 99% Visualize the three intervals on a single plot. Explain how sample size and confidence level influence the interval width.

2.1 Pembahasan

2.1.1 Uji statistik

Kondisi:

  • Tujuan: mengestimasi mean waktu task completion.

  • σ populasi tidak diketahui.

  • n = 12 (< 30) dan asumsi data kira‑kira dari populasi normal

Maka digunakan confidence interval untuk satu mean dengan σ unknown berbasis distribusi t (one‑sample t interval).

Rumus umum: x ¯ ± t α / 2 , df s n

2.1.2 Perhitungan Interval Kepercayaan

Dari data diperoleh:

  1. Sample mean x ¯ = 8.4 + 7.9 + 9.1 + 8.7 + 8.2 + 9.0 + 7.8 + 8.5 + 8.9 + 8.1 + 8.6 + 8.3 12 = 101.5 12 = 8.458333 \(\bar{x}\) = 8.458333 menit

  2. Sample size \(n = 12\)

  3. Standar Deviasi Sampel (s)

Rumus:

s = i = 1 n ( x i x ¯ ) 2 n 1

Jumlah Kuadrat Selisih

i = 1 n ( x i x ¯ ) 2 = 1.9492

Varian Sample

s 2 = 1.9492 n 1

\(n = 12\)

s 2 = 1.9492 12 1 = 1.9492 11 = 0.1772

  1. Standar Deviasi Sampel

s = 0.1772 = 0.421 menit

  1. Standar Error
Rumus Standard Error:

S E = s n

masukkan nilai:

S E = 0.421 12 = 0.421 3.464 = 0.122 menit

Derajat Kebebasan (df)

Rumus:

d f = n 1 = 12 1 = 11

2.1.3 Nilai Kritis dan Perhitungan

Diketahui: \(n=12¯x=8.458 menit\) $s=0,421 menit $ S E = s n = 0.122

\(df=n-1=11\)

  1. Interval Kepercayaan 90%:

Langkah 1: Tentukan tingkat signifikansi

α = 1 0.90 = 0.10 , α 2 = 0.10 2 = 0.05

Langkah 2: Tentukan nilai t-kritis

Dari tabel distribusi-t dengan:

df = 11

area ekor kanan = 0.05

t 0.05 , 11 = 1.796

Langkah 3: Hitung Margin of Error (ME)

M E = t × S E = 1.796 × 0.122 = 0.218 menit

Langkah 4: Hitung Interval Kepercayaan

Batas Bawah:

8.458 0.218 = 8.240

Batas Atas:

8.458 + 0.218 = 8.676

Interpretasi

Nilai mean sampel 8.458 menit berada tepat di tengah CI, sehingga estimasi rata‑rata cukup stabil untuk sampel kecil (n = 12) dengan SE 0.122 dan t 0.05 , 11 = 1.796 t 0.05,11 =1.796.

  1. Interval Kepercayaan 95%:

Langkah 1: Tentukan tingkat signifikansi α = 1 0.95 = 0.05 α 2 = 0.025

Langkah 2: Tentukan nilai t-kritis

t 0.025 , 11 = 2.201

Langkah 3: Hitung Margin of Error

M E = 2.201 × 0.122 M E = 0.267 menit

Langkah 4: Hitung Interval Kepercayaan

Batas bawah: 8.458 0.267 = 8.191

Batas Atas: 8.458 + 0.267 = 8.725

Interpretasi

Interval kepercayaan 95% (8,191, 8,725) berarti, berdasarkan data sampel, diasumsikan prosedur pengambilan sampel diulang berkali-kali, sekitar 95% interval yang terbentuk dengan cara yang sama akan memuat rata-rata waktu sebenarnya di populasi.

  1. Interval Kepercayaan 99%:

Langkah 1: Tentukan tingkat signifikansi

α = 1 0.99 = 0.01 α 2 = 0.005

Langkah 2: Tentukan nilai t-kritis

t 0.005 , 11 = 3.106

Langkah 3: Hitung Margin of Error M E = 3.106 × 0.122 M E = 0.377 menit

Langkah 4: Hitung Interval Kepercayaan

Batas bawah: 8.458 0.377 = 8.081

Batas Atas: 8.458 + 0.377 = 8.835

Interpretasi Interval kepercayaan 99% (8,081, 8,835) menyatakan bahwa, jika pengambilan sampel dan perhitungan interval dilakukan berulang kali dengan cara yang sama, sekitar 99% dari interval yang terbentuk akan memuat rata-rata waktu sebenarnya di populasi.

2.1.4 Visualisasi

Interpretasi

semakin tinggi tingkat kepercayaan, interval makin lebar dan estimasi makin aman, tapi kurang presisi. CI 90% paling sempit (paling presisi, risiko meleset lebih besar), sedangkan CI 99% paling lebar (paling yakin memuat mean populasi, tapi kurang tajam untuk keputusan praktis).

3 Study Case 3

Interval Kepercayaan untuk Proporsi, Uji A/B: Tim data science menjalankan uji A/B pada desain tombol Call-To-Action (CTA) yang baru. Hasil eksperimen menunjukkan: n=400 (total pengguna) x=156 (pengguna yang mengklik CTA)

Tugas:

Hitung proporsi sampel \(\hat{p}\)

Hitung Interval Kepercayaan untuk proporsi pada tingkat:

90%

95%

99%

Visualisasikan dan bandingkan ketiga interval tersebut.

Jelaskan bagaimana tingkat kepercayaan memengaruhi pengambilan keputusan dalam eksperimen produk.

3.1 Pembahasan

Hitung proporsi sampel Diketahui:

n=400 (total user)

${x} =156 (user yang klik CTA)

Proporsi sampel: p ^ = x n = 156 400 = 0.39

3.1.1 Rumus selang kepercayaan proporsi

Selang kepercayaan proporsi (aproksimasi normal, n besar):

p ± z α 2 p ̂ ( 1 p ̂ ) n

Standard error:

SE = 0,39 × 0,61 400 0,0243

Nilai z α/2 untuk level umum:

90% → z≈1,645

95% → z≈1,96

99% → z≈2,575

3.1.2 Perhitungan tiga selang kepercayaan

Margin of error (ME) tiap level:

90%: ME90=1,645×0,0243≈0,040

95%: ME95=1,96×0,0243≈0,048

99%: ME99 =2,575×0,0243≈0,063

Selang kepercayaan:

90% CI: 0,39 ± 0,040 ( 0,35 , 0,43 )

95% CI: 0,39 ± 0,048 ( 0,34 , 0,44 )

99% CI: 0,39 ± 0,063 ( 0,33 , 0,45 )

Visualisasi

Interpretasi

Dalam konteks A/B testing, memakai CI yang lebih sempit (misal 90%) memungkinkan keputusan lebih cepat dan agresif, sedangkan CI yang lebih lebar (95%–99%) membuat tim lebih konservatif karena hanya akan “mengklaim menang” jika perbedaan CTR cukup besar sehingga seluruh interval tetap menguntungkan

4 Study case 4

Precision Comparison (Z-Test vs t-Test): Two data teams measure API latency (in milliseconds) under different conditions.

Team A:

n = 36(sample size) x¯ = 210(sample mean) σ = 24(known population standard deviation) Team B:

n = 36(sample size) x¯ = 210(sample mean) s = 24(sample standard deviation) Tasks:

Identify the statistical test used by each team. Compute Confidence Intervals for 90%, 95%, and 99%. Create a visualization comparing all intervals. Explain why the interval widths differ, even with similar data.

4.1 Pembahasan

Tim A: Interval Kepercayaan Z (σ diketahui) Tim B: Interval Kepercayaan t (σ tidak diketahui)

Alasan: Tim A dapat menggunakan distribusi Z karena simpangan baku populasi (σ) diketahui. Tim B harus menggunakan distribusi t karena simpangan baku hanya diestimasi dari sampel (s).

  1. Data yang diberikan

Tim A (σ diketahui) Ukuran sampel: n=36 Rata-rata sampel: \(\bar{x}\) =210 Simpangan baku populasi: σ=24

Tim B (σ tidak diketahui) Ukuran sampel: n=36 Rata-rata sampel: \(\bar{x}\) = 210 Simpangan baku sampel: s = 24

Rumus - Tim A:

CI = x ¯ ± z α 2 σ n

-Tim B: CI = x ¯ ± t α 2 , df s n , df = n 1

Standard error

SE = σ or s n = 24 36 = 24 6 = 4 90 % CI : 210 ± 1.645 4 = 210 ± 6.58 = [ 203.42 , 216.58 ]

Tim B (t-Test)

90 % CI : 210 ± 1.690 4 = 210 ± 6.76 = [ 203.24 , 216.76 ]

Interpretasi

kedua tim punya mean yang sama (210 ms), tetapi lebar intervalnya berbeda.

Untuk setiap level (90%, 95%, 99%), CI Tim B (t) selalu sedikit lebih lebar daripada Tim A (Z).

Artinya, metode t lebih konservatif: memberikan keyakinan yang sama, tetapi dengan rentang estimasi yang sedikit lebih luas karena mengakomodasi ketidakpastian tambahan dari penggunaan s (bukanσ)

5 study case 5

One-Sided Confidence Interval: A Software as a Service (SaaS) company wants to ensure that at least 70% of weekly active users utilize a premium feature.

From the experiment:

nx==250(total users)185(active premium users)

Management is only interested in the lower bound of the estimate.

Tasks:

Identify the type of Confidence Interval and the appropriate test. Compute the one-sided lower Confidence Interval at: 90% 95% 99% Visualize the lower bounds for all confidence levels. Determine whether the 70% target is statistically satisfied.

5.1 Pembahasan

CI type: One-sided (lower bound only) Test: Z-test for proportion (population proportion unknown but n large)

data Total users: n=250

pengguna premium aktif: x=185

Sample proportion:

p ^ = x n = 185 250 = 0.74

minimum target: 70%

Rumus

L = p ^ - z α p ^ ( 1 - p ^ ) n

Standard error SE = p(1p) n = 0.74(10.74) 250 = 0.0007696 0.02774

Hitung Lower Bound CI

Lower CI = p ^ z α SE

  • 90% CI: 0.74−1.282⋅0.02774≈0.704

  • 95% CI: 0.74−1.645⋅0.02774≈0.694

  • 99% CI: 0.74−2.326⋅0.02774≈0.675

Visualisasi

Interpretasi