Assignment Week 13 ~ Study Cases
ITSB
Syafif Azmi Lontoh (52250060)
Student Major in Data Science
1 Case study 1
Confidence Interval untuk Mean, σ Diketahui
Sebuah platform e-commerce ingin memperkirakan rata-rata jumlah transaksi harian per pengguna setelah meluncurkan fitur baru. Berdasarkan data historis skala besar, simpangan baku populasi diketahui.
- σ = 3.2 (simpangan baku populasi)
- n = 100 (ukuran sampel)
- x̄ = 12.6 (rata-rata sampel)
Tugas
Identifikasi uji statistik yang tepat dan berikan alasan pemilihannya.
Hitung Confidence Interval untuk:
90%
95%
99%
Buat visualisasi perbandingan dari ketiga confidence interval tersebut.
Interpretasikan hasilnya dalam konteks business analytics.
1.1 Pembahasan
1.1.1 uji statistik
Interval Z untuk rata rata populasi
Alasan:
- Simpangan baku populasi (σ) sudah diketahui = 3.2
- Ukuran sampel besar (n = 100)
- Memperkirakan rata rata transaksi (Populasi)
1.1.2 Perhitungan Interval Kepercayaan
Rumus untuk interval kepercayaan ketika σ diketahui:
Diketahui:
- \(\bar{x}\) = 12.6
- \(\sigma\) = 3.2
- \(n\) = 100
Standard Error (SE)
1.1.3 Nilai Kritis dan Perhitungan:
- Interval Kepercayaan 90%:
Langkah 2: Temukan nilai kritis Z
Langkah 3: Hitung margin kesalahan (E)
Langkah 4: Menentukan batas interval kepercayaan
Batas Bawah:
Batas Atas:
b. Interval Kepercayaan 95%
Langkah 1: Tentukan tingkat signifikansi
Langkah 2: Temukan nilai kritis Z
\(Z(0.025)=−1.96\)
Langkah 3: Hitung margin kesalahan (E)
Langkah 4: Menentukan batas interval kepercayaan
Batas Bawah:c. Interval Kepercayaan 99%
Langkah 1: Tentukan tingkat signifikansi
Langkah 4: Menentukan batas interval kepercayaan
Batas Bawah:1.1.4 Visualisasi
1.1.5 Insight
Visualisasi menunjukkan hubungan antara lebar interval kepercayaan dan tingkat kepercayaan (90%, 95%, 99%) pada distribusi normal standar. Semakin tinggi tingkat kepercayaan, semakin lebar interval yang digambar di sekitar mean 0.
Makna tiga interval Garis 90% adalah interval paling pendek, artinya prosedur ini memberikan estimasi yang lebih sempit tetapi dengan keyakinan “hanya” 90% bahwa parameter sebenarnya (μ) berada di dalam interval tersebut.
Garis 95% lebih panjang dari 90%, menunjukkan bahwa untuk meningkatkan keyakinan menjadi 95%, interval harus diperlebar sehingga mencakup lebih banyak kemungkinan nilai μ.
Garis 99% paling panjang; ini menggambarkan bahwa untuk sangat yakin (99%), interval harus sangat lebar sehingga mencakup hampir semua nilai yang mungkin dari distribusi normal tersebut.
Hubungan lebar interval dan informasi Lebar interval mencerminkan ketidakpastian: interval sempit berarti estimasi lebih presisi, tetapi dengan tingkat kepercayaan lebih rendah; interval lebar berarti lebih aman (lebih yakin) tetapi informasinya kurang spesifik.
Visualisasi ini membantu menjelaskan trade‑off klasik: naikkan confidence level → critical value z z membesar → margin of error dan lebar interval ikut membesar.
2 Study Cases 2
Confidence Interval for Mean, σ Unknown: A UX Research team analyzes task completion time (in minutes) for a new mobile application. The data are collected from 12 users:
8.4,7.9,9.1,8.7,8.2,9.0,7.8,8.5,8.9,8.1,8.6,8.3
Tasks:
Identify the appropriate statistical test and explain why. Compute the Confidence Intervals for:
90% 95% 99% Visualize the three intervals on a single plot. Explain how sample size and confidence level influence the interval width.
2.1 Pembahasan
2.1.1 Uji statistik
Kondisi:
Tujuan: mengestimasi mean waktu task completion.
σ populasi tidak diketahui.
n = 12 (< 30) dan asumsi data kira‑kira dari populasi normal
Maka digunakan confidence interval untuk satu mean dengan σ unknown berbasis distribusi t (one‑sample t interval).
Rumus umum:
2.1.2 Perhitungan Interval Kepercayaan
Dari data diperoleh:
Sample mean \(\bar{x}\) = 8.458333 menit
Sample size \(n = 12\)
Standar Deviasi Sampel (s)
Rumus:
Jumlah Kuadrat Selisih
Varian Sample
\(n = 12\)
- Standar Deviasi Sampel
- Standar Error
masukkan nilai:
Derajat Kebebasan (df)
Rumus:2.1.3 Nilai Kritis dan Perhitungan
Diketahui: \(n=12¯x=8.458 menit\) $s=0,421 menit $
\(df=n-1=11\)
- Interval Kepercayaan 90%:
Langkah 1: Tentukan tingkat signifikansi
Langkah 2: Tentukan nilai t-kritis
Dari tabel distribusi-t dengan:
df = 11
area ekor kanan = 0.05
Langkah 3: Hitung Margin of Error (ME)
Langkah 4: Hitung Interval Kepercayaan
Batas Bawah:Interpretasi
Nilai mean sampel 8.458 menit berada tepat di tengah CI, sehingga estimasi rata‑rata cukup stabil untuk sampel kecil (n = 12) dengan SE 0.122 dan t 0.05 , 11 = 1.796 t 0.05,11 =1.796.
- Interval Kepercayaan 95%:
Langkah 1: Tentukan tingkat signifikansi
Langkah 2: Tentukan nilai t-kritis
Langkah 3: Hitung Margin of Error
Langkah 4: Hitung Interval Kepercayaan
Batas bawah:
Batas Atas:
Interpretasi
Interval kepercayaan 95% (8,191, 8,725) berarti, berdasarkan data sampel, diasumsikan prosedur pengambilan sampel diulang berkali-kali, sekitar 95% interval yang terbentuk dengan cara yang sama akan memuat rata-rata waktu sebenarnya di populasi.
- Interval Kepercayaan 99%:
Langkah 1: Tentukan tingkat signifikansi
Langkah 2: Tentukan nilai t-kritis
Langkah 3: Hitung Margin of Error
Langkah 4: Hitung Interval Kepercayaan
Batas bawah:
Batas Atas:
Interpretasi Interval kepercayaan 99% (8,081, 8,835) menyatakan bahwa, jika pengambilan sampel dan perhitungan interval dilakukan berulang kali dengan cara yang sama, sekitar 99% dari interval yang terbentuk akan memuat rata-rata waktu sebenarnya di populasi.
2.1.4 Visualisasi
Interpretasi
semakin tinggi tingkat kepercayaan, interval makin lebar dan estimasi makin aman, tapi kurang presisi. CI 90% paling sempit (paling presisi, risiko meleset lebih besar), sedangkan CI 99% paling lebar (paling yakin memuat mean populasi, tapi kurang tajam untuk keputusan praktis).
3 Study Case 3
Interval Kepercayaan untuk Proporsi, Uji A/B: Tim data science menjalankan uji A/B pada desain tombol Call-To-Action (CTA) yang baru. Hasil eksperimen menunjukkan: n=400 (total pengguna) x=156 (pengguna yang mengklik CTA)
Tugas:
Hitung proporsi sampel \(\hat{p}\)
Hitung Interval Kepercayaan untuk proporsi pada tingkat:
90%
95%
99%
Visualisasikan dan bandingkan ketiga interval tersebut.
Jelaskan bagaimana tingkat kepercayaan memengaruhi pengambilan keputusan dalam eksperimen produk.
3.1 Pembahasan
Hitung proporsi sampel Diketahui:
n=400 (total user)
${x} =156 (user yang klik CTA)
Proporsi sampel:
3.1.1 Rumus selang kepercayaan proporsi
Selang kepercayaan proporsi (aproksimasi normal, n besar):
Standard error:
Nilai z α/2 untuk level umum:
90% → z≈1,645
95% → z≈1,96
99% → z≈2,575
3.1.2 Perhitungan tiga selang kepercayaan
Margin of error (ME) tiap level:
90%: ME90=1,645×0,0243≈0,040
95%: ME95=1,96×0,0243≈0,048
99%: ME99 =2,575×0,0243≈0,063
Selang kepercayaan:
90% CI:
95% CI:
99% CI:
Visualisasi
Interpretasi
Dalam konteks A/B testing, memakai CI yang lebih sempit (misal 90%) memungkinkan keputusan lebih cepat dan agresif, sedangkan CI yang lebih lebar (95%–99%) membuat tim lebih konservatif karena hanya akan “mengklaim menang” jika perbedaan CTR cukup besar sehingga seluruh interval tetap menguntungkan
4 Study case 4
Precision Comparison (Z-Test vs t-Test): Two data teams measure API latency (in milliseconds) under different conditions.
Team A:
n = 36(sample size) x¯ = 210(sample mean) σ = 24(known population standard deviation) Team B:
n = 36(sample size) x¯ = 210(sample mean) s = 24(sample standard deviation) Tasks:
Identify the statistical test used by each team. Compute Confidence Intervals for 90%, 95%, and 99%. Create a visualization comparing all intervals. Explain why the interval widths differ, even with similar data.
4.1 Pembahasan
Tim A: Interval Kepercayaan Z (σ diketahui) Tim B: Interval Kepercayaan t (σ tidak diketahui)
Alasan: Tim A dapat menggunakan distribusi Z karena simpangan baku populasi (σ) diketahui. Tim B harus menggunakan distribusi t karena simpangan baku hanya diestimasi dari sampel (s).
- Data yang diberikan
Tim A (σ diketahui) Ukuran sampel: n=36 Rata-rata sampel: \(\bar{x}\) =210 Simpangan baku populasi: σ=24
Tim B (σ tidak diketahui) Ukuran sampel: n=36 Rata-rata sampel: \(\bar{x}\) = 210 Simpangan baku sampel: s = 24
Rumus - Tim A:
-Tim B:
Standard error
Tim B (t-Test)
Interpretasi
kedua tim punya mean yang sama (210 ms), tetapi lebar intervalnya berbeda.
Untuk setiap level (90%, 95%, 99%), CI Tim B (t) selalu sedikit lebih lebar daripada Tim A (Z).
Artinya, metode t lebih konservatif: memberikan keyakinan yang sama, tetapi dengan rentang estimasi yang sedikit lebih luas karena mengakomodasi ketidakpastian tambahan dari penggunaan s (bukanσ)
5 study case 5
One-Sided Confidence Interval: A Software as a Service (SaaS) company wants to ensure that at least 70% of weekly active users utilize a premium feature.
From the experiment:
nx==250(total users)185(active premium users)
Management is only interested in the lower bound of the estimate.
Tasks:
Identify the type of Confidence Interval and the appropriate test. Compute the one-sided lower Confidence Interval at: 90% 95% 99% Visualize the lower bounds for all confidence levels. Determine whether the 70% target is statistically satisfied.
5.1 Pembahasan
CI type: One-sided (lower bound only) Test: Z-test for proportion (population proportion unknown but n large)
data Total users: n=250
pengguna premium aktif: x=185
Sample proportion:
minimum target: 70%
Rumus
Standard error
Hitung Lower Bound CI
90% CI: 0.74−1.282⋅0.02774≈0.704
95% CI: 0.74−1.645⋅0.02774≈0.694
99% CI: 0.74−2.326⋅0.02774≈0.675
Visualisasi