Study Cases

Confidence Interval~ Week 13

`

1 Study Case 1: CI MEAN (Z-TEST)

Confidence Interval (Selang Kepercayaan) adalah rentang nilai yang diyakini mengandung nilai rata-rata populasi yang sebenarnya (\(\mu\)) berdasarkan data sampel.Penggunaan Z-Test (Distribusi Normal Standar) dilakukan dalam kondisi “ideal” di mana ketidakpastian sampel dapat diminimalisir oleh ukuran data atau pengetahuan tentang populasi.

  1. Syarat Penggunaan Z-TestAnda menggunakan Z-Test untuk mencari Confidence Interval hanya jika:Standar deviasi populasi (\(\sigma\)) DIKETAHUI. Ini adalah syarat mutlak yang membedakannya dengan T-Test.Ukuran sampel besar (\(n \ge 30\)). Berdasarkan Central Limit Theorem, jika sampel besar, distribusi rata-rata sampel akan mendekati distribusi normal.Data dipilih secara acak (Random Sampling).

  2. Rumus CI Mean (Z-Test)Rumus umum untuk menghitung batas bawah dan batas atas adalah:\[\bar{x} \pm z_{\alpha/2} \cdot \left( \frac{\sigma}{\sqrt{n}} \right)\]Komponen Rumus:\(\bar{x}\): Rata-rata sampel (Point Estimate).\(z_{\alpha/2}\): Nilai kritis Z berdasarkan tingkat kepercayaan (Confidence Level).\(\sigma\): Standar deviasi populasi.\(n\): Jumlah sampel.\(\frac{\sigma}{\sqrt{n}}\): Standard Error (SE).\(z \cdot \frac{\sigma}{\sqrt{n}}\): Margin of Error (MoE).

Tabel 1.3: Confidence Interval Mean (Z-Test, Versi Pastel)
Tingkat_Kepercayaan Z_Score Margin_of_Error Lower_Bound Upper_Bound
90% 1.6449 0.7402 11.2598 12.7402
95% 1.9600 0.8820 11.1180 12.8820
99% 2.5758 1.1591 10.8409 13.1591

2 . Study Case 2: CI MEAN (T-TEST)

Standar deviasi populasi (\(\sigma\)) TIDAK diketahui. (Kita hanya punya standar deviasi sampel, \(s\)).Ukuran sampel kecil (\(n < 30\)). Meskipun jika \(n \geq 30\) dan \(\sigma\) tidak diketahui, penggunaan T-test tetap dianggap lebih akurat.Asumsi Normalitas: Data diasumsikan berdistribusi normal atau mendekati normal.2. Rumus Confidence Interval (T-Test)Rumus untuk mencari rentang rata-rata populasi (\(\mu\)) adalah:\[\bar{x} \pm t_{\alpha/2, df} \cdot \left( \frac{s}{\sqrt{n}} \right)\]Keterangan Komponen:\(\bar{x}\): Rata-rata sampel (Point Estimate).\(t_{\alpha/2, df}\): Nilai kritis dari tabel distribusi-t.\(\alpha\): Tingkat signifikansi (misal: jika kepercayaan 95%, maka \(\alpha = 0.05\)).\(df\): Degrees of Freedom (Derajat Bebas), rumusnya \(n - 1\).\(s\): Standar deviasi sampel.\(n\): Jumlah sampel.\(\frac{s}{\sqrt{n}}\): Standard Error (SE).3. Langkah-Langkah MenghitungJika Anda mengerjakan studi kasus, ikuti urutan ini:Hitung Rata-rata (\(\bar{x}\)): Jumlahkan semua data lalu bagi dengan \(n\).Hitung Standar Deviasi Sampel (\(s\)): Ukur sebaran data dari rata-ratanya.Tentukan Derajat Bebas (\(df\)): Kurangi jumlah sampel dengan 1 (\(n - 1\)).Cari Nilai \(t\) di Tabel: Gunakan nilai \(df\) dan tingkat kepercayaan yang diinginkan (misal 95% dua sisi).Hitung Margin of Error (MoE): Kalikan nilai \(t\) dengan Standard Error.Tentukan Rentang: (\(\bar{x} - MoE\)) sampai (\(\bar{x} + MoE\)).4. Contoh SederhanaMisalkan Anda menguji kekuatan beton baru dengan sampel 10 buah (\(n=10, df=9\)).Rata-rata kekuatan (\(\bar{x}\)) = 2500 psi.Standar deviasi sampel (\(s\)) = 50 psi.Tingkat kepercayaan 95% (\(\alpha = 0.05\)).Dari tabel-t, nilai \(t_{0.025, 9}\) adalah 2.262.Perhitungan:\[MoE = 2.262 \cdot \left( \frac{50}{\sqrt{10}} \right) \approx 2.262 \cdot 15.81 \approx 35.76\]Hasil CI: \(2500 \pm 35.76\) atau [2464.24, 2535.76].5. Mengapa Pakai \(n-1\)?Mungkin Anda bertanya-tanya mengapa ada Degrees of Freedom. Secara teknis, ini dilakukan untuk mengoreksi bias. Karena kita mengestimasi \(\mu\) menggunakan \(\bar{x}\), kita “kehilangan” satu derajat kebebasan untuk memastikan estimasi standar deviasi kita tidak terlalu optimis (terlalu kecil).

Tabel 2.1: Confidence Interval Mean (t-Test, Sigma Tidak Diketahui)
Tingkat_Kepercayaan T_Score Margin_of_Error Lower_Bound Upper_Bound
90% 1.7959 0.2182 8.2401 8.6766
95% 2.2010 0.2675 8.1909 8.7258
99% 3.1058 0.3774 8.0809 8.8357

3 . Study Case 3: CI PROPORSI (A/B TESTING)

Dalam A/B Testing, kita biasanya membandingkan dua kelompok:

Kelompok A (Kontrol): Versi lama/asli.

Kelompok B (Variasi): Versi baru dengan perubahan tertentu.

CI Proporsi digunakan untuk menentukan seberapa yakin kita bahwa perbedaan Conversion Rate (CR) antara kedua kelompok tersebut bukan terjadi karena kebetulan, melainkan karena perubahan yang dilakukan.

Untuk menghitung CI Proporsi, kita membutuhkan data berikut dari masing-masing kelompok:\(n\): Total jumlah pengunjung/subjek.\(x\): Jumlah sukses (misalnya: klik, beli, daftar).\(\hat{p}\): Proporsi sampel (\(\hat{p} = \frac{x}{n}\)).

Dalam A/B testing, fokus kita adalah pada selisih proporsi (\(p_1 - p_2\)). Rumus Confidence Interval untuk selisih dua proporsi adalah:\[(p_1 - p_2) \pm z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}\]

\((p_1 - p_2)\): Estimasi titik selisih conversion rate.\(z_{\alpha/2}\): Nilai kritis (misal: 1.96 untuk kepercayaan 95%).Bagian akar adalah Standard Error (SE) dari selisih tersebut.

Tabel 3.1: CI Selisih Proporsi (B - A) - A/B Testing
Tingkat_Kepercayaan Z_Score Margin_of_Error Lower_Bound Upper_Bound
90% 1.6449 0.0423 0.0177 0.1023
95% 1.9600 0.0504 0.0096 0.1104
99% 2.5758 0.0662 -0.0062 0.1262

4 . Study Case 4: PERBANDINGAN Z VS T

Memilih antara Uji Z dan Uji T adalah keputusan krusial dalam analisis data. Perbedaan utamanya terletak pada ukuran sampel dan apakah kita mengetahui standar deviasi populasi (\(\sigma\)).

standar deviasi populasi (\(\sigma\)) yang sebenarnya (jarang terjadi di dunia nyata kecuali pada data historis/pabrik).Ukuran sampel Anda besar (\(n \geq 30\)). Menurut Teorema Limit Pusat, jika sampel cukup besar, distribusi rata-rata sampel akan mendekati normal meskipun populasi aslinya tidak.Gunakan Uji T Jika:Anda tidak tahu standar deviasi populasi (\(\sigma\)) dan harus mengestimasinya menggunakan standar deviasi sampel (\(s\)).Ukuran sampel Anda kecil (\(n < 30\)).Distribusi T memiliki “ekor” yang lebih tebal (leptokurtik) untuk mengompensasi ketidakpastian tambahan karena

Meskipun terlihat mirip, perhatikan simbol yang digunakan:Uji Z:\[Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}\]Uji T:\[T = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}}\]\(\bar{x}\): Rata-rata sampel\(\mu\): Rata-rata populasi\(\sigma\): Standar deviasi populasi\(s\): Standar deviasi sampel\(n\): Ukuran sampel

Dalam Uji T, Anda memerlukan nilai Degrees of Freedom (Derajat Bebas) untuk melihat tabel distribusi-t.Rumus: \(df = n - 1\)Semakin besar nilai \(n\) (dan \(df\)), bentuk distribusi-t akan semakin mendekati distribusi-Z. Itulah sebabnya pada sampel di atas 30, hasil Uji T seringkali memberikan kesimpulan yang mirip dengan Uji Z.

Tabel 4.2: Confidence Interval Z-Test vs t-Test (Versi Crispim)
Tingkat Kepercayaan Tes Nilai Kritis Batas Bawah Batas Atas Margin Error
90% Tim A (Z-Test, \(\sigma\) Known) 1.644854 10.304 10.696 0.196
95% Tim A (Z-Test, \(\sigma\) Known) 1.959964 10.266 10.734 0.234
99% Tim A (Z-Test, \(\sigma\) Known) 2.575829 10.193 10.807 0.307
90% Tim B (t-Test, \(s\) Used) 1.680230 10.300 10.700 0.200
95% Tim B (t-Test, \(s\) Used) 2.015368 10.260 10.740 0.240
99% Tim B (t-Test, \(s\) Used) 2.692278 10.179 10.821 0.321

5 . Study Case 5: ONE-SIDED LOWER CI

Materi mengenai One-Sided Lower Confidence Interval (CI) atau Selang Kepercayaan Batas Bawah Satu Sisi sangat penting dalam statistik, terutama ketika kita hanya peduli pada nilai minimum yang mungkin dari suatu parameter (seperti rata-rata atau proporsi).

Berikut adalah ringkasan materi untuk studi kasus Anda:

berbeda dengan selang kepercayaan dua sisi (yang memiliki batas bawah dan atas), One-Sided Lower CI memberikan batas minimum yang masuk akal bagi parameter populasi dengan tingkat kepercayaan tertentu (misalnya 95%).Dalam konteks ini, kita menyatakan bahwa nilai sebenarnya “setidaknya” sebesar \(L\) (Lower limit), dan batas atasnya adalah tak terhingga (\(\infty\)).Quality Control: Memastikan kekuatan material tidak di bawah standar tertentu.

Analisis Keuntungan: Menentukan estimasi terendah dari laba investasi.

Kesehatan: Memastikan kandungan nutrisi dalam makanan minimal mencapai angka tertentu.

Untuk rata-rata populasi (\(\mu\)) dengan asumsi distribusi normal atau sampel besar (\(n > 30\)):\[Lower\ Limit = \bar{x} - (z_{\alpha} \cdot \frac{\sigma}{\sqrt{n}})\] \(\bar{x}\): Rata-rata sampel.\(z_{\alpha}\): Nilai kritis dari tabel Z (menggunakan \(\alpha\), bukan \(\alpha/2\) karena hanya satu sisi).\(\sigma\): Standar deviasi populasi (atau \(s\) jika menggunakan standar deviasi sampel).\(n\): Ukuran sampel.

Tabel 5.1: One-Sided Lower Confidence Interval untuk Proporsi
Tingkat_Kepercayaan Z_Score_OneSided Margin_of_Error Lower_Bound Target_Tercapai
90% 1.2816 0.0199 0.7201 TRUE
95% 1.6449 0.0255 0.7145 TRUE
99% 2.3263 0.0361 0.7039 TRUE

