Rumus Interval Kepercayaan (Z-Interval)
Interval kepercayaan untuk rata-rata populasi dengan simpangan baku populasi diketahui menggunakan distribusi Z, dengan rumus sebagai berikut:
\[ SE = \frac{\sigma}{\sqrt{n}} \]
Perhitungan Standard Error (SE)
Standard Error (SE) dihitung menggunakan rumus:
\[ SE = \frac{\sigma}{\sqrt{n}} \] Sehingga, nilai Standard Error (SE) adalah sebesar 0,32.
Uji statistik yang digunakan adalah Interval Kepercayaan Rata-rata dengan Distribusi Z (Z-Interval). Alasan:
Maka digunakan Z-Score, bukan t-Score.
A. Rumus Interval Kepercayaan (Z-Interval)
\[ SE = \frac{\sigma}{\sqrt{n}} \]
B.Hitung Standard Error (SE)
\[ SE = \frac{3,2}{\sqrt{100}} = \frac{3,2}{10} = 0,32 \]
A. Interval Kepercayaan 90%
Nilai Z = 1,645
[12,6 (1,645 ,32)]
[12,6 ,526]
CI 90% = (12,07 ; 13,13)
B. Interval Kepercayaan 95%
Nilai Z = 1,96
[12,6 (1,96 ,32)]
[12,6 ,627]
CI 95% = (11,97 ; 13,23)
C. Interval Kepercayaan 99%
Nilai Z = 2,576
[12,6 (2,576 ,32)]
[12,6 ,824]
CI 99% = (11,78 ; 13,42)
Secara visual (misalnya dengan garis horizontal):
Semakin tinggi tingkat kepercayaan, semakin lebar intervalnya**, karena ingin semakin yakin nilai rata-rata populasi berada di dalam interval tersebut.
| Tingkat Kepercayaan | Batas Bawah (menit) | Rata-rata (menit) | Batas Atas (menit) |
|---|---|---|---|
| 90% | 8.25 | 8.46 | 8.66 |
| 95% | 8.20 | 8.46 | 8.71 |
| 99% | 8.09 | 8.46 | 8.82 |
Implikasi Bisnis: Jika manajemen ingin keputusan cepat dan presisi**, CI 90% bisa digunakan.
Jika keputusan berdampak besar (misalnya investasi besar),CI 95% atau 99% lebih aman.
Hasil ini menunjukkan bahwa fitur baru berpotensi meningkatkan transaksi harian pengguna secara konsisten.
Uji yang tepat adalah interval kepercayaan rata-rata menggunakan distribusi t (t-interval).
Alasan:
Rumus umum: \[
\bar{x} \pm t_{\alpha/2,\;n-1}\left(\frac{s}{\sqrt{n}}\right)
\] dengan: - \(\bar{x}\) :
rata-rata sampel
- \(t_{\alpha/2,\;n-1}\) : nilai kritis
distribusi t dengan derajat bebas \(n-1\)
- \(s\) : simpangan baku sampel
- \(n\) : ukuran sampel
- \(\alpha\) : tingkat signifikansi
(\(\alpha = 1 - \text{tingkat
kepercayaan}\))
Interval kepercayaan untuk rata-rata populasi ketika simpangan baku populasi tidak diketahui dan ukuran sampel kecil diberikan oleh:
\[ \bar{x} \pm t_{\alpha/2,\;n-1}\left(\frac{s}{\sqrt{n}}\right) \] β
Statistik sampel:
Interval Kepercayaan:
Interpretasi contoh (95%):
Kita 95% yakin bahwa rata-rata waktu penyelesaian tugas pengguna berada antara 8,20 hingga 8,71 menit.
Grafik di atas menampilkan ketiga interval kepercayaan dalam satu plot:
a. Ukuran sampel (n)
b. Tingkat kepercayaan
| Faktor | Perubahan | Dampak terhadap Interval | Penjelasan |
|---|---|---|---|
| Ukuran Sampel (n) | n meningkat | Interval semakin sempit | Standar error mengecil sehingga estimasi rata-rata lebih presisi |
| Ukuran Sampel (n) | n kecil | Interval lebih lebar | Ketidakpastian estimasi lebih besar |
| Tingkat Kepercayaan | 90% β 95% β 99% | Interval semakin lebar | Nilai kritis distribusi t semakin besar |
| Tingkat Kepercayaan | Rendah | Interval lebih sempit | Risiko kesalahan inferensi lebih tinggi |
Interval Kepercayaan untuk Proporsi (Pengujian A/B CTA)
Diketahui:
Jumlah total pengguna: π = 400 Jumlah pengguna yang mengklik CTA: π₯ = 156
Rumus Proporsi Sampel: \[ \hat{p} = \frac{x}{n} \]
Dengan:
π₯= 156
π= 400
Hasil \[ \hat{p} = \frac{156}{400} = 0.39 \] Artinya, 39% pengguna mengklik CTA.
Rumus Interval Kepercayaan untuk Proporsi
\[ \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
90% β π§=1.645
95% β π§=1.96
99% β π§= 2.576
Nilai Kritis untuk Tingkat Kepercayaan \[ z_{90\%} = 1.645, \quad z_{95\%} = 1.96, \quad z_{99\%} = 2.576 \]
\[ 0.39 \pm z_{\alpha/2} \sqrt{\frac{0.39(1-0.39)}{400}} \]
| Tingkat Kepercayaan | Batas Bawah | Proporsi Sampel | Batas Atas |
|---|---|---|---|
| 90% | 0.3397 | 0.3900 | 0.4403 |
| 95% | 0.3326 | 0.3900 | 0.4474 |
| 99% | 0.3208 | 0.3900 | 0.4592 |
Tingkat kepercayaan memengaruhi lebar interval kepercayaan dan tingkat keyakinan dalam keputusan produk. Semakin tinggi tingkat kepercayaan yang dipilih, semakin besar nilai kritis distribusi normal (z), sehingga interval kepercayaan menjadi semakin lebar.
Interval kepercayaan 90% menghasilkan rentang yang paling sempit, diikuti oleh interval 95% dan 99% yang semakin melebar. Hal ini menunjukkan adanya trade-off antara presisi dan keyakinan: interval sempit lebih presisi tetapi kurang meyakinkan, sedangkan interval lebar lebih meyakinkan namun kurang presisi.
Dalam konteks eksperimen produk:
90% cocok untuk eksperimen eksploratif atau pengambilan keputusan cepat.
95% merupakan standar umum dalam riset produk karena seimbang antara presisi dan keandalan.
99% digunakan untuk keputusan kritikal yang berdampak besar pada bisnis.
Berdasarkan hasil analisis, proporsi klik CTA berada secara konsisten di sekitar 39% pada semua tingkat kepercayaan. Hal ini menunjukkan bahwa desain CTA baru memiliki performa yang stabil. Untuk meningkatkan ketepatan estimasi dan mempersempit interval kepercayaan, disarankan menambah jumlah pengguna dalam eksperimen selanjutnya.
Dua tim mengukur latensi API (ms) dengan data yang sangat mirip, tetapi informasi simpangan baku berbeda.
Data
Tim A
π = 36
\(\bar{x}\) = 210
π = 24 β simpangan baku populasi diketahui
Tim B
π = 36
\(\bar{x}\) = 210
π = 24β simpangan baku sampel
| Tim | Informasi SD | Uji yang digunakan | Distribusi |
|---|---|---|---|
| Tim A | Ο diketahui | Uji Z | Normal (Z) |
| Tim B | Ο tidak diketahui (pakai s) | Uji t | Student t (df = 35) |
Alasan:
Jika Ο diketahui β Z-test
Jika Ο tidak diketahui β t-test, meskipun n besar
Z-test \[ CI = \bar{x} \pm Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \]
T-test \[ CI = \bar{x} \pm t_{\alpha/2, \, df} \cdot \frac{s}{\sqrt{n}} \]
Hitung Standart Eror (SE) \[ SE = \frac{\sigma}{\sqrt{n}} \quad \text{(jika simpangan baku populasi diketahui)} \]
Tim A (Uji Z)
| CI | Z | Interval |
|---|---|---|
| 90% | 1.645 | (210 ) |
| 95% | 1.96 | (210 ) |
| 99% | 2.576 | (210 ) |
Tim B (Uji t, df = 35)
| CI | t | Interval |
|---|---|---|
| 90% | 1.690 | (210 ) |
| 95% | 2.030 | (210 ) |
| 99% | 2.724 | (210 ) |
Meskipun kedua tim memiliki ukuran sampel, rata-rata, dan nilai simpangan baku yang sama, lebar interval kepercayaan tetap berbeda karena perbedaan metode statistik yang digunakan.
A. Perbedaan Distribusi Statistik
Tim A menggunakan uji Z, yang mengasumsikan simpangan baku populasi (Ο) diketahui. Tim B menggunakan uji t, karena simpangan baku populasi tidak diketahui dan digantikan oleh simpangan baku sampel (s).
Distribusi t-Student memiliki ekor yang lebih tebal dibandingkan distribusi normal (Z), sehingga lebih konservatif.
B. Nilai Kritis t Lebih Besar dari Z Untuk tingkat kepercayaan yang sama, nilai kritis distribusi t-Student selalu lebih besar dibandingkan nilai kritis distribusi normal (Z), yaitu:
\[ t_{\alpha/2,\,df} > Z_{\alpha/2} \]
Perbedaan ini terjadi karena distribusi t memiliki ekor yang lebih tebal untuk mengakomodasi ketidakpastian dalam estimasi simpangan baku populasi.
Akibatnya, margin of error pada interval kepercayaan berbasis distribusi t menjadi lebih besar dibandingkan distribusi Z, dengan rumus:
\[ \text{Margin of Error} = (\text{nilai kritis}) \times SE \]
Semakin kecil derajat kebebasan (\(df\)), semakin besar nilai kritis t, sehingga interval kepercayaan menjadi lebih lebar.
C. Ketidakpastian Estimasi Simpangan Baku
Pada uji t, simpangan baku diestimasi dari sampel, sehingga ada ketidakpastian tambahan yang harus diperhitungkan. Hal ini membuat interval kepercayaan menjadi lebih lebar.
D. Pengaruh Tingkat Kepercayaan
Semakin tinggi tingkat kepercayaan (90% β 99%):
Diketahui
π = 250
π₯ = 185
Proporsi sampel: \[ \hat{p} = \frac{x}{n} \]
Manajemen hanya tertarik pada batas bawah estimasi.
Target perusahaan: β₯ 70% (0,70)
Parameter yang ingin diestimasi adalah proporsi populasi π, yaitu proporsi pengguna aktif mingguan yang menggunakan fitur premium. Karena data bersifat dikotomi (premium dan non-premium) dan diringkas dalam bentuk jumlah keberhasilan π₯dari total sampel π, maka metode inferensi yang sesuai adalah inferensi proporsi.
Estimasi titik proporsi populasi diperoleh dari proporsi sampel:
\[ \hat{p} = \frac{x}{n} \]
Manajemen hanya tertarik pada apakah proporsi minimal pengguna premium mencapai 70%, sehingga interval yang digunakan adalah interval kepercayaan satu sisi (batas bawah). \[ n\hat{p} > 5 \quad \text{dan} \quad n(1-\hat{p}) > 5 \]
Dengan demikian, standar error dari estimasi proporsi dapat dihitung sebagai: \[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
Batas bawah interval kepercayaan satu sisi dengan tingkat kepercayaan (1βΞ±) dirumuskan sebagai: \[ LB = \hat{p} - z_{\alpha} \cdot SE \]
di mana zΞ± adalah kuantil distribusi normal baku yang memenuhi: \[ P(Z \le z_{\alpha}) = 1 - \alpha \]
dengan πβΌπ(0,1).
Interval kepercayaan satu sisi ini ekuivalen dengan uji hipotesis satu sisi berikut:
\[ \begin{aligned} H_0 &: p \le 0.70 \\ H_1 &: p > 0.70 \end{aligned} \]
Jika batas bawah interval kepercayaan lebih besar dari 0,70, maka hipotesis nol ditolak dan dapat disimpulkan bahwa target perusahaan tercapai secara statistik.
A. Data dan Notasi
Misalkan:
π = jumlah sampel
π₯ = jumlah keberhasilan (pengguna premium)
p^ = proporsi sampel
\[ n = 250, \quad x = 185 \]
B. Estimasi Proporsi Sampel
Estimasi titik untuk proporsi populasi diperoleh dari: \[ \hat{p} = \frac{x}{n} \]
Substitusi Nilai: \[ \hat{p} = \frac{185}{250} = 0.74 \]
C. Standar Error Estimasi Proporsi
Karena menggunakan pendekatan distribusi normal, maka standar error dari estimasi proporsi dihitung sebagai: \[ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
Substitusi Nilai \[ SE = \sqrt{\frac{0.74(1-0.74)}{250}} = \sqrt{\frac{0.1924}{250}} = \sqrt{0.0007696} \approx 0.0277 \]
D. Menentukan Nilai Kritis Z
Untuk interval kepercayaan satu sisi (batas bawah) dengan tingkat kepercayaan (1βΞ±), nilai kritis diperoleh dari distribusi normal baku:
\[ P(Z \le z_{\alpha}) = 1 - \alpha \]
Nilai yang umum digunakan: \[ \begin{array}{c|c} \text{Tingkat Kepercayaan} & z_{\alpha} \\ \hline 90\% & 1.28 \\ 95\% & 1.645 \\ 99\% & 2.33 \end{array} \]
E. Rumus Interval Kepercayaan Bawah \[ LB = \hat{p} - z_{\alpha} \cdot SE \]
F. Perhitungan Batas Bawah - Tingkat Kepercayaan 90% \[ LB_{90} = 0.74 - (1.28)(0.0277) \]
\[ LB_{90} = 0.74 - 0.0355 = 0.7045 \]
\[ LB_{95} = 0.74 - 0.0456 = 0.6944 \]
\[ LB_{99} = 0.74 - 0.0646 = 0.6754 \]
G. Interpretasi Statistik \[ \begin{array}{c|c} \text{Tingkat Kepercayaan} & \text{Batas Bawah} \\ \hline 90\% & 0.7045 \\ 95\% & 0.6944 \\ 99\% & 0.6754 \end{array} \]
Pada tingkat kepercayaan 90%, batas bawah interval kepercayaan lebih besar dari 0.70, sehingga target perusahaan terpenuhi.
Pada tingkat kepercayaan 95% dan 99%, batas bawah lebih kecil dari 0.70, sehingga klaim belum cukup kuat secara statistik.
Tabel Perbandingan | Tingkat Kepercayaan | Batas Bawah
| | ββββββ- | ββββ | | 90% | 0,7045 | | 95% | 0,6944 | | 99% | 0,6754
|
(Garis target perusahaan: 0,70)
| Tingkat Kepercayaan | Kesimpulan |
|---|---|
| 90% | Terpenuhi (0,7045 > 0,70) |
| 95% | Tidak terpenuhi |
| 99% | Tidak terpenuhi |
Berdasarkan seluruh analisis interval kepercayaan yang dilakukan pada beberapa studi kasus, dapat disimpulkan bahwa pemilihan jenis interval kepercayaan dan uji statistik sangat bergantung pada karakteristik data, tujuan analisis, serta tingkat kepastian yang diinginkan dalam pengambilan keputusan.
parameter yang diestimasi adalah proporsi populasi pengguna premium. Karena data bersifat dikotomi dan ukuran sampel cukup besar (n = 250), maka pendekatan distribusi normal baku (Z) layak digunakan. Fokus analisis manajemen hanya pada batas bawah proporsi, sehingga interval kepercayaan yang sesuai adalah interval kepercayaan satu sisi (lower bound confidence interval).
Hasil perhitungan menunjukkan bahwa:
Secara umum, semakin tinggi tingkat kepercayaan, semakin lebar interval kepercayaan, yang mencerminkan trade-off antara presisi dan keyakinan. Interval yang lebih sempit memberikan estimasi yang lebih presisi, tetapi dengan risiko kesalahan inferensi yang lebih besar. Sebaliknya, interval yang lebih lebar memberikan tingkat keyakinan yang lebih tinggi, tetapi mengurangi ketepatan estimasi.
Implikasi bisnis dari analisis ini adalah bahwa:
Untuk meningkatkan ketepatan estimasi di masa mendatang, disarankan untuk meningkatkan ukuran sampel, karena ukuran sampel yang lebih besar akan memperkecil standar error dan mempersempit interval kepercayaan.
https://www.openintro.org/stat/textbook.php?stat_book=os
Website: https://www.statlect.com