Code
Chandra Rizal Alamsyah
Student Majoring in Data Science at ITSB
R Programming Data Science Statistics
Studi Kasus 1
Interval Kepercayaan untuk Mean, \(\sigma\) Diketahui: Sebuah platform
e-commerce ingin memperkirakan rata-rata jumlah transaksi harian per
pengguna setelah meluncurkan fitur baru. Berdasarkan data historis skala
besar, standar deviasi populasi telah diketahui.
\(\sigma\) = 3.2 (Standar deviasi
populasi)
\(n\) = 100 (Ukuran sampel)
\(\bar{x}\) = 12.6 (Rata-rata
sampel)
Tugas
Identifikasi uji statistik yang tepat dan berikan alasan pilihan
Anda.
Hitung Interval Kepercayaan (Confidence Intervals) untuk:
\(90\%\)
\(95\%\)
\(99\%\)
Buat visualisasi perbandingan dari ketiga interval kepercayaan
tersebut.
Interpretasikan hasilnya dalam konteks analisis bisnis.
Identifikasi Uji
statistik
Identifikasi uji statistik yang tepat untuk kasus ini adalah Z-Test
untuk Satu Sampel Mean, dan estimasi dilakukan menggunakan Interval
Kepercayaan Z (Z-Confidence Interval).
Alasan Pemilihan Uji
Ada dua alasan utama mengapa kita menggunakan distribusi Z (Normal
standar) dan bukan distribusi t:
Standar Deviasi Populasi (\(\sigma\) ) Diketahui: Ini adalah kriteria
utama. Sesuai informasi yang ada, \(\sigma =
3.2\) sudah diketahui dari data historis skala besar. Jika \(\sigma\) tidak diketahui (hanya ada standar
deviasi sampel \(s\) ), maka kita harus
menggunakan t-test.
Ukuran Sampel Besar (\(n \geq
30\) ): Dengan \(n = 100\) ,
sampel yang ada memenuhi asumsi Teorema Limit Pusat (Central Limit
Theorem). Hal ini menjamin bahwa distribusi rata-rata sampel akan
mendekati distribusi normal, terlepas dari bentuk distribusi populasi
aslinya.
Perhitungan Interval
Kepercayaan (Confidence Intervals)
Rumus umum untuk Interval Kepercayaan Z adalah:
\[CI = \bar{x} \pm z_{\alpha/2} \left(
\frac{\sigma}{\sqrt{n}} \right)\]
Dimana:
\(\bar{x} = 12.6\)
\(\sigma = 3.2\)
\(n = 100\)
\(SE = \frac{\sigma}{\sqrt{n}} =
\frac{3.2}{\sqrt{100}} = \frac{3.2}{10} = 0.32\) (Standard Error
of the Mean)
Kita akan mencari nilai \(z_{\alpha/2}\) untuk masing-masing tingkat
kepercayaan:
Interval Kepercayaan 90%
\(\alpha = 1 - 0.90 = 0.10\)
\(\alpha/2 = 0.05\)
\(z_{0.05} = 1.645\) (Nilai z untuk
\(P(Z < -1.645)\) atau \(P(Z > 1.645)\) adalah 0.05)
\(CI_{90\%} = 12.6 \pm 1.645 \times
0.32\)
\(CI_{90\%} = 12.6 \pm
0.5264\)
Lower Bound: \(12.6 - 0.5264 =
12.0736\)
Upper Bound: \(12.6 + 0.5264 =
13.1264\) \(CI_{90\%} = [12.07,
13.13]\)
Interval Kepercayaan 95%
\(\alpha = 1 - 0.95 = 0.05\)
\(\alpha/2 = 0.025\)
\(z_{0.025} = 1.96\)
\(CI_{95\%} = 12.6 \pm 1.96 \times
0.32\)
\(CI_{95\%} = 12.6 \pm
0.6272\)
Lower Bound: \(12.6 - 0.6272 =
11.9728\)
Upper Bound: \(12.6 + 0.6272 =
13.2272\)
\(CI_{95\%} = [11.97, 13.23]\)
Interval Kepercayaan 99%
\(\alpha = 1 - 0.99 = 0.01\)
\(\alpha/2 = 0.005\)
\(z_{0.005} = 2.576\)
\(CI_{99\%} = 12.6 \pm 2.576 \times
0.32\)
\(CI_{99\%} = 12.6 \pm
0.82432\)
Lower Bound: \(12.6 - 0.82432 =
11.77568\)
Upper Bound: \(12.6 + 0.82432 =
13.42432\)
\(CI_{99\%} = [11.78, 13.42]\)
Ringkasan Interval Kepercayaan
90%
1.645
\(\pm 0.53\)
\([12.07,
13.13]\)
95%
1.96
\(\pm 0.63\)
\([11.97,
13.23]\)
99%
2.576
\(\pm 0.82\)
\([11.78,
13.42]\)
Visualisasi
Perbandingan Interval Kepercayaan
Interpretasi Hasil
dalam Konteks Analisis Bisnis
Berdasarkan perhitungan interval kepercayaan:
Semakin Tinggi Tingkat Kepercayaan, Semakin Lebar
Intervalnya:
Pada tingkat kepercayaan 90%, kita memperkirakan rata-rata
transaksi harian per pengguna berada antara 12.07 hingga 13.13. Ini
adalah rentang yang relatif sempit.
Pada tingkat kepercayaan 99%, rentang melebar menjadi 11.78
hingga 13.42. Ini mencerminkan bahwa untuk lebih yakin (99% percaya)
bahwa interval kita mengandung rata-rata populasi yang sebenarnya, kita
harus menerima rentang estimasi yang lebih luas.
Trade-off antara Presisi dan Kepercayaan:
Presisi (rentang sempit) diinginkan dalam bisnis untuk membuat
keputusan yang spesifik. Namun, presisi tinggi (misalnya, 90% CI)
berarti Anda memiliki kepercayaan yang sedikit lebih rendah bahwa
interval tersebut benar-benar mencakup nilai rata-rata
populasi.
Kepercayaan (probabilitas tinggi) bahwa interval Anda menangkap
parameter populasi (misalnya, 99% CI) berarti Anda harus menerima
rentang estimasi yang lebih luas, yang mungkin kurang “spesifik” dalam
perencanaan bisnis.
Implikasi Bisnis:
Platform e-commerce dapat menyatakan dengan 95% kepercayaan bahwa
rata-rata transaksi harian per pengguna setelah meluncurkan fitur baru
berada di antara 11.97 dan 13.23.
Manajemen dapat menggunakan rentang ini untuk perencanaan.
Misalnya, jika target kinerja fitur baru adalah minimal 12 transaksi per
pengguna, interval 95% masih menunjukkan kemungkinan bahwa rata-rata
sesungguhnya sedikit di bawah 12 (walaupun 11.97 sangat dekat). Interval
99% bahkan menunjukkan kemungkinan yang lebih tinggi untuk rata-rata di
bawah 12.
Jika perusahaan membutuhkan kepastian yang sangat tinggi (99%)
mengenai dampaknya, mereka harus menyadari bahwa rata-rata transaksi
bisa serendah 11.78 atau setinggi 13.42, memberikan rentang perkiraan
yang lebih besar untuk skenario terburuk dan terbaik.
Singkatnya, fitur baru ini tampaknya memiliki rata-rata transaksi
yang cukup baik, dengan perkiraan terbaik mendekati 12.6. Pemilihan
tingkat kepercayaan akan bergantung pada seberapa konservatif atau
agresif manajemen ingin melihat potensi dampak fitur ini.
Studi Kasus 2
Interval Kepercayaan untuk Mean, \(\sigma\) Tidak Diketahui: Tim Riset UX
(User Experience) menganalisis waktu penyelesaian tugas (dalam menit)
untuk aplikasi seluler baru. Data dikumpulkan dari 12 pengguna:
\(8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5,
8.9, 8.1, 8.6, 8.3\)
Tugas
Identifikasi uji statistik yang tepat dan jelaskan alasannya.
Hitung Interval Kepercayaan untuk:
\(90\%\)
\(95\%\)
\(99\%\)
Visualisasikan ketiga interval tersebut dalam satu plot.
Jelaskan bagaimana ukuran sampel dan tingkat kepercayaan memengaruhi
lebar interval.
Identifikasi Uji
Statistik
Uji statistik yang tepat untuk kasus ini adalah Distribusi t-Student
(t-distribution).
Alasannya:
Standar Deviasi Populasi (\(\sigma\) ) Tidak Diketahui: Kita hanya
memiliki data sampel untuk menghitung standar deviasi sampel (\(s\) ).
Ukuran Sampel Kecil: Jumlah sampel \(n =
12\) (kurang dari 30).
Asumsi: Kita mengasumsikan waktu penyelesaian tugas terdistribusi
secara normal.
Perhitungan Interval
Kepercayaan
Rumus yang digunakan adalah:
\[CI = \bar{x} \pm t_{\alpha/2, df} \times
\left( \frac{s}{\sqrt{n}} \right)\] 1. Untuk Tingkat Kepercayaan
90%
(\(\alpha = 0.10\) )\(\alpha/2 = 0.05\)
Nilai kritis \(t_{0.05, 11} =
1.796\)
Perhitungan: \[CI = 8.458 \pm 1.796
\times \left( \frac{0.412}{\sqrt{12}} \right)\] \[CI = 8.458 \pm 1.796 \times 0.119\] \[CI = 8.458 \pm 0.2137\]
Hasil: (8.244, 8.672)
Untuk Tingkat Kepercayaan 95%
(\(\alpha = 0.05\) )\(\alpha/2 = 0.025\)
Nilai kritis \(t_{0.025, 11} =
2.201\)
Perhitungan: \[CI = 8.458 \pm 2.201
\times \left( \frac{0.412}{\sqrt{12}} \right)\] \[CI = 8.458 \pm 2.201 \times 0.119\] \[CI = 8.458 \pm 0.2619\]
Hasil: (8.196, 8.720)
Untuk Tingkat Kepercayaan 99%
(\(\alpha = 0.01\) )\(\alpha/2 = 0.005\)
Nilai kritis \(t_{0.005, 11} =
3.106\)
Perhitungan: \[CI = 8.458 \pm 3.106
\times \left( \frac{0.412}{\sqrt{12}} \right)\] \[CI = 8.458 \pm 3.106 \times 0.119\] \[CI = 8.458 \pm 0.3696\]
Hasil: (8.088, 8.828)
Ringkasan Interval Kepercayaan
90%
\(1.796\)
\(0.214\)
(8.244, 8.672)
95%
\(2.201\)
\(0.262\)
(8.196, 8.720)
99%
\(3.106\)
\(0.370\)
(8.088, 8.828)
Visualisasi Interval
Kepercayaan
Pada plot yang ditampilkan:
Setiap garis horizontal merepresentasikan satu interval
kepercayaan.
Titik di tengah adalah rata-rata sampel.
Terlihat jelas bahwa interval 99% paling lebar, diikuti 95%, lalu
90%.
Analisis Pengaruh
Variabel
A. Pengaruh Tingkat Kepercayaan:Semakin tinggi tingkat kepercayaan
(misal dari 90% ke 99%), maka interval akan semakin lebar. Hal ini
karena kita membutuhkan rentang nilai yang lebih besar agar kita “lebih
yakin” bahwa parameter populasi yang sebenarnya berada di dalam rentang
tersebut.
B. Pengaruh Ukuran Sampel (\(n\) ):Meskipun dalam kasus ini \(n\) tetap (12), secara teori: semakin besar
ukuran sampel, maka interval akan semakin sempit. Hal ini terjadi karena
nilai pembagi dalam rumus Standar Error (\(\sqrt{n}\) ) menjadi lebih besar, yang
mengurangi ketidakpastian (error) dalam estimasi kita.
Studi Kasus 3
Interval Kepercayaan untuk Proporsi, A/B Testing: Sebuah tim sains
data menjalankan uji A/B pada desain tombol Call-To-Action (CTA) yang
baru. Eksperimen menghasilkan:
\(n\) = 400 (Total pengguna)
\(x\) = 156 (Pengguna yang mengklik
CTA)
Tugas:
Hitung proporsi sampel \(\hat{p}\) .
Hitung Interval Kepercayaan untuk proporsi pada tingkat:
\(90\%\)
\(95\%\)
\(99\%\)
Visualisasikan dan bandingkan ketiga interval tersebut.
Jelaskan bagaimana tingkat kepercayaan memengaruhi pengambilan
keputusan dalam eksperimen produk.
Proporsi Sampel
(\(\hat{p}\) )
Diketahui:
Proporsi sampel : \[\hat{p} = \frac{x}{n}
= \frac{156}{400} = 0.39\] Interpretasi:
Sekitar 39% pengguna mengklik tombol CTA pada desain yang diuji.
Perhitungan Interval
Kepercayaan untuk Proporsi
Rumus yang digunakan adalah: \[CI =
\hat{p} \pm z_{\alpha/2} \times
\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\] Di mana Standard Error
(\(SE\) ) adalah:\[SE = \sqrt{\frac{0.39(1-0.39)}{400}} =
\sqrt{\frac{0.39 \times 0.61}{400}} \approx 0.02439\]
Interval Kepercayaan 90% (\(z =
1.645\) )
Margin of Error: \(1.645 \times 0.02439
\approx 0.0401\)
Interval: (0.3499, 0.4301) atau 34.99% - 43.01%
Interval Kepercayaan 95% (\(z =
1.96\) )
Margin of Error: \(1.96 \times 0.02439
\approx 0.0478\)
Interval: (0.3422, 0.4378) atau 34.22% - 43.78%
Interval Kepercayaan 99% (\(z =
2.576\) )
Margin of Error: \(2.576 \times 0.02439
\approx 0.0628\)
Interval: (0.3272, 0.4528) atau 32.72% - 45.28%
Visualisasi dan
Perbandingan
Perbandingan: Semakin tinggi tingkat kepercayaan, rentang interval
semakin lebar. Hal ini terjadi karena untuk mendapatkan kepastian yang
lebih tinggi (99%), kita harus memperluas rentang estimasi agar nilai
populasi yang sebenarnya tidak “luput”.
Pengaruh pada
Pengambilan Keputusan Produk
Dalam eksperimen produk (A/B Testing), tingkat kepercayaan sangat
memengaruhi risiko bisnis:
Tingkat Kepercayaan Tinggi (99%): Digunakan untuk keputusan yang
berisiko tinggi atau mahal. Misalnya, jika mengganti desain CTA
membutuhkan biaya pengembangan yang besar, tim akan memilih 99% untuk
memastikan kenaikan konversi bukan karena faktor kebetulan.
Tingkat Kepercayaan Standar (95%): Merupakan standar industri.
Memberikan keseimbangan yang baik antara kepastian statistik dan
kecepatan pengambilan keputusan.
Dampak pada Keputusan: Jika interval kepercayaan desain baru (34%
- 43%) tidak tumpang tindih (overlap) dengan interval desain lama (misal
20% - 25%), maka kita bisa dengan yakin memutuskan untuk roll-out desain
baru. Namun, jika ada overlap, kita mungkin butuh ukuran sampel (\(n\) ) yang lebih besar atau menjalankan tes
lebih lama.
Studi Kasus 4
Perbandingan Presisi (Uji-Z vs Uji-t): Dua tim data mengukur latensi
API (dalam milidetik) di bawah kondisi yang berbeda.
Tim A:
\(n\) = 36 (Ukuran sampel)
\(\bar{x}\) = 210 (Rata-rata
sampel)
\(\sigma\) = 24 (Standar deviasi
populasi diketahui)
Tim B:
\(n\) = 36 (Ukuran sampel)
\(\bar{x}\) = 210 (Rata-rata
sampel)
\(s\) = 24 (Standar deviasi
sampel)
Tugas:
Identifikasi uji statistik yang digunakan oleh masing-masing
tim.
Hitung Interval Kepercayaan untuk
\(90\%\)
\(95\%\)
\(99\%\) .
Buat visualisasi yang membandingkan semua interval tersebut.
Jelaskan mengapa lebar interval berbeda, meskipun data yang
digunakan serupa.
Identifikasi Uji
Statistik
Tim A menggunakan Uji-Z (Normal Distribution): Karena ukuran sampel
sudah mencukupi (\(n \geq 30\) ) dan
standar deviasi populasi (\(\sigma\) )
diketahui.
Uji yang digunakan: Uji-Z (Z-interval) \[CI = \bar{x} \pm z_{\alpha/2} \left(
\frac{\sigma}{\sqrt{n}} \right)\]
Tim B menggunakan Uji-t (Student’s t-Distribution): Karena meskipun
ukuran sampel cukup, tim ini hanya mengetahui standar deviasi sampel
(\(s\) ), bukan standar deviasi
populasi.
Uji yang digunakan: Uji-t (t-interval) \[CI = \bar{x} \pm t_{\alpha/2, df} \times \left(
\frac{s}{\sqrt{n}} \right)\]
Perhitungan Interval
Kepercayaan (CI)
Kedua tim memiliki \(\bar{x} =
210\) , \(n = 36\) , dan angka
deviasi \(24\) .Standard Error (SE)
untuk keduanya adalah: \(SE =
\frac{24}{\sqrt{36}} = \frac{24}{6} = 4\) .
Tim A (Uji-Z)
Rumus: \(CI = \bar{x} \pm (z_{\alpha/2}
\times SE)\)
\(90\%\) (z=1.645): \(210 \pm (1.645 \times 4) = 210 \pm 6.58
\rightarrow\) (203.42, 216.58)
\(95\%\) (z=1.96): \(210 \pm (1.96 \times 4) = 210 \pm 7.84
\rightarrow\) (202.16, 217.84)
\(99\%\) (z=2.576): \(210 \pm (2.576 \times 4) = 210 \pm 10.30
\rightarrow\) (199.70, 220.30)
🔹 Interval Kepercayaan Tim A (Uji-Z)
90%
\(z\) = 1.645
(203.42 , 216.58)
95%
\(z\) = 1.96
(202.16 , 217.84)
99%
\(z\) = 2.576
(199.70 , 220.30)
Tim B (Uji-t, df=35)
Rumus: \(CI = \bar{x} \pm (t_{\alpha/2, 35}
\times SE)\)
90% (t=1.689): \(210 \pm (1.689 \times
4) = 210 \pm 6.756 \rightarrow\) (203.24, 216.76)
95% (t=2.030): \(210 \pm (2.030 \times
4) = 210 \pm 8.12 \rightarrow\) (201.88, 218.12)
99% (t=2.723): \(210 \pm (2.723 \times
4) = 210 \pm 10.89 \rightarrow\) (199.11, 220.89)
🔹 Interval Kepercayaan Tim B (Uji-t, df = 35)
90%
\(t\) =1.690
(203.24 , 216.76)
95%
\(t\) =2.030
(201.88 , 218.12)
99%
\(t\) =2.724
(199.10 , 220.90)
Visualisasi
Perbandingan Semua Variabel
Penjelasan Perbedaan
Lebar Interval
Meskipun data (\(\bar{x}, n, \text{angka
deviasi}\) ) identik, interval Tim B (Uji-t) selalu lebih lebar
daripada Tim A (Uji-Z). Mengapa?
Faktor Ketidakpastian: Tim A menggunakan standar deviasi populasi
(\(\sigma\) ) yang dianggap sebagai
nilai absolut yang pasti. Tim B hanya menggunakan standar deviasi sampel
(\(s\) ) yang mengandung risiko
kesalahan karena hanya berasal dari 36 data.
Karakteristik Distribusi-t: Distribusi-t memiliki “ekor” yang
lebih tebal (heavier tails) dibandingkan distribusi normal (Z). Ini
adalah cara statistik memberikan “penalti” atau kompensasi atas
ketidaktahuan kita terhadap parameter populasi asli.
Nilai Kritis: Nilai kritis \(t\)
selalu lebih besar daripada nilai \(z\)
untuk tingkat kepercayaan yang sama. Contohnya pada 95%, \(t=2.030\) sedangkan \(z=1.96\) . Angka pengali yang lebih besar
inilah yang membuat interval Tim B lebih lebar (kurang presisi
dibandingkan Tim A).
Kesimpulan untuk Keputusan: Tim A memiliki presisi yang lebih tinggi
karena informasi yang mereka miliki lebih lengkap (tahu data populasi).
Tim B harus menerima rentang yang lebih lebar sebagai konsekuensi dari
penggunaan data sampel.
Studi Kasus 5
Interval Kepercayaan Satu Sisi (One-Sided): Sebuah perusahaan SaaS
(Software as a Service) ingin memastikan bahwa setidaknya 70% dari
pengguna aktif mingguan menggunakan fitur premium.
Dari eksperimen:
\(n\) = 250 (Total pengguna)
\(x\) = 185 (Pengguna premium
aktif)
Manajemen hanya tertarik pada batas bawah (lower bound) dari estimasi
tersebut.
Tugas:
Identifikasi jenis Interval Kepercayaan dan uji yang tepat.
Hitung Interval Kepercayaan satu sisi (batas bawah) pada
tingkat:
\(90\%\)
\(95\%\)
\(99\%\)
Visualisasikan batas bawah untuk semua tingkat kepercayaan.
Tentukan apakah target 70% tersebut terpenuhi secara statistik.
Identifikasi Jenis
Interval Kepercayaan
Karena manajemen hanya ingin memastikan apakah persentase pengguna
setidaknya (paling sedikit) berada pada angka tertentu, maka uji yang
tepat adalah Interval Kepercayaan Satu Sisi (One-Sided Confidence
Interval - Lower Bound) untuk proporsi.
Jenis Data: Proporsi (kualitatif/biner: menggunakan atau tidak
menggunakan fitur premium).
Uji Statistik: Uji-Z untuk proporsi satu sisi (karena \(n=250\) sudah cukup besar).
Perhitungan Batas
Bawah (Lower Bound)
Data Statistik:
\(n = 250\)
\(x = 185\)
\(\hat{p} = \frac{185}{250} =
0.74\) (74%)
Standard Error (\(SE\) ): \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} =
\sqrt{\frac{0.74 \times 0.26}{250}} = \sqrt{0.0007696} \approx
0.0277\)
Rumus Batas Bawah: \(Lower\ Bound = \hat{p}
- (z_{\alpha} \times SE)\) Catatan: Pada uji satu sisi, kita
menggunakan \(z_{\alpha}\) , bukan \(z_{\alpha/2}\) .
Tingkat Kepercayaan 90% (\(\alpha =
0.10\) )
\(z_{0.10} = 1.282\)
\(0.74 - (1.282 \times 0.0277) = 0.74 -
0.0355 = \mathbf{0.7045\ (70.45\%)}\)
Tingkat Kepercayaan 95% (\(\alpha =
0.05\) )
\(z_{0.05} = 1.645\)
\(0.74 - (1.645 \times 0.0277) = 0.74 -
0.0456 = \mathbf{0.6944\ (69.44\%)}\)
Tingkat Kepercayaan 99% (\(\alpha =
0.01\) )
\(z_{0.01} = 2.326\)
\(0.74 - (2.326 \times 0.0277) = 0.74 -
0.0644 = \mathbf{0.6756\ (67.56\%)}\)
Kesimpulan
Apakah Target 70% Terpenuhi?Penentuan terpenuhinya target tergantung
pada tingkat kepercayaan yang dipilih oleh manajemen:
Pada Tingkat Kepercayaan 90%: Target Terpenuhi. Batas bawah
(70.45%) masih berada di atas target 70%. Kita yakin 90% bahwa
setidaknya 70.45% pengguna adalah premium.
Pada Tingkat Kepercayaan 95%: Target Tidak Terpenuhi secara
statistik. Batas bawah (69.44%) sedikit di bawah 70%. Walaupun rata-rata
sampel kita 74%, ada kemungkinan kecil proporsi asli populasi turun
hingga 69.44%.
Pada Tingkat Kepercayaan 99%: Target Tidak Terpenuhi. Batas bawah
(67.56%) berada cukup jauh di bawah target.
Referensi
Agresti, A. (2013). Categorical Data Analysis (3rd ed.). Hoboken,
NJ: John Wiley & Sons.(Referensi utama untuk logika perhitungan
interval kepercayaan proporsi pada Kasus 3 dan Kasus 5).
Hogg, R. V., McKean, J. W., & Craig, A. T. (2019). Introduction
to Mathematical Statistics (8th ed.). Pearson.(Dasar teori mengenai
sifat-sifat distribusi sampling dan Teorema Limit Pusat).
Montgomery, D. C., & Runger, G. C. (2014). Applied Statistics
and Probability for Engineers. Hoboken, NJ: John Wiley &
Sons.(Referensi untuk perhitungan praktis Interval Kepercayaan
menggunakan Distribusi-Z dan Distribusi-t pada data kontinu).
NIST/SEMATECH. (2012). e-Handbook of Statistical Methods. https://www.itl.nist.gov/div898/handbook/(Panduan teknis
untuk penentuan batas bawah/bawah aman dan Margin of Error).
Student [Gosset, W. S.]. (1908). The Probable Error of a Mean.
Biometrika, 6(1), 1-25.(Dokumen historis asli yang menjadi dasar
penggunaan Distribusi-t pada sampel kecil seperti pada Kasus 2).
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012).
Probability & Statistics for Engineers & Scientists (9th ed.).
Boston, MA: Pearson.(Buku pegangan standar untuk penentuan nilai kritis
\(z_{\alpha/2}\) dan \(t_{\alpha/2}\) ).
Ringkasan Logika yang
Digunakan:
Kasus 1 & 4 (Distribusi-Z): Digunakan saat ukuran sampel besar
atau standar deviasi populasi (\(\sigma\) ) diketahui. Menggunakan nilai
kritis dari kurva Normal standar.
Kasus 2 (Distribusi-t): Digunakan untuk sampel kecil (\(n < 30\) ) di mana standar deviasi
populasi tidak diketahui, sehingga menggunakan derajat kebebasan (\(df = n - 1\) ).
Kasus 3 & 5 (Proporsi): Menggunakan pendekatan distribusi Normal
terhadap distribusi Binomial dengan rumus \(Margin\ of\ Error = z_{\alpha/2}
\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\) .
