Probability Distributions (Distribusi Probabilitas)
Distribusi probabilitas adalah konsep penting dalam statistika.
Tujuannya adalah untuk memahami seberapa besar kemungkinan suatu
kejadian terjadi. Selain itu, konsep ini juga menjadi dasar dari
berbagai metode statistik yang digunakan untuk membuat keputusan.
Dalam suatu proses atau eksperimen (misalnya melempar koin, mengukur
tinggi badan, menghitung pelanggan datang), hasilnya bisa berbeda-beda.
Untuk mewakili hasil yang berubah-ubah ini, kita memakai:
Variabel acak (random variable) untuk mewakili nilai hasil yang
mungkin terjadi
Distribusi probabilitas untuk menjelaskan bagaimana peluang diberikan
pada tiap nilai itu
Kenapa bentuk distribusi penting?
Bentuk suatu distribusi membantu kita memahami:
bagaimana data itu berperilaku
bagaimana cara menghitung peluang tertentu
bagaimana membuat prediksi
Misalnya, data tinggi badan membentuk distribusi lonceng (normal),
sedangkan data jumlah pelanggan per hari bisa mengikuti distribusi
Poisson.
Perannya dalam statistika
Distribusi probabilitas sangat penting karena:
Menjelaskan bagaimana peluang dikelompokkan
Menjadi dasar dari statistik inferensial (misalnya: menghitung
rata-rata sampel, varians, membuat confidence interval, uji
hipotesis)
Materi penting yang akan dipelajari
Beberapa konsep kunci yang diperkenalkan dalam bagian ini:
Continuous Random Variables (Variabel Acak Kontinu) Variabel yang
nilainya bisa berupa angka dalam rentang terus-menerus (misal: tinggi
badan, berat badan, waktu). Distribusi probabilitas membantu menjelaskan
peluang nilai-nilai tersebut muncul.
Distribusi probabilitas membantu kita memahami bagaimana peluang
tersebar pada semua kemungkinan hasil. Ini sangat penting untuk
memprediksi data, menganalisis hasil eksperimen, dan mengambil keputusan
berdasarkan data.
2 . countinuous
Random
Variabel acak kontinu adalah variabel yang bisa mengambil nilai dalam
rentang yang tidak terhingga, atau dalam interval tertentu yang tidak
terputus.
Contoh variabel acak kontinu:tinggi badan, berat badan,waktu ( misal
waktu tempuh 0-10 menit) suhu udara jarak
Nilainya bisa berupa angka desimal, dan ada tak terbatas kemungkinan
nilai di antara dua angka.
Disebut continuous karena nilainya terus menerus dan tidak diskrit.
Misalnya waktu = 3 detik : masih bisa 3.1, 3.12, 3.123, 3.1234, dan
seterusnya.
Ini berbeda dengan variabel diskrit seperti:
jumlah anak (1, 2, 3, …)
jumlah dadu keluar (1–6)
Untuk variabel kontinu, probabilitas tidak dihitung untuk satu nilai
tertentu, tetapi untuk rentang nilai.
Karena:
Peluang bahwa variabel acak kontinu tepat sama dengan satu nilai
tertentu = 0.
Contohnya: P(tinggi = 170 cm tepat) = 0 Tapi P(tinggi antara 165–175
cm) > 0
Untuk variabel kontinu, kita menggunakan:
PDF (Probability Density Function)
grafik atau fungsi yang menggambarkan bagaimana probabilitas tersebar
dalam rentang nilai.
Contoh: Kurva normal (lonceng).
CDF (Cumulative Distribution Function)
menunjukkan peluang bahwa nilai X berada di bawah atau sama dengan
suatu angka
Video tersebut memberi pengantar dasar mengenai:
apa itu variabel acak kontinu
bagaimana peluang dihitung
perbedaan kontinu vs diskrit
bagaimana bentuk distribusi probabilitas kontinu
Variabel acak kontinu adalah variabel yang nilainya bisa berupa angka
dalam rentang tak terbatas (misalnya waktu, tinggi badan, suhu).
Distribusi probabilitas untuk variabel kontinu menggunakan PDF dan CDF,
dan peluang dihitung berdasarkan rentang nilai, bukan nilai tunggal.
1 Variabel Acak (Random Variable)
Definisi: Variabel yang nilainya ditentukan oleh hasil dari suatu
percobaan acak. Jenis:
Diskrit: Nilainya terhitung (contoh: jumlah kepala dalam pelemparan
koin). Kontinu: Nilainya dalam interval (contoh: tinggi badan,
waktu).
2 Distribusi Probabilitas Diskrit . Fungsi yang memberukan
probabilias untuk setiap nilai variable acak diskrit
syarat 1. 0 < P(X = x)< 1 2. \(\sum
x\)
Contoh Distribusi Diskrit: Distribusi Binomial
· Digunakan untuk: Percobaan dengan dua hasil (sukses/gagal),
percobaan independen, dan probabilitas sukses tetap.
P(X = k) =\[ \binom{n}{k} p^k
(1-p)^{n-k}\]
dengan: · n = jumlah percobaan · k = jumlah sukses · p = probabilitas
sukses per percobaan · \[\binom{n}{k} =
\frac{n!}{k!(n-k)!} \] ·
· Probabilitas dihitung sebagai area di bawah kurva fungsi kepadatan
probabilitas (PDF). · Probabilitas pada satu titik tertentu = 0. ·
Contoh utama: Distribusi Normal.
Distribusi Normal
· Ciri: Bentuk simetris, lonceng, ditentukan oleh mean\[ (\mu) dan standar deviasi (\sigma).\] ·
PDF: f(x) = \[\frac{1}{\sigma \sqrt{2\pi}}
e^{-\frac{1}{2} \left( \frac{x-\mu}{\sigma} \right)^2}\] ·
Standardisasi: Z = \[\frac{X - \mu}{\sigma}
Mengubah distribusi normal umum N(\mu, \sigma^2) menjadi distribusi
normal standar N(0, 1)\] . · Contoh: Tinggi badan mahasiswa ~
Normal\[( \mu=170 cm, \sigma=10 cm).
Probabilitas tinggi < 185 cm?\] Z = \[\frac{185 - 170}{10} = 1.5
Lihat tabel Z: P(Z < 1.5) \approx 0.9332\] .
4 Menggunakan Tabel Z (Tabel Normal Standar)
· Memberikan \[ P(Z \leq z) \]
untuk distribusi normal standar. · Langkah: Standardisasi $ X menjadi
\[ Z \]. Cari nilai z pada tabel.
Interpretasi area kumulatif.
Konsep Rumus Mean (Harapan) Diskrit \[E(X)
= \sum x \cdot P(X=x) \] Varians Diskrit Var\[(X) = \sum (x - \mu)^2 P(X=x) \] Binomial
P(X=k) = \[\binom{n}{k} p^k (1-p)^{n-k}
\] Z-score Z =\[ \frac{X -
\mu}{\sigma} \] Probabilitas Normal Gunakan Tabel Z setelah
standardisasi
Soal: Probabilitas produk cacat = 0.1. Diambil sampel 8 produk.
Hitung probabilitas maksimal 2 cacat.
· Distribusi Binomial cocok untuk menghitung jumlah sukses dalam
percobaan diskrit independen. · Distribusi Normal digunakan untuk data
kontinu yang simetris, dapat distandardisasi untuk menggunakan tabel Z.
· Pemahaman kedua distribusi ini menjadi dasar untuk analisis statistik
inferensial
3 . Sampling
Distributions
· Distribusi sampling adalah distribusi probabilitas dari suatu
statistik sampel (seperti mean, proporsi, varians) yang dihitung dari
banyak sampel acak berukuran sama dari populasi yang sama. · Ini berbeda
dengan distribusi populasi (distribusi nilai individu) dan distribusi
sampel (distribusi nilai dalam satu sampel).
Distribusi sampling merupakan dasar untuk:
Inferensi statistik (estimasi parameter dan pengujian
hipotesis)
Memahami variabilitas statistik sampel dari sampel ke
sampel
Menghitung margin of error dan interval kepercayaan
Distribusi Sampling Mean \((\bar{X})\)
Karakteristik (Teorema Limit Pusat)
Untuk sampel acak berukuran n dari populasi dengan mean dan standar
deviasi :
. Mean distribusi sampling = mean populasi: \[ \mu_{\bar{x}} = \mu\] . Standar error
(standar deviasi distribusi sampling): \[
\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\] . Bentuk
distribusi:
· Jika populasi normal distribusi sampling mean normal untuk semua n
· Jika populasi tidak normal distribusi sampling mean mendekati normal
jika n (Central Limit Theorem)
Z =\[ \frac{\bar{x} - \
u}{\sigma/\sqrt{n}}\]
Distribusi Normal Populasi
Populasi IQ berdistribusi normal dengan \[\mu = 100, \sigma = 15. Ambil sampel n =
25.\]
Pendapatan per kapita skew right dengan \[\mu = \$50,000, \sigma = \$20,000. Ambil sampel n
= 100.\]
. Bentuk distribusi sampling: Mendekati normal (karena n = 100 ) .
Standar error: \[\sigma_{\bar{x}} =
\frac{20000}{\sqrt{100}} = 2000\] Probabilitas mean sampel <
$48,000: Z =\[ \frac{48000 - 50000}{2000} =
-1
P(\bar{x} < 48000) = P(Z < -1) = 0.1587\]
Distribusi Sampling Proporsi \[(\hat{p})\]
Untuk proporsi populasi p dan sampel berukuran n:
. Mean distribusi sampling: \[
\mu_{\hat{p}}\] = p . Standar error: \[\sigma_{\hat{p}} =
\sqrt{\frac{p(1-p)}{n}}\] Kondisi pendekatan normal (Rule of
Thumb): np \[\geq 10 \quad \text{dan} \quad
n(1-p) \geq 10\]
Z = \[\frac{\hat{p} -
p}{\sqrt{\frac{p(1-p)}{n}}}\]
30% penduduk kota merokok (p = 0.3). Ambil sampel n = 200.
. Probabilitas proporsi sampel > 35%: Z = = 1.54 P( > 0.35) =
P(Z > 1.54) = 0.0618
Teorema Limit Pusat (Central Limit Theorem - CLT)
Untuk sampel acak berukuran n dari populasi dengan mean dan varians
^2 terbatas, distribusi sampling mean sampel akan mendekati distribusi
normal dengan mean dan varians ^2/n ketika n besar, terlepas dari bentuk
distribusi populasi.
Visualisasi CLT
Populasi (Bentuk Apa Saja) ↓ Sampel 1 → Mean₁
Sampel 2 → Mean₂
Sampel 3 → Mean₃ ⋮ Sampel k → Meanₖ ↓ Distribusi Mean₁, Mean₂, …,
Meanₖ → NORMAL (bentuk lonceng)
. Implikasi Praktis CLT
Ukuran sampel n biasanya cukup untuk pendekatan normal
Untuk populasi sangat skew, mungkin perlu n > 50
Untuk populasi normal, berlaku untuk semua n
Hubungan dengan Inferensi Statistik
. Estimasi Interval (Interval Kepercayaan)
Untuk mean populasi ():
{x} Z_{/2}
{x} t_{/2}
Untuk proporsi populasi (p):
Z_{/2}
. Contoh 4: Margin of Error
Survei 400 orang menunjukkan 60% setuju kebijakan ( = 0.6). Hitung
margin of error 95% CI.
Standar error: SE = = = 0.0245
Z-score 95% = 1.96
Margin of error: ME = 1.96 = 0.048
95% CI: 0.6 = (0.552, 0.648)
Distribusi Sampling
Statistik Sampel Mean Standar Error Kondisi Normalitas Mean \[(\bar{x}) \mu_{\bar{x}} = \mu
\sigma_{\bar{x}}\] = Populasi normal ATAU n \[\geq 30\]
4 . Distribusi
sampling
Konsep Dasar Distribusi Sampling
· Distribusi sampling adalah distribusi probabilitas dari suatu
statistik sampel (seperti mean, proporsi, varians) yang dihitung dari
banyak sampel acak berukuran sama dari populasi yang sama. · Ini berbeda
dengan distribusi populasi (distribusi nilai individu) dan distribusi
sampel (distribusi nilai dalam satu sampel).
Distribusi sampling merupakan dasar untuk:
Inferensi statistik (estimasi parameter dan pengujian
hipotesis)
Memahami variabilitas statistik sampel dari sampel ke
sampel
Menghitung margin of error dan interval kepercayaan
Distribusi Sampling Mean \((\bar{X})\)
A. Karakteristik (Teorema Limit Pusat)
Untuk sampel acak berukuran n dari populasi dengan mean \[\mu dan standar deviasi \sigma\]:
Mean distribusi sampling = mean populasi: \[ \mu_{\bar{x}} = \mu\]
Standar error (standar deviasi distribusi sampling): \[ \sigma_{\bar{x}} =
\frac{\sigma}{\sqrt{n}}\]
Bentuk distribusi: · Jika populasi normal → distribusi sampling mean
normal untuk semua n · Jika populasi tidak normal → distribusi sampling
mean mendekati normal jika n \[\geq 30
(Central Limit Theorem)\]
B. Rumus Z-score untuk Mean Sampel
Z = \[\frac{\bar{x} -
\mu}{\sigma/\sqrt{n}}\]
C. Contoh 1: Distribusi Normal Populasi
Populasi IQ berdistribusi normal dengan \[\mu = 100, \sigma = 15. Ambil sampel n =
25.\]
Probabilitas mean sampel > 105: Z = \[\frac{105 - 100}{3} = 1.67
P(\bar{x} > 105) = P(Z > 1.67) = 0.0475\] : Central Limit
Theorem
Pendapatan per kapita skew right dengan\[
\mu = \$50,000, \sigma = \$20,000. Ambil sampel n = 100.\]
Bentuk distribusi sampling: Mendekati normal (karena n = 100$$
)
Standar error: $$_{{x}} = = 2000
Probabilitas mean sampel < $48,000: Z = = -1 P({x} < 48000) =
P(Z < -1) = 0.1587
Distribusi Sampling Proporsi ()
A. Karakteristik
Untuk proporsi populasi p dan sampel berukuran n:
Mean distribusi sampling: \[
\mu_{\hat{p}\]} = p
Standar error: _{} =
Kondisi pendekatan normal (Rule of Thumb): np n(1-p)
Z-score untuk Proporsi Sampel
Z =\[ \frac{\hat{p} -
p}{\sqrt{\frac{p(1-p)}{n}}}\] Proporsi Sampel
30% penduduk kota merokok (p = 0.3). Ambil sampel n = 200.
Cek kondisi normal: np = 200$$ = 60 n(1-p) = 200 = 140 → Distribusi
sampling proporsi mendekati normal
Standar error: _{} = = = 0.0324
Probabilitas proporsi sampel > 35%: Z = = 1.54 P( > 0.35) =
P(Z > 1.54) = 0.0618
Teorema Limit Pusat (Central Limit Theorem - CLT)
. Pernyataan CLT
Untuk sampel acak berukuran n dari populasi dengan mean dan varians
^2 terbatas, distribusi sampling mean sampel akan mendekati distribusi
normal dengan mean dan varians ^2/n ketika n besar, terlepas dari bentuk
distribusi populasi.
. Visualisasi CLT
Populasi (Bentuk Apa Saja) ↓ Sampel 1 → Mean₁ Sampel 2 → Mean₂ Sampel
3 → Mean₃ ⋮ Sampel k → Meanₖ ↓ Distribusi Mean₁, Mean₂, …, Meanₖ →
NORMAL (bentuk lonceng)
C. Implikasi Praktis CLT
Ukuran sampel n biasanya cukup untuk pendekatan normal
Untuk populasi sangat skew, mungkin perlu n > 50
Untuk populasi normal, berlaku untuk semua n
Hubungan dengan Inferensi Statistik
A. Estimasi Interval (Interval Kepercayaan)
Untuk mean populasi ():
{x} Z_{/2}
{x} t_{/2}
Untuk proporsi populasi (p):
Z_{/2}
B. Contoh 4: Margin of Error
Survei 400 orang menunjukkan 60% setuju kebijakan ( = 0.6). Hitung
margin of error 95% CI.
Standar error: SE = = = 0.0245
Z-score 95% = 1.96
Margin of error: ME = 1.96 = 0.048
95% CI: 0.6 = (0.552, 0.648)
Tabel Ringkasan Distribusi Sampling
Statistik Sampel Mean Standar Error Kondisi Normalitas Mean ({x})
{{x}} = {{x}} = Populasi normal ATAU n Proporsi () {} = p
{} = np dan n(1-p) Selisih Mean ({x}_1 - {x}_2) _1 - _2
Masing-masing memenuhi kondisi mean Selisih Proporsi (_1 - _2) p_1 - p_2
Masing-masing memenuhi kondisi proporsi
Contoh Soal Gabungan
Soal:
Perusahaan klaim rata-rata masa pakai baterai 100 jam dengan σ = 20
jam. Diambil sampel 50 baterai.
Apa bentuk distribusi sampling mean masa pakai?
Hitung probabilitas mean sampel < 95 jam.
Hitung probabilitas mean sampel berbeda dari populasi > 3
jam.
Distribusi sampling menjelaskan variabilitas statistik sampel
dari sampel ke sampel.
Standar error (/) mengukur presisi estimasi → semakin besar n,
semakin kecil error.
Central Limit Theorem memungkinkan inferensi bahkan untuk
populasi tidak normal.
Aturan praktis: · Mean: gunakan normal jika populasi normal atau
n · Proporsi: gunakan normal jika np dan n(1-p)
Distribusi sampling adalah jembatan antara statistik deskriptif
dan inferensial.
#### .Sample proprotion
4.0.0.1 . Rankuman Video
Tersebut
Konsep Dasar: Distribusi sampling proporsi adalah distribusi
probabilitas dari proporsi sampel() yang diperoleh dari semua sampel
mungkin dengan ukuran n yang diambil dari suatu populasi. Proporsi
sampel (\[\hat{p})\] digunakan untuk
menduga proporsi populasi (p).
Rata-rata dan Simpangan Baku Proporsi Sampel:
· Rata-rata/Rata-rata yang Diharapkan dari\[ \hat{p} sama dengan proporsi populasi p.
\]{$$} = p · Simpangan Baku/Standar Error (SE) dari
bergantung pada ukuran populasi. · Untuk Populasi Tak Terbatas atau
Sampling dengan Pengembalian: {} = · Untuk Populasi Terbatas
(ukuran N) tanpa Pengembalian: Perlu faktor koreksi. _{} =
Teorema Limit Pusat untuk Proporsi (CLT for Proportions): Jika
ukuran sampeln cukup besar (umumnya np dan n(1-p) ), maka distribusi
sampling proporsi akan mendekati distribusi normal dengan
parameter:
N ( p, )
Teorema ini memungkinkan kita menggunakan distribusi normal untuk
menghitung probabilitas terkait .
Aplikasi: Estimasi Interval untuk Proporsi Dengan CLT,kita dapat
membangun Interval Kepercayaan (Confidence Interval/CI) untuk menduga
proporsi populasi p.
· Rumus Umum CI 95% untuk p: Z^* SE (Nilai Z^* = 1.96 berasal dari
distribusi normal standar untuk tingkat kepercayaan 95%). ·
Interpretasi: Kita 95% yakin bahwa proporsi populasi sebenarnya (p)
berada dalam interval tersebut.
Latar Belakang: Sebuah jajak pendapat terhadap 600 orang pemilik
mobil di suatu kota menemukan bahwa 180 di antaranya menggunakan mobil
listrik hybrid.
Pertanyaan:
Tentukan proporsi sampel (\[\hat{p}\]).
Hitung Standar Error (SE) dari \[\hat{p}\].
Buatlah estimasi interval kepercayaan 95% untuk proporsi sebenarnya
(p) semua pemilik mobil di kota tersebut yang menggunakan hybrid.
Langkah Penyelesaian:
Menghitung Proporsi Sampel (\[\hat{p})\]:
\[\hat{p} = \frac{180}{600}\] =
0.30
Artinya, 30% sampel menggunakan hybrid.
Menghitung Standar Error (SE): Karena ukuran populasi kota
diasumsikan jauh lebih besar dari sampel(600), kita gunakan rumus
populasi tak terbatas.
SE = $$ = =
SE = = $$
Membangun Interval Kepercayaan 95%:
· Rumus:\[ \hat{p} \pm 1.96 \cdot
SE\]
Kesimpulan (Interpretasi): Dengan tingkat kepercayaan 95%,kita
memperkirakan proporsi sebenarnya (p) pemilik mobil hybrid di seluruh
kota berada di antara 26.33% dan 33.67%.
5 . Review sampling
distribution
Distribusi Sampling adalah distribusi probabilitas dari suatu
statistik (seperti rata-rata sampel atau proporsi sampel) yang dihitung
dari banyak sampel acak berukuran sama yang diambil dari suatu
populasi.
Konsep ini penting karena memungkinkan kita memahami variasi
statistik sampel dan menghitung probabilitas terkait, yang menjadi dasar
inferensi statistik (penarikan kesimpulan tentang populasi dari data
sampel).
Ini adalah konsep terpenting. Teorema Limit Pusat menyatakan bahwa
jika Anda mengambil sampel acak yang cukup besar dari populasi apa pun,
distribusi dari rata-rata sampel akan mendekati distribusi normal.
· Sampel “Cukup Besar”: Konvensinya adalah ukuran sampel (n) ≥ 30. ·
Untuk Populasi Normal: Jika populasi sudah berdistribusi normal,
rata-rata sampel akan berdistribusi normal untuk sampel berukuran berapa
pun.
untuk Rata-Rata Sampel (X̄)
CLT memungkinkan kita mendeskripsikan distribusi sampling rata-rata
sampel dengan dua parameter ini:
. Rata-rata dari Distribusi Sampling (Nilai Harapan) Ini sama dengan
rata-rata populasi(μ). Rata-rata semua kemungkinan rata-rata sampel akan
berkumpul di sekitar rata-rata populasi sebenarnya.
\[ μ_X̄ = \]
. Simpangan Baku dari Distribusi Sampling (Galat Baku / Standard
Error) Ini mengukur variabilitas rata-rata sampel di sekitar rata-rata
populasi.Nilainya tergantung pada simpangan baku populasi (σ) dan ukuran
sampel (n).
\[ σ_X̄ = σ / √\]
Galat baku mengecil seiring bertambahnya ukuran sampel. Artinya,
sampel yang lebih besar memberikan estimasi yang lebih presisi.
Dengan demikian, distribusi sampling dapat dituliskan sebagai:
X̄ ~ N(μ, σ/√n) (jika n ≥ 30 atau populasi normal)
Menghitung Parameter Distribusi Sampling Sebuah populasi memiliki
rata-rata(μ) 112 dan simpangan baku (σ) 40. Sebuah sampel acak berukuran
n=50 diambil.
Menghitung Probabilitas untuk Rata-Rata Sampel Menggunakan populasi
di atas,berapa probabilitas rata-rata sampelnya antara 110 dan 114?
Karena n=50(≥30), CLT berlaku. Kita standarisasi nilainya menjadi
skor-Z:
Z untuk 110: (110 - 112) / 5.657 ≈ -0.35
Z untuk 114: (114 - 112) / 5.657 ≈ 0.35
Menggunakan tabel Z,probabilitas P(-0.35 < Z < 0.35) ≈ 0.2736
atau 27.36%.
Efek Ukuran Sampel (Mengapa Sampel Besar Lebih Baik)
Kasus Parameter Probabilitas \[(X <
48)\] Keterangan Satu Baterai μ=50 bulan, σ=6\[ P(X < 48)\] ≈ 0.3707 (37.07%) Melihat
1 individu, variasi tinggi. Sampel 36 Baterai μ_X̄=50, σ_X̄=6/√36\[=1 P(X̄ <\] 48) ≈ 0.0228 (2.28%) Melihat
rata-rata sampel, variasi kecil.
Probabilitas untuk mendapatkan rata-rata umur sampel yang jauh dari
rata-rata populasi (50) jauh lebih kecil daripada probabilitas untuk
satu individu. Ini menunjukkan bahwa estimasi dari sampel besar lebih
stabil dan dapat dipercaya.
. Distribusi Sampling menggambarkan perilaku statistik (seperti X) di
semua kemungkinan sampel. . Teorema Limit Pusat adalah fondasi: dengan
sampel yang cukup besar (n ≥ 30), distribusi X̄ akan mendekati normal,
tanpa peduli bentuk populasi asalnya. Galat Baku (σ/√n) mengukur presisi
estimasi sampel. Semakin besar n, semakin kecil galat bakunya, sehingga
estimasi rata-rata populasi semakin tepat.
6 . Referensi
ility and Statistical Inference oleh Robert V. Hogg, Joseph W.
McKean
Introduction to Mathematical Statistics and Its Applications oleh
Richard J. Larsen dan Morris L. Marx
Statistical Methods for the Social Sciences oleh Alan Agresti dan
Barbara Finlay
Introduction to Mathematical Statistics and Its Applications oleh
Richard J. Larsen dan Morris L. Marx