Peluang dan distribusi peluang adalah konsep fundamental dalam statistik yang digunakan untuk menggambarkan kemungkinan terjadinya suatu peristiwa dan bagaimana peristiwa tersebut didistribusikan dalam ruang sampel. Peluang memberikan dasar untuk inferensi statistik dan pengambilan keputusan dalam kondisi ketidakpastian.
Peluang adalah ukuran yang digunakan untuk mengekspresikan kemungkinan terjadinya suatu peristiwa. Peluang dari sebuah peristiwa \(A\) biasanya dinotasikan sebagai \(P(A)\) dan dihitung sebagai rasio antara jumlah kejadian yang mendukung \(A\) dengan jumlah total kemungkinan kejadian.
Rumus Peluang:
\[ P(A) = \frac{ {Jumlah Kejadian yang Mendukung A}}{{Jumlah Total Kejadian yang Mungkin}} \]
Misalnya, kita memiliki sebuah dadu. Peluang mendapatkan angka 3 saat melempar dadu adalah:
\[ P(3) = \frac{1}{6} \approx 0.167 \]
Di sini, jumlah total kejadian yang mungkin adalah 6 (karena dadu memiliki 6 sisi), dan hanya ada 1 kejadian yang mendukung mendapatkan angka 3.
Distribusi peluang adalah fungsi atau aturan yang memberikan kemungkinan bagi setiap hasil dalam ruang sampel suatu percobaan acak. Terdapat berbagai jenis distribusi peluang yang bergantung pada sifat dari variabel acak yang digunakan.
Distribusi Bernoulli menggambarkan percobaan yang hanya memiliki dua kemungkinan hasil: sukses (dengan probabilitas \(p\)) atau gagal (dengan probabilitas \(1-p\)). Contoh klasik adalah melempar koin, di mana ada dua kemungkinan hasil: kepala atau ekor.
\[ P(X = 1) = p \quad ext{dan} \quad P(X = 0) = 1 - p \]
Misalkan kita ingin menghitung peluang mendapatkan kepala saat melempar koin sekali. Jika peluang mendapatkan kepala adalah 0.5, maka:
# Peluang mendapatkan kepala
p <- 0.5
p
## [1] 0.5
Distribusi binomial adalah generalisasi dari distribusi Bernoulli untuk n percobaan. Ini menggambarkan jumlah keberhasilan dalam sejumlah percobaan independen yang identik.
\[ P(X = k) = {n \choose k} p^k (1-p)^{n-k} \]
Di mana:
\(n\) adalah jumlah percobaan,
\(k\) adalah jumlah keberhasilan,
\(p\) adalah peluang sukses dalam setiap percobaan.
Misalkan kita melempar koin 10 kali dan ingin mengetahui peluang mendapatkan 7 kepala.
# Peluang mendapatkan 7 sukses dari 10 percobaan, dengan p = 0.5
prob_7_heads <- dbinom(7, size = 10, prob = 0.5)
prob_7_heads
## [1] 0.1171875
# Grafik Distribusi Binomial
x <- 0:10
y <- dbinom(x, size = 10, prob = 0.5)
barplot(y, names.arg = x, main = "Distribusi Binomial (n=10, p=0.5)",
xlab = "Jumlah Keberhasilan (k)", ylab = "Peluang", col = "blue")
Distribusi hipergeometrik menggambarkan probabilitas dari k keberhasilan dalam n percobaan, tanpa penggantian, dari populasi yang memiliki K keberhasilan dalam total N elemen.
\[ P(X = k) = \frac{{K \choose k} {N-K \choose n-k}}{{N \choose n}} \]
Misalkan kita memiliki dek kartu yang terdiri dari 52 kartu, di mana 4 di antaranya adalah As. Jika kita mengambil 5 kartu tanpa penggantian, kita ingin menghitung peluang mendapatkan tepat 2 As.
# Peluang mendapatkan 2 As dari 5 kartu yang ditarik tanpa penggantian
prob_2_aces <- dhyper(2, 4, 48, 5)
prob_2_aces
## [1] 0.03992982
# Grafik Distribusi Hipergeometrik
x <- 0:5
y <- dhyper(x, 4, 48, 5)
barplot(y, names.arg = x, main = "Distribusi Hipergeometrik (N=52, K=4, n=5)",
xlab = "Jumlah Keberhasilan (k)", ylab = "Peluang", col = "green")
Distribusi Poisson menggambarkan probabilitas sejumlah kejadian dalam interval waktu atau ruang yang tetap, dengan rata-rata kejadian yang diketahui. Ini sering digunakan untuk model kejadian langka.
\[P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}\]
Di mana:
\(\lambda\) adalah rata-rata jumlah kejadian dalam interval tertentu,
\(k\) adalah jumlah kejadian yang ingin dihitung.
Misalkan rata-rata jumlah pelanggan yang datang ke sebuah toko dalam satu jam adalah 5. Kita ingin mengetahui peluang bahwa 7 pelanggan akan datang dalam satu jam tertentu.
# Peluang mendapatkan 7 kejadian dengan rata-rata 5
prob_7_customers <- dpois(7, lambda = 5)
prob_7_customers
## [1] 0.1044449
# Grafik Distribusi Poisson
x <- 0:15
y <- dpois(x, lambda = 5)
barplot(y, names.arg = x, main = "Distribusi Poisson (lambda=5)",
xlab = "Jumlah Kejadian (k)", ylab = "Peluang", col = "purple")
Distribusi normal adalah salah satu distribusi peluang yang paling penting dalam statistik. Distribusi ini bersifat simetris dan berbentuk lonceng (bell-shaped), dengan mean \(\mu\) dan standar deviasi \(\sigma\).
\[f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]
Misalkan tinggi badan pria dewasa mengikuti distribusi normal dengan mean 170 cm dan standar deviasi 10 cm. Kita ingin mengetahui peluang bahwa seorang pria memiliki tinggi kurang dari 180 cm.
# Peluang tinggi badan kurang dari atau sama dengan 180 cm
prob_less_180 <- pnorm(180, mean = 170, sd = 10)
prob_less_180
## [1] 0.8413447
# Grafik Distribusi Normal
x <- seq(140, 200, by = 0.1)
y <- dnorm(x, mean = 170, sd = 10)
plot(x, y, type = "l", main = "Distribusi Normal (mean=170, sd=10)",
xlab = "Tinggi Badan (cm)", ylab = "Densitas", col = "red")
abline(v = 180, col = "blue", lwd = 2, lty = 2)
Dengan peluang 0.84 atau 84%, ini berarti bahwa 84% dari populasi pria dewasa diperkirakan memiliki tinggi badan kurang dari atau sama dengan 180 cm.
Hasil ini juga menunjukkan bahwa tinggi 180 cm berada di atas rata-rata (170 cm), tetapi masih dalam kisaran yang umum di populasi pria dewasa tersebut.
Secara praktis, jika kita memilih seorang pria secara acak dari populasi ini, ada kemungkinan 84% bahwa tingginya akan kurang dari atau sama dengan 180 cm.
Peluang dan distribusi peluang adalah konsep inti dalam statistik yang digunakan untuk menggambarkan dan menganalisis kejadian acak. Dengan memahami berbagai distribusi peluang seperti Bernoulli, Binomial, Hipergeometrik, Poisson, dan Normal, kita dapat membuat prediksi yang lebih baik dan mengambil keputusan berdasarkan data dan ketidakpastian.