Dalam bidang statistika, salah satu tujuan utama adalah mempelajari bagaimana suatu kejadian acak dapat dimodelkan secara matematis untuk memahami pola dan kemungkinan hasilnya. Salah satu model probabilitas yang paling dasar namun sangat penting adalah Distribusi Binomial.
Distribusi ini termasuk dalam kategori distribusi probabilitas diskret, yang digunakan untuk menggambarkan jumlah keberhasilan dari sejumlah percobaan independen yang masing-masing hanya memiliki dua kemungkinan hasil: sukses atau gagal.
Distribusi binomial muncul dalam berbagai fenomena di dunia nyata yang melibatkan proses ya atau tidak, berhasil atau gagal, hidup atau mati, dan sebagainya. Misalnya:
Dalam industri, untuk menghitung peluang menemukan sejumlah produk cacat dalam sampel.
Dalam pendidikan, untuk memperkirakan berapa banyak siswa yang lulus ujian dari total peserta.
Dalam riset pemasaran, untuk memprediksi jumlah pelanggan yang akan membeli produk setelah menerima promosi.
Ciri utama dari proses yang mengikuti distribusi binomial adalah:
Setiap percobaan bersifat independen (hasil satu percobaan tidak memengaruhi hasil lainnya).
Hanya ada dua kemungkinan hasil: sukses (1) dan gagal (0).
Peluang sukses (p) bersifat tetap untuk setiap percobaan.
Jumlah percobaan (n) telah ditentukan sebelumnya.
Dengan keempat karakteristik tersebut, distribusi binomial menjadi dasar dalam memodelkan berbagai proses pengambilan keputusan berbasis peluang.
Dalam konteks komputasi statistika, distribusi binomial tidak hanya dipelajari secara teoretis, tetapi juga dapat dianalisis dan divisualisasikan menggunakan perangkat lunak seperti R. Bahasa R menyediakan fungsi bawaan seperti dbinom(), pbinom(), dan rbinom() yang memudahkan pengguna untuk menghitung probabilitas, mensimulasikan data acak, serta menampilkan grafik distribusi dengan mudah dan efisien.
Oleh karena itu, pemahaman terhadap distribusi binomial tidak hanya penting untuk membangun dasar teori probabilitas, tetapi juga menjadi keterampilan praktis yang berguna dalam analisis data dan pemodelan statistik berbasis komputer.
Misalkan dilakukan \(n\) kali
percobaan independen, masing-masing dengan peluang sukses \(p\).
Jika \(X\) adalah banyaknya
keberhasilan yang diperoleh, maka \(X\)
mengikuti Distribusi Binomial dengan parameter \(n\) dan \(p\).
Ditulis:
\[ X \sim \text{Binomial}(n, p) \]
\[ P(X = x) = \binom{n}{x} p^x (1 - p)^{n - x}, \quad x = 0, 1, 2, ..., n \]
dengan:
\[ \binom{n}{x} = \frac{n!}{x!(n - x)!} \]
Keterangan:
Rumus fungsi distribusi kumulatif ditulis dalam format LaTeX berikut:
\[ F(x) = P(X \le x) = \sum_{k=0}^{x} \binom{n}{k} p^k (1-p)^{n-k} \]
# Parameter distribusi
n <- 5
p <- 0.3
# Probabilitas kumulatif P(X <= 2)
cdf_value <- pbinom(2, size = n, prob = p)
cdf_value
## [1] 0.83692
Rumus nilai harapan dan variansi dari distribusi binomial dapat ditulis sebagai berikut:
\[ E[X] = np \]
\[ Var(X) = np(1 - p) \]
# Parameter distribusi
n <- 5
p <- 0.3
# Nilai harapan (mean)
mean_binomial <- n * p
# Variansi
var_binomial <- n * p * (1 - p)
# Simpangan baku (standar deviasi)
sd_binomial <- sqrt(var_binomial)
# Tampilkan hasil
mean_binomial
## [1] 1.5
var_binomial
## [1] 1.05
sd_binomial
## [1] 1.024695
Misalkan dilakukan 10 kali percobaan (\(n =
10\)) dengan peluang sukses \(p =
0.3\).
Tentukan:
Rumus peluang distribusi binomial:
\[ P(X = 4) = \binom{10}{4}(0.3)^4(0.7)^6 \]
# Parameter distribusi
n <- 10
p <- 0.3
# Probabilitas tepat 4 keberhasilan
prob_4 <- dbinom(4, size = n, prob = p)
prob_4
## [1] 0.2001209
Rumus: \[ E[X] = np, \quad SD(X) = \sqrt{np(1-p)} \]
mean_x <- n * p
sd_x <- sqrt(n * p * (1 - p))
mean_x
## [1] 3
sd_x
## [1] 1.449138
Distribusi binomial dapat divisualisasikan menggunakan grafik batang untuk memperlihatkan probabilitas masing-masing nilai keberhasilan \(x\).
# Parameter distribusi binomial
n <- 10
p <- 0.3
# Nilai x dan probabilitasnya
x <- 0:n
y <- dbinom(x, size = n, prob = p)
# Membuat barplot
barplot(y,
names.arg = x,
main = "Distribusi Binomial (n = 10, p = 0.3)",
xlab = "Jumlah Keberhasilan (x)",
ylab = "Probabilitas P(X = x)",
col = "skyblue",
border = "white")
###Interpretasi
Peluang memperoleh tepat 4 keberhasilan dari 10 percobaan dengan \(p = 0.3\) adalah sekitar nilai 0.2001.
Rata-rata banyaknya keberhasilan yang diharapkan adalah 3.
Simpangan bakunya adalah 1.449.
Grafik menunjukkan bahwa distribusi cenderung miring ke kanan (right-skewed) karena \(p < 0.5\).