Distribusi Poisson adalah distribusi probabilitas diskrit yang digunakan untuk memodelkan jumlah kejadian dalam interval waktu atau ruang tertentu. Distribusi ini diperkenalkan oleh Siméon Denis Poisson (1837) dan banyak digunakan untuk kasus “kejadian jarang” seperti jumlah pelanggan datang ke toko per jam, jumlah kendaraan lewat di pos tol per menit, atau jumlah cacat dalam produk per batch.
Sebaran Poisson merupakan sebaran probabilitas diskrit yang digunakan untuk memodelkan jumlah kejadian dalam suatu interval waktu atau ruang tertentu dengan asumsi bahwa kejadian tersebut:
Distribusi Poisson banyak digunakan untuk menganalisis data seperti: Jumlah kendaraan yang melewati jalan per menit, Jumlah panggilan masuk ke call center per jam, Jumlah cacat pada produk per batch, Jumlah pasien yang datang ke rumah sakit per hari.
Rumus dari sebaran Poisson adalah:
\[ P(X = k) = \frac{e^{-λ}.λ^k}{k!}, \quad k = 0, 1, 2, \ldots \] di mana:
Sifat-sifat sebaran Poisson adalah sebagai berikut: \[ E(X) = λ, Var(X) = λ \] Artinya, pada distribusi Poisson:
# Parameter lambda (rata-rata kejadian)
λ <- 4
# Nilai k dari 0 sampai 10
k <- 0:10
# Hitung probabilitas dengan rumus manual
P_X_k <- (exp(-λ) * λ^k) / factorial(k)
# Nilai harapan (ekspektasi)
nilai_harapan <- sum(k * P_X_k)
# Varians
varians <- sum((k - nilai_harapan)^2 * P_X_k)
# Tampilkan hasil
cat("Nilai Harapan (E[X]) =", round(nilai_harapan, 3), "\n")
## Nilai Harapan (E[X]) = 3.967
cat("Varians (Var[X]) =", round(varians, 3))
## Varians (Var[X]) = 3.84
# Tampilkan hasilnya dalam tabel
data.frame(k = k, P_X_k = round(P_X_k, 5))
## k P_X_k
## 1 0 0.01832
## 2 1 0.07326
## 3 2 0.14653
## 4 3 0.19537
## 5 4 0.19537
## 6 5 0.15629
## 7 6 0.10420
## 8 7 0.05954
## 9 8 0.02977
## 10 9 0.01323
## 11 10 0.00529
Fungsi distribusi kumulatif (Cumulative Distribution Function) untuk sebaran Poisson digunakan untuk menghitung peluang bahwa variabel acak \(X\) bernilai kurang dari atau sama dengan \(k\).
Rumusnya adalah:
\[ F(X≤k) = P(X≤k) = ∑_{i=0}^{k}{e^{-λ}.λ^{i}}/ {i!} \]
Dengan kata lain, nilai CDF merupakan penjumlahan semua peluang dari 0 sampai \(k\).
# Parameter lambda
λ <- 4
# Nilai k dari 0 sampai 10
k <- 0:10
# Hitung CDF secara manual
F_X_k_manual <- sapply(k, function(x) sum((exp(-λ) * λ^(0:x)) / factorial(0:x)))
# Hitung CDF menggunakan fungsi bawaan R
F_X_k_builtin <- ppois(k, λ)
# Bandingkan hasil keduanya
data.frame(
k = k,
CDF_Manual = round(F_X_k_manual, 5),
CDF_Builtin = round(F_X_k_builtin, 5)
)
## k CDF_Manual CDF_Builtin
## 1 0 0.01832 0.01832
## 2 1 0.09158 0.09158
## 3 2 0.23810 0.23810
## 4 3 0.43347 0.43347
## 5 4 0.62884 0.62884
## 6 5 0.78513 0.78513
## 7 6 0.88933 0.88933
## 8 7 0.94887 0.94887
## 9 8 0.97864 0.97864
## 10 9 0.99187 0.99187
## 11 10 0.99716 0.99716
# Simulasi 1000 data acak dengan rata-rata λ = 4
sim_data <- rpois(1000, λ)
# Ringkasan data simulasi
summary(sim_data)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 3.000 4.000 3.933 5.000 12.000
λ <- 4
k <- 0:10
P_X_k_r<- dpois(k,λ)
barplot(P_X_k_r,
names.arg = k,
col = "lightblue",
main = paste("Fungsi Kepekatan Peluang Poisson (λ =",λ,")"),
xlab = "Jumlah Kejadian (k)",
ylab = "P(X = k)")