Dokumentasi Kegiatan kelompok 5
Sebaran Negatif Binomial (Negative Binomial Distribution) adalah suatu distribusi probabilitas diskret yang menyatakan banyaknya kegagalan \((X)\) yang terjadi sebelum diperoleh \(r\) keberhasilan dalam serangkaian percobaan Bernoulli yang saling independen dan memiliki peluang sukses \((p)\) yang sama pada setiap percobaan. Dalam tindakan Bernoulli serupa seperti dalam sebaran Geometrik, misalkan \(X\) melambangkan peubah acak banyaknya tindakan yang diperlukan hingga tercapai \(r\) ‘Berhasil’. Peubah acak ini dikatakan memiliki sebaran Negatif Binomial yang fungsi kepekatan peluangnya dapat dituliskan sebagai berikut.
\[ nb(x; r, p) = C_{r-1}^{x-1} \, p^{\,r} \, q^{\,x-r}, \quad \text{untuk } x = r, r + 1, r + 2, \dots \](Nugroho,S 2008).
dengan keterangan:
(Handayani, D. 2022).
Fungsi Kepekatan Peluang (FKP) pada sebaran negatif binomial adalah fungsi yang menyatakan peluang bahwa suatu variabel acak diskret \(X\) akan bernilai \(k\) yaitu terjadi \(k\) kegagalan sebelum memperoleh \(r\) keberhasilan pertama dalam serangkaian percobaan Bernoulli yang saling bebas dengan peluang sukses \(p\).
(kenne, P. dkk, 2022).
dengan keterangan:
Nilai ekspektasi \((E[X])\) dari sebaran negatif binomial adalah rata-rata banyaknya kegagalan yang diharapkan terjadi sebelum diperoleh \(r\) keberhasilan pertama dalam percobaan Bernoulli yang saling bebas dengan peluang sukses \(p\). Ekspektasi menunjukkan pusat sebaran (nilai tengah teoritis) seberapa besar jumlah kegagalan yang “diperkirakan” terjadi jika eksperimen dilakukan berulang kali.
(Handayani, D. 2022).
dengan keterangan:
Nilai varian \((Var(X))\) pada sebaran negatif binomial menunjukkan derajat penyebaran atau keragaman jumlah kegagalan yang mungkin terjadi sebelum diperoleh \(r\) keberhasilan pertama dalam percobaan Bernoulli yang saling bebas dan identik. Dengan kata lain, varian menggambarkan seberapa jauh nilai variabel acak \(X\) (jumlah kegagalan) menyimpang dari nilai rata-rata (ekspektasi) secara rata-rata kuadrat.
Jika varian besar → hasil percobaan lebih bervariasi (tidak
stabil)
Jika varian kecil → hasil percobaan cenderung konsisten
(lebih stabil)
(Handayani, D. 2022).
dengan keterangan:
Di R, sebaran negatif binomial dapat digunakan melalui fungsi-fungsi built-in yang mirip dengan fungsi distribusi lainnya (seperti normal, binomial, atau Poisson). Ada empat fungsi utama yang bisa digunakan, tergantung kebutuhan: probabilitas, distribusi kumulatif, kuantil, dan simulasi random.
Fungsi \(dnbinom\) di R digunakan untuk menghitung probabilitas massa (PMF, Probability Mass Function) dari distribusi negatif binomial. Artinya, fungsi ini memberi \(P(X = x)\), yaitu probabilitas mendapatkan tepat \(x\) kegagalan sebelum tercapai \(r\) keberhasilan.
\[dnbinom(x, size = r, prob = p)\]
keterangan:
(Ningati, C. T., 2024).
keterangan:
Contoh dari PMF - Probability Mass Function :
dnbinom(x = 2, size = 3, prob = 0.4)
## [1] 0.13824
CDF (Cumulative Distribution Function) adalah fungsi yang menyatakan peluang kumulatif dari suatu variabel acak \(X\). Artinya, fungsi ini menghitung peluang bahwa nilai variabel acak lebih kecil atau sama dengan suatu nilai tertentu \(q\).
\[P(X≤q)\] Pada sebaran negatif binomial, ini berarti peluang bahwa jumlah kegagalan yang terjadi sebelum mencapai \(r\) keberhasilan tidak lebih dari \(q\).
\[pnbinom(q, size = r, prob = p)\] keterangan:
Catatan
\[1 - pnbinom(q, size = r, prob = p)\] Rumus fungsi distribusi kumulatif (CDF) untuk sebaran negatif binomial adalah:
\[ P(X \le q) = \sum_{x=0}^{q} \binom{x + r - 1}{r - 1} \, p^r \, (1 - p)^x \]
Keterangan:
Contoh dari CDF - Cumulative Distribution Function :
pnbinom(q = 4, size = 3, prob = 0.4)
## [1] 0.580096
Fungsi kuantil (Quantile Function) digunakan untuk menentukan nilai \(X\) dari variabel acak \(X\) yang memiliki peluang kumulatif sebesar \(p\). Dengan kata lain, fungsi ini mencari nilai batas \(x\) sehingga:
\[P(X≤x)=p\]
Pada sebaran negatif binomial, fungsi ini menunjukkan jumlah kegagalan maksimum yang kemungkinan besar terjadi sebelum mencapai \(r\) keberhasilan dengan probabilitas kumulatif sebesar \(p\).
\[qnbinom(p, size = r, prob = p)\] keterangan:
Catatan
\[ pnbinom(qnbinom(p, r, prob), r, prob) = p \] Fungsi \(qnbinom()\) mengembalikan nilai kuantil \(x_p\), yaitu jumlah kegagalan terbesar yang masih memenuhi kondisi:
\[P(X≤x_p)≥p\]
Artinya, \(qnbinom()\) adalah kebalikan (invers) dari fungsi \(pnbinom()\). Jika pnbinom \((x, r, p)\) memberikan probabilitas kumulatif, maka qnbinom \((p, r, p)\) memberikan nilai \(x\) yang sesuai dengan probabilitas tersebut.
Contoh dari Quantile Function :
qnbinom(p = 0.9, size = 3, prob = 0.4)
## [1] 9
Fungsi \(rnbinom()\) digunakan untuk menghasilkan bilangan acak yang mengikuti sebaran negatif binomial. Dengan kata lain, fungsi ini mensimulasikan hasil percobaan acak yang sesuai dengan karakteristik distribusi negatif binomial.
Sebaran negatif binomial menggambarkan jumlah kegagalan \((X)\) yang terjadi sebelum tercapai \(r\) keberhasilan dalam serangkaian percobaan Bernoulli, di mana tiap percobaan memiliki probabilitas sukses \(p\).
Fungsi \(rnbinom(n, size = r, prob = p)\) menghasilkan \(n\) nilai acak dari distribusi tersebut, sehingga menjalankan percobaan tersebut berulang kali sebanyak \(n\) kali. Secara matematis, variabel acak \(X\) yang dihasilkan dari fungsi ini mengikuti: \[X∼NegBin(r,p)\] yang berarti \(X\) menyatakan banyaknya kegagalan sebelum mencapai \(r\) keberhasilan dengan peluang sukses \(p\) di tiap percobaan.
\[rnbinom(n, size = r, prob = p)\] keterangan:
Catatan
Contoh dari Random Number Generation :
rnbinom(n = 10, size = 5, prob = 0.4)
## [1] 0 15 4 9 8 5 5 6 7 4
set.seed(123)
rnbinom(n = 5, size = 3, prob = 0.4)
## [1] 4 8 7 10 7
Untuk membangkitkan (menghasilkan) bilangan acak yang mengikuti sebaran negatif binomial, digunakan fungsi:
\[ rnbinom(n, size = r, prob = p) \]
Fungsi ini menghasilkan \(n\) bilangan acak yang masing-masing merepresentasikan jumlah kegagalan sebelum tercapai \(r\) keberhasilan, dengan probabilitas sukses \(p\) pada setiap percobaan.
# Mengatur seed agar hasil acak dapat direproduksi
set.seed(123)
# Membangkitkan 10 bilangan acak dari sebaran negatif binomial
data <- rnbinom(n = 10, size = 5, prob = 0.4)
# Menampilkan hasil
data
## [1] 8 12 12 3 5 12 8 5 15 1
# Membuat histogram dari hasil acak
set.seed(123)
data <- rnbinom(n = 10, size = 5, prob = 0.4)
hist(data,
main = "Sebaran Bilangan Acak Negatif Binomial",
xlab = "Jumlah Kegagalan (X)",
col = "lightpink", border = "black")
keterangan :
\(n = 10\) → jumlah bilangan acak yang dihasilkan.
\(size = 5\) → menunjukkan terdapat 5 keberhasilan yang ditargetkan.
\(prob = 0.4\) → peluang sukses dalam setiap percobaan adalah \(0.4\).
Nilai yang dihasilkan menunjukkan jumlah kegagalan sebelum \(5\) keberhasilan pertama tercapai.
Kode ini berfungsi untuk membangkitkan data acak sesuai sebaran negatif binomial dengan parameter tertentu, dan menyimpannya ke dalam variabel data. Langkah-langkah ini sangat umum digunakan saat melakukan simulasi probabilitas, pemodelan stokastik, atau eksperimen Monte Carlo di R.
Sebaran negatif binomial menggambarkan banyaknya kegagalan \((X)\) yang terjadi sebelum tercapai sejumlah keberhasilan \((r)\), dengan probabilitas sukses \(p\) pada setiap percobaan.
Rumus PMF (Probability Mass Function)
\[ P(X = x) = \binom{x + r - 1}{r - 1} p^r (1 - p)^x \]
Keterangan:
Fungsi yang digunakan di R
Untuk menghitung peluang pada sebaran negatif binomial, digunakan fungsi bawaan R berikut:
Misalkan terdapat \(r = 3\)
keberhasilan dengan probabilitas sukses \(p =
0.4\).
Hitung peluang \(P(X = 2)\) dan \(P(X \le 4)\).
# Parameter distribusi
r <- 3
p <- 0.4
# Peluang tepat X = 2
px2 <- dnbinom(x = 2, size = r, prob = p)
# Peluang kumulatif X ≤ 4
px_le4 <- pnbinom(q = 4, size = r, prob = p)
# Menampilkan hasil
px2
## [1] 0.13824
px_le4
## [1] 0.580096
Sebaran negatif binomial digunakan untuk memodelkan banyaknya kegagalan sebelum tercapai sejumlah keberhasilan \((r)\), dengan probabilitas sukses \(p\) pada setiap percobaan.
Untuk menghitung kuantil atau nilai \(x\) yang memenuhi \(P(X \le x) = p\), digunakan fungsi:
\[ qnbinom(p, size = r, prob = p) \]
Namun agar tidak rancu antara parameter dan probabilitas, umumnya penulisannya adalah:
\[ qnbinom(p, size = r, prob = \pi) \]
di mana \(\pi\) adalah probabilitas sukses tiap percobaan.
Misalkan terdapat \(r = 4\)
keberhasilan dengan probabilitas sukses \(p =
0.3\).
Tentukan kuantil ke-0.75 (artinya cari \(x\) sehingga \(P(X \le x) = 0.75\)).
# Parameter distribusi
r <- 4
p <- 0.3
# Menghitung kuantil ke-0.75
q <- qnbinom(p = 0.75, size = r, prob = p)
# Menampilkan hasil
q
## [1] 12
Nilai yang dihasilkan oleh fungsi \(qnbinom()\) menunjukkan jumlah kegagalan maksimum \((X)\) yang masih memberikan peluang kumulatif \(≤\) nilai probabilitas yang ditentukan. Dengan kata lain, sekitar \(75%\) dari total percobaan akan menghasilkan jumlah kegagalan tidak lebih dari nilai \(q\).
# Membuat grafik hubungan antara p dan quantile
p_seq <- seq(0, 1, by = 0.05)
q_seq <- qnbinom(p = p_seq, size = r, prob = p)
plot(p_seq, q_seq,
type = "l",
col = "purple",
lwd = 2,
main = "Fungsi Kuantil Sebaran Negatif Binomial",
xlab = "Probabilitas Kumulatif (p)",
ylab = "Kuantil (x)")
grid()
Sebaran negatif binomial menunjukkan peluang terjadinya sejumlah kegagalan \((X)\) sebelum diperoleh \(r\) keberhasilan dalam percobaan Bernoulli berulang dengan probabilitas sukses \(p\) pada setiap percobaan.
\[ P(X = x) = \binom{x + r - 1}{r - 1} p^r (1 - p)^x \]
Misalkan: - \(r = 3\) (jumlah keberhasilan yang diinginkan) - \(p = 0.4\) (probabilitas sukses) - \(X = 0, 1, 2, ..., 10\)
Maka peluang tiap nilai \(X\) dapat dihitung dengan fungsi \(dnbinom()\).
# Parameter sebaran
r <- 3
p <- 0.4
# Rentang nilai X
x <- 0:10
# Menghitung probabilitas
y <- dnbinom(x, size = r, prob = p)
# Menampilkan nilai peluang
data.frame(X = x, Probabilitas = y)
## X Probabilitas
## 1 0 0.06400000
## 2 1 0.11520000
## 3 2 0.13824000
## 4 3 0.13824000
## 5 4 0.12441600
## 6 5 0.10450944
## 7 6 0.08360755
## 8 7 0.06449725
## 9 8 0.04837294
## 10 9 0.03547349
## 11 10 0.02554091
# Membuat diagram batang
barplot(y,
names.arg = x,
col = "skyblue",
border = "white",
main = "Grafik Sebaran Negatif Binomial",
xlab = "Jumlah Kegagalan (X)",
ylab = "Probabilitas P(X = x)",
ylim = c(0, max(y) + 0.05))
# Menambahkan label nilai di atas batang
text(x = seq_along(y),
y = y,
label = round(y, 3),
pos = 3,
cex = 0.8)
Handayani, D. (2022). Karakterisasi sebaran binomial negatif–binomial negatif. Jurnal Hasil Penelitian dan Pengkajian Ilmiah Eksakta, 1(2).
Kenne Pagui, E. C., Salvan, A., & Sartori, N. (2022). Improved estimation in negative binomial regression. Statistics in Medicine, 41(13), 2403-2416.
Ningati, C. T. (2024). Normal distribution approximation through negative binomial distribution. Journal of Mathematics and Mathematics Education, 14(1).
Nugroho, S. (2008). Pengantar Statistika Matematika (Edisi pertama). Bengkulu: UNIB Press.