D:/3'semester/komstat/rsconnect/documents/kelompok 5A.jpg

Dokumentasi Kegiatan kelompok 5

1. Pendahuluan

A. Pengertian Sebaran Negatif Binomial

Sebaran Negatif Binomial (Negative Binomial Distribution) adalah suatu distribusi probabilitas diskret yang menyatakan banyaknya kegagalan \((X)\) yang terjadi sebelum diperoleh \(r\) keberhasilan dalam serangkaian percobaan Bernoulli yang saling independen dan memiliki peluang sukses \((p)\) yang sama pada setiap percobaan. Dalam tindakan Bernoulli serupa seperti dalam sebaran Geometrik, misalkan \(X\) melambangkan peubah acak banyaknya tindakan yang diperlukan hingga tercapai \(r\) ‘Berhasil’. Peubah acak ini dikatakan memiliki sebaran Negatif Binomial yang fungsi kepekatan peluangnya dapat dituliskan sebagai berikut.

\[ nb(x; r, p) = C_{r-1}^{x-1} \, p^{\,r} \, q^{\,x-r}, \quad \text{untuk } x = r, r + 1, r + 2, \dots \]

(Nugroho,S 2008).

dengan keterangan:

  • \(nb(x; r, p)\) : fungsi peluang dari sebaran binomial negatif.
  • \(C_{r-1}^{x-1}\) : kombinasi (“x-1 pilih r-1”).
  • \(p^r\) : peluang sukses.
  • \(q^{x-r}\) : peluang gagal, dengan \(q = 1 - p\).
  • \(x = r, r + 1, r + 2, \ldots\) : nilai-nilai diskret yang mungkin dari variabel acak \(X\).
Ketika \(N\) menyebar menurut distribusi Binomial Negatif maka sebaran tersebut disebut sebaran Binomial Negatif Majemuk. Selanjutnya ketika \(N\) menyebar menurut distribusi Binomial Negatif dan \(X\) menyebaran menurut distribusi Binomial Negatif, maka sebaran tersebut disebut distribusi Binomial Negatif. Binomial Negatif memiliki beberapa karakterisasi diantaranya nilai harapan yang menggambarkan letak pusat suatu distribusi peluang, nilai variansi yang menggambarkan keragaman suatu distribusi, fungsi pembangkit momen yang memiliki kegunaan untuk membangkitkan momen-momen distribusi, dan fungsi karakterisasi yang digunakan untuk mengkaji kekonvergenan suatu fungsi distribusi

(Handayani, D. 2022).

B. Fungsi Kepekatan Peluang

Fungsi Kepekatan Peluang (FKP) pada sebaran negatif binomial adalah fungsi yang menyatakan peluang bahwa suatu variabel acak diskret \(X\) akan bernilai \(k\) yaitu terjadi \(k\) kegagalan sebelum memperoleh \(r\) keberhasilan pertama dalam serangkaian percobaan Bernoulli yang saling bebas dengan peluang sukses \(p\).

Rumus dari Fungsi Kepekatan Peluang

\[ P(X = k) = \binom{k + r - 1}{k} (1 - p)^k p^r, \quad k = 0, 1, 2, \ldots \]

(kenne, P. dkk, 2022).

dengan keterangan:

  • \(P(X = k)\): peluang terdapat \(k\) kegagalan sebelum \(r\) keberhasilan pertama.
  • \(\displaystyle \binom{k + r - 1}{k}\): kombinasi, menyatakan banyaknya cara menempatkan \(r-1\) keberhasilan di antara \(k + r - 1\) percobaan pertama.
  • \(p^r\): peluang \(r\) keberhasilan.
  • \((1 - p)^k\): peluang \(k\) kegagalan.
  • \(k = 0, 1, 2, \ldots\): jumlah kegagalan sebelum keberhasilan ke-\(r\) terjadi.

C. Nilai Ekspektasi

Nilai ekspektasi \((E[X])\) dari sebaran negatif binomial adalah rata-rata banyaknya kegagalan yang diharapkan terjadi sebelum diperoleh \(r\) keberhasilan pertama dalam percobaan Bernoulli yang saling bebas dengan peluang sukses \(p\). Ekspektasi menunjukkan pusat sebaran (nilai tengah teoritis) seberapa besar jumlah kegagalan yang “diperkirakan” terjadi jika eksperimen dilakukan berulang kali.

Rumus dari Nilai Ekspektasi

\[ E[X] = \frac{r(1 - p)}{p} \]

(Handayani, D. 2022).

dengan keterangan:

  • \(E[X]\) :Nilai ekspektasi atau rata-rata banyaknya kegagalan sebelum \(r\) keberhasilan.
  • \(r\) :Banyaknya keberhasilan yang diinginkan.
  • \(p\) :Peluang sukses pada setiap percobaan.
  • \(1 - p\):Peluang gagal pada setiap percobaan.

D. Nilai Varian

Nilai varian \((Var(X))\) pada sebaran negatif binomial menunjukkan derajat penyebaran atau keragaman jumlah kegagalan yang mungkin terjadi sebelum diperoleh \(r\) keberhasilan pertama dalam percobaan Bernoulli yang saling bebas dan identik. Dengan kata lain, varian menggambarkan seberapa jauh nilai variabel acak \(X\) (jumlah kegagalan) menyimpang dari nilai rata-rata (ekspektasi) secara rata-rata kuadrat.

Jika varian besar → hasil percobaan lebih bervariasi (tidak stabil)
Jika varian kecil → hasil percobaan cenderung konsisten (lebih stabil)

Rumus dari Nilai Varian

\[ Var(X) = \frac{r(1 - p)}{p^2} \]

(Handayani, D. 2022).

dengan keterangan:

  • \(Var[X]\) :Nilai varian atau ukuran penyebaran dari distribusi.
  • \(r\) :Banyaknya keberhasilan yang diinginkan.
  • \(p\) :Peluang sukses pada setiap percobaan.
  • \(1 - p\) :Peluang gagal pada setiap percobaan.

2. Fungsi R untuk Sebaran Negatif Binomial

Di R, sebaran negatif binomial dapat digunakan melalui fungsi-fungsi built-in yang mirip dengan fungsi distribusi lainnya (seperti normal, binomial, atau Poisson). Ada empat fungsi utama yang bisa digunakan, tergantung kebutuhan: probabilitas, distribusi kumulatif, kuantil, dan simulasi random.

1. PMF - Probability Mass Function

Fungsi \(dnbinom\) di R digunakan untuk menghitung probabilitas massa (PMF, Probability Mass Function) dari distribusi negatif binomial. Artinya, fungsi ini memberi \(P(X = x)\), yaitu probabilitas mendapatkan tepat \(x\) kegagalan sebelum tercapai \(r\) keberhasilan.

\[dnbinom(x, size = r, prob = p)\]

keterangan:

  • \(x\) : jumlah kegagalan sebelum tercapai \(r\) keberhasilan \((0, 1, 2, ...).\)
  • \(size = r\) : jumlah keberhasilan yang ditargetkan \((r > 0).\)
  • \(prob = p\) : probabilitas sukses pada tiap percobaan tunggal \((0 < p ≤ 1).\)
Rumus Probability Mass Function (PMF) untuk sebaran negatif binomial adalah: \[ P(Y = y) = \binom{y + r - 1}{r - 1} \, p^r \, (1-p)^y \]

(Ningati, C. T., 2024).

keterangan:

  • \(X\) : Variabel random: jumlah kegagalan sebelum tercapai \(r\) keberhasilan
  • \(x\) : Nilai spesifik dari \(X\) (0, 1, 2, …)
  • \(r\) : Jumlah keberhasilan yang ditargetkan
  • \(p\) : Probabilitas sukses pada tiap percobaan tunggal
  • \(\binom{x+r-1}{r-1}\) : Jumlah cara mengatur x kegagalan dan r-1 keberhasilan sebelumnya
  • \(p^r\): Probabilitas tercapainya r keberhasilan
  • \((1-p)^x\) : Probabilitas terjadinya x kegagalan

Contoh dari PMF - Probability Mass Function :

dnbinom(x = 2, size = 3, prob = 0.4)
## [1] 0.13824
2.CDF - Cumulative Distribution Function

CDF (Cumulative Distribution Function) adalah fungsi yang menyatakan peluang kumulatif dari suatu variabel acak \(X\). Artinya, fungsi ini menghitung peluang bahwa nilai variabel acak lebih kecil atau sama dengan suatu nilai tertentu \(q\).

\[P(X≤q)\] Pada sebaran negatif binomial, ini berarti peluang bahwa jumlah kegagalan yang terjadi sebelum mencapai \(r\) keberhasilan tidak lebih dari \(q\).

\[pnbinom(q, size = r, prob = p)\] keterangan:

  • \(q\) : Nilai batas (jumlah kegagalan) yang dihitung secara kumulatif, yaitu hingga \(P(X \le q)\).
  • \(size = r\) : Jumlah keberhasilan yang ditargetkan sebelum percobaan dihentikan.
  • \(prob = p\) : Probabilitas sukses pada tiap percobaan tunggal \((0 < p ≤ 1)\).

Catatan

  • \(pnbinom()\) mengembalikan nilai peluang kumulatif \(P(X \le q)\).
  • Jika ingin menghitung peluang kebalikannya \(P(X > q)\), gunakan:

\[1 - pnbinom(q, size = r, prob = p)\] Rumus fungsi distribusi kumulatif (CDF) untuk sebaran negatif binomial adalah:

\[ P(X \le q) = \sum_{x=0}^{q} \binom{x + r - 1}{r - 1} \, p^r \, (1 - p)^x \]

Keterangan:

  • \(P(X \le q)\) : Peluang bahwa jumlah kegagalan tidak lebih dari q sebelum tercapai \(r\) keberhasilan
  • \(X\) : Variabel acak: jumlah kegagalan sebelum mencapai \(r\) keberhasilan
  • \(q\) : Nilai batas kegagalan yang dihitung secara kumulatif
  • \(r\) : Jumlah keberhasilan yang ditargetkan
  • \(p\) : Probabilitas sukses pada tiap percobaan
  • \(\binom{x + r - 1}{r - 1}\) : Jumlah cara menyusun \(x\) kegagalan dan \(r-1\) keberhasilan
  • \(p^r\) : Probabilitas untuk \(r\) keberhasilan
  • \((1-p)^x\) : Probabilitas untuk \(x\) kegagalan

Contoh dari CDF - Cumulative Distribution Function :

pnbinom(q = 4, size = 3, prob = 0.4)
## [1] 0.580096
3. Quantile Function

Fungsi kuantil (Quantile Function) digunakan untuk menentukan nilai \(X\) dari variabel acak \(X\) yang memiliki peluang kumulatif sebesar \(p\). Dengan kata lain, fungsi ini mencari nilai batas \(x\) sehingga:

\[P(X≤x)=p\]

Pada sebaran negatif binomial, fungsi ini menunjukkan jumlah kegagalan maksimum yang kemungkinan besar terjadi sebelum mencapai \(r\) keberhasilan dengan probabilitas kumulatif sebesar \(p\).

\[qnbinom(p, size = r, prob = p)\] keterangan:

  • \(p\) : Nilai probabilitas kumulatif (antara 0 dan 1) yang ingin dicari nilai kuantilnya.
  • \(size = r\) : Jumlah keberhasilan yang ditargetkan sebelum percobaan dihentikan.
  • \(prob = p\) : Probabilitas sukses pada tiap percobaan tunggal \((0 < p ≤ 1)\).

Catatan

  • Fungsi \(qnbinom()\) merupakan kebalikan (invers) dari \(pnbinom()\).
  • Hasil dari \(qnbinom()\) berupa nilai diskrit (integer) yang menunjukkan jumlah kegagalan maksimum sebelum mencapai \(r\) keberhasilan dengan peluang kumulatif sebesar \(p\).
  • Hubungan antara CDF dan fungsi kuantil adalah:

\[ pnbinom(qnbinom(p, r, prob), r, prob) = p \] Fungsi \(qnbinom()\) mengembalikan nilai kuantil \(x_p\), yaitu jumlah kegagalan terbesar yang masih memenuhi kondisi:

\[P(X≤x_p)≥p\]

Artinya, \(qnbinom()\) adalah kebalikan (invers) dari fungsi \(pnbinom()\). Jika pnbinom \((x, r, p)\) memberikan probabilitas kumulatif, maka qnbinom \((p, r, p)\) memberikan nilai \(x\) yang sesuai dengan probabilitas tersebut.

Contoh dari Quantile Function :

qnbinom(p = 0.9, size = 3, prob = 0.4)
## [1] 9
4. Random Number Generation

Fungsi \(rnbinom()\) digunakan untuk menghasilkan bilangan acak yang mengikuti sebaran negatif binomial. Dengan kata lain, fungsi ini mensimulasikan hasil percobaan acak yang sesuai dengan karakteristik distribusi negatif binomial.

Sebaran negatif binomial menggambarkan jumlah kegagalan \((X)\) yang terjadi sebelum tercapai \(r\) keberhasilan dalam serangkaian percobaan Bernoulli, di mana tiap percobaan memiliki probabilitas sukses \(p\).

Fungsi \(rnbinom(n, size = r, prob = p)\) menghasilkan \(n\) nilai acak dari distribusi tersebut, sehingga menjalankan percobaan tersebut berulang kali sebanyak \(n\) kali. Secara matematis, variabel acak \(X\) yang dihasilkan dari fungsi ini mengikuti: \[X∼NegBin(r,p)\] yang berarti \(X\) menyatakan banyaknya kegagalan sebelum mencapai \(r\) keberhasilan dengan peluang sukses \(p\) di tiap percobaan.

\[rnbinom(n, size = r, prob = p)\] keterangan:

  • \(n\) : Jumlah bilangan acak yang ingin dihasilkan.
  • \(size = r\) : Jumlah keberhasilan yang ditargetkan sebelum percobaan dihentikan.
  • \(prob = p\) : Probabilitas sukses pada setiap percobaan tunggal \((0 < p ≤ 1)\)

Catatan

  • Hasil dari \(rnbinom()\) berupa nilai diskrit (integer) yang merepresentasikan jumlah kegagalan sebelum mencapai \(r\) keberhasilan.
  • Nilai yang dihasilkan akan berbeda setiap kali dijalankan, kecuali jika digunakan \(set.seed()\)` untuk mengatur bilangan acak agar hasilnya dapat direproduksi.

Contoh dari Random Number Generation :

rnbinom(n = 10, size = 5, prob = 0.4)
##  [1]  0 15  4  9  8  5  5  6  7  4
set.seed(123)
rnbinom(n = 5, size = 3, prob = 0.4)
## [1]  4  8  7 10  7

3. Membangkitkan Bilangan Acak Sebaran Negatif Binomial pada R

Untuk membangkitkan (menghasilkan) bilangan acak yang mengikuti sebaran negatif binomial, digunakan fungsi:

\[ rnbinom(n, size = r, prob = p) \]

Fungsi ini menghasilkan \(n\) bilangan acak yang masing-masing merepresentasikan jumlah kegagalan sebelum tercapai \(r\) keberhasilan, dengan probabilitas sukses \(p\) pada setiap percobaan.

Contoh

# Mengatur seed agar hasil acak dapat direproduksi

set.seed(123)

# Membangkitkan 10 bilangan acak dari sebaran negatif binomial

data <- rnbinom(n = 10, size = 5, prob = 0.4)

# Menampilkan hasil

data
##  [1]  8 12 12  3  5 12  8  5 15  1
# Membuat histogram dari hasil acak
set.seed(123)
data <- rnbinom(n = 10, size = 5, prob = 0.4)
hist(data,
     main = "Sebaran Bilangan Acak Negatif Binomial",
     xlab = "Jumlah Kegagalan (X)",
     col = "lightpink", border = "black")

keterangan :

\(n = 10\) → jumlah bilangan acak yang dihasilkan.

\(size = 5\) → menunjukkan terdapat 5 keberhasilan yang ditargetkan.

\(prob = 0.4\) → peluang sukses dalam setiap percobaan adalah \(0.4\).

Nilai yang dihasilkan menunjukkan jumlah kegagalan sebelum \(5\) keberhasilan pertama tercapai.

Kode ini berfungsi untuk membangkitkan data acak sesuai sebaran negatif binomial dengan parameter tertentu, dan menyimpannya ke dalam variabel data. Langkah-langkah ini sangat umum digunakan saat melakukan simulasi probabilitas, pemodelan stokastik, atau eksperimen Monte Carlo di R.

4. Menghitung Peluang Sebaran Negatif Binomial pada R

Sebaran negatif binomial menggambarkan banyaknya kegagalan \((X)\) yang terjadi sebelum tercapai sejumlah keberhasilan \((r)\), dengan probabilitas sukses \(p\) pada setiap percobaan.

Rumus PMF (Probability Mass Function)

\[ P(X = x) = \binom{x + r - 1}{r - 1} p^r (1 - p)^x \]

Keterangan:

  • \(x\) : Jumlah kegagalan sebelum mencapai r keberhasilan
  • \(r\) : Jumlah keberhasilan yang ditargetkan
  • \(p\) : Probabilitas sukses tiap percobaan (\(0 < p ≤ 1\))

Fungsi yang digunakan di R

Untuk menghitung peluang pada sebaran negatif binomial, digunakan fungsi bawaan R berikut:

  • PMF : \(dnbinom(x, size = r, prob = p)\) –> Menghitung peluang tepat \(P(X = x)\)
  • CDF : \(pnbinom(q, size = r, prob = p)\) –> Menghitung peluang kumulatif \(P(X \le q)\)
  • Random : \(rnbinom(n, size = r, prob = p)\) –> Membangkitkan bilangan acak dari distribusi negatif binomial

Contoh Perhitungan

Misalkan terdapat \(r = 3\) keberhasilan dengan probabilitas sukses \(p = 0.4\).
Hitung peluang \(P(X = 2)\) dan \(P(X \le 4)\).

# Parameter distribusi
r <- 3
p <- 0.4

# Peluang tepat X = 2
px2 <- dnbinom(x = 2, size = r, prob = p)

# Peluang kumulatif X ≤ 4
px_le4 <- pnbinom(q = 4, size = r, prob = p)

# Menampilkan hasil
px2
## [1] 0.13824
px_le4
## [1] 0.580096

5. Menghitung Kuantil (Quantile) Sebaran Negatif Binomial pada R

Sebaran negatif binomial digunakan untuk memodelkan banyaknya kegagalan sebelum tercapai sejumlah keberhasilan \((r)\), dengan probabilitas sukses \(p\) pada setiap percobaan.

Fungsi Kuantil di R

Untuk menghitung kuantil atau nilai \(x\) yang memenuhi \(P(X \le x) = p\), digunakan fungsi:

\[ qnbinom(p, size = r, prob = p) \]

Namun agar tidak rancu antara parameter dan probabilitas, umumnya penulisannya adalah:

\[ qnbinom(p, size = r, prob = \pi) \]

di mana \(\pi\) adalah probabilitas sukses tiap percobaan.


Keterangan Parameter

  • \(p\) : Probabilitas kumulatif \(P(X \le x)\)
  • \(size\) atau \(r\) : Jumlah keberhasilan yang diinginkan
  • \(prob\) atau \(\pi\) : Probabilitas sukses pada setiap percobaan

Contoh Penggunaan

Misalkan terdapat \(r = 4\) keberhasilan dengan probabilitas sukses \(p = 0.3\).
Tentukan kuantil ke-0.75 (artinya cari \(x\) sehingga \(P(X \le x) = 0.75\)).

# Parameter distribusi
r <- 4
p <- 0.3

# Menghitung kuantil ke-0.75
q <- qnbinom(p = 0.75, size = r, prob = p)

# Menampilkan hasil
q
## [1] 12

Nilai yang dihasilkan oleh fungsi \(qnbinom()\) menunjukkan jumlah kegagalan maksimum \((X)\) yang masih memberikan peluang kumulatif \(≤\) nilai probabilitas yang ditentukan. Dengan kata lain, sekitar \(75%\) dari total percobaan akan menghasilkan jumlah kegagalan tidak lebih dari nilai \(q\).

# Membuat grafik hubungan antara p dan quantile
p_seq <- seq(0, 1, by = 0.05)
q_seq <- qnbinom(p = p_seq, size = r, prob = p)

plot(p_seq, q_seq,
     type = "l",
     col = "purple",
     lwd = 2,
     main = "Fungsi Kuantil Sebaran Negatif Binomial",
     xlab = "Probabilitas Kumulatif (p)",
     ylab = "Kuantil (x)")
grid()

6. Grafik Sebaran Negatif Binomial

Sebaran negatif binomial menunjukkan peluang terjadinya sejumlah kegagalan \((X)\) sebelum diperoleh \(r\) keberhasilan dalam percobaan Bernoulli berulang dengan probabilitas sukses \(p\) pada setiap percobaan.

Rumus PMF (Probability Mass Function)

\[ P(X = x) = \binom{x + r - 1}{r - 1} p^r (1 - p)^x \]

Contoh Kasus

Misalkan: - \(r = 3\) (jumlah keberhasilan yang diinginkan) - \(p = 0.4\) (probabilitas sukses) - \(X = 0, 1, 2, ..., 10\)

Maka peluang tiap nilai \(X\) dapat dihitung dengan fungsi \(dnbinom()\).

# Parameter sebaran
r <- 3
p <- 0.4

# Rentang nilai X
x <- 0:10

# Menghitung probabilitas
y <- dnbinom(x, size = r, prob = p)

# Menampilkan nilai peluang
data.frame(X = x, Probabilitas = y)
##     X Probabilitas
## 1   0   0.06400000
## 2   1   0.11520000
## 3   2   0.13824000
## 4   3   0.13824000
## 5   4   0.12441600
## 6   5   0.10450944
## 7   6   0.08360755
## 8   7   0.06449725
## 9   8   0.04837294
## 10  9   0.03547349
## 11 10   0.02554091

Membuat Grafik Sebaran Negatif Binomial

# Membuat diagram batang
barplot(y,
        names.arg = x,
        col = "skyblue",
        border = "white",
        main = "Grafik Sebaran Negatif Binomial",
        xlab = "Jumlah Kegagalan (X)",
        ylab = "Probabilitas P(X = x)",
        ylim = c(0, max(y) + 0.05))

# Menambahkan label nilai di atas batang
text(x = seq_along(y),
     y = y,
     label = round(y, 3),
     pos = 3,
     cex = 0.8)

7. Daftar Pustaka

Handayani, D. (2022). Karakterisasi sebaran binomial negatif–binomial negatif. Jurnal Hasil Penelitian dan Pengkajian Ilmiah Eksakta, 1(2).

Kenne Pagui, E. C., Salvan, A., & Sartori, N. (2022). Improved estimation in negative binomial regression. Statistics in Medicine, 41(13), 2403-2416.

Ningati, C. T. (2024). Normal distribution approximation through negative binomial distribution. Journal of Mathematics and Mathematics Education, 14(1).

Nugroho, S. (2008). Pengantar Statistika Matematika (Edisi pertama). Bengkulu: UNIB Press.