Pendahuluan

Sebaran geometrik (Geometric Distribution) merupakan salah satu sebaran probabilitas diskrit yang paling penting dalam statistika. Sebaran ini menggambarkan distribusi data yang memodelkan jumlah percobaan yang diperlukan hingga keberhasilan pertama dalam serangkaian percobaan Bernoulli independen dengan peluang keberhasilan yang konstan. Sebaran geometrik sering digunakan untuk memodelkan berbagai fenomena seperti jumlah lemparan koin hingga muncul sisi gambar, atau jumlah produk yang diuji hingga ditemukan cacat pertama (Illowsky & Dean, 2023).

Sebuah peubah acak diskrit \(X\) dikatakan berdistribusi Geometrik apabila fungsi massa peluangnya (probability mass function) diberikan oleh:

\[ f(x) = P(X = x) = (1 - p)^{x-1}p, \quad x = 1, 2, 3, \ldots \]

dengan:

Jika \(X\) didefinisikan sebagai jumlah kegagalan sebelum keberhasilan pertama, maka:

\[ P(X = x) = (1 - p)^x p, \quad x = 0, 1, 2, \ldots \]

Nilai ekspektasi dan variansi dari sebaran geometrik adalah:

\[ E(X) = \frac{1}{p}, \quad Var(X) = \frac{1-p}{p^2} \]

Fungsi R untuk Sebaran Geometrik

Membangkitan Bilangan Acak Sebaran Geometrik

Untuk membangkitkan (menghasilkan) bilangan acak dari sebaran geometrik digunakan fungsi rgeom() dalam bahasa pemrograman R. Fungsi ini digunakan ketika kita ingin mensimulasikan data yang mengikuti distribusi geometrik, misalnya untuk jumlah lemparan koin hingga muncul sisi gambar, atau jumlah panggilan telepon hingga satu berhasil tersambung.

Syntax: rgeom(n, prob)

Parameter:

n :jumlah bilangan acak yang dibangkitkan

prob :peluang keberhasilan (p), default tidak ada (harus dispesifikasikan)

Contoh:

rgeom(10, prob = 0.3)
##  [1]  2  1  1  2  6  0  1  1  4 10

Menghitung Peluang Sebaran Geometrik

Untuk menghitung peluang pada sebaran geometrik, digunakan fungsi dgeom() dan pgeom() dalam bahasa pemrograman R. Fungsi dgeom() digunakan untuk menghitung peluang titik (PMF), sedangkan pgeom() digunakan ketika kita ingin mengetahui probabilitas kumulatif suatu nilai atau kurang dari nilai tertentu pada distribusi geometrik. Distribusi geometrik sendiri sering digunakan untuk menggambarkan jumlah percobaan hingga keberhasilan pertama dalam percobaan Bernoulli independen.


Rumus Fungsi Kepekatan Peluang (PMF)
\[ P(X = x) = (1 - p)^{x - 1}p, \quad x = 1, 2, 3, \ldots \]

Rumus Fungsi Distribusi Kumulatif (CDF)
\[ P(X \le x) = 1 - (1 - p)^x \]


Syntax:
dgeom(x, prob)
pgeom(q, prob, lower.tail = TRUE)

Parameter:

x, q : nilai yang ingin dihitung peluangnya

prob : peluang keberhasilan pada setiap percobaan (\(0 < p \le 1\))

lower.tail = TRUE : digunakan untuk menghitung peluang \(P(X \le x)\)

lower.tail = FALSE : digunakan untuk menghitung peluang \(P(X > x)\)

Contoh: Sebagai contoh, jika variabel acak \(X\) berdistribusi geometrik dengan peluang keberhasilan 0.3, maka peluang

P(X=3) dapat dihitung dengan:

dgeom(3 - 1, prob = 0.3)
## [1] 0.147

P(X≤3) dapat dihitung dengan:

pgeom(3 - 1, prob = 0.3)
## [1] 0.657

P(X>3) dapat dihitung dengan:

pgeom(3 - 1, prob = 0.3, lower.tail = FALSE)
## [1] 0.343

Menghitung Quantile Sebaran Geometrik

Untuk menghitung kuantil (quantile) atau nilai batas (x) pada sebaran geometrik digunakan fungsi qgeom() dalam bahasa pemrograman R. Fungsi ini merupakan kebalikan dari pgeom(), yaitu digunakan ketika kita sudah mengetahui peluang (probabilitas) dan ingin mencari nilai data (x) yang sesuai dengan peluang tersebut.

Dengan kata lain, fungsi qgeom() digunakan untuk mencari nilai q yang memenuhi hubungan: \[P(X≤q)=p\] Fungsi ini berguna ketika ingin mengetahui batas persentil dari data yang berdistribusi geometrik, misalnya menentukan jumlah percobaan maksimum untuk mencapai 80% kemungkinan keberhasilan pertama, atau jumlah kegagalan yang mencakup 95% populasi.

Syntax: qgeom(p, prob, lower.tail = TRUE)

Parameter:

p : peluang atau probabilitas kumulatif yang diketahui

prob : peluang keberhasilan (p) distribusi

lower.tail = TRUE :digunakan untuk menghitung p(𝑋≤q)

lower.tail = TRUE :digunakan Untuk menghitung p(X>q).

Contoh: Sebagai contoh, jika peluang keberhasilan 0.3, maka untuk mengetahui jumlah kegagalan yang mencakup 80% dari distribusi, dapat dihitung dengan:

qgeom(0.8, prob = 0.3, lower.tail = TRUE)
## [1] 4

Penjelasan: Fungsi qgeom(0.8, prob = 0.3, lower.tail = TRUE) digunakan untuk mencari nilai kuantil ke-80% dari distribusi geometrik dengan peluang keberhasilan (prob) = 0.3. Artinya, kita mencari nilai q sehingga:

\[P(X≤q)=0.8\] Ketika dijalankan, R akan menghasilkan output sekitar 4: Artinya, 80% data dari distribusi geometrik Geom(0.3) memiliki nilai kurang dari atau sama dengan 4. Dengan kata lain, hanya 20% data yang lebih besar dari 4.

Grafik Sebaran Geometrik

Grafik sebaran geometrik digunakan untuk memvisualisasikan bentuk distribusi data yang mengikuti pola peluang diskrit menurun secara eksponensial. Distribusi ini tidak simetris dan cenderung memiliki ekor panjang ke kanan, di mana peluang keberhasilan pertama semakin kecil seiring bertambahnya jumlah percobaan.

Grafik sebaran geometrik dapat dibuat menggunakan fungsi barplot() dan dgeom(). Fungsi dgeom() digunakan untuk menghitung massa peluang (PMF) dari distribusi geometrik pada setiap titik nilai \(x\), sedangkan barplot() digunakan untuk menggambarkan grafik batangnya karena bersifat diskrit.

Syntax: Bentuk umum perintahnya adalah: barplot(dgeom(x, prob), names.arg = x)

Keterangan:

dnorm(x, prob) : menghitung nilai fungsi massa peluang geometrik.

x : vektor nilai diskrit (misalnya 0:10).

Contoh: Misalkan suatu data memiliki peluang keberhasilan 0.3. Maka grafik sebaran geometriknya dapat digambar dengan:

# Definisikan x dan prob
x <- 0:10
prob <- 0.3
y <- dgeom(x, prob = prob)

barplot(y, names.arg = x,
        main = "Grafik Sebaran Geometrik Geom(0.3)",
        xlab = "Jumlah Kegagalan (x)", ylab = "P(X = x)",
        col = "lightblue", border = "blue")

```