Melalui HTML ini, saya akan mengimplementasikan materi Komputasi Statistika mengenai Hypergeometric Distribution
Dalam dunia yang semakin didorong oleh data, distribusi ini sering diterapkan menggunakan bahasa pemrograman seperti R, yang menyediakan fungsi-fungsi bawaan untuk menghitung probabilitas, fungsi kumulatif, kuantil, dan simulasi data acak. Project ini disusun sebagai bagian dari tugas komputasi statistika, yang bertujuan untuk memaparkan konsep Hypergeometric Distribution. Konsep ini diterapkan menggunakan bahasa pemrograman R, yang dikenal fleksibel dalam pengolahan data dan analisis statistik.
Distribusi hipergeometrik adalah salah satu distribusi probabilitas diskrit yang digunakan dalam statistik untuk memodelkan situasi sampling tanpa penggantian (without replacement) dari populasi terbatas. Berbeda dengan distribusi binomial yang mengasumsikan sampling dengan penggantian, distribusi hipergeometrik lebih realistis untuk kasus di mana ukuran sampel memengaruhi komposisi populasi yang tersisa. Adapun bentuk umum dari distrisbusi hipergeometrik adalah sebagai berikut (Gupta & Kapoor, 2002):
\[
P(x;N,n,k) \;=\;
\frac{\binom{k}{x}\,\binom{N-k}{\,n-x\,}}{\binom{N}{n}}
\quad\text{untuk } x=0,1,\dots,n
\] Di mana:
N adalah ukuran populasi
n adalah ukuran
sampel
k adalah banyaknya unsur yang sama pada populasi
x
adalah banyaknya peristiwa sukses
Berikut ini merupakan contoh soalnya, akan dikerjakan
menggunakan pemrograman R:
Sebuah pabrik memproduksi 50 lampu, terdiri dari:
- 10 lampu
rusak (cacat)
- 40 lampu bagus
Dari 50 lampu itu, seorang
pengawas mutu mengambil 5 lampu secara acak tanpa pengembalian. Berapa
peluang bahwa tepat 2 dari 5 lampu yang diambil adalah rusak?
Parameter:
N = 50, K = 10, n = 5, X =
2
Selanjutnya kita mencari distribusi hipergeometriknya
N <- 50
k_pop <- 10
n_sampel <- 5
x <- 2
p <- dhyper(x, m = k_pop, n = N - k_pop, k=n_sampel)
p
## [1] 0.2098397
Anda dapat menambahkan grafik, seperti dibawah ini:
# Distribusi peluang
x <- 0:n_sampel
prob <- dhyper(x, m = k_pop, n = N - k_pop, k = n_sampel)
barplot(prob, names.arg = x, col = "steelblue",
main = "Distribusi Hipergeometrik",
xlab = "Jumlah cacat dalam sampel (x)",
ylab = "Probabilitas P(X = 2)")
# Tambahkan garis rata-rata teoretis (nilai harapan)
abline(v = n_sampel * k_pop / N, col = "red",lwd=2,lty=2)
Gupta, S. C., & Kapoor, V. K. (2002). Fundamentals of mathematical statistics (10th ed.). New Delhi: Sultan Chand & Sons.