Metode Penarikan Contoh - Penarikan Contoh Gerombol Dua Tahap
Video Pembelajaran - P5
Video Pembelajaran dapat diakses melalui link berikut : https://ipb.link/materis2mpc
Definisi
Two-stage cluster sampling (penarikan contoh gerombol dua tahap) adalah salah satu metode sampling di mana:
- Populasi dibagi menjadi beberapa gerombol (\(N\)).
- Pada tahap pertama, beberapa gerombol (\(n\)) dipilih secara acak.
- Pada tahap kedua, dari setiap gerombol yang terpilih, beberapa elemen (\(m_i\)) dipilih secara acak.
Metode ini digunakan karena:
- Efisien secara biaya dan waktu, terutama jika elemen populasi tersebar secara geografis.
- Tidak memerlukan daftar elemen populasi secara lengkap, cukup mengetahui struktur gerombol.
Contoh: Dalam estimasi konsumsi LPG di Kecamatan Dramaga, setiap RT dianggap sebagai gerombol, dan beberapa rumah tangga dalam RT dipilih untuk analisis.
Notasi Penting
Untuk memahami perhitungan, berikut adalah notasi yang digunakan:
- \(N\): Jumlah total gerombol dalam populasi.
- \(n\): Jumlah gerombol yang dipilih sebagai sampel.
- \(M_i\): Jumlah elemen dalam gerombol ke-\(i\).
- \(M\): Jumlah total elemen dalam populasi (\(M = \sum_{i=1}^{N} M_i\)).
- \(m_i\): Jumlah elemen yang dipilih dari gerombol ke-\(i\).
- \(\bar{M}\): Rata-rata ukuran gerombol dalam populasi. \[ \bar{M} = \frac{\sum_{i=1}^N M_i}{N} \]
- \(y_{ij}\): Observasi ke-\(j\) dari gerombol ke-\(i\).
- \(\bar{y}_i\): Rataan sampel dalam gerombol ke-\(i\). \[ \bar{y}_i = \frac{1}{m_i} \sum_{j=1}^{m_i} y_{ij} \]
Pendugaan Parameter
Rataan Populasi (\(\mu\))
Penduga tak bias untuk rata-rata populasi: \[ \hat{\mu} = \frac{1}{n} \sum_{i=1}^{n} \frac{M_i \bar{y}_i}{M} \] dengan:
\[ \bar{y}_i = \frac{1}{m_i} \sum_{j=1}^{m_i} y_{ij} \]
Varians Penduga Rataan (\(V(\hat{\mu})\))
\[ V(\hat{\mu}) = \frac{1}{n} \left[ \frac{\text{MSB}}{m} + \text{MSW} \right] \] - MSB (Mean Square Between): \[ \text{MSB} = \frac{1}{n-1} \sum_{i=1}^n M_i (\bar{y}_i - \hat{\mu})^2 \] - MSW (Mean Square Within): \[ \text{MSW} = \frac{1}{n} \sum_{i=1}^n s_i^2 \] dengan:
\[ s_i^2 = \frac{1}{m_i - 1} \sum_{j=1}^{m_i} (y_{ij} - \bar{y}_i)^2 \]
Total Populasi (\(\tau\))
Penduga total populasi: \[ \hat{\tau} = M \hat{\mu} \] Varians total populasi: \[ V(\hat{\tau}) = M^2 V(\hat{\mu}) \]
Contoh Kasus
Misalkan kita memiliki data berikut:
| Gerombol (\(i\)) | \(M_i\) | \(m_i\) | \(\bar{y}_i\) | \(s_i^2\) |
|---|---|---|---|---|
| 1 | 45 | 9 | 102 | 20 |
| 2 | 36 | 7 | 90 | 16 |
| 3 | 20 | 4 | 76 | 22 |
| 4 | 18 | 4 | 94 | 26 |
| 5 | 28 | 6 | 120 | 12 |
Parameter yang diketahui:
- \(N = 20\): Jumlah total gerombol.
- \(M = 147\): Total elemen dalam populasi.
- \(n = 5\): Jumlah gerombol yang dipilih.
- \(m\): Rata-rata elemen per gerombol (\(m = \frac{\sum_{i=1}^n m_i}{n} = 6\)).
Implementasi R
Berikut adalah kode R yang menghitung estimasi rata-rata populasi (\(\mu\)), varians (\(V(\hat{\mu})\)), dan total populasi (\(\tau\)):
# Data gerombol
data <- data.frame(
cluster = 1:5, # ID Gerombol
M_i = c(45, 36, 20, 18, 28), # Jumlah elemen di gerombol
m_i = c(9, 7, 4, 4, 6), # Jumlah sampel di gerombol
y_bar_i = c(102, 90, 76, 94, 120), # Rataan sampel di gerombol
s_i2 = c(20, 16, 22, 26, 12) # Ragam dalam gerombol
)
# Parameter Populasi
N <- 20 # Jumlah total gerombol
M <- sum(data$M_i) # Total elemen populasi
n <- nrow(data) # Jumlah gerombol sampel
m <- mean(data$m_i) # Rata-rata ukuran sampel per gerombol
# Estimasi rata-rata populasi (μ)
y_bar <- sum(data$M_i * data$y_bar_i) / sum(data$M_i)
cat("Rataan populasi (μ):", y_bar, "\n")## Rataan populasi (μ): 97.97279
# Varians Penduga Rataan Populasi
MSB <- sum(data$M_i * (data$y_bar_i - y_bar)^2) / (n - 1)
MSW <- mean(data$s_i2)
V_mu <- (MSB / m + MSW) / n
cat("Varians penduga rataan populasi:", V_mu, "\n")## Varians penduga rataan populasi: 225.0391
## Total populasi (τ): 14402