Simulasi Pengaruh Faktor terhadap Lebar Interval Kepercayaan 95%

Pendahuluan

Tugas ini bertujuan untuk melakukan simulasi guna mempelajari pengaruh tiga faktor terhadap lebar interval kepercayaan 95%, yaitu:

Ukuran Sampel (n): 5, 30, 100
Variabilitas Data (Standar Deviasi, σ atau s): 10, 50, 90
Pengetahuan Standar Deviasi Populasi: Diketahui (σ) atau Tidak Diketahui (s)

Simulasi

# Parameter tetap
mean_sampel <- 100
alpha <- 0.05

# Faktor-faktor simulasi
n_values    <- c(5, 30, 100)
sd_values   <- c(10, 50, 90)
status_sd   <- c("Diketahui", "Tidak Diketahui")

# Membuat seluruh kombinasi faktor
kombinasi <- expand.grid(
  n      = n_values,
  sd     = sd_values,
  status = status_sd
)

# Fungsi untuk menghitung interval kepercayaan
hitung_interval <- function(n, sd, status, mean_sampel, alpha) {
  if (status == "Diketahui") {
    # Gunakan distribusi Z
    nilai_kritis <- qnorm(1 - alpha/2)
  } else {
    # Gunakan distribusi t
    nilai_kritis <- qt(1 - alpha/2, df = n - 1)
  }
  
  margin_error <- nilai_kritis * sd / sqrt(n)
  batas_bawah  <- mean_sampel - margin_error
  batas_atas   <- mean_sampel + margin_error
  lebar        <- batas_atas - batas_bawah
  
  return(c(margin_error = margin_error,
           batas_bawah   = batas_bawah,
           batas_atas    = batas_atas,
           lebar         = lebar))
}

# Menjalankan simulasi untuk seluruh kombinasi
hasil <- t(mapply(hitung_interval,
                   n      = kombinasi$n,
                   sd     = kombinasi$sd,
                   status = kombinasi$status,
                   MoreArgs = list(mean_sampel = mean_sampel, alpha = alpha)))

# Menggabungkan hasil dengan kombinasi faktor
tabel_hasil <- cbind(kombinasi, round(hasil, 3))

# Mengurutkan berdasarkan lebar interval (dari tersempit ke terlebar)
tabel_hasil <- tabel_hasil[order(tabel_hasil$lebar), ]
rownames(tabel_hasil) <- NULL

tabel_hasil

##      n sd          status margin_error batas_bawah batas_atas   lebar
## 1  100 10       Diketahui        1.960      98.040    101.960   3.920
## 2  100 10 Tidak Diketahui        1.984      98.016    101.984   3.968
## 3   30 10       Diketahui        3.578      96.422    103.578   7.157
## 4   30 10 Tidak Diketahui        3.734      96.266    103.734   7.468
## 5    5 10       Diketahui        8.765      91.235    108.765  17.530
## 6  100 50       Diketahui        9.800      90.200    109.800  19.600
## 7  100 50 Tidak Diketahui        9.921      90.079    109.921  19.842
## 8    5 10 Tidak Diketahui       12.417      87.583    112.417  24.833
## 9  100 90       Diketahui       17.640      82.360    117.640  35.279
## 10 100 90 Tidak Diketahui       17.858      82.142    117.858  35.716
## 11  30 50       Diketahui       17.892      82.108    117.892  35.784
## 12  30 50 Tidak Diketahui       18.670      81.330    118.670  37.341
## 13  30 90       Diketahui       32.205      67.795    132.205  64.411
## 14  30 90 Tidak Diketahui       33.607      66.393    133.607  67.213
## 15   5 50       Diketahui       43.826      56.174    143.826  87.652
## 16   5 50 Tidak Diketahui       62.083      37.917    162.083 124.166
## 17   5 90       Diketahui       78.887      21.113    178.887 157.774
## 18   5 90 Tidak Diketahui      111.750     -11.750    211.750 223.500

Visualisasi

library(ggplot2)

ggplot(tabel_hasil, aes(x = factor(n), y = lebar, fill = status)) +
  geom_bar(stat = "identity", position = "dodge") +
  facet_wrap(~ sd, labeller = label_both) +
  labs(
    title = "Pengaruh Ukuran Sampel, Standar Deviasi, dan Status Pengetahuan SD\nterhadap Lebar Interval Kepercayaan 95%",
    x = "Ukuran Sampel (n)",
    y = "Lebar Interval Kepercayaan",
    fill = "Status SD Populasi"
  ) +
  theme_minimal()

Interpretasi Hasil

Berdasarkan tabel dan visualisasi simulasi di atas, dapat diperoleh beberapa pernyataan berikut:

1. Pengaruh Ukuran Sampel (n)

Semakin besar ukuran sampel, semakin sempit lebar interval kepercayaan. Hal ini konsisten dengan rumus margin of error \(E = Z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}\), di mana \(n\) berada pada penyebut sehingga semakin besar \(n\), semakin kecil \(E\).

2. Pengaruh Variabilitas Data (SD)

Semakin besar standar deviasi, semakin lebar interval kepercayaan. Data yang lebih bervariasi membutuhkan rentang yang lebih luas untuk mencakup parameter populasi dengan tingkat kepercayaan yang sama.

3. Pengaruh Status Pengetahuan SD Populasi

Untuk kombinasi n dan SD yang sama, interval kepercayaan yang menggunakan distribusi t (SD tidak diketahui) selalu lebih lebar dibandingkan distribusi Z (SD diketahui). Hal ini karena distribusi t memiliki ekor lebih tebal untuk mengakomodasi ketidakpastian tambahan akibat estimasi SD dari sampel, terutama terlihat jelas pada ukuran sampel kecil (n=5).

4. Kombinasi Ekstrem

Interval tersempit: n = 100, SD = 10, Status = Diketahui — kombinasi ukuran sampel besar dan variabilitas rendah menghasilkan estimasi paling presisi.
Interval terlebar: n = 5, SD = 90, Status = Tidak Diketahui — kombinasi ukuran sampel kecil, variabilitas tinggi, dan ketidaktahuan SD populasi menghasilkan estimasi paling tidak presisi.

Kesimpulan

Simulasi ini menunjukkan bahwa presisi estimasi interval kepercayaan dipengaruhi oleh tiga faktor utama secara simultan: ukuran sampel, variabilitas data, dan pengetahuan terhadap standar deviasi populasi. Untuk memperoleh estimasi yang presisi (interval sempit), peneliti sebaiknya menggunakan ukuran sampel yang besar, terutama pada data dengan variabilitas tinggi atau ketika standar deviasi populasi tidak diketahui.

Referensi: Walpole, R.E., Myers, R.H., & Myers, S.L. (2012). Probability & Statistics for Engineers and Scientists (9th ed.). Pearson.