Simulasi Lebar Interval Kepercayaan 95%

1. Tujuan Simulasi

Simulasi ini dilakukan untuk mempelajari pengaruh tiga faktor terhadap lebar interval kepercayaan 95%, yaitu:

Faktor Level
Ukuran sampel (n) 5, 30, 100
Standar deviasi 10, 50, 90
Status SD populasi Diketahui dan tidak diketahui

Jumlah kombinasi perlakuan: \[ 3 \times 3 \times 2 = 18 \] ## 2. Dasar Perhitungan Setiap kombinasi disimulasikan sebanyak 1.000 kali dengan rata-rata populasi sebesar 120. \[ L_z = 2z_{0.975}\frac{\sigma}{\sqrt{n}} \]

Apabila standar deviasi populasi diketahui, lebar interval kepercayaan dihitung menggunakan distribusi normal:

\[ L_t = 2t_{0.975,\,n-1}\frac{s}{\sqrt{n}} \] ## 3. Kode Simulasi R

library(dplyr)
library(ggplot2)
library(knitr)

Menentukan Parameter

set.seed(123)

mu <- 120
n_values <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
replikasi <- 1000

jumlah_kombinasi <- length(n_values) *
  length(sd_values) * 2

jumlah_kombinasi
## [1] 18

Menjalankan Simulasi

hasil <- data.frame()

for (n in n_values) {
  for (sd_pop in sd_values) {
    for (i in 1:replikasi) {

      sampel <- rnorm(
        n = n,
        mean = mu,
        sd = sd_pop
      )

      s <- sd(sampel)

      # SD populasi diketahui
      z_value <- qnorm(0.975)
      lebar_z <- 2 * z_value * sd_pop / sqrt(n)

      # SD populasi tidak diketahui
      t_value <- qt(0.975, df = n - 1)
      lebar_t <- 2 * t_value * s / sqrt(n)

      hasil <- rbind(
        hasil,
        data.frame(
          n = n,
          SD = sd_pop,
          Status = "Diketahui",
          Lebar = lebar_z
        ),
        data.frame(
          n = n,
          SD = sd_pop,
          Status = "Tidak Diketahui",
          Lebar = lebar_t
        )
      )
    }
  }
}

Menampilkan Data Awal

head(hasil)
##   n SD          Status    Lebar
## 1 5 10       Diketahui 17.53045
## 2 5 10 Tidak Diketahui 20.14033
## 3 5 10       Diketahui 17.53045
## 4 5 10 Tidak Diketahui 28.89326
## 5 5 10       Diketahui 17.53045
## 6 5 10 Tidak Diketahui 15.87997

4. Ringkasan Hasil

ringkasan <- hasil %>%
  group_by(n, SD, Status) %>%
  summarise(
    Rata_Rata_Lebar = mean(Lebar),
    SD_Lebar = sd(Lebar),
    .groups = "drop"
  )

kable(
  ringkasan,
  digits = 3,
  caption = "Ringkasan Lebar Interval Kepercayaan 95%"
)
Ringkasan Lebar Interval Kepercayaan 95%
n SD Status Rata_Rata_Lebar SD_Lebar
5 10 Diketahui 17.530 0.000
5 10 Tidak Diketahui 23.292 8.606
5 50 Diketahui 87.652 0.000
5 50 Tidak Diketahui 117.702 41.426
5 90 Diketahui 157.774 0.000
5 90 Tidak Diketahui 210.722 74.940
30 10 Diketahui 7.157 0.000
30 10 Tidak Diketahui 7.416 0.960
30 50 Diketahui 35.784 0.000
30 50 Tidak Diketahui 37.111 5.011
30 90 Diketahui 64.411 0.000
30 90 Tidak Diketahui 66.572 9.049
100 10 Diketahui 3.920 0.000
100 10 Tidak Diketahui 3.970 0.284
100 50 Diketahui 19.600 0.000
100 50 Tidak Diketahui 19.801 1.409
100 90 Diketahui 35.279 0.000
100 90 Tidak Diketahui 35.699 2.619

5. Visualisasi dan Output Grafik

grafik <- ggplot(
  ringkasan,
  aes(
    x = factor(n),
    y = Rata_Rata_Lebar,
    fill = Status
  )
) +
  geom_col(
    position = "dodge",
    width = 0.7
  ) +
  facet_wrap(
    ~SD,
    labeller = label_bquote("SD = " * .(SD))
  ) +
  labs(
    title = "Lebar Interval Kepercayaan 95%",
    subtitle = paste(
      "Berdasarkan ukuran sampel, standar deviasi,",
      "dan status SD populasi"
    ),
    x = "Ukuran Sampel (n)",
    y = "Rata-Rata Lebar Interval",
    fill = "Status SD Populasi"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold"),
    legend.position = "bottom"
  )

print(grafik)

6. Interpretasi

Pengaruh Ukuran Sampel

Semakin besar ukuran sampel, semakin sempit interval kepercayaan yang dihasilkan. Sebagai contoh, ketika standar deviasi sebesar 10 dan diketahui, rata-rata lebarnya menurun dari 17,530 pada n = 5 menjadi 7,157 pada n = 30 dan 3,920 pada n = 100.

Hal tersebut terjadi karena lebar interval berbanding terbalik dengan akar kuadrat ukuran sampel. Oleh karena itu, peningkatan jumlah sampel dapat meningkatkan ketepatan estimasi rata-rata populasi.

Pengaruh Variabilitas Data

Semakin besar standar deviasi, semakin lebar interval kepercayaan. Pada n = 30 dengan SD populasi diketahui, lebar interval meningkat dari 7,157 untuk SD = 10 menjadi 35,784 untuk SD = 50 dan 64,411 untuk SD = 90.

Standar deviasi yang tinggi menunjukkan bahwa data lebih menyebar. Kondisi tersebut meningkatkan ketidakpastian estimasi sehingga diperlukan interval yang lebih lebar.

Pengaruh Pengetahuan SD Populasi

Interval kepercayaan ketika SD populasi tidak diketahui cenderung lebih lebar dibandingkan ketika SD populasi diketahui. Perbedaan terbesar terlihat pada ukuran sampel kecil. Pada n = 5 dan SD = 90, rata-rata lebarnya adalah 157,774 ketika SD diketahui dan 210,722 ketika SD tidak diketahui.

Hal ini disebabkan oleh penggunaan distribusi t, yang memiliki nilai kritis lebih besar daripada distribusi normal, serta penggunaan standar deviasi sampel yang nilainya berubah pada setiap replikasi.

Pada ukuran sampel besar, perbedaan kedua metode menjadi semakin kecil. Sebagai contoh, pada n = 100 dan SD = 10, lebarnya adalah 3,920 ketika SD diketahui dan 3,970 ketika tidak diketahui. Distribusi t semakin mendekati distribusi normal ketika derajat bebas bertambah.

Variasi Lebar Interval

Nilai SD Lebar pada kondisi SD populasi diketahui adalah nol karena lebar interval hanya ditentukan oleh n dan nilai SD populasi yang telah ditetapkan. Dengan demikian, nilainya tetap sama pada seluruh replikasi.

Ketika SD populasi tidak diketahui, lebar interval berubah karena menggunakan standar deviasi sampel. Variasi tersebut paling tinggi pada sampel kecil dan data dengan standar deviasi besar.

7. Kesimpulan

Simulasi menunjukkan bahwa ukuran sampel yang lebih besar menghasilkan interval kepercayaan 95% yang lebih sempit. Sebaliknya, peningkatan variabilitas data menghasilkan interval yang semakin lebar. Ketika standar deviasi populasi tidak diketahui, interval kepercayaan cenderung lebih lebar dan lebih bervariasi, terutama pada sampel berukuran kecil. Pengaruh ketidaktahuan terhadap SD populasi semakin berkurang ketika ukuran sampel bertambah karena distribusi t mendekati distribusi normal.