Simulasi Lebar Interval Kepercayaan 95%

1. Tujuan Simulasi

Simulasi ini dilakukan untuk mempelajari pengaruh tiga faktor terhadap lebar interval kepercayaan 95%, yaitu:

Faktor	Level
Ukuran sampel (`n`)	5, 30, 100
Standar deviasi	10, 50, 90
Status SD populasi	Diketahui dan tidak diketahui

Jumlah kombinasi perlakuan: \[ 3 \times 3 \times 2 = 18 \] ## 2. Dasar Perhitungan Setiap kombinasi disimulasikan sebanyak 1.000 kali dengan rata-rata populasi sebesar 120. \[ L_z = 2z_{0.975}\frac{\sigma}{\sqrt{n}} \]

Apabila standar deviasi populasi diketahui, lebar interval kepercayaan dihitung menggunakan distribusi normal:

\[ L_t = 2t_{0.975,\,n-1}\frac{s}{\sqrt{n}} \] ## 3. Kode Simulasi R

library(dplyr)
library(ggplot2)
library(knitr)

Menentukan Parameter

set.seed(123)

mu <- 120
n_values <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
replikasi <- 1000

jumlah_kombinasi <- length(n_values) *
  length(sd_values) * 2

jumlah_kombinasi

## [1] 18

Menjalankan Simulasi

hasil <- data.frame()

for (n in n_values) {
  for (sd_pop in sd_values) {
    for (i in 1:replikasi) {

      sampel <- rnorm(
        n = n,
        mean = mu,
        sd = sd_pop
      )

      s <- sd(sampel)

      # SD populasi diketahui
      z_value <- qnorm(0.975)
      lebar_z <- 2 * z_value * sd_pop / sqrt(n)

      # SD populasi tidak diketahui
      t_value <- qt(0.975, df = n - 1)
      lebar_t <- 2 * t_value * s / sqrt(n)

      hasil <- rbind(
        hasil,
        data.frame(
          n = n,
          SD = sd_pop,
          Status = "Diketahui",
          Lebar = lebar_z
        ),
        data.frame(
          n = n,
          SD = sd_pop,
          Status = "Tidak Diketahui",
          Lebar = lebar_t
        )
      )
    }
  }
}

Menampilkan Data Awal

head(hasil)

##   n SD          Status    Lebar
## 1 5 10       Diketahui 17.53045
## 2 5 10 Tidak Diketahui 20.14033
## 3 5 10       Diketahui 17.53045
## 4 5 10 Tidak Diketahui 28.89326
## 5 5 10       Diketahui 17.53045
## 6 5 10 Tidak Diketahui 15.87997

4. Ringkasan Hasil

ringkasan <- hasil %>%
  group_by(n, SD, Status) %>%
  summarise(
    Rata_Rata_Lebar = mean(Lebar),
    SD_Lebar = sd(Lebar),
    .groups = "drop"
  )

kable(
  ringkasan,
  digits = 3,
  caption = "Ringkasan Lebar Interval Kepercayaan 95%"
)

Ringkasan Lebar Interval Kepercayaan 95%
n	SD	Status	Rata_Rata_Lebar	SD_Lebar
5	10	Diketahui	17.530	0.000
5	10	Tidak Diketahui	23.292	8.606
5	50	Diketahui	87.652	0.000
5	50	Tidak Diketahui	117.702	41.426
5	90	Diketahui	157.774	0.000
5	90	Tidak Diketahui	210.722	74.940
30	10	Diketahui	7.157	0.000
30	10	Tidak Diketahui	7.416	0.960
30	50	Diketahui	35.784	0.000
30	50	Tidak Diketahui	37.111	5.011
30	90	Diketahui	64.411	0.000
30	90	Tidak Diketahui	66.572	9.049
100	10	Diketahui	3.920	0.000
100	10	Tidak Diketahui	3.970	0.284
100	50	Diketahui	19.600	0.000
100	50	Tidak Diketahui	19.801	1.409
100	90	Diketahui	35.279	0.000
100	90	Tidak Diketahui	35.699	2.619

5. Visualisasi dan Output Grafik

grafik <- ggplot(
  ringkasan,
  aes(
    x = factor(n),
    y = Rata_Rata_Lebar,
    fill = Status
  )
) +
  geom_col(
    position = "dodge",
    width = 0.7
  ) +
  facet_wrap(
    ~SD,
    labeller = label_bquote("SD = " * .(SD))
  ) +
  labs(
    title = "Lebar Interval Kepercayaan 95%",
    subtitle = paste(
      "Berdasarkan ukuran sampel, standar deviasi,",
      "dan status SD populasi"
    ),
    x = "Ukuran Sampel (n)",
    y = "Rata-Rata Lebar Interval",
    fill = "Status SD Populasi"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold"),
    legend.position = "bottom"
  )

print(grafik)

6. Interpretasi

Pengaruh Ukuran Sampel

Semakin besar ukuran sampel, semakin sempit interval kepercayaan yang dihasilkan. Sebagai contoh, ketika standar deviasi sebesar 10 dan diketahui, rata-rata lebarnya menurun dari 17,530 pada n = 5 menjadi 7,157 pada n = 30 dan 3,920 pada n = 100.

Hal tersebut terjadi karena lebar interval berbanding terbalik dengan akar kuadrat ukuran sampel. Oleh karena itu, peningkatan jumlah sampel dapat meningkatkan ketepatan estimasi rata-rata populasi.

Pengaruh Variabilitas Data

Semakin besar standar deviasi, semakin lebar interval kepercayaan. Pada n = 30 dengan SD populasi diketahui, lebar interval meningkat dari 7,157 untuk SD = 10 menjadi 35,784 untuk SD = 50 dan 64,411 untuk SD = 90.

Standar deviasi yang tinggi menunjukkan bahwa data lebih menyebar. Kondisi tersebut meningkatkan ketidakpastian estimasi sehingga diperlukan interval yang lebih lebar.

Pengaruh Pengetahuan SD Populasi

Interval kepercayaan ketika SD populasi tidak diketahui cenderung lebih lebar dibandingkan ketika SD populasi diketahui. Perbedaan terbesar terlihat pada ukuran sampel kecil. Pada n = 5 dan SD = 90, rata-rata lebarnya adalah 157,774 ketika SD diketahui dan 210,722 ketika SD tidak diketahui.

Hal ini disebabkan oleh penggunaan distribusi t, yang memiliki nilai kritis lebih besar daripada distribusi normal, serta penggunaan standar deviasi sampel yang nilainya berubah pada setiap replikasi.

Pada ukuran sampel besar, perbedaan kedua metode menjadi semakin kecil. Sebagai contoh, pada n = 100 dan SD = 10, lebarnya adalah 3,920 ketika SD diketahui dan 3,970 ketika tidak diketahui. Distribusi t semakin mendekati distribusi normal ketika derajat bebas bertambah.

Variasi Lebar Interval

Nilai SD Lebar pada kondisi SD populasi diketahui adalah nol karena lebar interval hanya ditentukan oleh n dan nilai SD populasi yang telah ditetapkan. Dengan demikian, nilainya tetap sama pada seluruh replikasi.

Ketika SD populasi tidak diketahui, lebar interval berubah karena menggunakan standar deviasi sampel. Variasi tersebut paling tinggi pada sampel kecil dan data dengan standar deviasi besar.

7. Kesimpulan

Simulasi menunjukkan bahwa ukuran sampel yang lebih besar menghasilkan interval kepercayaan 95% yang lebih sempit. Sebaliknya, peningkatan variabilitas data menghasilkan interval yang semakin lebar. Ketika standar deviasi populasi tidak diketahui, interval kepercayaan cenderung lebih lebar dan lebih bervariasi, terutama pada sampel berukuran kecil. Pengaruh ketidaktahuan terhadap SD populasi semakin berkurang ketika ukuran sampel bertambah karena distribusi t mendekati distribusi normal.

Praktikum Week 5

Hanif