Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan 95%, dengan informasi setiap faktor dan level sebagai berikut:

mean <- 100
alpha    <- 0.05
 
ukuran_sampel <- c(5, 30, 100)
sd_levels     <- c(10, 50, 90)
 
hasil <- data.frame()
 
for (n in ukuran_sampel) {
  for (sd in sd_levels) {
 
    # Distribusi Z (sigma diketahui)
    z_value  <- qnorm(1 - alpha/2)
    margin_z <- z_value * sd / sqrt(n)
    lebar_z  <- 2 * margin_z
 
    # Distribusi t (sigma tidak diketahui)
    t_value  <- qt(1 - alpha/2, df = n - 1)
    margin_t <- t_value * sd / sqrt(n)
    lebar_t  <- 2 * margin_t
 
    hasil <- rbind(hasil, data.frame(
      n            = n,
      SD           = sd,
      Sigma        = "Diketahui",
      Lebar_CI_95  = round(lebar_z, 4)
    ))
 
    hasil <- rbind(hasil, data.frame(
      n            = n,
      SD           = sd,
      Sigma        = "Tidak Diketahui",
      Lebar_CI_95  = round(lebar_t, 4)
    ))
  }
}
 
hasil
##      n SD           Sigma Lebar_CI_95
## 1    5 10       Diketahui     17.5305
## 2    5 10 Tidak Diketahui     24.8333
## 3    5 50       Diketahui     87.6523
## 4    5 50 Tidak Diketahui    124.1664
## 5    5 90       Diketahui    157.7741
## 6    5 90 Tidak Diketahui    223.4995
## 7   30 10       Diketahui      7.1568
## 8   30 10 Tidak Diketahui      7.4681
## 9   30 50       Diketahui     35.7839
## 10  30 50 Tidak Diketahui     37.3406
## 11  30 90       Diketahui     64.4110
## 12  30 90 Tidak Diketahui     67.2131
## 13 100 10       Diketahui      3.9199
## 14 100 10 Tidak Diketahui      3.9684
## 15 100 50       Diketahui     19.5996
## 16 100 50 Tidak Diketahui     19.8422
## 17 100 90       Diketahui     35.2794
## 18 100 90 Tidak Diketahui     35.7159
library(ggplot2)
hasil$n  <- factor(paste0("n=",  hasil$n),  levels = paste0("n=",  ukuran_sampel))
hasil$SD <- factor(paste0("sd=", hasil$SD), levels = paste0("sd=", sd_levels))
 
ggplot(hasil, aes(x = n, y = SD, fill = Lebar_CI_95)) +
  geom_tile(color = "white", linewidth = 1.5) +
  geom_text(aes(label = round(Lebar_CI_95, 2)), fontface = "bold", size = 4.5) +
  facet_wrap(~ Sigma) +
  scale_fill_gradient(low = "antiquewhite", high = "antiquewhite4", name = "Lebar CI") +
  labs(
    title = "Heatmap Lebar Interval Kepercayaan 95%",
    x     = "Ukuran Sampel",
    y     = "Standar Deviasi"
  ) +
  theme_minimal(base_size = 13) +
  theme(plot.title = element_text(face = "bold", hjust = 0.5))

Semakin besar ukuran sampel (n), semakin sempit lebar interval kepercayaan. Hal ini terlihat jelas pada SD = 10 dengan sigma diketahui:

n = 5 : lebar = 17.5305

n = 30 : lebar = 7.1568

n = 100 : lebar = 3.9199

Lebar interval menyempit secara drastis seiring bertambahnya n karena margin of error berbanding terbalik dengan akar kuadrat dari n (1/√n). Artinya, sampel yang lebih besar memberikan estimasi yang lebih presisi.

Semakin besar standar deviasi (SD), semakin lebar interval kepercayaan. Hal ini terlihat pada n = 30 dengan sigma diketahui:

SD = 10 : lebar = 7.1568

SD = 50 : lebar = 35.7839

SD = 90 : lebar = 64.4110

Lebar interval bertambah secara proporsional seiring meningkatnya SD. Ketika data lebih menyebar (variabilitas tinggi), estimasi rata-rata menjadi kurang presisi sehingga interval harus lebih lebar untuk tetap mencakup nilai parameter populasi dengan kepercayaan 95%.

Distribusi t (sigma tidak diketahui) selalu menghasilkan interval yang lebih lebar dibandingkan distribusi Z (sigma diketahui).

Perbedaan paling besar terjadi saat n kecil, contohnya n = 5, SD = 10:

Diketahui (Z) : lebar = 17.5305

Tidak Diketahui (t): lebar = 24.8333

Namun perbedaan semakin mengecil seiring bertambahnya n, seperti pada n = 100, SD = 10:

Diketahui (Z) : lebar = 3.9199

Tidak Diketahui (t): lebar = 3.9684

Hal ini terjadi karena pada n besar, nilai t mendekati nilai z sehingga kedua distribusi menghasilkan interval yang hampir sama. Ketidakpastian akibat tidak mengetahui sigma populasi menjadi tidak signifikan ketika sampel cukup besar.