Tugas

Melakukan simulasi untuk mempelajari pengaruh tiga faktor berikut terhadap lebar Interval Kepercayaan 95%:

  1. Ukuran Sampel (n): 5, 30, 100

  2. Variabilitas Data (sigma atau s): 10, 50, 90

  3. Kondisi Standar Deviasi: Diketahui (sigma menggunakan Distribusi z) vs Tidak Diketahui (s menggunakan Distribusi t)

Penyelesaian

# Mengatur Seed agar hasil simulasi konsisten
set.seed(2026)

# Mendefinisikan level untuk setiap faktor sesuai instruksi tugas
faktor_n     <- c(5, 30, 100)
faktor_sd    <- c(10, 50, 90)
faktor_kondisi <- c("Diketahui (z)", "Tidak Diketahui (t)")
alpha        <- 0.05
mean_pop     <- 100 # Nilai rata-rata dummy untuk visualisasi interval

# Membuat grid kombinasi dari seluruh faktor
tabel_simulasi <- expand.grid(n = faktor_n, SD = faktor_sd, Kondisi = faktor_kondisi)

# Inisialisasi vektor untuk menyimpan lebar interval
lebar_interval <- c()

# Melakukan perulangan untuk menghitung lebar interval pada setiap kondisi
for(i in 1:nrow(tabel_simulasi)) {
  n_val   <- tabel_simulasi$n[i]
  sd_val  <- tabel_simulasi$SD[i]
  kondisi <- tabel_simulasi$Kondisi[i]
  
  if(kondisi == "Diketahui (z)") {
    # Menggunakan nilai kritis z
    z_value <- qnorm(1 - alpha/2)
    margin_error <- z_value * (sd_val / sqrt(n_val))
  } else {
    # Menggunakan nilai kritis t (df = n - 1)
    t_value <- qt(1 - alpha/2, df = n_val - 1)
    margin_error <- t_value * (sd_val / sqrt(n_val))
  }
  
  # Lebar interval adalah 2 kali dari margin of error
  lebar_interval[i] <- 2 * margin_error
}

# Menggabungkan hasil perhitungan ke dalam tabel utama
tabel_simulasi$Lebar_Interval <- round(lebar_interval, 4)
tabel_simulasi
##      n SD             Kondisi Lebar_Interval
## 1    5 10       Diketahui (z)        17.5305
## 2   30 10       Diketahui (z)         7.1568
## 3  100 10       Diketahui (z)         3.9199
## 4    5 50       Diketahui (z)        87.6523
## 5   30 50       Diketahui (z)        35.7839
## 6  100 50       Diketahui (z)        19.5996
## 7    5 90       Diketahui (z)       157.7741
## 8   30 90       Diketahui (z)        64.4110
## 9  100 90       Diketahui (z)        35.2794
## 10   5 10 Tidak Diketahui (t)        24.8333
## 11  30 10 Tidak Diketahui (t)         7.4681
## 12 100 10 Tidak Diketahui (t)         3.9684
## 13   5 50 Tidak Diketahui (t)       124.1664
## 14  30 50 Tidak Diketahui (t)        37.3406
## 15 100 50 Tidak Diketahui (t)        19.8422
## 16   5 90 Tidak Diketahui (t)       223.4995
## 17  30 90 Tidak Diketahui (t)        67.2131
## 18 100 90 Tidak Diketahui (t)        35.7159

Visualisasi

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
ggplot(tabel_simulasi, aes(x = as.factor(n), y = Lebar_Interval, fill = Kondisi)) +
  geom_bar(stat = "identity", position = "dodge") +
  facet_wrap(~SD, labeller = label_both) +
  labs(title = "Pengaruh Ukuran Sampel, SD, dan Kondisi Populasi Terhadap Lebar IK 95%",
       x = "Ukuran Sampel (n)",
       y = "Lebar Interval Kepercayaan",
       fill = "Kondisi Standar Deviasi") +
  theme_minimal()

Interpretasi Hasil Simulasi

Berdasarkan hasil simulasi kombinasi faktor di atas, diperoleh kesimpulan singkat sebagai berikut:

  1. Pengaruh Ukuran Sampel (n): Semakin besar ukuran sampel (n naik dari 5 hingga 100), maka lebar interval kepercayaan akan menjadi semakin sempit. Hal ini menunjukkan bahwa sampel yang lebih besar menghasilkan estimasi yang lebih presisi.

  2. Pengaruh Variabilitas Data (SD): Semakin tinggi variabilitas data (SD naik dari 10 hingga 90), maka lebar interval kepercayaan akan menjadi semakin lebar. Hal ini terjadi karena keragaman data yang tinggi meningkatkan ketidakpastian estimasi.

  3. Pengaruh Pengetahuan Standar Deviasi: Kondisi standar deviasi “Tidak Diketahui” (Distribusi t) selalu menghasilkan interval yang lebih lebar dibandingkan kondisi “Diketahui” (Distribusi z). Perbedaan lebar ini terlihat sangat signifikan pada sampel kecil (n = 5) dan akan semakin menipis (konvergen) seiring bertambahnya ukuran sampel (n = 100).