Pendahuluan

Interval kepercayaan digunakan untuk mengestimasi parameter populasi berdasarkan data sampel. Lebar interval kepercayaan dipengaruhi oleh beberapa faktor, antara lain:

  1. Ukuran sampel (n)
  2. Variabilitas data (standar deviasi)
  3. Pengetahuan tentang standar deviasi populasi

Pada simulasi ini akan dipelajari bagaimana pengaruh ketiga faktor tersebut terhadap lebar interval kepercayaan 95%.

Faktor yang digunakan dalam simulasi:

Simulasi dilakukan sebanyak 1000 kali untuk setiap kombinasi faktor.


#Simulasi

set.seed(123)

n_values <- c(5,30,100)
sd_values <- c(10,50,90)
sim <- 1000

result <- data.frame()

#Proses Simulasi

for(n in n_values){

  for(sd in sd_values){

    width_known <- c()
    width_unknown <- c()

    for(i in 1:sim){

      x <- rnorm(n, mean = 100, sd = sd)

      xbar <- mean(x)
      s <- sd(x)

      # sigma diketahui
      z <- qnorm(0.975)
      lower_z <- xbar - z*(sd/sqrt(n))
      upper_z <- xbar + z*(sd/sqrt(n))

      width_known[i] <- upper_z - lower_z

      # sigma tidak diketahui
      t <- qt(0.975, df = n-1)
      lower_t <- xbar - t*(s/sqrt(n))
      upper_t <- xbar + t*(s/sqrt(n))

      width_unknown[i] <- upper_t - lower_t
    }

    result <- rbind(result,
                    data.frame(
                      n = n,
                      SD = sd,
                      Sigma = "Diketahui",
                      Mean_Width = mean(width_known)
                    ))

    result <- rbind(result,
                    data.frame(
                      n = n,
                      SD = sd,
                      Sigma = "Tidak Diketahui",
                      Mean_Width = mean(width_unknown)
                    ))
  }
}

result
##      n SD           Sigma Mean_Width
## 1    5 10       Diketahui  17.530451
## 2    5 10 Tidak Diketahui  23.291899
## 3    5 50       Diketahui  87.652254
## 4    5 50 Tidak Diketahui 117.702168
## 5    5 90       Diketahui 157.774057
## 6    5 90 Tidak Diketahui 210.722415
## 7   30 10       Diketahui   7.156777
## 8   30 10 Tidak Diketahui   7.416046
## 9   30 50       Diketahui  35.783883
## 10  30 50 Tidak Diketahui  37.111382
## 11  30 90       Diketahui  64.410989
## 12  30 90 Tidak Diketahui  66.572102
## 13 100 10       Diketahui   3.919928
## 14 100 10 Tidak Diketahui   3.969923
## 15 100 50       Diketahui  19.599640
## 16 100 50 Tidak Diketahui  19.801044
## 17 100 90       Diketahui  35.279352
## 18 100 90 Tidak Diketahui  35.698780

#Visualisasi

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
ggplot(result, aes(x=factor(n), y=Mean_Width, fill=Sigma)) +
  geom_bar(stat="identity", position="dodge") +
  facet_wrap(~SD) +
  labs(
    title="Pengaruh Ukuran Sampel dan Variabilitas terhadap Lebar Interval Kepercayaan",
    x="Ukuran Sampel (n)",
    y="Rata-rata Lebar Interval"
  ) +
  theme_minimal()

Interpretasi Hasil

Berdasarkan hasil simulasi, dapat diperoleh beberapa kesimpulan sebagai berikut:

  1. Pengaruh Ukuran Sampel

Semakin besar ukuran sampel (n), maka lebar interval kepercayaan semakin kecil. Hal ini menunjukkan bahwa semakin banyak data yang digunakan, maka estimasi terhadap parameter populasi menjadi semakin presisi.

Sebagai contoh, pada ukuran sampel n = 5 interval kepercayaan relatif lebih lebar dibandingkan dengan n = 30 dan n = 100.

  1. Pengaruh Variabilitas Data

Semakin besar nilai standar deviasi, maka interval kepercayaan menjadi semakin lebar. Hal ini terjadi karena data yang memiliki variabilitas tinggi cenderung lebih menyebar sehingga ketidakpastian estimasi parameter menjadi lebih besar.

Misalnya, standar deviasi 90 menghasilkan interval yang jauh lebih lebar dibandingkan standar deviasi 10.

  1. Pengaruh Pengetahuan Standar Deviasi Populasi

Ketika standar deviasi populasi diketahui, interval kepercayaan dihitung menggunakan distribusi normal (Z). Sebaliknya, ketika standar deviasi populasi tidak diketahui, digunakan distribusi t yang menghasilkan interval kepercayaan sedikit lebih lebar, terutama pada ukuran sampel kecil.

Perbedaan ini semakin kecil ketika ukuran sampel semakin besar karena distribusi t akan mendekati distribusi normal.

Kesimpulan

Dari simulasi yang dilakukan dapat disimpulkan bahwa:

Ukuran sampel yang lebih besar menghasilkan interval kepercayaan yang lebih sempit.

Variabilitas data yang lebih besar menyebabkan interval kepercayaan menjadi lebih lebar.

Ketika standar deviasi populasi tidak diketahui, interval kepercayaan cenderung sedikit lebih lebar dibandingkan ketika standar deviasi diketahui.

Simulasi ini menunjukkan pentingnya ukuran sampel dan variabilitas data dalam menentukan ketepatan estimasi parameter populasi.