Tugas: Simulasi Pengaruh Ukuran Sampel, Variabilitas Data, dan Pengetahuan Standar Deviasi terhadap Lebar Interval Kepercayaan 95%

Tujuan dari simulasi ini adalah untuk mengamati secara langsung bagaimana perubahan pada tiga faktor utama (Ukuran Sampel, Variabilitas Data, dan Pengetahuan tentang Standar Deviasi Populasi) memengaruhi lebar dari interval kepercayaan 95%.

Dengan kombinasi faktor-faktor berikut:

Asumsi: Rata-rata sampel (mean) ditetapkan secara konstan di angka 100 untuk semua skenario. Hal ini dilakukan agar kita bisa fokus membandingkan lebar interval, bukan pergeseran intervalnya.

Kode R untuk Simulasi

# Membersihkan lingkungan kerja
rm(list = ls())

# Membuat fungsi untuk menghitung lebar interval kepercayaan
# Lebar interval = 2 * Margin of Error
calculate_width <- function(n, sd, alpha = 0.05, sd_known = FALSE) {
  if (sd_known) {
    # Jika standar deviasi populasi diketahui, gunakan nilai z
    z_value <- qnorm(1 - alpha/2)
    margin_of_error <- z_value * sd / sqrt(n)
  } else {
    # Jika standar deviasi populasi tidak diketahui, gunakan nilai t
    t_value <- qt(1 - alpha/2, df = n-1)
    margin_of_error <- t_value * sd / sqrt(n)
  }
  width <- 2 * margin_of_error
  return(width)
}

# Mendefinisikan nilai-nilai faktor
sample_sizes <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
alpha <- 0.05

# Membuat dataframe untuk menyimpan hasil simulasi
results <- expand.grid(Ukuran_Sampel = sample_sizes, 
                       Standar_Deviasi = sd_values, 
                       Pengetahuan_SD = c("Diketahui (σ)", "Tidak Diketahui (s)"))

# Menghitung lebar interval untuk setiap kombinasi
results$Lebar_Interval <- mapply(calculate_width, 
                                   n = results$Ukuran_Sampel, 
                                   sd = results$Standar_Deviasi, 
                                   sd_known = results$Pengetahuan_SD == "Diketahui (σ)")

# Menampilkan hasil dalam format yang lebih rapi
library(knitr)
kable(results, caption = "Lebar Interval Kepercayaan 95% untuk Berbagai Kombinasi Faktor")
Lebar Interval Kepercayaan 95% untuk Berbagai Kombinasi Faktor
Ukuran_Sampel Standar_Deviasi Pengetahuan_SD Lebar_Interval
5 10 Diketahui (σ) 17.530451
30 10 Diketahui (σ) 7.156777
100 10 Diketahui (σ) 3.919928
5 50 Diketahui (σ) 87.652254
30 50 Diketahui (σ) 35.783883
100 50 Diketahui (σ) 19.599640
5 90 Diketahui (σ) 157.774057
30 90 Diketahui (σ) 64.410989
100 90 Diketahui (σ) 35.279352
5 10 Tidak Diketahui (s) 24.833280
30 10 Tidak Diketahui (s) 7.468123
100 10 Tidak Diketahui (s) 3.968434
5 50 Tidak Diketahui (s) 124.166400
30 50 Tidak Diketahui (s) 37.340614
100 50 Tidak Diketahui (s) 19.842170
5 90 Tidak Diketahui (s) 223.499520
30 90 Tidak Diketahui (s) 67.213105
100 90 Tidak Diketahui (s) 35.715905

Interpretasi Hasil Simulasi

Dari tabel hasil simulasi di atas, kita dapat menginterpretasikan pengaruh masing-masing faktor sebagai berikut:

1. Pengaruh Ukuran Sampel (n):

  • Kesimpulan: Semakin besar ukuran sampel, semakin sempit (kecil) lebar interval kepercayaannya.

  • Bukti: Perhatikan baris dengan Standar_Deviasi = 10 dan Pengetahuan_SD = Diketahui (σ). Ketika n = 5, lebar interval adalah 17.54. Ketika n dinaikkan menjadi 30, lebar interval menyusut drastis menjadi 7.16. Dan ketika n = 100, lebarnya semakin menyempit menjadi 3.92. Pola yang sama terlihat jelas di semua kombinasi lainnya.

  • Penjelasan: Ukuran sampel yang lebih besar memberikan lebih banyak informasi tentang populasi, sehingga estimasi kita menjadi lebih presisi (akurat) dan ketidakpastian berkurang. Hal ini tercermin dari interval kepercayaan yang lebih sempit.

2. Pengaruh Variabilitas Data (Standar Deviasi):

  • Kesimpulan: Semakin tinggi variabilitas data (nilai standar deviasi semakin besar), semakin lebar interval kepercayaannya.

  • Bukti: Perhatikan baris dengan Ukuran_Sampel = 30 dan Pengetahuan_SD = Tidak Diketahui (s). Ketika Standar_Deviasi = 10, lebar interval adalah 7.47. Ketika Standar_Deviasi naik menjadi 50, lebar interval melebar menjadi 37.34. Dan ketika Standar_Deviasi = 90, lebarnya semakin lebar menjadi 67.21. Pola konsisten ini juga terjadi di semua skenario.

  • Penjelasan: Data yang sangat bervariasi (tersebar) membuat kita lebih sulit untuk menentukan nilai pusat populasi yang sebenarnya. Akibatnya, rentang nilai yang mungkin (interval kepercayaan) harus lebih lebar untuk mengakomodasi ketidakpastian yang lebih besar ini.

3. Pengaruh Pengetahuan tentang Standar Deviasi Populasi:

  • Kesimpulan: Ketika standar deviasi populasi tidak diketahui (dan kita menggunakan standar deviasi sampel serta distribusi t), interval kepercayaan yang dihasilkan sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui (menggunakan distribusi z). Perbedaan ini sangat terasa pada ukuran sampel yang kecil.

  • Bukti:

    • Sampel Kecil (n=5): Untuk SD = 10, lebar interval saat SD diketahui adalah 17.54, sedangkan saat SD tidak diketahui melebar menjadi 24.82. Perbedaan sekitar 7.3 poin, atau interval menjadi sekitar 41% lebih lebar. Perbedaan ini sangat signifikan.
    • Sampel Besar (n=100): Untuk SD = 10, lebar interval saat SD diketahui adalah 3.92, sedangkan saat SD tidak diketahui hanya sedikit lebih lebar menjadi 3.97. Perbedaannya hanya sekitar 0.05 poin, atau interval hanya melebar sekitar 1.3%. Perbedaan ini hampir tidak terlihat.
  • Penjelasan: Ketika standar deviasi populasi tidak diketahui, kita harus mengestimasinya dari sampel (s). Hal ini menambah satu sumber ketidakpastian lagi. Distribusi t-Student secara khusus dirancang untuk mengakomodasi ketidakpastian tambahan ini dengan memberikan interval yang lebih lebar. Semakin kecil ukuran sampel, semakin besar ketidakpastian dalam estimasi standar deviasi, sehingga interval t jauh lebih lebar daripada interval z. Seiring bertambahnya ukuran sampel, nilai s menjadi estimasi yang sangat baik untuk σ, dan distribusi t mendekati distribusi z, sehingga perbedaan lebar interval menjadi sangat kecil.

Kesimpulan Akhir: Simulasi ini secara empiris membuktikan teori yang dipelajari. Lebar interval kepercayaan 95% sangat dipengaruhi oleh tiga faktor:

  1. Berbanding terbalik dengan akar kuadrat ukuran sampel (√n).

  2. Berbanding lurus dengan standar deviasi (variabilitas data).

  3. Lebih lebar ketika standar deviasi populasi tidak diketahui, terutama pada sampel kecil, karena adanya ketidakpastian tambahan dalam estimasi.