Tujuan dari simulasi ini adalah untuk mengamati secara langsung bagaimana perubahan pada tiga faktor utama (Ukuran Sampel, Variabilitas Data, dan Pengetahuan tentang Standar Deviasi Populasi) memengaruhi lebar dari interval kepercayaan 95%.
Dengan kombinasi faktor-faktor berikut:
Faktor 1: Ukuran Sampel (n): 5, 30, 100
Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s): 10, 50, 90
Faktor 3: Pengetahuan Standar Deviasi Populasi:
Diketahui (σ): Menggunakan distribusi Z (nilai z = 1.96 untuk CI 95%).
Tidak Diketahui (s): Menggunakan distribusi t dengan derajat kebebasan (df) = n-1. Nilai t akan berbeda untuk setiap ukuran sampel.
Asumsi: Rata-rata sampel (mean)
ditetapkan secara konstan di angka 100 untuk semua skenario. Hal ini
dilakukan agar kita bisa fokus membandingkan lebar interval, bukan
pergeseran intervalnya.
# Membersihkan lingkungan kerja
rm(list = ls())
# Membuat fungsi untuk menghitung lebar interval kepercayaan
# Lebar interval = 2 * Margin of Error
calculate_width <- function(n, sd, alpha = 0.05, sd_known = FALSE) {
if (sd_known) {
# Jika standar deviasi populasi diketahui, gunakan nilai z
z_value <- qnorm(1 - alpha/2)
margin_of_error <- z_value * sd / sqrt(n)
} else {
# Jika standar deviasi populasi tidak diketahui, gunakan nilai t
t_value <- qt(1 - alpha/2, df = n-1)
margin_of_error <- t_value * sd / sqrt(n)
}
width <- 2 * margin_of_error
return(width)
}
# Mendefinisikan nilai-nilai faktor
sample_sizes <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
alpha <- 0.05
# Membuat dataframe untuk menyimpan hasil simulasi
results <- expand.grid(Ukuran_Sampel = sample_sizes,
Standar_Deviasi = sd_values,
Pengetahuan_SD = c("Diketahui (σ)", "Tidak Diketahui (s)"))
# Menghitung lebar interval untuk setiap kombinasi
results$Lebar_Interval <- mapply(calculate_width,
n = results$Ukuran_Sampel,
sd = results$Standar_Deviasi,
sd_known = results$Pengetahuan_SD == "Diketahui (σ)")
# Menampilkan hasil dalam format yang lebih rapi
library(knitr)
kable(results, caption = "Lebar Interval Kepercayaan 95% untuk Berbagai Kombinasi Faktor")
| Ukuran_Sampel | Standar_Deviasi | Pengetahuan_SD | Lebar_Interval |
|---|---|---|---|
| 5 | 10 | Diketahui (σ) | 17.530451 |
| 30 | 10 | Diketahui (σ) | 7.156777 |
| 100 | 10 | Diketahui (σ) | 3.919928 |
| 5 | 50 | Diketahui (σ) | 87.652254 |
| 30 | 50 | Diketahui (σ) | 35.783883 |
| 100 | 50 | Diketahui (σ) | 19.599640 |
| 5 | 90 | Diketahui (σ) | 157.774057 |
| 30 | 90 | Diketahui (σ) | 64.410989 |
| 100 | 90 | Diketahui (σ) | 35.279352 |
| 5 | 10 | Tidak Diketahui (s) | 24.833280 |
| 30 | 10 | Tidak Diketahui (s) | 7.468123 |
| 100 | 10 | Tidak Diketahui (s) | 3.968434 |
| 5 | 50 | Tidak Diketahui (s) | 124.166400 |
| 30 | 50 | Tidak Diketahui (s) | 37.340614 |
| 100 | 50 | Tidak Diketahui (s) | 19.842170 |
| 5 | 90 | Tidak Diketahui (s) | 223.499520 |
| 30 | 90 | Tidak Diketahui (s) | 67.213105 |
| 100 | 90 | Tidak Diketahui (s) | 35.715905 |
Dari tabel hasil simulasi di atas, kita dapat menginterpretasikan pengaruh masing-masing faktor sebagai berikut:
1. Pengaruh Ukuran Sampel (n):
Kesimpulan: Semakin besar ukuran sampel, semakin sempit (kecil) lebar interval kepercayaannya.
Bukti: Perhatikan baris dengan
Standar_Deviasi = 10 dan
Pengetahuan_SD = Diketahui (σ). Ketika n = 5,
lebar interval adalah 17.54. Ketika n
dinaikkan menjadi 30, lebar interval menyusut drastis
menjadi 7.16. Dan ketika n = 100, lebarnya
semakin menyempit menjadi 3.92. Pola yang sama terlihat
jelas di semua kombinasi lainnya.
Penjelasan: Ukuran sampel yang lebih besar memberikan lebih banyak informasi tentang populasi, sehingga estimasi kita menjadi lebih presisi (akurat) dan ketidakpastian berkurang. Hal ini tercermin dari interval kepercayaan yang lebih sempit.
2. Pengaruh Variabilitas Data (Standar Deviasi):
Kesimpulan: Semakin tinggi variabilitas data (nilai standar deviasi semakin besar), semakin lebar interval kepercayaannya.
Bukti: Perhatikan baris dengan
Ukuran_Sampel = 30 dan
Pengetahuan_SD = Tidak Diketahui (s). Ketika
Standar_Deviasi = 10, lebar interval adalah
7.47. Ketika Standar_Deviasi naik menjadi
50, lebar interval melebar menjadi
37.34. Dan ketika Standar_Deviasi = 90,
lebarnya semakin lebar menjadi 67.21. Pola konsisten
ini juga terjadi di semua skenario.
Penjelasan: Data yang sangat bervariasi (tersebar) membuat kita lebih sulit untuk menentukan nilai pusat populasi yang sebenarnya. Akibatnya, rentang nilai yang mungkin (interval kepercayaan) harus lebih lebar untuk mengakomodasi ketidakpastian yang lebih besar ini.
3. Pengaruh Pengetahuan tentang Standar Deviasi Populasi:
Kesimpulan: Ketika standar deviasi populasi tidak diketahui (dan kita menggunakan standar deviasi sampel serta distribusi t), interval kepercayaan yang dihasilkan sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui (menggunakan distribusi z). Perbedaan ini sangat terasa pada ukuran sampel yang kecil.
Bukti:
SD = 10,
lebar interval saat SD diketahui adalah 17.54,
sedangkan saat SD tidak diketahui melebar menjadi
24.82. Perbedaan sekitar 7.3 poin, atau interval
menjadi sekitar 41% lebih lebar. Perbedaan ini sangat signifikan.SD = 10,
lebar interval saat SD diketahui adalah 3.92, sedangkan
saat SD tidak diketahui hanya sedikit lebih lebar menjadi
3.97. Perbedaannya hanya sekitar 0.05 poin, atau
interval hanya melebar sekitar 1.3%. Perbedaan ini hampir tidak
terlihat.Penjelasan: Ketika standar deviasi populasi
tidak diketahui, kita harus mengestimasinya dari sampel
(s). Hal ini menambah satu sumber ketidakpastian lagi.
Distribusi t-Student secara khusus dirancang untuk mengakomodasi
ketidakpastian tambahan ini dengan memberikan interval yang lebih lebar.
Semakin kecil ukuran sampel, semakin besar ketidakpastian dalam estimasi
standar deviasi, sehingga interval t jauh lebih lebar daripada interval
z. Seiring bertambahnya ukuran sampel, nilai s menjadi
estimasi yang sangat baik untuk σ, dan distribusi t
mendekati distribusi z, sehingga perbedaan lebar interval menjadi sangat
kecil.
Kesimpulan Akhir: Simulasi ini secara empiris membuktikan teori yang dipelajari. Lebar interval kepercayaan 95% sangat dipengaruhi oleh tiga faktor:
Berbanding terbalik dengan akar kuadrat ukuran sampel (√n).
Berbanding lurus dengan standar deviasi (variabilitas data).
Lebih lebar ketika standar deviasi populasi tidak diketahui, terutama pada sampel kecil, karena adanya ketidakpastian tambahan dalam estimasi.