Tugas ini bertujuan untuk melakukan simulasi guna mempelajari pengaruh tiga faktor terhadap lebar interval kepercayaan 95%, yaitu:
# Parameter tetap
mean_sampel <- 100
alpha <- 0.05
# Faktor-faktor simulasi
n_values <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
status_sd <- c("Diketahui", "Tidak Diketahui")
# Membuat seluruh kombinasi faktor
kombinasi <- expand.grid(
n = n_values,
sd = sd_values,
status = status_sd
)
# Fungsi untuk menghitung interval kepercayaan
hitung_interval <- function(n, sd, status, mean_sampel, alpha) {
if (status == "Diketahui") {
# Gunakan distribusi Z
nilai_kritis <- qnorm(1 - alpha/2)
} else {
# Gunakan distribusi t
nilai_kritis <- qt(1 - alpha/2, df = n - 1)
}
margin_error <- nilai_kritis * sd / sqrt(n)
batas_bawah <- mean_sampel - margin_error
batas_atas <- mean_sampel + margin_error
lebar <- batas_atas - batas_bawah
return(c(margin_error = margin_error,
batas_bawah = batas_bawah,
batas_atas = batas_atas,
lebar = lebar))
}
# Menjalankan simulasi untuk seluruh kombinasi
hasil <- t(mapply(hitung_interval,
n = kombinasi$n,
sd = kombinasi$sd,
status = kombinasi$status,
MoreArgs = list(mean_sampel = mean_sampel, alpha = alpha)))
# Menggabungkan hasil dengan kombinasi faktor
tabel_hasil <- cbind(kombinasi, round(hasil, 3))
# Mengurutkan berdasarkan lebar interval (dari tersempit ke terlebar)
tabel_hasil <- tabel_hasil[order(tabel_hasil$lebar), ]
rownames(tabel_hasil) <- NULL
tabel_hasil
## n sd status margin_error batas_bawah batas_atas lebar
## 1 100 10 Diketahui 1.960 98.040 101.960 3.920
## 2 100 10 Tidak Diketahui 1.984 98.016 101.984 3.968
## 3 30 10 Diketahui 3.578 96.422 103.578 7.157
## 4 30 10 Tidak Diketahui 3.734 96.266 103.734 7.468
## 5 5 10 Diketahui 8.765 91.235 108.765 17.530
## 6 100 50 Diketahui 9.800 90.200 109.800 19.600
## 7 100 50 Tidak Diketahui 9.921 90.079 109.921 19.842
## 8 5 10 Tidak Diketahui 12.417 87.583 112.417 24.833
## 9 100 90 Diketahui 17.640 82.360 117.640 35.279
## 10 100 90 Tidak Diketahui 17.858 82.142 117.858 35.716
## 11 30 50 Diketahui 17.892 82.108 117.892 35.784
## 12 30 50 Tidak Diketahui 18.670 81.330 118.670 37.341
## 13 30 90 Diketahui 32.205 67.795 132.205 64.411
## 14 30 90 Tidak Diketahui 33.607 66.393 133.607 67.213
## 15 5 50 Diketahui 43.826 56.174 143.826 87.652
## 16 5 50 Tidak Diketahui 62.083 37.917 162.083 124.166
## 17 5 90 Diketahui 78.887 21.113 178.887 157.774
## 18 5 90 Tidak Diketahui 111.750 -11.750 211.750 223.500
library(ggplot2)
ggplot(tabel_hasil, aes(x = factor(n), y = lebar, fill = status)) +
geom_bar(stat = "identity", position = "dodge") +
facet_wrap(~ sd, labeller = label_both) +
labs(
title = "Pengaruh Ukuran Sampel, Standar Deviasi, dan Status Pengetahuan SD\nterhadap Lebar Interval Kepercayaan 95%",
x = "Ukuran Sampel (n)",
y = "Lebar Interval Kepercayaan",
fill = "Status SD Populasi"
) +
theme_minimal()
Berdasarkan tabel dan visualisasi simulasi di atas, dapat diperoleh beberapa pernyataan berikut:
1. Pengaruh Ukuran Sampel (n)
Semakin besar ukuran sampel, semakin sempit lebar interval kepercayaan. Hal ini konsisten dengan rumus margin of error \(E = Z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}\), di mana \(n\) berada pada penyebut sehingga semakin besar \(n\), semakin kecil \(E\).
2. Pengaruh Variabilitas Data (SD)
Semakin besar standar deviasi, semakin lebar interval kepercayaan. Data yang lebih bervariasi membutuhkan rentang yang lebih luas untuk mencakup parameter populasi dengan tingkat kepercayaan yang sama.
3. Pengaruh Status Pengetahuan SD Populasi
Untuk kombinasi n dan SD yang sama, interval kepercayaan yang menggunakan distribusi t (SD tidak diketahui) selalu lebih lebar dibandingkan distribusi Z (SD diketahui). Hal ini karena distribusi t memiliki ekor lebih tebal untuk mengakomodasi ketidakpastian tambahan akibat estimasi SD dari sampel, terutama terlihat jelas pada ukuran sampel kecil (n=5).
4. Kombinasi Ekstrem
Simulasi ini menunjukkan bahwa presisi estimasi interval kepercayaan dipengaruhi oleh tiga faktor utama secara simultan: ukuran sampel, variabilitas data, dan pengetahuan terhadap standar deviasi populasi. Untuk memperoleh estimasi yang presisi (interval sempit), peneliti sebaiknya menggunakan ukuran sampel yang besar, terutama pada data dengan variabilitas tinggi atau ketika standar deviasi populasi tidak diketahui.
Referensi: Walpole, R.E., Myers, R.H., & Myers, S.L. (2012). Probability & Statistics for Engineers and Scientists (9th ed.). Pearson.