Interval kepercayaan digunakan untuk mengestimasi parameter populasi berdasarkan data sampel. Lebar interval kepercayaan dipengaruhi oleh beberapa faktor, antara lain:
Pada simulasi ini akan dipelajari bagaimana pengaruh ketiga faktor tersebut terhadap lebar interval kepercayaan 95%.
Faktor yang digunakan dalam simulasi:
Simulasi dilakukan sebanyak 1000 kali untuk setiap kombinasi faktor.
#Simulasi
set.seed(123)
n_values <- c(5,30,100)
sd_values <- c(10,50,90)
sim <- 1000
result <- data.frame()
#Proses Simulasi
for(n in n_values){
for(sd in sd_values){
width_known <- c()
width_unknown <- c()
for(i in 1:sim){
x <- rnorm(n, mean = 100, sd = sd)
xbar <- mean(x)
s <- sd(x)
# sigma diketahui
z <- qnorm(0.975)
lower_z <- xbar - z*(sd/sqrt(n))
upper_z <- xbar + z*(sd/sqrt(n))
width_known[i] <- upper_z - lower_z
# sigma tidak diketahui
t <- qt(0.975, df = n-1)
lower_t <- xbar - t*(s/sqrt(n))
upper_t <- xbar + t*(s/sqrt(n))
width_unknown[i] <- upper_t - lower_t
}
result <- rbind(result,
data.frame(
n = n,
SD = sd,
Sigma = "Diketahui",
Mean_Width = mean(width_known)
))
result <- rbind(result,
data.frame(
n = n,
SD = sd,
Sigma = "Tidak Diketahui",
Mean_Width = mean(width_unknown)
))
}
}
result
## n SD Sigma Mean_Width
## 1 5 10 Diketahui 17.530451
## 2 5 10 Tidak Diketahui 23.291899
## 3 5 50 Diketahui 87.652254
## 4 5 50 Tidak Diketahui 117.702168
## 5 5 90 Diketahui 157.774057
## 6 5 90 Tidak Diketahui 210.722415
## 7 30 10 Diketahui 7.156777
## 8 30 10 Tidak Diketahui 7.416046
## 9 30 50 Diketahui 35.783883
## 10 30 50 Tidak Diketahui 37.111382
## 11 30 90 Diketahui 64.410989
## 12 30 90 Tidak Diketahui 66.572102
## 13 100 10 Diketahui 3.919928
## 14 100 10 Tidak Diketahui 3.969923
## 15 100 50 Diketahui 19.599640
## 16 100 50 Tidak Diketahui 19.801044
## 17 100 90 Diketahui 35.279352
## 18 100 90 Tidak Diketahui 35.698780
#Visualisasi
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
ggplot(result, aes(x=factor(n), y=Mean_Width, fill=Sigma)) +
geom_bar(stat="identity", position="dodge") +
facet_wrap(~SD) +
labs(
title="Pengaruh Ukuran Sampel dan Variabilitas terhadap Lebar Interval Kepercayaan",
x="Ukuran Sampel (n)",
y="Rata-rata Lebar Interval"
) +
theme_minimal()
Interpretasi Hasil
Berdasarkan hasil simulasi, dapat diperoleh beberapa kesimpulan sebagai berikut:
Semakin besar ukuran sampel (n), maka lebar interval kepercayaan semakin kecil. Hal ini menunjukkan bahwa semakin banyak data yang digunakan, maka estimasi terhadap parameter populasi menjadi semakin presisi.
Sebagai contoh, pada ukuran sampel n = 5 interval kepercayaan relatif lebih lebar dibandingkan dengan n = 30 dan n = 100.
Semakin besar nilai standar deviasi, maka interval kepercayaan menjadi semakin lebar. Hal ini terjadi karena data yang memiliki variabilitas tinggi cenderung lebih menyebar sehingga ketidakpastian estimasi parameter menjadi lebih besar.
Misalnya, standar deviasi 90 menghasilkan interval yang jauh lebih lebar dibandingkan standar deviasi 10.
Ketika standar deviasi populasi diketahui, interval kepercayaan dihitung menggunakan distribusi normal (Z). Sebaliknya, ketika standar deviasi populasi tidak diketahui, digunakan distribusi t yang menghasilkan interval kepercayaan sedikit lebih lebar, terutama pada ukuran sampel kecil.
Perbedaan ini semakin kecil ketika ukuran sampel semakin besar karena distribusi t akan mendekati distribusi normal.
Kesimpulan
Dari simulasi yang dilakukan dapat disimpulkan bahwa:
Ukuran sampel yang lebih besar menghasilkan interval kepercayaan yang lebih sempit.
Variabilitas data yang lebih besar menyebabkan interval kepercayaan menjadi lebih lebar.
Ketika standar deviasi populasi tidak diketahui, interval kepercayaan cenderung sedikit lebih lebar dibandingkan ketika standar deviasi diketahui.
Simulasi ini menunjukkan pentingnya ukuran sampel dan variabilitas data dalam menentukan ketepatan estimasi parameter populasi.