Interval kepercayaan (confidence interval) merupakan metode dalam statistika inferensial yang digunakan untuk mengestimasi parameter populasi berdasarkan data sampel. Interval ini memberikan rentang nilai yang kemungkinan besar mengandung parameter populasi yang sebenarnya dengan tingkat kepercayaan tertentu (Walpole et al., 2012).
Lebar interval kepercayaan dipengaruhi oleh beberapa faktor utama, yaitu ukuran sampel, variabilitas data, dan tingkat kepercayaan yang digunakan (Montgomery & Runger, 2014).
Selain itu, metode perhitungan interval kepercayaan juga bergantung pada apakah standar deviasi populasi diketahui atau tidak. Jika standar deviasi populasi diketahui, maka digunakan distribusi normal (z). Sebaliknya, jika tidak diketahui, maka digunakan distribusi t-Student (Casella & Berger, 2002).
Praktikum ini bertujuan untuk melakukan simulasi menggunakan R untuk mempelajari pengaruh ukuran sampel, variabilitas data, serta pengetahuan tentang standar deviasi populasi terhadap lebar interval kepercayaan 95%.
Simulasi dilakukan dengan mempertimbangkan tiga faktor utama:
Menurut teori statistika inferensial, interval kepercayaan untuk mean populasi diberikan oleh rumus berikut (Walpole et al., 2012).:
Jika standar deviasi populasi diketahui:
\[ CI = \bar{x} \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \]
Jika standar deviasi populasi tidak diketahui:
\[ CI = \bar{x} \pm t_{\alpha/2,n-1}\frac{s}{\sqrt{n}} \]
Lebar interval kepercayaan kemudian dihitung sebagai selisih antara batas atas dan batas bawah interval tersebut.
# Menentukan faktor simulasi
n_values <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
alpha <- 0.05
z <- qnorm(1 - alpha/2)
result <- data.frame()
for (n in n_values) {
for (sd in sd_values) {
width_z <- 2 * z * sd / sqrt(n)
t_val <- qt(1 - alpha/2, df = n-1)
width_t <- 2 * t_val * sd / sqrt(n)
result <- rbind(result,
data.frame(
Sample_Size = n,
SD = sd,
CI_Sigma_Known = width_z,
CI_Sigma_Unknown = width_t
))
}
}
result
## Sample_Size SD CI_Sigma_Known CI_Sigma_Unknown
## 1 5 10 17.530451 24.833280
## 2 5 50 87.652254 124.166400
## 3 5 90 157.774057 223.499520
## 4 30 10 7.156777 7.468123
## 5 30 50 35.783883 37.340614
## 6 30 90 64.410989 67.213105
## 7 100 10 3.919928 3.968434
## 8 100 50 19.599640 19.842170
## 9 100 90 35.279352 35.715905
library(ggplot2)
library(reshape2)
## Warning: package 'reshape2' was built under R version 4.5.2
data_long <- melt(result,
id.vars=c("Sample_Size","SD"),
variable.name="Condition",
value.name="CI_Width")
ggplot(data_long,
aes(x=factor(Sample_Size),
y=CI_Width,
fill=Condition)) +
geom_bar(stat="identity", position="dodge") +
facet_wrap(~SD) +
labs(title="Pengaruh Ukuran Sampel dan Variabilitas terhadap Lebar CI 95%",
x="Ukuran Sampel",
y="Lebar Interval Kepercayaan") +
theme_minimal()
Hasil simulasi menunjukkan beberapa pola yang konsisten dengan teori statistika inferensial.
Pertama, semakin besar ukuran sampel, maka lebar interval kepercayaan semakin kecil. Hal ini disebabkan oleh menurunnya standar error ketika ukuran sampel meningkat (Montgomery & Runger, 2014).
Kedua, semakin besar variabilitas data (standar deviasi), maka interval kepercayaan menjadi lebih lebar karena ketidakpastian estimasi meningkat.
Ketiga, ketika standar deviasi populasi tidak diketahui, interval kepercayaan yang dihasilkan sedikit lebih lebar karena menggunakan distribusi t yang memiliki ekor distribusi lebih tebal dibanding distribusi normal, terutama pada ukuran sampel kecil (Casella & Berger, 2002).
Berdasarkan simulasi yang dilakukan, dapat disimpulkan bahwa: