Simulasi ini dilakukan untuk mempelajari pengaruh tiga faktor terhadap lebar interval kepercayaan 95%, yaitu:
| Faktor | Level |
|---|---|
Ukuran sampel (n) |
5, 30, 100 |
| Standar deviasi | 10, 50, 90 |
| Status SD populasi | Diketahui dan tidak diketahui |
Jumlah kombinasi perlakuan: \[ 3 \times 3 \times 2 = 18 \] ## 2. Dasar Perhitungan Setiap kombinasi disimulasikan sebanyak 1.000 kali dengan rata-rata populasi sebesar 120. \[ L_z = 2z_{0.975}\frac{\sigma}{\sqrt{n}} \]
Apabila standar deviasi populasi diketahui, lebar interval kepercayaan dihitung menggunakan distribusi normal:
\[ L_t = 2t_{0.975,\,n-1}\frac{s}{\sqrt{n}} \] ## 3. Kode Simulasi R
library(dplyr)
library(ggplot2)
library(knitr)
set.seed(123)
mu <- 120
n_values <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
replikasi <- 1000
jumlah_kombinasi <- length(n_values) *
length(sd_values) * 2
jumlah_kombinasi
## [1] 18
hasil <- data.frame()
for (n in n_values) {
for (sd_pop in sd_values) {
for (i in 1:replikasi) {
sampel <- rnorm(
n = n,
mean = mu,
sd = sd_pop
)
s <- sd(sampel)
# SD populasi diketahui
z_value <- qnorm(0.975)
lebar_z <- 2 * z_value * sd_pop / sqrt(n)
# SD populasi tidak diketahui
t_value <- qt(0.975, df = n - 1)
lebar_t <- 2 * t_value * s / sqrt(n)
hasil <- rbind(
hasil,
data.frame(
n = n,
SD = sd_pop,
Status = "Diketahui",
Lebar = lebar_z
),
data.frame(
n = n,
SD = sd_pop,
Status = "Tidak Diketahui",
Lebar = lebar_t
)
)
}
}
}
head(hasil)
## n SD Status Lebar
## 1 5 10 Diketahui 17.53045
## 2 5 10 Tidak Diketahui 20.14033
## 3 5 10 Diketahui 17.53045
## 4 5 10 Tidak Diketahui 28.89326
## 5 5 10 Diketahui 17.53045
## 6 5 10 Tidak Diketahui 15.87997
ringkasan <- hasil %>%
group_by(n, SD, Status) %>%
summarise(
Rata_Rata_Lebar = mean(Lebar),
SD_Lebar = sd(Lebar),
.groups = "drop"
)
kable(
ringkasan,
digits = 3,
caption = "Ringkasan Lebar Interval Kepercayaan 95%"
)
| n | SD | Status | Rata_Rata_Lebar | SD_Lebar |
|---|---|---|---|---|
| 5 | 10 | Diketahui | 17.530 | 0.000 |
| 5 | 10 | Tidak Diketahui | 23.292 | 8.606 |
| 5 | 50 | Diketahui | 87.652 | 0.000 |
| 5 | 50 | Tidak Diketahui | 117.702 | 41.426 |
| 5 | 90 | Diketahui | 157.774 | 0.000 |
| 5 | 90 | Tidak Diketahui | 210.722 | 74.940 |
| 30 | 10 | Diketahui | 7.157 | 0.000 |
| 30 | 10 | Tidak Diketahui | 7.416 | 0.960 |
| 30 | 50 | Diketahui | 35.784 | 0.000 |
| 30 | 50 | Tidak Diketahui | 37.111 | 5.011 |
| 30 | 90 | Diketahui | 64.411 | 0.000 |
| 30 | 90 | Tidak Diketahui | 66.572 | 9.049 |
| 100 | 10 | Diketahui | 3.920 | 0.000 |
| 100 | 10 | Tidak Diketahui | 3.970 | 0.284 |
| 100 | 50 | Diketahui | 19.600 | 0.000 |
| 100 | 50 | Tidak Diketahui | 19.801 | 1.409 |
| 100 | 90 | Diketahui | 35.279 | 0.000 |
| 100 | 90 | Tidak Diketahui | 35.699 | 2.619 |
grafik <- ggplot(
ringkasan,
aes(
x = factor(n),
y = Rata_Rata_Lebar,
fill = Status
)
) +
geom_col(
position = "dodge",
width = 0.7
) +
facet_wrap(
~SD,
labeller = label_bquote("SD = " * .(SD))
) +
labs(
title = "Lebar Interval Kepercayaan 95%",
subtitle = paste(
"Berdasarkan ukuran sampel, standar deviasi,",
"dan status SD populasi"
),
x = "Ukuran Sampel (n)",
y = "Rata-Rata Lebar Interval",
fill = "Status SD Populasi"
) +
theme_minimal() +
theme(
plot.title = element_text(face = "bold"),
legend.position = "bottom"
)
print(grafik)
Semakin besar ukuran sampel, semakin sempit interval kepercayaan yang dihasilkan. Sebagai contoh, ketika standar deviasi sebesar 10 dan diketahui, rata-rata lebarnya menurun dari 17,530 pada n = 5 menjadi 7,157 pada n = 30 dan 3,920 pada n = 100.
Hal tersebut terjadi karena lebar interval berbanding terbalik dengan akar kuadrat ukuran sampel. Oleh karena itu, peningkatan jumlah sampel dapat meningkatkan ketepatan estimasi rata-rata populasi.
Semakin besar standar deviasi, semakin lebar interval kepercayaan. Pada n = 30 dengan SD populasi diketahui, lebar interval meningkat dari 7,157 untuk SD = 10 menjadi 35,784 untuk SD = 50 dan 64,411 untuk SD = 90.
Standar deviasi yang tinggi menunjukkan bahwa data lebih menyebar. Kondisi tersebut meningkatkan ketidakpastian estimasi sehingga diperlukan interval yang lebih lebar.
Interval kepercayaan ketika SD populasi tidak diketahui cenderung lebih lebar dibandingkan ketika SD populasi diketahui. Perbedaan terbesar terlihat pada ukuran sampel kecil. Pada n = 5 dan SD = 90, rata-rata lebarnya adalah 157,774 ketika SD diketahui dan 210,722 ketika SD tidak diketahui.
Hal ini disebabkan oleh penggunaan distribusi t, yang memiliki nilai kritis lebih besar daripada distribusi normal, serta penggunaan standar deviasi sampel yang nilainya berubah pada setiap replikasi.
Pada ukuran sampel besar, perbedaan kedua metode menjadi semakin kecil. Sebagai contoh, pada n = 100 dan SD = 10, lebarnya adalah 3,920 ketika SD diketahui dan 3,970 ketika tidak diketahui. Distribusi t semakin mendekati distribusi normal ketika derajat bebas bertambah.
Nilai SD Lebar pada kondisi SD populasi diketahui adalah nol karena lebar interval hanya ditentukan oleh n dan nilai SD populasi yang telah ditetapkan. Dengan demikian, nilainya tetap sama pada seluruh replikasi.
Ketika SD populasi tidak diketahui, lebar interval berubah karena menggunakan standar deviasi sampel. Variasi tersebut paling tinggi pada sampel kecil dan data dengan standar deviasi besar.
Simulasi menunjukkan bahwa ukuran sampel yang lebih besar menghasilkan interval kepercayaan 95% yang lebih sempit. Sebaliknya, peningkatan variabilitas data menghasilkan interval yang semakin lebar. Ketika standar deviasi populasi tidak diketahui, interval kepercayaan cenderung lebih lebar dan lebih bervariasi, terutama pada sampel berukuran kecil. Pengaruh ketidaktahuan terhadap SD populasi semakin berkurang ketika ukuran sampel bertambah karena distribusi t mendekati distribusi normal.