Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100
Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90
Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s)
mean <- 100
alpha <- 0.05
ukuran_sampel <- c(5, 30, 100)
sd_levels <- c(10, 50, 90)
hasil <- data.frame()
for (n in ukuran_sampel) {
for (sd in sd_levels) {
# Distribusi Z (sigma diketahui)
z_value <- qnorm(1 - alpha/2)
margin_z <- z_value * sd / sqrt(n)
lebar_z <- 2 * margin_z
# Distribusi t (sigma tidak diketahui)
t_value <- qt(1 - alpha/2, df = n - 1)
margin_t <- t_value * sd / sqrt(n)
lebar_t <- 2 * margin_t
hasil <- rbind(hasil, data.frame(
n = n,
SD = sd,
Sigma = "Diketahui",
Lebar_CI_95 = round(lebar_z, 4)
))
hasil <- rbind(hasil, data.frame(
n = n,
SD = sd,
Sigma = "Tidak Diketahui",
Lebar_CI_95 = round(lebar_t, 4)
))
}
}
hasil
## n SD Sigma Lebar_CI_95
## 1 5 10 Diketahui 17.5305
## 2 5 10 Tidak Diketahui 24.8333
## 3 5 50 Diketahui 87.6523
## 4 5 50 Tidak Diketahui 124.1664
## 5 5 90 Diketahui 157.7741
## 6 5 90 Tidak Diketahui 223.4995
## 7 30 10 Diketahui 7.1568
## 8 30 10 Tidak Diketahui 7.4681
## 9 30 50 Diketahui 35.7839
## 10 30 50 Tidak Diketahui 37.3406
## 11 30 90 Diketahui 64.4110
## 12 30 90 Tidak Diketahui 67.2131
## 13 100 10 Diketahui 3.9199
## 14 100 10 Tidak Diketahui 3.9684
## 15 100 50 Diketahui 19.5996
## 16 100 50 Tidak Diketahui 19.8422
## 17 100 90 Diketahui 35.2794
## 18 100 90 Tidak Diketahui 35.7159
library(ggplot2)
hasil$n <- factor(paste0("n=", hasil$n), levels = paste0("n=", ukuran_sampel))
hasil$SD <- factor(paste0("sd=", hasil$SD), levels = paste0("sd=", sd_levels))
ggplot(hasil, aes(x = n, y = SD, fill = Lebar_CI_95)) +
geom_tile(color = "white", linewidth = 1.5) +
geom_text(aes(label = round(Lebar_CI_95, 2)), fontface = "bold", size = 4.5) +
facet_wrap(~ Sigma) +
scale_fill_gradient(low = "antiquewhite", high = "antiquewhite4", name = "Lebar CI") +
labs(
title = "Heatmap Lebar Interval Kepercayaan 95%",
x = "Ukuran Sampel",
y = "Standar Deviasi"
) +
theme_minimal(base_size = 13) +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
Semakin besar ukuran sampel (n), semakin sempit lebar interval kepercayaan. Hal ini terlihat jelas pada SD = 10 dengan sigma diketahui:
n = 5 : lebar = 17.5305
n = 30 : lebar = 7.1568
n = 100 : lebar = 3.9199
Lebar interval menyempit secara drastis seiring bertambahnya n karena margin of error berbanding terbalik dengan akar kuadrat dari n (1/√n). Artinya, sampel yang lebih besar memberikan estimasi yang lebih presisi.
Semakin besar standar deviasi (SD), semakin lebar interval kepercayaan. Hal ini terlihat pada n = 30 dengan sigma diketahui:
SD = 10 : lebar = 7.1568
SD = 50 : lebar = 35.7839
SD = 90 : lebar = 64.4110
Lebar interval bertambah secara proporsional seiring meningkatnya SD. Ketika data lebih menyebar (variabilitas tinggi), estimasi rata-rata menjadi kurang presisi sehingga interval harus lebih lebar untuk tetap mencakup nilai parameter populasi dengan kepercayaan 95%.
Distribusi t (sigma tidak diketahui) selalu menghasilkan interval yang lebih lebar dibandingkan distribusi Z (sigma diketahui).
Perbedaan paling besar terjadi saat n kecil, contohnya n = 5, SD = 10:
Diketahui (Z) : lebar = 17.5305
Tidak Diketahui (t): lebar = 24.8333
Namun perbedaan semakin mengecil seiring bertambahnya n, seperti pada n = 100, SD = 10:
Diketahui (Z) : lebar = 3.9199
Tidak Diketahui (t): lebar = 3.9684
Hal ini terjadi karena pada n besar, nilai t mendekati nilai z sehingga kedua distribusi menghasilkan interval yang hampir sama. Ketidakpastian akibat tidak mengetahui sigma populasi menjadi tidak signifikan ketika sampel cukup besar.