Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ),
Tidak Diketahui (s)
Interpretasikan hasilnya..
# Parameter
n_levels <- c(5, 30, 100)
sd_levels <- c(10, 50, 90)
alpha <- 0.05
# Membuat tabel guna menyimpan hasil
results <- expand.grid(n = n_levels, sd = sd_levels, status = c("Diketahui", "Tidak Diketahui"))
results$width <- NA
# Simulasi
for(i in 1:nrow(results)) {
n <- results$n[i]
sigma <- results$sd[i]
if(results$status[i] == "Diketahui") {
z_val <- qnorm(1 - alpha/2)
margin_of_error <- z_val * sigma / sqrt(n)
} else {
t_val <- qt(1 - alpha/2, df = n - 1)
margin_of_error <- t_val * sigma / sqrt(n) }
results$width[i] <- 2 * margin_of_error}
print(results)
## n sd status width
## 1 5 10 Diketahui 17.530451
## 2 30 10 Diketahui 7.156777
## 3 100 10 Diketahui 3.919928
## 4 5 50 Diketahui 87.652254
## 5 30 50 Diketahui 35.783883
## 6 100 50 Diketahui 19.599640
## 7 5 90 Diketahui 157.774057
## 8 30 90 Diketahui 64.410989
## 9 100 90 Diketahui 35.279352
## 10 5 10 Tidak Diketahui 24.833280
## 11 30 10 Tidak Diketahui 7.468123
## 12 100 10 Tidak Diketahui 3.968434
## 13 5 50 Tidak Diketahui 124.166400
## 14 30 50 Tidak Diketahui 37.340614
## 15 100 50 Tidak Diketahui 19.842170
## 16 5 90 Tidak Diketahui 223.499520
## 17 30 90 Tidak Diketahui 67.213105
## 18 100 90 Tidak Diketahui 35.715905
# Visualisasi
library(ggplot2)
results$n_num <- as.numeric(as.character(results$n))
ggplot(results, aes(x = n_num, y = width, group = status, color = status)) +
geom_line(linewidth = 1) +
geom_point(size = 3) +
# scales = "free_y" agar setiap panel SD punya skala yang sesuai
facet_wrap(~sd, labeller = label_both, scales = "free_y") +
labs(title = "Pengaruh Ukuran Sampel dan Variabilitas terhadap Lebar Selang",
subtitle = "Perbandingan Distribusi Z (Diketahui σ) dan Distribusi t (Tidak Diketahui σ)",
x = "Ukuran Sampel (n)",
y = "Lebar Selang Kepercayaan (95%)",
color = "Status Pengetahuan σ") +
theme_minimal() +
theme(legend.position = "bottom")
Pengetahuan Standar Deviasi Populasi: Menggunakan distribusi \(t\) (ketika standar deviasi populasi tidak
diketahui) menghasilkan interval yang lebih lebar dibandingkan
menggunakan distribusi \(Z\) (ketika
standar deviasi populasi diketahui). Hal ini disebabkan adanya tambahan
ketidakpastian saat kita harus mengestimasi variabilitas populasi dari
sampel itu sendiri.