Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan 95%, dengan informasi setiap faktor dan level sebagai berikut: - Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100 - Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90 - Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s)
Kasus 1: n = 5, sd = 10
σ diketahui
n <- 5
sd <- 10
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_1 <- 2 * z * sd / sqrt(n)
lebar_CI_1
## [1] 17.53045
σ tidak diketahui
n <- 5
sd <- 10
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_2 <- 2 * t_val * sd / sqrt(n)
lebar_CI_2
## [1] 24.83328
Kasus 2: n = 5, sd = 50 σ diketahui
n <- 5
sd <- 50
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_3 <- 2 * z * sd / sqrt(n)
lebar_CI_3
## [1] 87.65225
σ tidak diketahui
n <- 5
sd <- 50
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_4 <- 2 * t_val * sd / sqrt(n)
lebar_CI_4
## [1] 124.1664
Kasus 3: n = 5, sd = 90 σ diketahui
n <- 5
sd <- 90
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_5 <- 2 * z * sd / sqrt(n)
lebar_CI_5
## [1] 157.7741
σ tidak diketahui
n <- 5
sd <- 90
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_6 <- 2 * t_val * sd / sqrt(n)
lebar_CI_6
## [1] 223.4995
Kasus 4: n = 30, sd = 10 σ diketahui
n <- 30
sd <- 10
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_7 <- 2 * z * sd / sqrt(n)
lebar_CI_7
## [1] 7.156777
σ tidak diketahui
n <- 30
sd <- 10
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_8 <- 2 * t_val * sd / sqrt(n)
lebar_CI_8
## [1] 7.468123
Kasus 5: n = 30, sd = 50 σ diketahui
n <- 30
sd <- 50
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_9 <- 2 * z * sd / sqrt(n)
lebar_CI_9
## [1] 35.78388
σ tidak diketahui
n <- 30
sd <- 50
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_10 <- 2 * t_val * sd / sqrt(n)
lebar_CI_10
## [1] 37.34061
Kasus 6: n = 30, sd = 90 σ diketahui
n <- 30
sd <- 90
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_11 <- 2 * z * sd / sqrt(n)
lebar_CI_11
## [1] 64.41099
σ tidak diketahui
n <- 30
sd <- 90
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_12 <- 2 * t_val * sd / sqrt(n)
lebar_CI_12
## [1] 67.2131
Kasus 7: n = 100, sd = 10 σ diketahui
n <- 100
sd <- 10
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_13 <- 2 * z * sd / sqrt(n)
lebar_CI_13
## [1] 3.919928
σ tidak diketahui
n <- 100
sd <- 10
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_14 <- 2 * t_val * sd / sqrt(n)
lebar_CI_14
## [1] 3.968434
Kasus 8: n = 100, sd = 50 σ diketahui
n <- 100
sd <- 50
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_15 <- 2 * z * sd / sqrt(n)
lebar_CI_15
## [1] 19.59964
σ tidak diketahui
n <- 100
sd <- 50
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_16 <- 2 * t_val * sd / sqrt(n)
lebar_CI_16
## [1] 19.84217
Kasus 9: n = 100, sd = 90 σ diketahui
n <- 100
sd <- 90
alpha <- 0.05
z <- qnorm(1 - alpha/2)
lebar_CI_17 <- 2 * z * sd / sqrt(n)
lebar_CI_17
## [1] 35.27935
σ tidak diketahui
n <- 100
sd <- 90
alpha <- 0.05
t_val <- qt(1 - alpha/2, df = n-1)
lebar_CI_18 <- 2 * t_val * sd / sqrt(n)
lebar_CI_18
## [1] 35.71591
Cara simulasi Monte Carlo
set.seed(123)
# Faktor
n_values <- c(5, 30, 100)
sd_values <- c(10, 50, 90)
rep <- 1000 # jumlah simulasi
# Fungsi hitung lebar CI
hitung_ci <- function(n, sd, known_sd = TRUE) {
widths <- numeric(rep)
for (i in 1:rep) {
data <- rnorm(n, mean = 0, sd = sd)
xbar <- mean(data)
s <- sd(data)
if (known_sd) {
# Z interval
z <- qnorm(0.975)
margin <- z * sd / sqrt(n)
} else {
# t interval
t_val <- qt(0.975, df = n - 1)
margin <- t_val * s / sqrt(n)
}
widths[i] <- 2 * margin
}
return(mean(widths))
}
# Simpan hasil
hasil <- data.frame()
for (n in n_values) {
for (sd in sd_values) {
# σ diketahui
w_known <- hitung_ci(n, sd, TRUE)
# σ tidak diketahui
w_unknown <- hitung_ci(n, sd, FALSE)
hasil <- rbind(hasil, data.frame(
n = n,
sd = sd,
kondisi = "Diketahui",
lebar_CI = w_known
))
hasil <- rbind(hasil, data.frame(
n = n,
sd = sd,
kondisi = "Tidak Diketahui",
lebar_CI = w_unknown
))
}
}
print(hasil)
## n sd kondisi lebar_CI
## 1 5 10 Diketahui 17.530451
## 2 5 10 Tidak Diketahui 23.540434
## 3 5 50 Diketahui 87.652254
## 4 5 50 Tidak Diketahui 116.929885
## 5 5 90 Diketahui 157.774057
## 6 5 90 Tidak Diketahui 209.936799
## 7 30 10 Diketahui 7.156777
## 8 30 10 Tidak Diketahui 7.396325
## 9 30 50 Diketahui 35.783883
## 10 30 50 Tidak Diketahui 37.361298
## 11 30 90 Diketahui 64.410989
## 12 30 90 Tidak Diketahui 66.922576
## 13 100 10 Diketahui 3.919928
## 14 100 10 Tidak Diketahui 3.961393
## 15 100 50 Diketahui 19.599640
## 16 100 50 Tidak Diketahui 19.744606
## 17 100 90 Diketahui 35.279352
## 18 100 90 Tidak Diketahui 35.657132
INTERPRETASI: Berdasarkan hasil output diatas diperoleh beberapa hasil yang terlihat: 1.) Semakin besar ukuran sampel (n), maka lebar interval kepercayaannya akan semakin kecil. 2.) Semakin besar standar deviasi (σ), maka lebar interval kepercayaannya akan semakin besar. 3.) interval dengan σ tidak diketahui selalu memiliki lebar interval kepercayaan yang lebih besar dibandingkan jika σ diketahui. 4.) Perbedaan lebar interval antara distribusi Z dan t akan semakin mengecil saat ukuran sampel (n) semakin besar.
Berdasarkan interpretasi yang diperoleh, dapat disimpulkan bahwa lebar interval kepercayaan 95% sangat dipengaruhi oleh ukuran sampel, variailitas data, dan pengetahuan terhadap standar deviasi populasi dalam konteks confident interval.