# Mengatur seed untuk hasil yang konsisten
set.seed(123)
# Definisi faktor dan level
ukuran_sampel <- c(5, 30, 100)
standar_deviasi <- c(10, 50, 90)
sigma_known <- c(TRUE, FALSE)
# Menyusun kombinasi semua faktor
kombinasi <- expand.grid(n = ukuran_sampel, sd = standar_deviasi, sigma_known = sigma_known)
# Fungsi untuk menghitung lebar interval kepercayaan
ci_width <- function(n, sd, sigma_known) {
alpha <- 0.05 # Tingkat signifikansi untuk interval kepercayaan 95%
if (sigma_known) {
# Jika standar deviasi populasi diketahui, gunakan distribusi normal (z-score)
z_value <- qnorm(1 - alpha/2)
ci <- 2 * (z_value * (sd / sqrt(n)))
} else {
# Jika standar deviasi populasi tidak diketahui, gunakan distribusi t
t_value <- qt(1 - alpha/2, df = n - 1)
ci <- 2 * (t_value * (sd / sqrt(n)))
}
return(ci)
}
# Menghitung lebar interval kepercayaan untuk setiap kombinasi faktor
kombinasi$ci_width <- mapply(ci_width, kombinasi$n, kombinasi$sd, kombinasi$sigma_known)
# Menampilkan hasil simulasi
print(kombinasi)
## n sd sigma_known ci_width
## 1 5 10 TRUE 17.530451
## 2 30 10 TRUE 7.156777
## 3 100 10 TRUE 3.919928
## 4 5 50 TRUE 87.652254
## 5 30 50 TRUE 35.783883
## 6 100 50 TRUE 19.599640
## 7 5 90 TRUE 157.774057
## 8 30 90 TRUE 64.410989
## 9 100 90 TRUE 35.279352
## 10 5 10 FALSE 24.833280
## 11 30 10 FALSE 7.468123
## 12 100 10 FALSE 3.968434
## 13 5 50 FALSE 124.166400
## 14 30 50 FALSE 37.340614
## 15 100 50 FALSE 19.842170
## 16 5 90 FALSE 223.499520
## 17 30 90 FALSE 67.213105
## 18 100 90 FALSE 35.715905
Dari hasil simulasi, kita bisa melihat beberapa pola yang jelas. Jika jumlah sampel yang digunakan lebih banyak, hasil estimasi menjadi lebih akurat, yang ditunjukkan dengan interval kepercayaan yang semakin kecil. Misalnya, saat jumlah sampel hanya 5, interval kepercayaannya sekitar 17,53, tetapi saat jumlah sampel meningkat menjadi 100, intervalnya mengecil menjadi sekitar 3,92. Sebaliknya, jika data yang kita analisis lebih bervariasi (standar deviasi besar), maka interval kepercayaannya menjadi lebih lebar. Misalnya, pada ukuran sampel 30, ketika variasi data kecil (standar deviasi 10), interval kepercayaannya sekitar 7,16. Namun, saat variasi data tinggi (standar deviasi 90), intervalnya melebar hingga sekitar 64,41. Selain itu, mengetahui standar deviasi populasi juga berpengaruh. Jika standar deviasi populasi diketahui, interval kepercayaan lebih kecil dibandingkan saat kita hanya mengandalkan data sampel. Contohnya, dengan sampel 5 dan standar deviasi 10, intervalnya sekitar 17,53 jika standar deviasi populasi diketahui. Namun, jika standar deviasi populasi tidak diketahui, intervalnya membesar menjadi sekitar 24,83. Kesimpulannya, untuk mendapatkan hasil estimasi yang lebih akurat, kita sebaiknya menggunakan sampel yang lebih besar. Selain itu, memahami seberapa besar variasi dalam data juga penting karena semakin bervariasi datanya, semakin lebar interval kepercayaannya. Jika kita memiliki informasi tentang standar deviasi populasi, estimasi kita juga akan lebih tepat.
Hasil simulasi menunjukkan bahwa semakin besar ukuran sampel, semakin kecil interval kepercayaan, sehingga estimasi menjadi lebih akurat. Sebaliknya, semakin tinggi variasi data (standar deviasi), semakin lebar interval kepercayaannya. Selain itu, mengetahui standar deviasi populasi membantu memperkecil interval kepercayaan. Jadi, untuk estimasi yang lebih akurat, disarankan menggunakan sampel yang lebih besar dan memahami variasi data yang ada.