Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan 95%, dengan informasi setiap faktor dan level sebagai berikut:
faktor_list <- list(
faktor1 = c(5,30,100),
faktor2 = c(10, 50, 90),
faktor3 = c("Standar deviasi populasi diketahui", "Standar deviasi populasi tidak diketahui")
)
for (faktor1 in faktor_list$faktor1){
for (faktor2 in faktor_list$faktor2){
for (faktor3 in faktor_list$faktor3){
print(paste("Ukuran sampel (n): ",faktor1))
print(paste("Standar Deviasi(σ atau s): ",faktor2))
print(paste("Faktor 3: ",faktor3))
mean <- 0
sd <- faktor2
alpha <- 0.05
n <- faktor1
if (faktor3 == "Standar deviasi populasi diketahui") {
z_value <- qnorm(1 - alpha/2)
error_margin <- z_value * sd / sqrt(n)
interval <- c(mean - error_margin, mean + error_margin)
cat("Interval kepercayaan 95%: [", interval[1], ",", interval[2], "] \n \n")
} else{
t_value <- qt(1 - alpha/2, df = n-1)
error_margin <- t_value * sd / sqrt(n)
interval <- c(mean - error_margin, mean + error_margin)
cat("Interval kepercayaan 95%: [", interval[1], ",", interval[2], "] \n \n")
}
}
}
}
## [1] "Ukuran sampel (n): 5"
## [1] "Standar Deviasi(σ atau s): 10"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -8.765225 , 8.765225 ]
##
## [1] "Ukuran sampel (n): 5"
## [1] "Standar Deviasi(σ atau s): 10"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -12.41664 , 12.41664 ]
##
## [1] "Ukuran sampel (n): 5"
## [1] "Standar Deviasi(σ atau s): 50"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -43.82613 , 43.82613 ]
##
## [1] "Ukuran sampel (n): 5"
## [1] "Standar Deviasi(σ atau s): 50"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -62.0832 , 62.0832 ]
##
## [1] "Ukuran sampel (n): 5"
## [1] "Standar Deviasi(σ atau s): 90"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -78.88703 , 78.88703 ]
##
## [1] "Ukuran sampel (n): 5"
## [1] "Standar Deviasi(σ atau s): 90"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -111.7498 , 111.7498 ]
##
## [1] "Ukuran sampel (n): 30"
## [1] "Standar Deviasi(σ atau s): 10"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -3.578388 , 3.578388 ]
##
## [1] "Ukuran sampel (n): 30"
## [1] "Standar Deviasi(σ atau s): 10"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -3.734061 , 3.734061 ]
##
## [1] "Ukuran sampel (n): 30"
## [1] "Standar Deviasi(σ atau s): 50"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -17.89194 , 17.89194 ]
##
## [1] "Ukuran sampel (n): 30"
## [1] "Standar Deviasi(σ atau s): 50"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -18.67031 , 18.67031 ]
##
## [1] "Ukuran sampel (n): 30"
## [1] "Standar Deviasi(σ atau s): 90"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -32.20549 , 32.20549 ]
##
## [1] "Ukuran sampel (n): 30"
## [1] "Standar Deviasi(σ atau s): 90"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -33.60655 , 33.60655 ]
##
## [1] "Ukuran sampel (n): 100"
## [1] "Standar Deviasi(σ atau s): 10"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -1.959964 , 1.959964 ]
##
## [1] "Ukuran sampel (n): 100"
## [1] "Standar Deviasi(σ atau s): 10"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -1.984217 , 1.984217 ]
##
## [1] "Ukuran sampel (n): 100"
## [1] "Standar Deviasi(σ atau s): 50"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -9.79982 , 9.79982 ]
##
## [1] "Ukuran sampel (n): 100"
## [1] "Standar Deviasi(σ atau s): 50"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -9.921085 , 9.921085 ]
##
## [1] "Ukuran sampel (n): 100"
## [1] "Standar Deviasi(σ atau s): 90"
## [1] "Faktor 3: Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -17.63968 , 17.63968 ]
##
## [1] "Ukuran sampel (n): 100"
## [1] "Standar Deviasi(σ atau s): 90"
## [1] "Faktor 3: Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -17.85795 , 17.85795 ]
##
Dari hasil simulasi, kita bisa melihat bagaimana ukuran sampel (n), variabilitas data (standar deviasi σ atau s), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) memengaruhi lebar interval kepercayaan 95%. Berikut adalah interpretasi dari pola yang muncul:
Ketika ukuran sampel kecil (n = 5), interval kepercayaan lebih lebar. Saat ukuran sampel bertambah (n = 30 atau n = 100), interval kepercayaan menjadi lebih sempit. Hal ini terjadi karena semakin besar ukuran sampel, semakin kecil kesalahan standar (SE = σ/√n), yang menyebabkan interval kepercayaan lebih sempit.
Contoh:
n = 5, σ = 10, standar deviasi diketahui => Interval: [-8.77, 8.77]
n = 30, σ = 10, standar deviasi diketahui => Interval: [-3.58, 3.58]
n = 100, σ = 10, standar deviasi diketahui => Interval: [-1.96, 1.96]
Semakin besar n, semakin kecil rentang intervalnya.
Semakin besar standar deviasi (σ atau s), semakin lebar interval kepercayaan. Ini masuk akal karena semakin besar variabilitas data, semakin besar ketidakpastian dalam estimasi rata-rata, sehingga interval harus lebih lebar untuk mencakup nilai populasi sebenarnya.
Contoh:
n = 30, σ = 10, standar deviasi diketahui => Interval: [-3.58, 3.58]
n = 30, σ = 50, standar deviasi diketahui => Interval: [-17.89, 17.89]
n = 30, σ = 90, standar deviasi diketahui => Interval: [-32.21, 32.21]
Semakin besar standar deviasi, semakin besar intervalnya.
Jika standar deviasi populasi diketahui → Gunakan distribusi normal (Z). Jika standar deviasi populasi tidak diketahui → Gunakan distribusi t-Student (yang memiliki tail lebih tebal, sehingga interval lebih lebar). Efeknya lebih terlihat ketika n kecil (karena distribusi t lebih menyebar untuk n kecil). Ketika n besar (misalnya n = 100), perbedaan antara distribusi t dan Z hampir tidak signifikan.
Contoh:
n = 5, σ = 10
Diketahui => Interval: [-8.77, 8.77]
Tidak diketahui => Interval: [-12.42, 12.42]
Perbedaan besar! (interval lebih lebar saat σ tidak diketahui).
n = 100, σ = 10
Diketahui => Interval: [-1.96, 1.96]
Tidak diketahui => Interval: [-1.98, 1.98]
Perbedaan kecil! (hampir sama karena distribusi t mendekati distribusi normal saat n besar).