Tugas Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan 95%, dengan informasi setiap faktor dan level sebagai berikut: - Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100 - Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90 - Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s)
# ============================================
# SIMULASI INTERVAL KEPERCAYAAN 95%
# Pengaruh ukuran sampel dan standar deviasi
# ============================================
set.seed(123)
# Parameter simulasi
mu <- 100
n <- c(5, 30, 100)
sigma <- c(10, 50, 90)
B <- 1000 # banyak simulasi
# membuat penyimpanan hasil
hasil <- data.frame()
for (i in n){
for (j in sigma){
for(k in 1:B){
# bangkit data
x <- rnorm(
n = i,
mean = mu,
sd = j
)
xbar <- mean(x)
s <- sd(x)
# CI sigma diketahui
z <- qnorm(0.975)
lower_z <- xbar - z*j/sqrt(i)
upper_z <- xbar + z*j/sqrt(i)
# CI sigma tidak diketahui
t <- qt(0.975, df=i-1)
lower_t <- xbar - t*s/sqrt(i)
upper_t <- xbar + t*s/sqrt(i)
hasil <- rbind(
hasil,
data.frame(
n=i,
SD=j,
kondisi="Sigma diketahui",
lower=lower_z,
upper=upper_z,
lebar=upper_z-lower_z
),
data.frame(
n=i,
SD=j,
kondisi="Sigma tidak diketahui",
lower=lower_t,
upper=upper_t,
lebar=upper_t-lower_t
)
)
}
}
}
# lihat hasil
head(hasil)
## n SD kondisi lower upper lebar
## 1 5 10 Sigma diketahui 93.17048 110.7009 17.53045
## 2 5 10 Sigma tidak diketahui 91.86554 112.0059 20.14033
## 3 5 10 Sigma diketahui 90.79158 108.3220 17.53045
## 4 5 10 Sigma tidak diketahui 85.11018 114.0034 28.89326
## 5 5 10 Sigma diketahui 94.31379 111.8442 17.53045
## 6 5 10 Sigma tidak diketahui 95.13903 111.0190 15.87997
# rata-rata lebar CI
hasil_akhir <- aggregate(
lebar ~ n + SD + kondisi,
data=hasil,
FUN=mean
)
hasil_akhir
## n SD kondisi lebar
## 1 5 10 Sigma diketahui 17.530451
## 2 30 10 Sigma diketahui 7.156777
## 3 100 10 Sigma diketahui 3.919928
## 4 5 50 Sigma diketahui 87.652254
## 5 30 50 Sigma diketahui 35.783883
## 6 100 50 Sigma diketahui 19.599640
## 7 5 90 Sigma diketahui 157.774057
## 8 30 90 Sigma diketahui 64.410989
## 9 100 90 Sigma diketahui 35.279352
## 10 5 10 Sigma tidak diketahui 23.291899
## 11 30 10 Sigma tidak diketahui 7.416046
## 12 100 10 Sigma tidak diketahui 3.969923
## 13 5 50 Sigma tidak diketahui 117.702168
## 14 30 50 Sigma tidak diketahui 37.111382
## 15 100 50 Sigma tidak diketahui 19.801044
## 16 5 90 Sigma tidak diketahui 210.722415
## 17 30 90 Sigma tidak diketahui 66.572102
## 18 100 90 Sigma tidak diketahui 35.698780
# install.packages("ggplot2") kalau belum ada
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.3
ggplot(
hasil_akhir,
aes(
x=factor(n),
y=lebar,
fill=kondisi
)
)+
geom_col(position="dodge")+
facet_wrap(~SD)+
labs(
title="Pengaruh Ukuran Sampel dan SD terhadap Lebar CI 95%",
x="Ukuran Sampel",
y="Rata-rata Lebar CI"
)
# Ringkasan berdasarkan 3 faktor
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
ringkasan <- hasil %>%
group_by(
n,
SD,
kondisi
) %>%
summarise(
rata_rata_lebar_CI = mean(lebar),
.groups = "drop"
)
ringkasan
## # A tibble: 18 × 4
## n SD kondisi rata_rata_lebar_CI
## <dbl> <dbl> <chr> <dbl>
## 1 5 10 Sigma diketahui 17.5
## 2 5 10 Sigma tidak diketahui 23.3
## 3 5 50 Sigma diketahui 87.7
## 4 5 50 Sigma tidak diketahui 118.
## 5 5 90 Sigma diketahui 158.
## 6 5 90 Sigma tidak diketahui 211.
## 7 30 10 Sigma diketahui 7.16
## 8 30 10 Sigma tidak diketahui 7.42
## 9 30 50 Sigma diketahui 35.8
## 10 30 50 Sigma tidak diketahui 37.1
## 11 30 90 Sigma diketahui 64.4
## 12 30 90 Sigma tidak diketahui 66.6
## 13 100 10 Sigma diketahui 3.92
## 14 100 10 Sigma tidak diketahui 3.97
## 15 100 50 Sigma diketahui 19.6
## 16 100 50 Sigma tidak diketahui 19.8
## 17 100 90 Sigma diketahui 35.3
## 18 100 90 Sigma tidak diketahui 35.7
#Interpretasi Hasil Simulasi Interval Kepercayaan 95%
Berdasarkan hasil simulasi, diperoleh bahwa perubahan ukuran sampel (n), standar deviasi data (SD), dan kondisi standar deviasi populasi diketahui atau tidak diketahui memengaruhi lebar interval kepercayaan 95%.
Pengaruh ukuran sampel (n) Hasil simulasi menunjukkan bahwa semakin besar ukuran sampel yang digunakan, maka lebar interval kepercayaan semakin kecil. Sehingga ketika nilai n meningkat, standar error menurun dan estimasi rata-rata populasi menjadi lebih presisi. Dengan kata lain, jumlah sampel yang lebih besar menghasilkan interval kepercayaan yang lebih sempit.
Pengaruh standar deviasi (SD) Berdasarkan simulasi, peningkatan standar deviasi menyebabkan interval kepercayaan menjadi semakin lebar. Ketika SD besar, data memiliki penyebaran yang lebih tinggi sehingga ketidakpastian dalam mengestimasi rata-rata populasi meningkat.
Misalnya, data dengan SD = 90 menghasilkan interval yang lebih lebar dibandingkan data dengan SD = 10 pada ukuran sampel yang sama.
Hasil simulasi menunjukkan bahwa kondisi σ tidak diketahui cenderung menghasilkan interval yang lebih lebar dibandingkan σ diketahui. Hal ini disebabkan distribusi t memiliki nilai kritis yang lebih besar karena terdapat tambahan ketidakpastian dalam mengestimasi standar deviasi populasi menggunakan standar deviasi sampel.
#Kesimpulan
Dari ketiga faktor tersebut, dapat disimpulkan bahwa: