Tugas Week 5 Pemodelan Statistika dan Simulasi

Simulasi Ketidakpastian Estimasi Interval

Faktor 1: Pengaruh Ukuran Sampel (\(n\)) terhadap Lebar Interval

Skenario: Nilai rata-rata sampel ditentukan tetap (\(\bar{X} = 100\)), standar deviasi diketahui (\(\sigma = 10\)), dengan variasi ukuran sampel \(n = 5\), \(n = 30\), dan \(n = 100\).

# Pengaturan parameter awal
x_bar <- 100
sigma <- 10
alpha <- 0.05
z_crit <- qnorm(1 - alpha/2)

# Simulasi n = 5
n_kecil <- 5
me_5 <- z_crit * sigma / sqrt(n_kecil)
ci_5 <- c(x_bar - me_5, x_bar + me_5)

# Simulasi n = 30
n_sedang <- 30
me_30 <- z_crit * sigma / sqrt(n_sedang)
ci_30 <- c(x_bar - me_30, x_bar + me_30)

# Simulasi n = 100
n_besar <- 100
me_100 <- z_crit * sigma / sqrt(n_besar)
ci_100 <- c(x_bar - me_100, x_bar + me_100)

# Menampilkan hasil lebar interval (Batas Atas - Batas Bawah)
lebar_n <- c(ci_5[2] - ci_5[1], ci_30[2] - ci_30[1], ci_100[2] - ci_100[1])
names(lebar_n) <- c("n=5", "n=30", "n=100")
lebar_n

##       n=5      n=30     n=100 
## 17.530451  7.156777  3.919928

Penjelasan:

qnorm() digunakan untuk menentukan nilai kritis \(z\) karena standar deviasi populasi diasumsikan diketahui.
Interpretasi Hasil: Ketika ukuran sampel sangat kecil (\(n=5\)), lebar interval mencapai 17.53. Saat sampel ditambah menjadi \(n=30\) dan \(n=100\), lebar interval menyusut drastis masing-masing menjadi 7.16 dan 3.92.
Kesimpulan: Semakin besar ukuran sampel (\(n\)), semakin kecil nilai margin of error, sehingga selang kepercayaan menjadi semakin sempit yang menandakan estimasi kita semakin presisi.

Faktor 2: Pengaruh Variabilitas Data (Standar Deviasi) terhadap Lebar Interval

Skenario: Nilai rata-rata sampel tetap (\(\bar{X} = 100\)), ukuran sampel tetap (\(n = 30\)), dengan variasi standar deviasi \(\sigma = 10\), \(\sigma = 50\), dan \(\sigma = 90\).

x_bar <- 100
n <- 30
alpha <- 0.05
z_crit <- qnorm(1 - alpha/2)

# Simulasi SD = 10
me_sd10 <- z_crit * 10 / sqrt(n)
ci_sd10 <- c(x_bar - me_sd10, x_bar + me_sd10)

# Simulasi SD = 50
me_sd50 <- z_crit * 50 / sqrt(n)
ci_sd50 <- c(x_bar - me_sd50, x_bar + me_sd50)

# Simulasi SD = 90
me_sd90 <- z_crit * 90 / sqrt(n)
ci_sd90 <- c(x_bar - me_sd90, x_bar + me_sd90)

# Menampilkan hasil lebar interval
lebar_sd <- c(ci_sd10[2] - ci_sd10[1], ci_sd50[2] - ci_sd50[1], ci_sd90[2] - ci_sd90[1])
names(lebar_sd) <- c("SD=10", "SD=50", "SD=90")
lebar_sd

##     SD=10     SD=50     SD=90 
##  7.156777 35.783883 64.410989

Penjelasan:

Nilai standar deviasi mencerminkan tingkat keragaman atau sebaran data di dalam kelompok sampel.
Interpretasi Hasil: Pada data yang homogen (\(SD=10\)), lebar selang kepercayaan sangat sempit, yaitu 7.16. Namun, pada data yang sangat heterogen (\(SD=90\)), rentang lebar selang melonjak tinggi hingga mencapai 64.41.
Kesimpulan: Semakin besar tingkat variabilitas data sampel (standar deviasi), semakin besar pula margin of error yang dihasilkan. Hal ini menyebabkan selang kepercayaan melebar, yang berarti tingkat ketidakpastian estimasi semakin tinggi.

Faktor 3: Pengaruh Pengetahuan Standar Deviasi Populasi (Diketahui vs Tidak Diketahui)

Skenario: Ukuran sampel kecil (\(n = 5\)), rata-rata sampel tetap (\(\bar{X} = 100\)), dan nilai standar deviasi tetap (\(10\)). Kita membandingkan kondisi Diketahui (\(\sigma\)) vs Tidak Diketahui (\(s\)).

x_bar <- 100
n <- 5
sd_val <- 10
alpha <- 0.05

# Kondisi A: Standar Deviasi Populasi Diketahui (Distribusi Z)
z_crit <- qnorm(1 - alpha/2)
me_z <- z_crit * sd_val / sqrt(n)
lebar_z <- (x_bar + me_z) - (x_bar - me_z)

# Kondisi B: Standar Deviasi Populasi Tidak Diketahui (Distribusi T, df = n - 1)
t_crit <- qt(1 - alpha/2, df = n - 1)
me_t <- t_crit * sd_val / sqrt(n)
lebar_t <- (x_bar + me_t) - (x_bar - me_t)

# Menampilkan hasil perbandingan lebar interval
perbandingan_distribusi <- c(lebar_z, lebar_t)
names(perbandingan_distribusi) <- c("Diketahui (Distribusi Z)", "Tidak Diketahui (Distribusi T)")
perbandingan_distribusi

##       Diketahui (Distribusi Z) Tidak Diketahui (Distribusi T) 
##                       17.53045                       24.83328

Penjelasan:

qt() digunakan untuk mencari nilai kritis pada distribusi \(t\)-Student dengan derajat kebebasan \(df = n - 1\).
Interpretasi Hasil: Jika nilai standar deviasi populasi diketahui secara pasti (menggunakan distribusi \(z\)), lebar intervalnya adalah 17.53. Sebaliknya, jika standar deviasi populasi tidak diketahui sehingga harus ditaksir dari sampel (menggunakan distribusi \(t\)), intervalnya melebar menjadi 24.83.
Kesimpulan: Ketika standar deviasi populasi tidak diketahui, tingkat ketidakpastian dalam estimasi meningkat. Penggunaan distribusi \(t\)-Student secara matematis memberikan penalti berupa interval yang lebih lebar untuk mengompensasi informasi variabilitas populasi yang hilang, terutama ketika ukuran sampel yang digunakan tergolong kecil.

Tugas Week 5 Pemodelan Statistika dan Simulasi

Kirana Aripuspa Wardani

2026-03-20