This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

Analisis Lebar Interval Kepercayaan 95%

Persoalan

Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan 95%, dengan informasi setiap faktor dan level sebagai berikut:

- Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100

- Faktor 2:** Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90

- Faktor 3:** Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s)

if(!require(ggplot2)) install.packages("ggplot2")
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.4.3
library(ggplot2)
alpha <- 0.05
conf_level <- 0.95
n_levels <- c(5, 30, 100)
sd_levels <- c(10, 50, 90)
sd_known_levels <- c("Diketahui (z)", "Tidak Diketahui (t)")

Membuat Grid Kombinasi untuk Simulasi

df <- expand.grid(n = n_levels, 
                  SD = sd_levels, 
                  Status_SD = sd_known_levels)

Perhitungan Margin of Error (E)

Lebar Interval = 2 * Margin of Error

df$Margin_Error <- mapply(function(n, sd, status) {
  if (status == "Diketahui (z)") {
    return(qnorm(0.975) * (sd / sqrt(n)))
  } else {
    return(qt(0.975, df = n - 1) * (sd / sqrt(n)))
  }
}, df$n, df$SD, df$Status_SD)

Menghitung Lebar Interval

df$Lebar_Interval <- 2 * df$Margin_Error
df <- df[order(df$Lebar_Interval), ]
print(df)
##      n SD           Status_SD Margin_Error Lebar_Interval
## 3  100 10       Diketahui (z)     1.959964       3.919928
## 12 100 10 Tidak Diketahui (t)     1.984217       3.968434
## 2   30 10       Diketahui (z)     3.578388       7.156777
## 11  30 10 Tidak Diketahui (t)     3.734061       7.468123
## 1    5 10       Diketahui (z)     8.765225      17.530451
## 6  100 50       Diketahui (z)     9.799820      19.599640
## 15 100 50 Tidak Diketahui (t)     9.921085      19.842170
## 10   5 10 Tidak Diketahui (t)    12.416640      24.833280
## 9  100 90       Diketahui (z)    17.639676      35.279352
## 18 100 90 Tidak Diketahui (t)    17.857953      35.715905
## 5   30 50       Diketahui (z)    17.891941      35.783883
## 14  30 50 Tidak Diketahui (t)    18.670307      37.340614
## 8   30 90       Diketahui (z)    32.205495      64.410989
## 17  30 90 Tidak Diketahui (t)    33.606552      67.213105
## 4    5 50       Diketahui (z)    43.826127      87.652254
## 13   5 50 Tidak Diketahui (t)    62.083200     124.166400
## 7    5 90       Diketahui (z)    78.887029     157.774057
## 16   5 90 Tidak Diketahui (t)   111.749760     223.499520
ggplot(df, aes(x = factor(n), y = Lebar_Interval, color = factor(SD), group = SD)) +
  geom_line() +
  geom_point() +
  facet_wrap(~Status_SD) +
  labs(title = "Analisis Lebar Interval Kepercayaan 95%",
       x = "Ukuran Sampel (n)",
       y = "Lebar Interval",
       color = "Standar Deviasi (SD)") +
  theme_minimal()

Interpretasi

Saat n naik dari 5 ke 100, Lebar_Interval menurun drastis (hubungan terbalik).

Variabilitas (SD): Saat SD naik dari 10 ke 90, Lebar_Interval meningkat secara signifikan (hubungan searah).

Status SD: Nilai pada kolom “Tidak Diketahui (t)” akan selalu lebih besar (lebih lebar) daripada “Diketahui (z)” pada baris yang sama, terutama pada n=5 karena nilai kritis t lebih besar dari z untuk mengompensasi ketidakpastian. Ketika ukuran sampel meningkat (n=100), perbedaan antara penggunaan distribusi z dan t menjadi tidak signifikan karena distribusi t mendekati distribusi normal baku seiring bertambahnya derajat bebas (df).

Lebar interval adalah \(2 \times\) Margin of Error. Penurunan drastis pada grafik saat \(n\) berubah dari 5 ke 30 menunjukkan bahwa penambahan sampel pada skala kecil memberikan dampak yang jauh lebih besar dalam mengurangi error dibandingkan penambahan sampel pada skala besar.

Kesimpulan

Secara keseluruhan, faktor yang paling dominan dalam mempersempit interval kepercayaan adalah ukuran sampel, namun variabilitas data tetap menjadi penentu utama besarnya error dasar. Penggunaan distribusi \(t\) adalah langkah konservatif yang diperlukan ketika standar deviasi populasi tidak diketahui untuk menjaga keandalan estimasi, terutama pada sampel kecil.