Pendahuluan

Interval kepercayaan (confidence interval) merupakan metode dalam statistika inferensial yang digunakan untuk mengestimasi parameter populasi berdasarkan data sampel. Interval ini memberikan rentang nilai yang kemungkinan besar mengandung parameter populasi yang sebenarnya dengan tingkat kepercayaan tertentu (Walpole et al., 2012).

Lebar interval kepercayaan dipengaruhi oleh beberapa faktor utama, yaitu ukuran sampel, variabilitas data, dan tingkat kepercayaan yang digunakan (Montgomery & Runger, 2014).

Selain itu, metode perhitungan interval kepercayaan juga bergantung pada apakah standar deviasi populasi diketahui atau tidak. Jika standar deviasi populasi diketahui, maka digunakan distribusi normal (z). Sebaliknya, jika tidak diketahui, maka digunakan distribusi t-Student (Casella & Berger, 2002).

Praktikum ini bertujuan untuk melakukan simulasi menggunakan R untuk mempelajari pengaruh ukuran sampel, variabilitas data, serta pengetahuan tentang standar deviasi populasi terhadap lebar interval kepercayaan 95%.

Metodologi Simulasi

Simulasi dilakukan dengan mempertimbangkan tiga faktor utama:

Ukuran Sampel (n)

  • 5
  • 30
  • 100

Variabilitas Data (Standar Deviasi)

  • 10
  • 50
  • 90

Pengetahuan Standar Deviasi Populasi

  • Diketahui (menggunakan distribusi normal / z)
  • Tidak diketahui (menggunakan distribusi t)

Menurut teori statistika inferensial, interval kepercayaan untuk mean populasi diberikan oleh rumus berikut (Walpole et al., 2012).:

Jika standar deviasi populasi diketahui:

\[ CI = \bar{x} \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \]

Jika standar deviasi populasi tidak diketahui:

\[ CI = \bar{x} \pm t_{\alpha/2,n-1}\frac{s}{\sqrt{n}} \]

Lebar interval kepercayaan kemudian dihitung sebagai selisih antara batas atas dan batas bawah interval tersebut.

Simulasi

# Menentukan faktor simulasi
n_values <- c(5, 30, 100)
sd_values <- c(10, 50, 90)

alpha <- 0.05
z <- qnorm(1 - alpha/2)

result <- data.frame()

for (n in n_values) {
  for (sd in sd_values) {

    width_z <- 2 * z * sd / sqrt(n)

    t_val <- qt(1 - alpha/2, df = n-1)
    width_t <- 2 * t_val * sd / sqrt(n)

    result <- rbind(result,
                    data.frame(
                      Sample_Size = n,
                      SD = sd,
                      CI_Sigma_Known = width_z,
                      CI_Sigma_Unknown = width_t
                    ))
  }
}

result
##   Sample_Size SD CI_Sigma_Known CI_Sigma_Unknown
## 1           5 10      17.530451        24.833280
## 2           5 50      87.652254       124.166400
## 3           5 90     157.774057       223.499520
## 4          30 10       7.156777         7.468123
## 5          30 50      35.783883        37.340614
## 6          30 90      64.410989        67.213105
## 7         100 10       3.919928         3.968434
## 8         100 50      19.599640        19.842170
## 9         100 90      35.279352        35.715905
library(ggplot2)
library(reshape2)
## Warning: package 'reshape2' was built under R version 4.5.2
data_long <- melt(result,
                  id.vars=c("Sample_Size","SD"),
                  variable.name="Condition",
                  value.name="CI_Width")

ggplot(data_long,
       aes(x=factor(Sample_Size),
           y=CI_Width,
           fill=Condition)) +
  geom_bar(stat="identity", position="dodge") +
  facet_wrap(~SD) +
  labs(title="Pengaruh Ukuran Sampel dan Variabilitas terhadap Lebar CI 95%",
       x="Ukuran Sampel",
       y="Lebar Interval Kepercayaan") +
  theme_minimal()

Interpretasi Hasil

Hasil simulasi menunjukkan beberapa pola yang konsisten dengan teori statistika inferensial.

Pertama, semakin besar ukuran sampel, maka lebar interval kepercayaan semakin kecil. Hal ini disebabkan oleh menurunnya standar error ketika ukuran sampel meningkat (Montgomery & Runger, 2014).

Kedua, semakin besar variabilitas data (standar deviasi), maka interval kepercayaan menjadi lebih lebar karena ketidakpastian estimasi meningkat.

Ketiga, ketika standar deviasi populasi tidak diketahui, interval kepercayaan yang dihasilkan sedikit lebih lebar karena menggunakan distribusi t yang memiliki ekor distribusi lebih tebal dibanding distribusi normal, terutama pada ukuran sampel kecil (Casella & Berger, 2002).

Kesimpulan

Berdasarkan simulasi yang dilakukan, dapat disimpulkan bahwa:

  1. Ukuran sampel yang lebih besar menghasilkan interval kepercayaan yang lebih sempit.
  2. Variabilitas data yang lebih tinggi menghasilkan interval kepercayaan yang lebih lebar.
  3. Ketika standar deviasi populasi tidak diketahui, interval kepercayaan dihitung menggunakan distribusi t. Penggunaan distribusi ini membuat interval kepercayaan sedikit lebih lebar karena masih ada ketidakpastian dalam memperkirakan standar deviasi populasi dari data sampel, terutama ketika ukuran sampel kecil.