Pendahuluan

Pada simulasi ini digunakan studi kasus waktu pelayanan pelanggan pada Gerai Teh Raya. Tujuan simulasi adalah mempelajari pengaruh ukuran sampel, variabilitas data, dan pengetahuan standar deviasi populasi terhadap lebar interval kepercayaan 95%.

Faktor yang digunakan:

Faktor Level
Ukuran Sampel (n) 5, 30, 100
Standar Deviasi 10, 50, 90
Status SD Populasi Diketahui, Tidak Diketahui

Total kombinasi perlakuan:

\[ 3 \times 3 \times 2 = 18 \]

Dasar Teori

Interval Kepercayaan Saat SD Populasi Diketahui

\[ \bar{x} \pm z_{0.025}\left(\frac{\sigma}{\sqrt{n}}\right) \]

Interval Kepercayaan Saat SD Populasi Tidak Diketahui

\[ \bar{x} \pm t_{0.025,n-1}\left(\frac{s}{\sqrt{n}}\right) \]

Simulasi

# seluruh kode simulasi disini
library(dplyr)
library(ggplot2)

set.seed(123)

mu <- 120
n_values <- c(5,30,100)
sd_values <- c(10,50,90)
replikasi <- 1000

hasil <- data.frame()

for(n in n_values){
  for(sd_pop in sd_values){
    for(i in 1:replikasi){

      data <- rnorm(
        n,
        mean = mu,
        sd = sd_pop
      )

      s <- sd(data)

      z <- qnorm(0.975)

      lebar_z <- 2*z*sd_pop/sqrt(n)

      hasil <- rbind(
        hasil,
        data.frame(
          n=n,
          SD=sd_pop,
          Status="Diketahui",
          Lebar=lebar_z
        )
      )

      t_value <- qt(
        0.975,
        df=n-1
      )

      lebar_t <- 2*t_value*s/sqrt(n)

      hasil <- rbind(
        hasil,
        data.frame(
          n=n,
          SD=sd_pop,
          Status="Tidak Diketahui",
          Lebar=lebar_t
        )
      )
    }
  }
}

head(hasil)
##   n SD          Status    Lebar
## 1 5 10       Diketahui 17.53045
## 2 5 10 Tidak Diketahui 20.14033
## 3 5 10       Diketahui 17.53045
## 4 5 10 Tidak Diketahui 28.89326
## 5 5 10       Diketahui 17.53045
## 6 5 10 Tidak Diketahui 15.87997
ringkasan <- hasil %>%
group_by(
  n,
  SD,
  Status
) %>%
summarise(
  Rata_Rata_Lebar = mean(Lebar),
  SD_Lebar = sd(Lebar),
  .groups="drop"
)

knitr::kable(ringkasan) 
n SD Status Rata_Rata_Lebar SD_Lebar
5 10 Diketahui 17.530451 0.0000000
5 10 Tidak Diketahui 23.291899 8.6062929
5 50 Diketahui 87.652254 0.0000000
5 50 Tidak Diketahui 117.702168 41.4256125
5 90 Diketahui 157.774057 0.0000000
5 90 Tidak Diketahui 210.722415 74.9399628
30 10 Diketahui 7.156777 0.0000000
30 10 Tidak Diketahui 7.416046 0.9603458
30 50 Diketahui 35.783883 0.0000000
30 50 Tidak Diketahui 37.111382 5.0105978
30 90 Diketahui 64.410989 0.0000000
30 90 Tidak Diketahui 66.572102 9.0494727
100 10 Diketahui 3.919928 0.0000000
100 10 Tidak Diketahui 3.969923 0.2843728
100 50 Diketahui 19.599640 0.0000000
100 50 Tidak Diketahui 19.801044 1.4087100
100 90 Diketahui 35.279352 0.0000000
100 90 Tidak Diketahui 35.698780 2.6186965
ggplot(
  ringkasan,
  aes(
    x=factor(n),
    y=Rata_Rata_Lebar,
    fill=Status
  )
)+
geom_col(position="dodge")+
facet_wrap(~SD)+
labs(
  title="Pengaruh Ukuran Sampel dan Variabilitas Data",
  x="Ukuran Sampel",
  y="Rata-rata Lebar Interval"
) 

anova_model <- aov(
  Lebar ~ factor(n)*
  factor(SD)*
  factor(Status),
  data=hasil
)

summary(anova_model) 
##                                        Df   Sum Sq  Mean Sq F value Pr(>F)    
## factor(n)                               2 22969220 11484610 27478.8 <2e-16 ***
## factor(SD)                              2 21435411 10717705 25643.9 <2e-16 ***
## factor(Status)                          1   482346   482346  1154.1 <2e-16 ***
## factor(n):factor(SD)                    4  9790208  2447552  5856.2 <2e-16 ***
## factor(n):factor(Status)                2   833119   416559   996.7 <2e-16 ***
## factor(SD):factor(Status)               2   203910   101955   243.9 <2e-16 ***
## factor(n):factor(SD):factor(Status)     4   353845    88461   211.7 <2e-16 ***
## Residuals                           17982  7515469      418                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1