Tugas Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan 95%, dengan informasi setiap faktor dan level sebagai berikut: - Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100 - Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90 - Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s)

# ============================================
# SIMULASI INTERVAL KEPERCAYAAN 95%
# Pengaruh ukuran sampel dan standar deviasi
# ============================================


set.seed(123)


# Parameter simulasi
mu <- 100
n <- c(5, 30, 100)
sigma <- c(10, 50, 90)

B <- 1000   # banyak simulasi


# membuat penyimpanan hasil

hasil <- data.frame()



for (i in n){
  
  for (j in sigma){
    
    
    for(k in 1:B){
      
      
      # bangkit data
      
      x <- rnorm(
        n = i,
        mean = mu,
        sd = j
      )
      
      
      xbar <- mean(x)
      s <- sd(x)
      
      
      # CI sigma diketahui
      
      z <- qnorm(0.975)
      
      lower_z <- xbar - z*j/sqrt(i)
      upper_z <- xbar + z*j/sqrt(i)
      
      
      # CI sigma tidak diketahui
      
      t <- qt(0.975, df=i-1)
      
      lower_t <- xbar - t*s/sqrt(i)
      upper_t <- xbar + t*s/sqrt(i)
      
      
      
      hasil <- rbind(
        hasil,
        data.frame(
          
          n=i,
          SD=j,
          
          kondisi="Sigma diketahui",
          lower=lower_z,
          upper=upper_z,
          lebar=upper_z-lower_z
          
        ),
        
        data.frame(
          
          n=i,
          SD=j,
          
          kondisi="Sigma tidak diketahui",
          lower=lower_t,
          upper=upper_t,
          lebar=upper_t-lower_t
          
        )
      )
      
    }
    
  }
}



# lihat hasil

head(hasil)
##   n SD               kondisi    lower    upper    lebar
## 1 5 10       Sigma diketahui 93.17048 110.7009 17.53045
## 2 5 10 Sigma tidak diketahui 91.86554 112.0059 20.14033
## 3 5 10       Sigma diketahui 90.79158 108.3220 17.53045
## 4 5 10 Sigma tidak diketahui 85.11018 114.0034 28.89326
## 5 5 10       Sigma diketahui 94.31379 111.8442 17.53045
## 6 5 10 Sigma tidak diketahui 95.13903 111.0190 15.87997
# rata-rata lebar CI

hasil_akhir <- aggregate(
  lebar ~ n + SD + kondisi,
  data=hasil,
  FUN=mean
)


hasil_akhir
##      n SD               kondisi      lebar
## 1    5 10       Sigma diketahui  17.530451
## 2   30 10       Sigma diketahui   7.156777
## 3  100 10       Sigma diketahui   3.919928
## 4    5 50       Sigma diketahui  87.652254
## 5   30 50       Sigma diketahui  35.783883
## 6  100 50       Sigma diketahui  19.599640
## 7    5 90       Sigma diketahui 157.774057
## 8   30 90       Sigma diketahui  64.410989
## 9  100 90       Sigma diketahui  35.279352
## 10   5 10 Sigma tidak diketahui  23.291899
## 11  30 10 Sigma tidak diketahui   7.416046
## 12 100 10 Sigma tidak diketahui   3.969923
## 13   5 50 Sigma tidak diketahui 117.702168
## 14  30 50 Sigma tidak diketahui  37.111382
## 15 100 50 Sigma tidak diketahui  19.801044
## 16   5 90 Sigma tidak diketahui 210.722415
## 17  30 90 Sigma tidak diketahui  66.572102
## 18 100 90 Sigma tidak diketahui  35.698780
# install.packages("ggplot2") kalau belum ada

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.3
ggplot(
  hasil_akhir,
  aes(
    x=factor(n),
    y=lebar,
    fill=kondisi
  )
)+
  
  geom_col(position="dodge")+
  
  facet_wrap(~SD)+
  
  labs(
    title="Pengaruh Ukuran Sampel dan SD terhadap Lebar CI 95%",
    x="Ukuran Sampel",
    y="Rata-rata Lebar CI"
  )

# Ringkasan berdasarkan 3 faktor

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
ringkasan <- hasil %>%
  group_by(
    n,
    SD,
    kondisi
  ) %>%
  summarise(
    rata_rata_lebar_CI = mean(lebar),
    .groups = "drop"
  )


ringkasan
## # A tibble: 18 × 4
##        n    SD kondisi               rata_rata_lebar_CI
##    <dbl> <dbl> <chr>                              <dbl>
##  1     5    10 Sigma diketahui                    17.5 
##  2     5    10 Sigma tidak diketahui              23.3 
##  3     5    50 Sigma diketahui                    87.7 
##  4     5    50 Sigma tidak diketahui             118.  
##  5     5    90 Sigma diketahui                   158.  
##  6     5    90 Sigma tidak diketahui             211.  
##  7    30    10 Sigma diketahui                     7.16
##  8    30    10 Sigma tidak diketahui               7.42
##  9    30    50 Sigma diketahui                    35.8 
## 10    30    50 Sigma tidak diketahui              37.1 
## 11    30    90 Sigma diketahui                    64.4 
## 12    30    90 Sigma tidak diketahui              66.6 
## 13   100    10 Sigma diketahui                     3.92
## 14   100    10 Sigma tidak diketahui               3.97
## 15   100    50 Sigma diketahui                    19.6 
## 16   100    50 Sigma tidak diketahui              19.8 
## 17   100    90 Sigma diketahui                    35.3 
## 18   100    90 Sigma tidak diketahui              35.7

#Interpretasi Hasil Simulasi Interval Kepercayaan 95%

Berdasarkan hasil simulasi, diperoleh bahwa perubahan ukuran sampel (n), standar deviasi data (SD), dan kondisi standar deviasi populasi diketahui atau tidak diketahui memengaruhi lebar interval kepercayaan 95%.

  1. Pengaruh ukuran sampel (n) Hasil simulasi menunjukkan bahwa semakin besar ukuran sampel yang digunakan, maka lebar interval kepercayaan semakin kecil. Sehingga ketika nilai n meningkat, standar error menurun dan estimasi rata-rata populasi menjadi lebih presisi. Dengan kata lain, jumlah sampel yang lebih besar menghasilkan interval kepercayaan yang lebih sempit.

  2. Pengaruh standar deviasi (SD) Berdasarkan simulasi, peningkatan standar deviasi menyebabkan interval kepercayaan menjadi semakin lebar. Ketika SD besar, data memiliki penyebaran yang lebih tinggi sehingga ketidakpastian dalam mengestimasi rata-rata populasi meningkat.

Misalnya, data dengan SD = 90 menghasilkan interval yang lebih lebar dibandingkan data dengan SD = 10 pada ukuran sampel yang sama.

  1. Pengaruh standar deviasi populasi diketahui dan tidak diketahui Pada kondisi standar deviasi populasi diketahui, interval kepercayaan dihitung menggunakan distribusi Z, sedangkan ketika standar deviasi populasi tidak diketahui digunakan distribusi t.

Hasil simulasi menunjukkan bahwa kondisi σ tidak diketahui cenderung menghasilkan interval yang lebih lebar dibandingkan σ diketahui. Hal ini disebabkan distribusi t memiliki nilai kritis yang lebih besar karena terdapat tambahan ketidakpastian dalam mengestimasi standar deviasi populasi menggunakan standar deviasi sampel.

#Kesimpulan

Dari ketiga faktor tersebut, dapat disimpulkan bahwa: