Studi Kasus 1: Pengaruh Ukuran Sampel terhadap Selang Kepercayaan

Situasi:

Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dihabiskan oleh pelanggan di situs web mereka. Mereka melakukan dua survei dengan ukuran sampel yang berbeda.

Data:

Survei 1: 30 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit

Survei 2: 100 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit

Tugas:

Hitung interval kepercayaan 95% untuk kedua survei.

Bandingkan lebar interval kepercayaan dari kedua survei.

Jelaskan bagaimana ukuran sampel mempengaruhi selang kepercayaan.

Survey 1

n1 <- 30
mean1 <- 5
sd1 <- 2
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 4.253188 5.746812

Survey 2

n2 <- 100
mean2 <- 5
sd2 <- 2
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2 / sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 4.603157 5.396843

Interpretasi:

Survei 1 memiliki interval kepercayaan (4.252, 5.748) menit.

Survei 2 memiliki interval kepercayaan (4.602, 5.398) menit.

Ukuran sampel yang lebih besar menghasilkan selang kepercayaan yang lebih sempit, menunjukkan estimasi yang lebih presisi.

Studi Kasus 2: Pengaruh Variabilitas Data terhadap Selang Kepercayaan

Situasi:

Sebuah sekolah ingin mengestimasi rata-rata nilai ujian matematika siswa. Mereka memiliki dua kelas dengan variabilitas nilai yang berbeda.

Data:

Kelas A: 40 siswa, rata-rata nilai = 75, standar deviasi = 10

Kelas B: 40 siswa, rata-rata nilai = 75, standar deviasi = 20

Tugas:

Hitung interval kepercayaan 95% untuk kedua kelas.

Bandingkan lebar interval kepercayaan dari kedua kelas.

Jelaskan bagaimana variabilitas data mempengaruhi selang kepercayaan.

Kelas A

nA <- 40
meanA <- 75
sdA <- 10
alpha <- 0.05
t_valueA <- qt(1 - alpha/2, df = nA-1)
error_marginA <- t_valueA * sdA / sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 71.80184 78.19816

Kelas B

nB <- 40
meanB <- 75
sdB <- 20
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 68.60369 81.39631

Interpretasi:

Kelas A memiliki interval kepercayaan (71.784, 78.216).

Kelas B memiliki interval kepercayaan (68.568, 81.432).

Variabilitas data yang lebih tinggi menghasilkan selang kepercayaan yang lebih lebar, menunjukkan estimasi yang kurang presisi.

Studi Kasus 3: Pengaruh Tingkat Kepercayaanterhadap Selang Kepercayaan

Situasi:

Sebuah perusahaan ingin mengestimasi rata-rata jumlah produk yang terjual per hari dengan dua tingkat kepercayaan yang berbeda.

Data:

Sampel: 50 hari, rata-rata penjualan = 100 produk, standar deviasi = 15 produk

Tingkat kepercayaan: 90% dan 99%

Tugas:

Hitung interval kepercayaan untuk kedua tingkat kepercayaan.

Bandingkan lebar interval kepercayaan dari kedua tingkat kepercayaan.

Jelaskan bagaimana tingkat kepercayaan mempengaruhi selang kepercayaan.

Tingkat Kepercayaan 90%

alpha90 <- 0.10
t_value90 <- qt(1 - alpha90/2, df = 49)
error_margin90 <- t_value90 * 15 / sqrt(50)
interval90 <- c(100 - error_margin90, 100 + error_margin90)
interval90
## [1]  96.4435 103.5565

Tingkat Kepercayaan 99%

alpha99 <- 0.01
t_value99 <- qt(1 - alpha99/2, df = 49)
error_margin99 <- t_value99 * 15 / sqrt(50)
interval99 <- c(100 - error_margin99, 100 + error_margin99)
interval99
## [1]  94.31496 105.68504

Interpretasi:

Interval kepercayaan 90% adalah (96.464, 103.536).

Interval kepercayaan 99% adalah (94.394, 105.606).

Tingkat kepercayaan yang lebih tinggi menghasilkan selang kepercayaan yang lebih lebar, menunjukkan rentang yang lebih luas untuk mencakup parameter populasi dengan keyakinan yang lebih tinggi.

#Studi Kasus 4: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Diketahui)

Situasi:

Sebuah universitas ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas teknik. Berdasarkan datahistoris, standar deviasi tinggi badan populasi mahasiswa teknik adalah 5 cm. Sebuah sampel acak dari 36mahasiswa diambil, dan rata-rata tinggi badan sampel adalah 170 cm.

Tugas:

  1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa.
  2. Interpretasikan hasilnya.

Penyelesaian:

Karena standar deviasi populasi diketahui, kita menggunakan distribusi z.

mean_tinggi <- 170 # dalam cm
sd_tinggi <- 5 # dalam cm (diketahui)
n <- 36
alpha <- 0.05
# Menghitung nilai z untuk tingkat kepercayaan 95%
z_value <- qnorm(1 - alpha/2)
# Menghitung margin of error
error_margin <- z_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.3667 171.6333
## [1] 168.3667 171.6333
## [1] 168.3667 171.6333

Interpretasi:

Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa teknik adalah (168.37 cm, 171.63 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa teknik di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi diketahui, estimasi ini lebih presisi.

Studi Kasus 5: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Tidak Diketahui)

Situasi:

Universitas yang sama ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas seni. Namun, standardeviasi populasi tidak diketahui. Sebuah sampel acak dari 25 mahasiswa diambil, dan hasilnya adalah sebagai berikut (dalam cm):

tinggi_badan <- c(165, 168, 170, 172, 169, 167, 171, 166, 173, 174, 170, 168, 169, 167, 172, 171, 170, 169, 168, 173, 172, 170, 169, 167, 171)

Tugas:

  1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa.
  2. Interpretasikan hasilnya.

Penyelesaian:

Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t.

mean_tinggi <- mean(tinggi_badan)
sd_tinggi <- sd(tinggi_badan)
n <- length(tinggi_badan)
alpha <- 0.05
# Menghitung nilai t untuk tingkat kepercayaan 95% dan df = n-1
t_value <- qt(1 - alpha/2, df = n-1)
# Menghitung margin of error
error_margin <- t_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)

Interpretasi:

Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa seni adalah (168.67 cm, 170.73 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa seni di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t, yangmenghasilkan interval yang sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui.

Perbandingan Kasus 4 dan 5: Standar Deviasi Diketahui vsTidak Diketahui

  1. Presisi Estimasi: Ketika standar deviasi populasi diketahui (Kasus 4), interval kepercayaan lebih sempit (168.37 cm,171.63 cm) karena kita memiliki informasi tambahan tentang variabilitas populasi. Ketika standar deviasi populasi tidak diketahui (Kasus 5), interval kepercayaan sedikit lebih lebar (168.67 cm, 170.73 cm) karena kita harus mengestimasi variabilitas dari sampel, yang menambahketidakpastian.

  2. Distribusi yang Digunakan: Standar deviasi diketahui: Distribusi z (normal). Standar deviasi tidak diketahui: Distribusi t (Student’s t).

  3. Ukuran Sampel: Pada Kasus 4, ukuran sampel lebih besar (36 vs 25), yang juga berkontribusi pada interval yang lebihsempit. Pada Kasus 5, ukuran sampel lebih kecil, sehingga interval kepercayaan lebih lebar.

Faktor yang Mempengaruhi Selang KepercayaanBeberapa faktor yang dapat mempengaruhi lebar selang kepercayaan antara lain:

  1. Ukuran Sampel: Semakin besar ukuran sampel, semakin sempit selang kepercayaan, karena semakinbanyak informasi yang tersedia untuk mengestimasi parameter populasi.

  2. Variabilitas Data: Semakin besar variabilitas data (standar deviasi), semakin lebar selang kepercayaan. Halini karena data yang lebih variabel memerlukan rentang yang lebih luas untuk mencakup parameter populasi.3. Tingkat Kepercayaan: Tingkat kepercayaan yang lebih tinggi menghasilkan selang kepercayaan yang lebihlebar, karena kita memerlukan rentang yang lebih luas untuk meningkatkan keyakinan bahwa parameterpopulasi tercakup.

  3. Tingkat Kepercayaan: Tingkat kepercayaan yang lebih tinggi menghasilkan selang kepercayaan yang lebihlebar, karena kita memerlukan rentang yang lebih luas untuk meningkatkan keyakinan bahwa parameterpopulasi tercakup.

Kesimpulan Estimasi dalam dan selang kepercayaan adalah konsep penting dalam statistika yang memungkinkan kitauntuk membuat inferensi tentang parameter populasi berdasarkan data sampel. Dengan memahami danmenghitung selang kepercayaan, kita dapat membuat estimasi yang lebih akurat dan dapat diandalkan untukpengambilan keputusan.

Tugas

Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), danpengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan95%, dengan informasi setiap faktor dan level sebagai berikut: - Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100 - Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90 - Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s) Interpretasikan hasilnya..

set.seed(42) 

sample_sizes <- c(5, 30, 100)
std_devs <- c(10, 50, 90)
known_sigma <- c(TRUE, FALSE)  

Konstanta

alpha <- 0.05  
mu <- 50  
results <- data.frame(Ukuran_Sampel = integer(), Standar_Deviasi = numeric(),
                      Pengetahuan_Sigma = character(), Lebar_CI = numeric())

Simulasi

Lebar interval kepercayaan

Simpan hasil ke dalam data frame

for (n in sample_sizes) {
  for (sigma in std_devs) {
    for (sigma_known in known_sigma) {
      
      # Simulasi data
      sample <- rnorm(n, mean = mu, sd = sigma)
      x_bar <- mean(sample)
      s <- sd(sample) 
      
      if (sigma_known) {

        z_value <- qnorm(1 - alpha/2)
        margin_of_error <- z_value * (sigma / sqrt(n))
      } else {

        t_value <- qt(1 - alpha/2, df = n-1)
        margin_of_error <- t_value * (s / sqrt(n))
      }
      
      
      ci_width <- 2 * margin_of_error
      
    
      results <- rbind(results, data.frame(Ukuran_Sampel = n, Standar_Deviasi = sigma,
                                           Pengetahuan_Sigma = ifelse(sigma_known, "Diketahui", "Tidak Diketahui"),
                                           Lebar_CI = ci_width))
    }
  }
}
print(results)
##    Ukuran_Sampel Standar_Deviasi Pengetahuan_Sigma   Lebar_CI
## 1              5              10         Diketahui  17.530451
## 2              5              10   Tidak Diketahui  25.594404
## 3              5              50         Diketahui  87.652254
## 4              5              50   Tidak Diketahui 222.932190
## 5              5              90         Diketahui 157.774057
## 6              5              90   Tidak Diketahui 180.097401
## 7             30              10         Diketahui   7.156777
## 8             30              10   Tidak Diketahui   5.849313
## 9             30              50         Diketahui  35.783883
## 10            30              50   Tidak Diketahui  31.576894
## 11            30              90         Diketahui  64.410989
## 12            30              90   Tidak Diketahui  66.886810
## 13           100              10         Diketahui   3.919928
## 14           100              10   Tidak Diketahui   3.618628
## 15           100              50         Diketahui  19.599640
## 16           100              50   Tidak Diketahui  21.605575
## 17           100              90         Diketahui  35.279352
## 18           100              90   Tidak Diketahui  31.821928

Dari hasil simulasi, saya mendapatkan bahwa ukuran sampel berpengaruh signifikan terhadap lebar interval kepercayaan (CI). Semakin besar ukuran sampel, semakin sempit interval kepercayaan, yang berarti estimasi rata-rata semakin akurat. Misalnya, pada standar deviasi 50, ketika jumlah sampel meningkat dari 5 menjadi 100, lebar interval kepercayaan berkurang dari 87.65 menjadi 19.60 (untuk standar deviasi populasi diketahui). Hal ini menunjukkan bahwa semakin banyak data yang digunakan, semakin kecil ketidakpastian dalam estimasi rata-rata.

Selain itu, saya mendapatkan bahwa variabilitas data juga memengaruhi lebar interval kepercayaan. Semakin besar standar deviasi, semakin lebar CI karena meningkatnya ketidakpastian dalam estimasi rata-rata. Sebagai contoh, untuk ukuran sampel 30, ketika standar deviasi meningkat dari 10 menjadi 90, lebar interval kepercayaan bertambah dari 7.16 menjadi 64.41 (untuk standar deviasi populasi diketahui). Ini menunjukkan bahwa semakin besar variasi dalam data, semakin besar ketidakpastian dalam estimasi rata-rata, sehingga interval kepercayaan menjadi lebih lebar.

Saya juga mendapatkan bahwa pengetahuan tentang standar deviasi populasi memengaruhi hasil estimasi interval kepercayaan. Jika standar deviasi populasi diketahui, interval kepercayaan lebih sempit dibandingkan jika harus diestimasi dari sampel. Sebagai contoh, untuk ukuran sampel 5 dan standar deviasi 10, jika standar deviasi populasi diketahui, CI adalah 17.53, sedangkan jika tidak diketahui, CI menjadi 25.59. Hal ini terjadi karena ketika standar deviasi tidak diketahui, saya harus menggunakan distribusi t yang memiliki ekor lebih tebal dibandingkan distribusi normal, sehingga ketidakpastian dalam estimasi meningkat.

Berdasarkan hasil simulasi ini, saya mendapatkan bahwa untuk memperoleh estimasi rata-rata yang lebih akurat dengan interval kepercayaan yang lebih sempit, saya perlu menggunakan sampel yang lebih besar, mengurangi variabilitas data jika memungkinkan, dan sebisa mungkin mengetahui standar deviasi populasi. Dengan cara ini, estimasi rata-rata menjadi lebih stabil, dan ketidakpastian dalam pengambilan keputusan dapat dikurangi.