Studi Kasus 1: Pengaruh Ukuran Sampel terhadapSelang Kepercayaan

Situasi: Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dihabiskan oleh pelanggan di situs web mereka.Mereka melakukan dua survei dengan ukuran sampel yang berbeda.

Data: Survei 1: 30 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit Survei 2: 100 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit

Tugas: 1. Hitung interval kepercayaan 95% untuk kedua survei. 2. Bandingkan lebar interval kepercayaan dari kedua survei. 3. Jelaskan bagaimana ukuran sampel mempengaruhi selang kepercayaan.

# Survei 1
n1 <- 30
mean1 <- 5
sd1 <- 2
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 4.253188 5.746812
# Survei 2
n2 <- 100
mean2 <- 5
sd2 <- 2
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2 / sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 4.603157 5.396843

Interpretasi: - Survei 1 memiliki interval kepercayaan (4.252, 5.748) menit. - Survei 2 memiliki interval kepercayaan (4.602, 5.398) menit. - Ukuran sampel yang lebih besar (100 vs 30) menghasilkan selang kepercayaan yang lebih sempit,menunjukkan estimasi yang lebih presisi.

Studi Kasus 2: Pengaruh Variabilitas Data terhadap Selang Kepercayaan

Situasi: Sebuah sekolah ingin mengestimasi rata-rata nilai ujian matematika siswa. Mereka memiliki dua kelas denganvariabilitas nilai yang berbeda.

Data: - Kelas A: 40 siswa, rata-rata nilai = 75, standar deviasi = 10 - Kelas B: 40 siswa, rata-rata nilai = 75, standar deviasi = 20

Tugas: 1. Hitung interval kepercayaan 95% untuk kedua kelas. 2. Bandingkan lebar interval kepercayaan dari kedua kelas. 3. Jelaskan bagaimana variabilitas data mempengaruhi selang kepercayaan

# Kelas A
nA <- 40
meanA <- 75
sdA <- 10
alpha <- 0.05
t_valueA <- qt(1 - alpha/2, df = nA-1)
error_marginA <- t_valueA * sdA / sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 71.80184 78.19816
# Kelas B
nB <- 40
meanB <- 75
sdB <- 20
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 68.60369 81.39631

Interpretasi: - Kelas A memiliki interval kepercayaan (71.784, 78.216). - Kelas B memiliki interval kepercayaan (68.568, 81.432). - Variabilitas data yang lebih tinggi (standar deviasi 20 vs 10) menghasilkan selang kepercayaan yanglebih lebar, menunjukkan estimasi yang kurang presisi.

Studi Kasus 3: Pengaruh Tingkat Kepercayaan terhadap Selang Kepercayaan

Situasi: Sebuah perusahaan ingin mengestimasi rata-rata jumlah produk yang terjual per hari. Mereka menggunakandua tingkat kepercayaan yang berbeda.

Data: - Sampel: 50 hari, rata-rata penjualan = 100 produk, standar deviasi = 15 produk - Tingkat kepercayaan: 90% dan 99%

Tugas: 1. Hitung interval kepercayaan untuk kedua tingkat kepercayaan. 2. Bandingkan lebar interval kepercayaan dari kedua tingkat kepercayaan. 3. Jelaskan bagaimana tingkat kepercayaan mempengaruhi selang kepercayaan.

# Tingkat Kepercayaan 90%
alpha90 <- 0.10
t_value90 <- qt(1 - alpha90/2, df = 49)
error_margin90 <- t_value90 * 15 / sqrt(50)
interval90 <- c(100 - error_margin90, 100 + error_margin90)
interval90
## [1]  96.4435 103.5565
# Tingkat Kepercayaan 99%
alpha99 <- 0.01
t_value99 <- qt(1 - alpha99/2, df = 49)
error_margin99 <- t_value99 * 15 / sqrt(50)
interval99 <- c(100 - error_margin99, 100 + error_margin99)
interval99
## [1]  94.31496 105.68504

Interpretasi: - Interval kepercayaan 90% adalah (96.464, 103.536). - Interval kepercayaan 99% adalah (94.394, 105.606). - Tingkat kepercayaan yang lebih tinggi (99% vs 90%) menghasilkan selang kepercayaan yang lebihlebar, menunjukkan rentang yang lebih luas untuk mencakup parameter populasi dengan keyakinanyang lebih tinggi.

Studi Kasus 4: Estimasi Rata-Rata Tinggi Badan Mahasiswa (Standar Deviasi Diketahui)

Situasi: Sebuah universitas ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas teknik. Berdasarkan datahistoris, standar deviasi tinggi badan populasi mahasiswa teknik adalah 5 cm. Sebuah sampel acak dari 36mahasiswa diambil, dan rata-rata tinggi badan sampel adalah 170 cm.

Tugas: 1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa. 2. Interpretasikan hasilnya.

Penyelesaian: Karena standar deviasi populasi diketahui, kita menggunakan distribusi z.

mean_tinggi <- 170 # dalam cm
sd_tinggi <- 5 # dalam cm (diketahui)
n <- 36
alpha <- 0.05
# Menghitung nilai z untuk tingkat kepercayaan 95%
z_value <- qnorm(1 - alpha/2)
z_value
## [1] 1.959964
# Menghitung margin of error
error_margin <- z_value * sd_tinggi / sqrt(n)
error_margin
## [1] 1.633303
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.3667 171.6333

Interpretasi: Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa teknik adalah (168.37 cm, 171.63 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa teknik di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi diketahui, estimasi ini lebih presisi.

Studi Kasus 5: Estimasi Rata-Rata Tinggi Badan Mahasiswa (Standar Deviasi Tidak Diketahui)

Situasi: Universitas yang sama ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas seni. Namun, standardeviasi populasi tidak diketahui. Sebuah sampel acak dari 25 mahasiswa diambil, dan hasilnya adalah sebagai berikut (dalam cm)

tinggi_badan <- c(165, 168, 170, 172, 169, 167, 171, 166, 173, 174, 170, 168, 169, 167, 172, 171, 170, 169, 168, 173, 172, 170, 169, 167, 171)

Tugas: 1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa. 2. Interpretasikan hasilnya.

Penyelesaian: Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t.

mean_tinggi <- mean(tinggi_badan)
sd_tinggi <- sd(tinggi_badan)
n <- length(tinggi_badan)
alpha <- 0.05
# Menghitung nilai t untuk tingkat kepercayaan 95% dan df = n-1
t_value <- qt(1 - alpha/2, df = n-1)
# Menghitung margin of error
error_margin <- t_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.6802 170.5998

Interpretasi: Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa seni adalah (168.67 cm, 170.73 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa seni di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t, yang menghasilkan interval yang sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui.

Tugas

Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), dan pengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan 95%, dengan informasi setiap faktor dan level sebagai berikut:

- Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100

- Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90

- Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s) Interpretasikan hasilnya..

set.seed(123) # Untuk replikasi

# Kombinasi faktor
sample_sizes <- c(5, 30, 100)
std_devs <- c(10, 50, 90)
pop_sd_known <- c(TRUE, FALSE) # TRUE jika σ diketahui, FALSE jika tidak

# Simulasi
results <- expand.grid(n = sample_sizes, sd = std_devs, known = pop_sd_known)
results$ci_width <- NA # Menyimpan hasil lebar interval kepercayaan

for (i in 1:nrow(results)) {
  n <- results$n[i]
  sd <- results$sd[i]
  known <- results$known[i]
  
  # Generate data
  data <- rnorm(n, mean = 50, sd = sd)
  x_bar <- mean(data)
  
  # Interval kepercayaan
  alpha <- 0.05
  if (known) {
    # Jika σ diketahui (Distribusi Normal)
    z_score <- qnorm(1 - alpha/2)
    margin_error <- z_score * (sd / sqrt(n))
  } else {
    # Jika σ tidak diketahui (Distribusi t-Student)
    t_score <- qt(1 - alpha/2, df = n - 1)
    sample_sd <- sd(data)
    margin_error <- t_score * (sample_sd / sqrt(n))
  }
  
  # Lebar interval kepercayaan
  results$ci_width[i] <- 2 * margin_error
}

# Analisis hasil
print(results)
##      n sd known   ci_width
## 1    5 10  TRUE  17.530451
## 2   30 10  TRUE   7.156777
## 3  100 10  TRUE   3.919928
## 4    5 50  TRUE  87.652254
## 5   30 50  TRUE  35.783883
## 6  100 50  TRUE  19.599640
## 7    5 90  TRUE 157.774057
## 8   30 90  TRUE  64.410989
## 9  100 90  TRUE  35.279352
## 10   5 10 FALSE  22.476857
## 11  30 10 FALSE   8.222457
## 12 100 10 FALSE   3.635033
## 13   5 50 FALSE 106.581970
## 14  30 50 FALSE  36.355118
## 15 100 50 FALSE  20.327684
## 16   5 90 FALSE 110.585449
## 17  30 90 FALSE  67.362310
## 18 100 90 FALSE  35.749291
# Visualisasi
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.2
ggplot(results, aes(x = factor(n), y = ci_width, fill = factor(known))) +
  geom_bar(stat = "identity", position = "dodge") +
  facet_wrap(~ sd, scales = "free_y") +
  labs(title = "Pengaruh Faktor terhadap Lebar Interval Kepercayaan",
       x = "Ukuran Sampel (n)", y = "Lebar Interval Kepercayaan",
       fill = "Standar Deviasi Populasi Diketahui") +
  theme_minimal()

Interpretasi Hasil:

  1. Ukuran Sampel (n) Meningkat → Interval Semakin Sempit Dengan n kecil (misal 5), interval lebar karena estimasi kurang presisi. Dengan n besar (misal 100), interval lebih sempit karena lebih banyak data yang mewakili populasi.

  2. Variabilitas Data \(\sigma\) Meningkat → Interval Lebih Lebar Jika standar deviasi lebih besar (misal 90), data lebih tersebar → interval lebih besar. Jika standar deviasi kecil (misal 10), data lebih terkonsentrasi → interval lebih kecil.

  3. Mengetahui Standar Deviasi Populasi \(\sigma\) Memperkecil Interval Jika σ diketahui, margin of error lebih kecil karena menggunakan distribusi normal. Jika σ tidak diketahui, estimasi menggunakan distribusi t-Student yang lebih konservatif (interval lebih lebar).