Studi Kasus 1: Pengaruh Ukuran Sampel terhadap Selang Kepercayaan

# Survei 1
 n1 <- 30
 mean1 <- 5
 sd1 <- 2
 alpha <- 0.05
 t_value1 <- qt(1 - alpha/2, df = n1-1)
 error_margin1 <- t_value1 * sd1 / sqrt(n1)
 interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
 interval1
## [1] 4.253188 5.746812
 # Survei 2
 n2 <- 100
 mean2 <- 5
 sd2 <- 2
 t_value2 <- qt(1 - alpha/2, df = n2-1)
 error_margin2 <- t_value2 * sd2 / sqrt(n2)
 interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
 interval2
## [1] 4.603157 5.396843

Interpretasi: Survei 1 memiliki interval kepercayaan (4.252, 5.748) menit. Survei 2 memiliki interval kepercayaan (4.602, 5.398) menit. Ukuran sampel yang lebih besar (100 vs 30) menghasilkan selang kepercayaan yang lebih sempit, menunjukkan estimasi yang lebih presisi.

Studi Kasus 2: Pengaruh Variabilitas Data terhadap Selang Kepercayaan

# Kelas A
 nA <- 40
 meanA <- 75
 sdA <- 10
 alpha <- 0.05
 t_valueA <- qt(1 - alpha/2, df = nA-1)
 error_marginA <- t_valueA * sdA / sqrt(nA)
 intervalA <- c(meanA - error_marginA, meanA + error_marginA)
 intervalA
## [1] 71.80184 78.19816
# Kelas B
 nB <- 40
 meanB <- 75
 sdB <- 20
 t_valueB <- qt(1 - alpha/2, df = nB-1)
 error_marginB <- t_valueB * sdB / sqrt(nB)
 intervalB <- c(meanB - error_marginB, meanB + error_marginB)
 intervalB
## [1] 68.60369 81.39631

Interpretasi: Kelas A memiliki interval kepercayaan (71.784, 78.216). Kelas B memiliki interval kepercayaan (68.568, 81.432). Variabilitas data yang lebih tinggi (standar deviasi 20 vs 10) menghasilkan selang kepercayaan yang lebih lebar, menunjukkan estimasi yang kurang presisi.

Studi Kasus 3: Pengaruh Tingkat Kepercayaan terhadap Selang Kepercayaan

# Tingkat Kepercayaan 90%
 alpha90 <- 0.10
 t_value90 <- qt(1 - alpha90/2, df = 49)
 error_margin90 <- t_value90 * 15 / sqrt(50)
 interval90 <- c(100 - error_margin90, 100 + error_margin90)
 interval90
## [1]  96.4435 103.5565
# Tingkat Kepercayaan 99%
 alpha99 <- 0.01
 t_value99 <- qt(1 - alpha99/2, df = 49)
 error_margin99 <- t_value99 * 15 / sqrt(50)
 interval99 <- c(100 - error_margin99, 100 + error_margin99)
 interval99
## [1]  94.31496 105.68504

Interpretasi: Interval kepercayaan 90% adalah (96.464, 103.536). Interval kepercayaan 99% adalah (94.394, 105.606). Tingkat kepercayaan yang lebih tinggi (99% vs 90%) menghasilkan selang kepercayaan yang lebih lebar, menunjukkan rentang yang lebih luas untuk mencakup parameter populasi dengan keyakinan yang lebih tinggi.

Studi Kasus 4: Estimasi Rata-Rata Tinggi Badan Mahasiswa (Standar Deviasi Diketahui)

mean_tinggi <- 170 # dalam cm
 sd_tinggi <- 5
 # dalam cm (diketahui)
 n <- 36
 alpha <- 0.05
 # Menghitung nilai z untuk tingkat kepercayaan 95%
 z_value <- qnorm(1 - alpha/2)
 # Menghitung margin of error
 error_margin <- z_value * sd_tinggi / sqrt(n)
 # Menghitung interval kepercayaan
 interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
 interval
## [1] 168.3667 171.6333

Interpretasi: Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa teknik adalah (168.37 cm, 171.63 cm). Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa teknik di universitas tersebut berada dalam rentang ini. Karena standar deviasi populasi diketahui, estimasi ini lebih presisi.

Studi Kasus 5: Estimasi Rata-Rata Tinggi Badan Mahasiswa (Standar Deviasi Tidak Diketahui)

tinggi_badan <- c(165, 168, 170, 172, 169, 167, 171, 166, 173, 174, 170, 168, 169, 167, 172, 
171, 170, 169, 168, 173, 172, 170, 169, 167, 171)

#Tugas: 1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa. 2. Interpretasikan hasilnya

Penyelesaian: Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t.

mean_tinggi <- mean(tinggi_badan)
 sd_tinggi <- sd(tinggi_badan)
 n <- length(tinggi_badan)
 alpha <- 0.05
 # Menghitung nilai t untuk tingkat kepercayaan 95% dan df = n-1
 t_value <- qt(1 - alpha/2, df = n-1)
 # Menghitung margin of error
 error_margin <- t_value * sd_tinggi / sqrt(n)
 # Menghitung interval kepercayaan
 interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
 interval
## [1] 168.6802 170.5998

Interpretasi: Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa seni adalah (168.67 cm, 170.73 cm). Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa seni di universitas tersebut berada dalam rentang ini. Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t, yang menghasilkan interval yang sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui.

Perbandingan Kasus 4 dan 5: Standar Deviasi Diketahui vs Tidak Diketahui

1.Presisi Estimasi: - Ketika standar deviasi populasi diketahui (Kasus 4), interval kepercayaan lebih sempit (168.37 cm, 171.63 cm) karena kita memiliki informasi tambahan tentang variabilitas populasi. - Ketika standar deviasi populasi tidak diketahui (Kasus 5), interval kepercayaan sedikit lebih lebar (168.67 cm, 170.73 cm) karena kita harus mengestimasi variabilitas dari sampel, yang menambah ketidakpastian.

2.Distribusi yang Digunakan: - Standar deviasi diketahui: Distribusi z (normal). - Standar deviasi tidak diketahui: Distribusi t (Student’s t).

3.Ukuran Sampel: - Pada Kasus 4, ukuran sampel lebih besar (36 vs 25), yang juga berkontribusi pada interval yang lebih sempit. - Pada Kasus 5, ukuran sampel lebih kecil, sehingga interval kepercayaan lebih lebar.

Tugas (Mandiri) Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100 Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90 Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s)

set.seed(123)

# Faktor 1: Ukuran Sampel (n)
n_values <- c(5, 30, 100)

# Faktor 2: Variabilitas Data (σ atau s)
sd_values <- c(10, 50, 90)

# Faktor 3: Pengetahuan Standar Deviasi Populasi (σ diketahui atau tidak diketahui)
known_sd <- c(TRUE, FALSE)

# Fungsi untuk menghitung lebar interval kepercayaan 95%
calculate_ci_width <- function(n, sd, known) {
  alpha <- 0.05
  if (known) {
    error <- qnorm(1 - alpha/2) * (sd / sqrt(n))
  } else {
    error <- qt(1 - alpha/2, df = n - 1) * (sd / sqrt(n))
  }
  return(2 * error) # Lebar interval kepercayaan = 2 * margin of error
}

# Simulasi
results <- expand.grid(n = n_values, sd = sd_values, known = known_sd)
results$ci_width <- mapply(calculate_ci_width, results$n, results$sd, results$known)
# Plot hasil
library(ggplot2)
ggplot(results, aes(x = factor(n), y = ci_width, fill = factor(known))) +
  geom_bar(stat = "identity", position = "dodge") +
  facet_wrap(~ sd, scales = "free_y") +
  labs(title = "Pengaruh Ukuran Sampel, Variabilitas, dan Pengetahuan SD terhadap Lebar CI",
       x = "Ukuran Sampel (n)",
       y = "Lebar Interval Kepercayaan",
       fill = "SD Populasi Diketahui") +
  theme_minimal()

Interpretasi Hasil: Pengaruh Ukuran Sampel (n): - Semakin besar ukuran sampel, lebar interval kepercayaan semakin kecil → karena ketidakpastian berkurang seiring dengan bertambahnya data.

Pengaruh Variabilitas Data (σ atau s): - Semakin besar variabilitas data, lebar interval kepercayaan semakin besar → karena ketidakpastian meningkat dengan meningkatnya variasi data.

Pengaruh Pengetahuan Standar Deviasi Populasi: - Jika standar deviasi diketahui → interval kepercayaan lebih sempit karena ketidakpastian lebih rendah. - Jika standar deviasi tidak diketahui → interval kepercayaan lebih lebar karena adanya ketidakpastian tambahan dari estimasi standar deviasi sampel.