Ketidak Pastian Estimasi

Estimasi Interval

berdasarkan data sampel. Estimasi ini memberikan informasi tentang tingkat kepercayaan terhadap parametertersebut. Selang kepercayaan (confidence interval) adalah rentang nilai yang digunakan untuk mengestimasi parameterpopulasi dengan tingkat kepercayaan tertentu. Selang ini memberikan informasi mengenai seberapa percayadiri kita bahwa parameter populasi berada dalam rentang yang telah ditentukan.

Komponen Selang Kepercayaan

Selang kepercayaan dibentuk oleh tiga komponen utama: 1. Nilai Estimasi (Point Estimate): Ini adalah nilai tengah dari sampel yang digunakan untuk mengestimasi parameter populasi. Contoh umum adalah rata-rata sampel. 2. Tingkat Kepercayaan (Confidence Level): Tingkat kepercayaan adalah probabilitas bahwa selangkepercayaan yang dihitung mencakup parameter populasi yang sebenarnya. Tingkat kepercayaan yang umumdigunakan adalah 90%, 95%, dan 99%. 3. Margin of Error: Margin of error adalah nilai yang ditambahkan dan dikurangi dari nilai estimasi untukmembentuk selang kepercayaan. Besarnya margin of error bergantung pada variabilitas data dan ukuransampel. ### Studi Kasus 1 Pengaruh Ukuran Sampel terhadapSelang Kepercayaan # Data Survei 1: 30 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit Survei 2: 100 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit

Tugas

  1. Hitung interval kepercayaan 95% untuk kedua survei.
  2. Bandingkan lebar interval kepercayaan dari kedua survei.
  3. Jelaskan bagaimana ukuran sampel mempengaruhi selang kepercayaan
# Survei 1
n1 <- 30
mean1 <- 5
sd1 <- 2
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 4.253188 5.746812
# Survei 2
n2 <- 100
mean2 <- 5
sd2 <- 2
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2 / sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 4.603157 5.396843

Interpretasi

Data

Kelas A: 40 siswa, rata-rata nilai = 75, standar deviasi = 10 Kelas B: 40 siswa, rata-rata nilai = 75, standar deviasi = 20

Tugas

  1. Hitung interval kepercayaan 95% untuk kedua kelas.
  2. Bandingkan lebar interval kepercayaan dari kedua kelas.
  3. Jelaskan bagaimana variabilitas data mempengaruhi selang kepercayaan.
# Kelas A
nA <- 40
meanA <- 75
sdA <- 10
alpha <- 0.05
t_valueA <- qt(1 - alpha/2, df = nA-1)
error_marginA <- t_valueA * sdA / sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 71.80184 78.19816
# Kelas B
nB <- 40
meanB <- 75
sdB <- 20
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 68.60369 81.39631

Interpretasi

Studi Kasus 3: Pengaruh Tingkat Kepercayaanterhadap Selang Kepercayaan

#Data Sampel: 50 hari, rata-rata penjualan = 100 produk, standar deviasi = 15 produk Tingkat kepercayaan: 90% dan 99%

Tugas

  1. Hitung interval kepercayaan untuk kedua tingkat kepercayaan.
  2. Bandingkan lebar interval kepercayaan dari kedua tingkat kepercayaan.
  3. Jelaskan bagaimana tingkat kepercayaan mempengaruhi selang kepercayaan.
# Tingkat Kepercayaan 90%
alpha90 <- 0.10
t_value90 <- qt(1 - alpha90/2, df = 49)
error_margin90 <- t_value90 * 15 / sqrt(50)
interval90 <- c(100 - error_margin90, 100 + error_margin90)
interval90
## [1]  96.4435 103.5565
# Tingkat Kepercayaan 99%
alpha99 <- 0.01
t_value99 <- qt(1 - alpha99/2, df = 49)
error_margin99 <- t_value99 * 15 / sqrt(50)
interval99 <- c(100 - error_margin99, 100 + error_margin99)
interval99
## [1]  94.31496 105.68504

Interpretasi

Studi Kasus 4: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Diketahui)

Situasi

Sebuah universitas ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas teknik. Berdasarkan datahistoris, standar deviasi tinggi badan populasi mahasiswa teknik adalah 5 cm. Sebuah sampel acak dari 36mahasiswa diambil, dan rata-rata tinggi badan sampel adalah 170 cm.

Tugas

  1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa.
  2. Interpretasikan hasilnya.
mean_tinggi <- 170 # dalam cm
sd_tinggi <- 5 # dalam cm (diketahui)
n <- 36
alpha <- 0.05
# Menghitung nilai z untuk tingkat kepercayaan 95%
z_value <- qnorm(1 - alpha/2)
# Menghitung margin of error
error_margin <- z_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.3667 171.6333

Studi Kasus 5: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Tidak Diketahui)

Situasi

Universitas yang sama ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas seni. Namun, standardeviasi populasi tidak diketahui. Sebuah sampel acak dari 25 mahasiswa diambil, dan hasilnya adalah sebagai berikut (dalam cm):

tinggi_badan <- c(165, 168, 170, 172, 169, 167, 171, 166, 173, 174, 170, 168, 169, 167, 172, 171, 170, 169, 168, 173, 172, 170, 169, 167, 171)

Tugas

  1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa.
  2. Interpretasikan hasilnya.
mean_tinggi <- mean(tinggi_badan)
sd_tinggi <- sd(tinggi_badan)
n <- length(tinggi_badan)
alpha <- 0.05
# Menghitung nilai t untuk tingkat kepercayaan 95% dan df = n-1
t_value <- qt(1 - alpha/2, df = n-1)
# Menghitung margin of error
error_margin <- t_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.6802 170.5998

Interpretasi

Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa seni adalah (168.67 cm, 170.73 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa seni di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t, yangmenghasilkan interval yang sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui.

Tugas

# Load library
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

# Parameter simulasi
set.seed(123) # Agar hasil dapat direproduksi
n_values <- c(5, 30, 100) # Ukuran sampel
sd_values <- c(10, 50, 90) # Standar deviasi
n_simulations <- 1000 # Banyak simulasi per kombinasi

# Fungsi untuk menghitung interval kepercayaan
calculate_ci <- function(n, sd, sigma_known = TRUE) {
  sample_means <- numeric(n_simulations)
  ci_widths <- numeric(n_simulations)
  
  for (i in 1:n_simulations) {
    sample_data <- rnorm(n, mean = 100, sd = sd)  # Data dari distribusi normal
    
    sample_mean <- mean(sample_data)
    
    if (sigma_known) {
      # Interval Kepercayaan dengan σ diketahui (Distribusi Normal)
      se <- sd / sqrt(n)
      margin_error <- qnorm(0.975) * se
    } else {
      # Interval Kepercayaan dengan σ tidak diketahui (Distribusi t-Student)
      se <- sd(sample_data) / sqrt(n)
      margin_error <- qt(0.975, df = n - 1) * se
    }
    
    ci_widths[i] <- 2 * margin_error # Lebar interval kepercayaan
  }
  
  mean(ci_widths) # Rata-rata lebar interval kepercayaan
}

# Simulasi untuk semua kombinasi faktor
results <- expand.grid(n = n_values, sd = sd_values, sigma_known = c(TRUE, FALSE)) %>%
  rowwise() %>%
  mutate(ci_width = calculate_ci(n, sd, sigma_known))

# Konversi ke data frame
results <- as.data.frame(results)

# Tampilkan hasil simulasi
print(results)
##      n sd sigma_known   ci_width
## 1    5 10        TRUE  17.530451
## 2   30 10        TRUE   7.156777
## 3  100 10        TRUE   3.919928
## 4    5 50        TRUE  87.652254
## 5   30 50        TRUE  35.783883
## 6  100 50        TRUE  19.599640
## 7    5 90        TRUE 157.774057
## 8   30 90        TRUE  64.410989
## 9  100 90        TRUE  35.279352
## 10   5 10       FALSE  23.332429
## 11  30 10       FALSE   7.323474
## 12 100 10       FALSE   3.970122
## 13   5 50       FALSE 117.302369
## 14  30 50       FALSE  36.812695
## 15 100 50       FALSE  19.801041
## 16   5 90       FALSE 203.828614
## 17  30 90       FALSE  66.636436
## 18 100 90       FALSE  35.657132
# Grafik hasil simulasi
ggplot(results, aes(x = factor(n), y = ci_width, fill = factor(sd))) +
  geom_bar(stat = "identity", position = "dodge") +
  facet_wrap(~ sigma_known, labeller = labeller(sigma_known = c("TRUE" = "σ Diketahui", "FALSE" = "σ Tidak Diketahui"))) +
  labs(title = "Pengaruh Ukuran Sampel, Variabilitas, dan Pengetahuan SD terhadap Lebar Interval Kepercayaan",
       x = "Ukuran Sampel (n)",
       y = "Lebar Interval Kepercayaan",
       fill = "Standar Deviasi (σ)") +
  theme_minimal()