Estimasi Interval

Estimasi dalam statistika adalah proses untuk menentukan rentang nilai yang mungkin dari parameter populasi berdasarkan data sampel. Estimasi ini memberikan informasi tentang kepercayaan terhadap parameter tersebut.

Selang kepercayaan (confidence interval) adalah rentang nilai yang digunakan untuk mengestimasi parameter populasi dengan tingkat kepercayaan tertentu. Selang ini memberikan informasi mengenai seberapa percaya diri kita bahwa parameter populasi berada dalam rentang yang telah ditentukan.

Komponen Selang Kepercayaan

Selang kepercayaan dibentuk oleh tiga komponen utama: 1. Nilai Estimasi (Point Estimate): Ini adalah nilai tengah dari sampel yang digunakan untuk mengestimasi parameter populasii. Contoh umum adalah rata-rata sampel. 2. Tingkat Kepercayaan (Confidence Level): Tingkat Kepercayaan adalah probabilitas bahwa selang kepercayaan dihitung mencakup parameter populasi yang sebenarnya. Tingkat kepercayaan yang umum digunakan adalah 90%, 95%, dan 99%. 3. Margin of Error: Margin of error adalah nilai yang ditambahkan dan dikurangi dari nilai estimasi untuk membentuk selang kepercayaan. Besarnya margin of error bergantung pada variabilitas data dan ukuran sampel.

Proses Perhitungan Selang Kepercayaan

Proses untuk menghitung selang kepercayaan adalah sebagai berikut: 1. Tentukan Nilai Estimasi: Tentukan nilai estimasi dari sampel, misalnya rata-rata sampel. 2. Pilih tingkat kepercayaan: Pilih tingkat kepercayaan yang sesuai, misalnya 95%. 3. Hitung Margin of Error: Margin of error dihitung dengan menggunakan distribusi z (jika standar deviasi populasi diketahui) atau distribusi t (jika standar deviasi populasi tidak diketahui). 4. Tentukan Selang Kepercayaan: Selang kepercayaan dperoleh dengan menambahkan dan mengurangi margin of error dari nilai estimasi.

Rumus Estimasi Interval

Untuk menghitung estimasi interval dari rata-rata populasi (\(µ\)) berdasarkan sampel, digunakan rumus berikut:

Rumus Margin of Error

jika standar deviasi populasi () diketahui, rumus margin of error (\(E\)) adalah \(E = Z_{\frac{\alpha}{2}} \times \frac{\sigma}{\sqrt{n}}\)

Jika standar deviasi populasi tidak diketahui dan kita menggunakan standar deviasi sampel (s), rumus margin of error adalah: \(E = t_{\frac{\alpha}{2}} \times \frac{s}{\sqrt{n}}\)

Dimana:

Interpretasi Selang Kepercayaan

Selang kepercayaan memberikan ingormasi tentang rentang di mana kita memperkirakan parameter populasi berada. Misalnya, selang kepercayaan 95% untuk rata-rata populasi berarti kita 95% yakin bahwa rata-rata populasi berada dalam rentang tersebut. perlu dicatat bahwa ini bukan berarti ada 95% kemungkinan bahwa rata-rata populasi ada dalam selang tertentu dari satu sampel melainkan bahwa jika kita mengambil banyak sampel, 95% dari selang kepercayaan yang dihitung dari sampel-sampel tersebut akan mencakup rata-rata populasi yang sebenarnya. Ini berarti bahwa dalam jangka panjang, jika kita mengulang pengambilan sampel dan menghitung selang kepercayaan masing-masing sampel tersebut, sekitar 95% dari selang-selang kepercayaan tersebut akan berisi nilai rata-rata populasi yang sebenarnya. Namun, ini juga berarti bahwa 5% dari selang kepercayaan yang dihitung mungkin tidak akan mencakup nilai rata-rata populasi yang sebenarnya.

Interpretasi Margin of Error

Margin of error adalah jarak dari nilai estimasi (misalnya, rata-rata sampel) ke batas atas atau bawah dari selang kepercayaan. Margin of error mencerminkan tingkat ketidakpastian yang kita miliki dalam estimasi. Semakin besar margin of error, semakin luas rentang estimasi kita, yang menunjukkan bahwa kita kurang yakin tentang perkiraan nilai rata-rata populasi. Sebaliknya, margin of error yang lebih keccil menunjukkan estimasi yang lebih presisi dan keyakinan yang lebih tinggi terhadap estimasi tersebut. Margin of error yang kecil biasanya dihasilkan dai ukuran sampel yang lebih besar atau dari data yang memiliki variabilitas rendah. Dengan margin of error yang kecil, selang kepercayaan menjadi lebih sempit, yang berarti estimasi rata-rata populasi lebih dekat dengan nilai yang sebenarnya. Oleh karena itu, memahami margin of error membantu dalam menilai keandalan dan akurasi hasil dari analisis statistik, serta dalam mengambil keputusan berdasarkan estimasi tersebut.

Studi Kasus 1: Pengaruh Ukuran Sampel terhadap Selang Kepercayaan

Situasi:

Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dihabiskan oleh pelanggan di situs web merka. Mereka melakukan dua survei dengan ukuran sampel yang berbeda.

Data:

  • Survei 1: 30 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit
  • Survei 2: 100 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit

Tugas:

  1. Hitung interval kepercayaan 95% untuk kedua survei.
  2. Bandingkan lebar interval kepercayaan dari kedua survei.
  3. Jelaskan bagaimana ukuran sampel mempengaruhi selang kepercayaan.
# Survei 1
n1 <- 30
mean1 <- 5
sd1 <- 2
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 4.253188 5.746812
# Survei 2
n2 <- 100
mean2 <- 5
sd2 <- 2
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2/sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 4.603157 5.396843

Interpretasi:

  • Survei 1 memiliki interval kepercayaan (4.252, 5.748).
  • Survei 2 memiliki interval kepercayaan (4.602, 5.398).
  • Ukuran sampel yang lebih besar (100 vs 30) menghasilkan selang kepercayaan yang lebih sempit menunjukkan estimasi yang lebih presisi.

Studi Kasus 2: Pengaruh Variabilitas Data terhadap Selang Kepercayaan

Situasi:

Sebuah sekolah ingin mengestimasi rata-rata nilai ujian matematika siswa. Mereka memiliki dua kelas dengan variabilitas nilai yang berbeda.

Data:

  • Kelas A: 40 siswa, rata-rata nilai = 75, standar deviasi = 10
  • Kelas B: 40 siswa, rata-rata nilai = 75, standar deviasi = 20

Tugas:

  1. Hitung interval kepercayaan 95% untuk kedua kelas.
  2. Bandingkan lebar interval kepercayaan dari kedua kelas.
  3. Jelaskan bagaimana variablitas data mempengaruhi selang kepercayaan.
# Kelas A
nA <- 40
meanA <- 75
sdA <- 10
alpha <- 0.05
t_valueA <-qt(1 - alpha/2, df = nA - 1)
error_marginA <- t_valueA * sdA /  sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 71.80184 78.19816
# Kelas B
nB <- 40
meanB <- 75
sdB <- 20
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 68.60369 81.39631

Interpretasi:

  • Kelas A memiliki interval kepercayaan (71.784, 78.216).
  • Kelas B memiliki interval kepercayaan (68.568, 81.432).
  • Variabilitas data yang lebih tinggi (standar deviasi 20 vs 10) menghasilkan selang kepercayaan yang lebih lebar, menunjukkan estimasi yang kurang presisi.

Studi Kasus 3: Pengaruh Tingkat kepercayaan terhadap Selang Kepercayaan

Situasi:

Sebuah perusahaan ingin mengestimasi rata-rata jumlah rata-rata jumlah produk yang terjual per hari. Mereka menggunakan dua tingkat kepercayaan yang berbeda.

Data:

  • Sampel: 50 hari, rata-rata penjualan = 100 produk, standar deviasi = 15 produk
  • Tingkat kepercayaan: 90% dan 99%

Tugas:

  1. Hitung interval kepercayaan untuk kedua tingkat kepercayaan.
  2. Bandingkan lebar interval kepercayaan dari kedua tingkat kepercayaan.
  3. Jelaskan bagaimana tingkat kepercayaan mempengaruhi selang keercayaan.
# Tingkat Kepercayaan 90%
alpha90 <- 0.10
t_value90 <- qt(1 - alpha90/2, df = 49)
error_margin90 <- t_value90 * 15 / sqrt(50)
interval90 <- c(100 - error_margin90, 100 + error_margin90)
interval90
## [1]  96.4435 103.5565
# Tingkat Kepercayaan 99%
alpha99 <- 0.01
t_value99 <- qt(1 - alpha99/2, df = 49)
error_margin99 <- t_value99 * 15 / sqrt(50)
interval99 <- c(100 - error_margin99, 100 + error_margin99)
interval99
## [1]  94.31496 105.68504

Interpretasi:

  • Interval kepercayaan 90% adalah (96.464, 103.536).
  • Interval kepercayaan 99% adalah (94.394, 105.606).
  • Tingkat kepercayaan yang lebih tinggi (99% vs 90%) menghasilkan selang kepercayaan yang lebihlebar, menunjukkan rentang yang lebih luas untuk mencakup parameter populasi dengan keyakinanyang lebih tinggi.

Studi Kasus 4: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Diketahui)

Situasi:

Sebuah universitas ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas teknik. Berdasarkan datahistoris, standar deviasi tinggi badan populasi mahasiswa teknik adalah 5 cm. Sebuah sampel acak dari 36mahasiswa diambil, dan rata-rata tinggi badan sampel adalah 170 cm.

Tugas:

  1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa.
  2. Interpretasikan hasilnya.

Penyelesaian:

Karena standar deviasi populasi diketahui, kita menggunakan distribusi z

mean_tinggi <- 170 # dalam cm
sd_tinggi <- 5 # dalam cm (diketahui)
n <- 36
alpha <- 0.05
# Menghitung nilai z untuk tingkat kepercayaan 95%
z_value <- qnorm(1 - alpha/2)
# Menghitung margin of error
error_margin <- z_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.3667 171.6333

Interpretasi:

Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa teknik adalah (168.37 cm, 171.63 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa teknik di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi diketahui, estimasi ini lebih presisi.

Studi Kasus 5: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Tidak Diketahui)

Situasi:

Universitas yang sama ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas seni. Namun, standardeviasi populasi tidak diketahui. Sebuah sampel acak dari 25 mahasiswa diambil, dan hasilnya adalah sebagai berikut (cm):

tinggi_badan <- c(165, 168, 170, 172, 169, 167, 171, 166, 173, 174, 170, 168, 169, 167, 172, 171, 170, 169, 168, 173, 172, 170, 169, 167, 171)

Tugas:

  1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa.
  2. Interpretasikan hasilnya.

Penyelesaian:

Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t.

mean_tinggi <- mean(tinggi_badan)
sd_tinggi <- sd(tinggi_badan)
n <- length(tinggi_badan)
alpha <- 0.05
# Menghitung nilai t untuk tingkat kepercayaan 95% dan df = n-1
t_value <- qt(1 - alpha/2, df = n-1)
# Menghitung margin of error
error_margin <- t_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.6802 170.5998

Interpretasi:

Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa seni adalah (168.67 cm, 170.73 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa seni di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t, yangmenghasilkan interval yang sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui.

Perbandingan Kasus 4 dan 5: Standar Deviasi Diketahui vsTidak Diketahui

  1. Presisi Estimasi:
  • Ketika standar deviasi populasi diketahui (Kasus 4), interval kepercayaan lebih sempit (168.37 cm,171.63 cm) karena kita memiliki informasi tambahan tentang variabilitas populasi.
  • Ketika standar deviasi populasi tidak diketahui (Kasus 5), interval kepercayaan sedikit lebih lebar (168.67 cm, 170.73 cm) karena kita harus mengestimasi variabilitas dari sampel, yang menambahketidakpastian.
  1. Distribusi yang Digunakan:
  • Standar deviasi diketahui: Distribusi z (normal).
  • Standar deviasi tidak diketahui: Distribusi t (Student’s t).
  1. Ukuran Sampel:
  • Pada Kasus 4, ukuran sampel lebih besar (36 vs 25), yang juga berkontribusi pada interval yang lebihsempit.
  • Pada Kasus 5, ukuran sampel lebih kecil, sehingga interval kepercayaan lebih lebar.

Faktor yang Mempengaruhi Selang Kepercayaan

Beberapa faktor yang dapat mempengaruhi lebar selang kepercayaan antara lain: 1. Ukuran Sampel: Semakin besar ukuran sampel, semakin sempit selang kepercayaan, karena semakinbanyak informasi yang tersedia untuk mengestimasi parameter populasi. 2. Variabilitas Data: Semakin besar variabilitas data (standar deviasi), semakin lebar selang kepercayaan. Halini karena data yang lebih variabel memerlukan rentang yang lebih luas untuk mencakup parameter populasi.3. Tingkat Kepercayaan: Tingkat kepercayaan yang lebih tinggi menghasilkan selang kepercayaan yang lebihlebar, karena kita memerlukan rentang yang lebih luas untuk meningkatkan keyakinan bahwa parameterpopulasi tercakup

Kesimpulan

Estimasi dalam dan selang kepercayaan adalah konsep penting dalam statistika yang memungkinkan kitauntuk membuat inferensi tentang parameter populasi berdasarkan data sampel. Dengan memahami danmenghitung selang kepercayaan, kita dapat membuat estimasi yang lebih akurat dan dapat diandalkan untukpengambilan keputusan.

Tugas

Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), danpengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan95%, dengan informasi setiap faktor dan level sebagai berikut:

Interpretasikan hasilnya.

faktor_list <- list(
  faktor1 = c(5, 30, 100),
  faktor2 = c(10, 50, 90),
  faktor3 = c('Standar deviasi populasi diketahui', 'Standar deviasi populasi tidak diketahui')
)
for (faktor1 in faktor_list$faktor1){
  for (faktor2 in faktor_list$faktor2){
    for (faktor3 in faktor_list$faktor3){
      print(paste('Ukuran Sampel (n): ', faktor1))
      print(paste('Ukuran Deviasi (σ atau s) :', faktor2))
      print(paste('Kondisi SD: ', faktor3))
      
      mean <- 9
      sd <- faktor2
      alpha <- 0.05
      n <- faktor1
      
      if (faktor3 == 'Standar deviasi populasi diketahui'){
        z_value <- qnorm(1 - alpha/2)
        error_margin <- z_value * sd / sqrt(n)
        interval <- c(mean - error_margin, mean + error_margin)
        
        cat("Interval kepercayaan 95%: [", interval[1], ",", interval[2], "] \n \n")
      } else{
        t_value <- qt(1 - alpha/2, df = n-1)
        error_margin <- t_value * sd/ sqrt(n)
        interval <- c(mean -error_margin, mean + error_margin)
        
        cat("Interval kepercayaan 95%: [", interval[1], ",", interval[2], "] \n \n")
        
      }
    }
  }
}
## [1] "Ukuran Sampel (n):  5"
## [1] "Ukuran Deviasi (σ atau s) : 10"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ 0.2347746 , 17.76523 ] 
##  
## [1] "Ukuran Sampel (n):  5"
## [1] "Ukuran Deviasi (σ atau s) : 10"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -3.41664 , 21.41664 ] 
##  
## [1] "Ukuran Sampel (n):  5"
## [1] "Ukuran Deviasi (σ atau s) : 50"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -34.82613 , 52.82613 ] 
##  
## [1] "Ukuran Sampel (n):  5"
## [1] "Ukuran Deviasi (σ atau s) : 50"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -53.0832 , 71.0832 ] 
##  
## [1] "Ukuran Sampel (n):  5"
## [1] "Ukuran Deviasi (σ atau s) : 90"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -69.88703 , 87.88703 ] 
##  
## [1] "Ukuran Sampel (n):  5"
## [1] "Ukuran Deviasi (σ atau s) : 90"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -102.7498 , 120.7498 ] 
##  
## [1] "Ukuran Sampel (n):  30"
## [1] "Ukuran Deviasi (σ atau s) : 10"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ 5.421612 , 12.57839 ] 
##  
## [1] "Ukuran Sampel (n):  30"
## [1] "Ukuran Deviasi (σ atau s) : 10"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ 5.265939 , 12.73406 ] 
##  
## [1] "Ukuran Sampel (n):  30"
## [1] "Ukuran Deviasi (σ atau s) : 50"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -8.891941 , 26.89194 ] 
##  
## [1] "Ukuran Sampel (n):  30"
## [1] "Ukuran Deviasi (σ atau s) : 50"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -9.670307 , 27.67031 ] 
##  
## [1] "Ukuran Sampel (n):  30"
## [1] "Ukuran Deviasi (σ atau s) : 90"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -23.20549 , 41.20549 ] 
##  
## [1] "Ukuran Sampel (n):  30"
## [1] "Ukuran Deviasi (σ atau s) : 90"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -24.60655 , 42.60655 ] 
##  
## [1] "Ukuran Sampel (n):  100"
## [1] "Ukuran Deviasi (σ atau s) : 10"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ 7.040036 , 10.95996 ] 
##  
## [1] "Ukuran Sampel (n):  100"
## [1] "Ukuran Deviasi (σ atau s) : 10"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ 7.015783 , 10.98422 ] 
##  
## [1] "Ukuran Sampel (n):  100"
## [1] "Ukuran Deviasi (σ atau s) : 50"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -0.7998199 , 18.79982 ] 
##  
## [1] "Ukuran Sampel (n):  100"
## [1] "Ukuran Deviasi (σ atau s) : 50"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -0.9210848 , 18.92108 ] 
##  
## [1] "Ukuran Sampel (n):  100"
## [1] "Ukuran Deviasi (σ atau s) : 90"
## [1] "Kondisi SD:  Standar deviasi populasi diketahui"
## Interval kepercayaan 95%: [ -8.639676 , 26.63968 ] 
##  
## [1] "Ukuran Sampel (n):  100"
## [1] "Ukuran Deviasi (σ atau s) : 90"
## [1] "Kondisi SD:  Standar deviasi populasi tidak diketahui"
## Interval kepercayaan 95%: [ -8.857953 , 26.85795 ] 
## 

Interpretasi

Dari hasil simulasi, dapat diinterpretasikan bahwa:

1. Pengaruh Ukuran Sampel terhadap Lebar Interval Kepercayaan

  • Saat ukuran sampel kecil (n = 5), interval kepercayaan sangat lebar.
  • Saat ukuran sampel sedang (n = 30), interval kepercayaan lebih sempit dibandingkan n = 5.
  • Saat ukuran sampel besar (n = 100), interval kepercayaan semakin menyempit, menunjukkan estimasi yang lebih akurat.

    👉 Semakin besar ukuran sampel, semakin sempit interval kepercayaan, sehingga estimasi mean lebih presisi.

2. Pengaruh Variabilitas Data (Standar Deviasi) terhadap Lebar Interval Kepercayaan

  • Saat σ atau s = 10, interval kepercayaan relatif kecil.
  • Saat σ atau s = 50, interval kepercayaan meningkat secara signifikan.
  • Saat σ atau s = 90, interval kepercayaan menjadi sangat lebar.

    👉 Semakin besar variabilitas data (σ/s), semakin lebar interval kepercayaan, menunjukkan ketidakpastian estimasi yang lebih tinggi.

3. Pengaruh Pengetahuan tentang Standar Deviasi Populasi (σ Diketahui vs. Tidak Diketahui)

  • Ketika σ diketahui, interval kepercayaan lebih sempit dibandingkan saat σ tidak diketahui.
  • Ketika σ tidak diketahui, digunakan distribusi t-Student, yang menyebabkan interval kepercayaan lebih lebar karena memperhitungkan ketidakpastian dalam estimasi standar deviasi.

    👉 Jika standar deviasi populasi diketahui, estimasi lebih akurat, dan interval kepercayaan lebih sempit.