Dalam statistika inferensial, kita sering ingin menduga nilai rata-rata populasi (μ) berdasarkan data sampel. Salah satu metode yang digunakan adalah selang kepercayaan (confidence interval).
Selang kepercayaan memberikan rentang nilai yang diperkirakan memuat parameter populasi dengan tingkat keyakinan tertentu, misalnya 90%, 95%, atau 99%.
Secara umum bentuk selang kepercayaan untuk rata-rata populasi adalah
\(\bar{x} \pm t_{\alpha/2,df}\frac{s}{\sqrt{n}}\), \(df = n - 1\)
Nilai kritis distribusi dapat dihitung menggunakan fungsi berikut.
Distribusi
Nilai Kritis
Sintaks R
Normal (Z)
\(Z_{\alpha/2}\)
qnorm(1 - alpha/2)
t-Student
\(t_{\alpha/2,\,df}\)
qt(1 - alpha/2, df)
Ilustrasi 1
Rataan 1 Populasi ( σ diketahui, n > 30)
Penghasilan perbulan karyawan pada sebuah perusahaan diketahui menyebar normal dengan simpangan baku Rp600.000,-. Jika diambil sebanyak 40 contoh acak dari populasi tersebut, diperoleh rata-rata Rp1.200.000,-. Tentukan selang kepercayaan 95% bagi nilai tengah populasi karyawan perusahaan tersebut.
Cara 1
# Diketahuixbar <-1200000sigma <-600000n <-40alpha <-0.05# Nilai z kritisz <-qnorm(1- alpha/2)# Standard ErrorSE <- sigma /sqrt(n)# Selang kepercayaanlower <- xbar - z * SEupper <- xbar + z * SElower
[1] 1014061
upper
[1] 1385939
Cara 2
library(BSDA)
Warning: package 'BSDA' was built under R version 4.5.2
Loading required package: lattice
Attaching package: 'BSDA'
The following object is masked from 'package:datasets':
Orange
One-sample z-Test
data: Summarized x
z = 12.649, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
1014061 1385939
sample estimates:
mean of x
1200000
Kesimpulan:
SK 95% bagi rata-rata penghasilan perbulan karyawan adalah Rp 1.014.061 s.d Rp 1.385.939.
Ilustrasi 2
Rataan 1 Populasi ( σ tidak diketahui, n > 30)
Menurut sebuah penelitian, konsumsi sereal yang telah diberi pemanis secara terus menerus menyebabkan pembusukan gigi, penyakit jantung, dan penyakit menurunnya fungsi tubuh lainnya. Dari suatu contoh acak 64 bungkus α Bits diperoleh rata-rata kadar gula 11.3 gram dengan simpangan baku 2.45 gram. Bila kadar gula itu menyebar normal, susun selang kepercayaan 95% bagi nilai tengah kadar gula per bungkus α-Bits.
Cara 1
# Diketahuixbar <-11.3s <-2.45n <-64alpha <-0.05# Nilai z kritisz <-qnorm(1- alpha/2)# Standard ErrorSE <- s /sqrt(n)# Selang kepercayaanlower <- xbar - z * SEupper <- xbar + z * SElower
One-sample z-Test
data: Summarized x
z = 36.898, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
10.69976 11.90024
sample estimates:
mean of x
11.3
Kesimpulan :
SK 95% bagi rata-rata kadar gula per bungkus α-Bits adalah 10,69976 s.d. 11,90024
Ilustrasi 3
Rataan 1 Populasi ( σ tidak diketahui, n < 30)
Suatu perusahaan memproduksi bohlam yang umurnya menyebar normal. Bila dari contoh acak sebanyak 25 bohlam mencapai umur rata-rata 780 jam dengan simpangan baku 40 jam, buatlah selang kepercayaan 96% bagi rata-rata umur bohlam yang diproduksi.
Cara 1
# Diketahuixbar <-780s <-40n <-25alpha <-0.04sk <-0.96# Nilai t kritist <-qt(1- alpha/2, df = n -1)# Standard ErrorSE <- s /sqrt(n)# Selang kepercayaanlower <- xbar - t * SEupper <- xbar + t * SElower
[1] 762.6276
upper
[1] 797.3724
Cara 2
# Selang kepercayaan menggunakan tsum.testtsum.test(mean.x = xbar, # rata-rata sampels.x = s, # simpangan baku sampeln.x = n, # jumlah sampelconf.level = sk # tingkat kepercayaan (96%))
Warning in tsum.test(mean.x = xbar, s.x = s, n.x = n, conf.level = sk):
argument 'var.equal' ignored for one-sample test.
One-sample t-Test
data: Summarized x
t = 97.5, df = 24, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
96 percent confidence interval:
762.6276 797.3724
sample estimates:
mean of x
780
Kesimpulan:
SK 96% bagi rata-rata umur bohlam yang diproduksi adalah 762,628 s.d. 797,372
Ilustrasi 4
Proporsi 1 Populasi
Sebelum memutuskan untuk memperkenalkan produk baru pada tahun 1985, perusahaan Coca Cola memperkenalkan produk baru (tanpa diberi label) kepada 40.000 pelanggan di 30 kota. Sekitar 55% pelanggan lebih menyukai produk baru dibanding produk lama. Jika diasumsikan 40.000 pelanggan tersebut sebagai sebuah contoh acak dari populasi pelanggan Coca Cola di 30 kota:
a. Tentukan selang kepercayaan 95% bagi p (proporsi konsumen yang menyukai produk baru tersebut)!
# Diketahuiphat <-0.55# proporsi sampel yang menyukai produk barun <-40000# ukuran sampelalpha <-0.05# tingkat signifikansi# Nilai z kritisz <-qnorm(1- alpha/2)# Standard ErrorSE <-sqrt(phat * (1- phat) / n)# Selang kepercayaanlower <- phat - z * SEupper <- phat + z * SElower
[1] 0.5451247
upper
[1] 0.5548753
# Jumlah konsumen yang menyukai produk barux <-0.55*40000# Menghitung selang kepercayaan proporsiprop.test(x = x, # jumlah sukses (menyukai produk baru)n =40000, # jumlah sampelconf.level =0.95)
1-sample proportions test with continuity correction
data: x out of 40000, null probability 0.5
X-squared = 399.8, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.5451076 0.5548828
sample estimates:
p
0.55
Kesimpulan:
Selang kepercayaan 95% bagi p (proporsi konsumen yang menyukai produk baru adalah 54,5% sampai 55,5%
b. Tentukan selang kepercayaan 95% bagi proporsi konsumen yang lebih menyukai produk lama!
# Diketahuiphat <-0.45# proporsi yang menyukai produk lama ( 1 - proporsi produk baru)n <-40000alpha <-0.05# Nilai z kritisz <-qnorm(1- alpha/2)# Standard ErrorSE <-sqrt(phat * (1- phat) / n)# Selang kepercayaanlower <- phat - z * SEupper <- phat + z * SElower
[1] 0.4451247
upper
[1] 0.4548753
# Jumlah konsumen yang menyukai produk lamax <-0.45*40000# Selang kepercayaan proporsiprop.test(x = x, # jumlah sukses (menyukai produk lama)n =40000, # ukuran sampelconf.level =0.95)
1-sample proportions test with continuity correction
data: x out of 40000, null probability 0.5
X-squared = 399.8, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.4451172 0.4548924
sample estimates:
p
0.45
Kesimpulan :
selang kepercayaan 95% bagi proporsi konsumen yang lebih menyukai produk lama adalah 44,5% sampai 45,5%
Pendugaan Parameter 2 Populasi
Jika \(\bar{x}_1\) dan \(\bar{x}_2\) masing-masing merupakan rata-rata sampel dari populasi pertama dan kedua, maka selang kepercayaan untuk perbedaan rata-rata populasi dinyatakan sebagai
Rataan 2 Populasi ( σ1 & σ1 tidak diketahui, n1, n2 > 30)
Soal ujian kimia diberikan pada 75 mahasiswa dan 50 mahasiswi. Nilai mahasiswa mencapai rata-rata 82 dengan simpangan baku 8, sedangkan nilai mahasiswi memperoleh rata-rata 76 dengan simpangan baku 6. Tentukan selang kepercayaan 96% bagi beda μ₁ − μ₂, dalam hal ini μ₁ adalah rata-rata skor nilai semua mahasiswa dan μ₂ adalah rata-rata skor nilai semua mahasiswi yang mungkin mengambil ujian ini.
# Diketahuixbar1 <-82xbar2 <-76s1 <-8s2 <-6n1 <-75n2 <-50alpha <-0.04# Nilai z kritisz <-qnorm(1- alpha/2)# Standard ErrorSE <-sqrt((s1^2/ n1) + (s2^2/ n2))# Selang kepercayaanlower <- (xbar1 - xbar2) - z * SEupper <- (xbar1 - xbar2) + z * SElower
[1] 3.42393
upper
[1] 8.57607
Kesimpulan :
SK 96% bagi selisih skor nilai semua mahasiswa dan mahasiswi yang mungkin mengambil ujian ini adalah 3,424 s.d. 8.576.
Ilustrasi 6
Rataan 2 Populasi ( σ1 & σ1 tidak diketahui, n1, n2 > 30)
Seorang pakar ekonomi mengatakan bahwa rata-rata tingkat pendapatan nelayan di daerah A lebih besar dibandingkan rata-rata tingkat pendapatan nelayan di daerah B.
Untuk membuktikan pendapat tersebut, seorang mahasiswa melakukan penelitian mengenai tingkat pendapatan nelayan di dua wilayah pesisir pantai (A dan B). Mahasiswa tersebut melakukan survei terhadap 45 nelayan, yang terdiri dari 40% nelayan di daerah A dan 60% nelayan di daerah B.
Data yang terkumpul tercatat sebagai berikut.
Daerah
Rata-rata Pendapatan (dalam ribu)
Simpangan Baku
A
254
3
B
225
2
Apakah data hasil penelitian mahasiswa tersebut mendukung pernyataan pakar ekonomi pada tingkat kepercayaan 95%?
a. Asumsikan ragam kedua populasi sama
# Diketahuixbar1 <-254# rata-rata pendapatan daerah Axbar2 <-225# rata-rata pendapatan daerah Bs1 <-3s2 <-2n1 <-18# jumlah sampel daerah A (40% × 45)n2 <-27# jumlah sampel daerah B (60% × 45)alpha <-0.05# Nilai t kritist <-qt(1- alpha/2, df = n1 + n2 -2)# Ragam gabungansp2 <- ((n1-1)*s1^2+ (n2-1)*s2^2) / (n1 + n2 -2)# Standard ErrorSE <-sqrt(sp2 * (1/n1 +1/n2))# Selang kepercayaanlower <- (xbar1 - xbar2) - t * SEupper <- (xbar1 - xbar2) + t * SElower
Standard Two-Sample t-Test
data: Summarized x and y
t = 38.983, df = 43, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
27.49976 30.50024
sample estimates:
mean of x mean of y
254 225
Kesimpulan:
SK 95% bagi selisih rata-rata tingkat pendapatan nelayan di daerah A dan daerah B adalah antara 27,50 ribu rupiah dan 30,50 ribu rupiah.
SK tidak mencakup nilai negatif atau 0, sehingga benar bahwa tingkat pendapatan nelayan di daerah A lebih besar dibandingkan daerah B.
b. Asumsikan ragam kedua populasi tidak sama
# Diketahuixbar1 <-254xbar2 <-225s1 <-3s2 <-2n1 <-18n2 <-27alpha <-0.05# Standard ErrorSE <-sqrt((s1^2/n1) + (s2^2/n2))# Derajat bebas Welchdf <- ( (s1^2/n1 + s2^2/n2)^2 ) / ( ((s1^2/n1)^2/(n1-1)) + ((s2^2/n2)^2/(n2-1)) )# Nilai t kritist <-qt(1- alpha/2, df)# Selang kepercayaanlower <- (xbar1 - xbar2) - t * SEupper <- (xbar1 - xbar2) + t * SElower
Welch Modified Two-Sample t-Test
data: Summarized x and y
t = 36.021, df = 27.016, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
27.34816 30.65184
sample estimates:
mean of x mean of y
254 225
Kesimpulan :
SK 95% bagi perbedaan rata-rata tingkat pendapatan nelayan di daerah A dan daerah B adalah 27.3481 ribu rupiah s.d 30.651 ribu rupiah.
SK 95% tidak mencakup nilai 0 atau negatif, sehingga benar bahwa tingkat pendapatan nelayan di daerah A berbeda dibandingkan rata-rata tingkat pendapatan nelayan di daerah B.