Pendugaan Parameter

Author

Windi Pangesti

Pendugaan Parameter 1 Populasi

Dalam statistika inferensial, kita sering ingin menduga nilai rata-rata populasi (μ) berdasarkan data sampel. Salah satu metode yang digunakan adalah selang kepercayaan (confidence interval).

Selang kepercayaan memberikan rentang nilai yang diperkirakan memuat parameter populasi dengan tingkat keyakinan tertentu, misalnya 90%, 95%, atau 99%.

Secara umum bentuk selang kepercayaan untuk rata-rata populasi adalah

\[ \bar{x} \pm (\text{nilai kritis}) \times (\text{standard error}) \]

Nilai kritis yang digunakan dapat berasal dari distribusi normal (Z) atau distribusi t, tergantung pada kondisi data.

Pemilihan Distribusi untuk Selang Kepercayaan dapat dilihat pada tabel berikut.

Kondisi Sampel Simpangan Baku Distribusi Rumus Selang Kepercayaan
\(n > 30\) \(\sigma\) diketahui Normal (Z) \(\bar{x} \pm Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\)
\(n > 30\) \(\sigma\) tidak diketahui Normal (Z) \(\bar{x} \pm Z_{\alpha/2}\frac{s}{\sqrt{n}}\)
\(n \le 30\) \(\sigma\) tidak diketahui t-Student \(\bar{x} \pm t_{\alpha/2,df}\frac{s}{\sqrt{n}}\), \(df = n - 1\)

Nilai kritis distribusi dapat dihitung menggunakan fungsi berikut.

Distribusi Nilai Kritis Sintaks R
Normal (Z) \(Z_{\alpha/2}\) qnorm(1 - alpha/2)
t-Student \(t_{\alpha/2,\,df}\) qt(1 - alpha/2, df)

Ilustrasi 1

Rataan 1 Populasi ( σ diketahui, n > 30)

Penghasilan perbulan karyawan pada sebuah perusahaan diketahui menyebar normal dengan simpangan baku Rp600.000,-. Jika diambil sebanyak 40 contoh acak dari populasi tersebut, diperoleh rata-rata Rp1.200.000,-. Tentukan selang kepercayaan 95% bagi nilai tengah populasi karyawan perusahaan tersebut.

Cara 1

# Diketahui
xbar <- 1200000
sigma <- 600000
n <- 40
alpha <- 0.05

# Nilai z kritis
z <- qnorm(1 - alpha/2)

# Standard Error
SE <- sigma / sqrt(n)

# Selang kepercayaan
lower <- xbar - z * SE
upper <- xbar + z * SE

lower
[1] 1014061
upper
[1] 1385939

Cara 2

library(BSDA)
Warning: package 'BSDA' was built under R version 4.5.2
Loading required package: lattice

Attaching package: 'BSDA'
The following object is masked from 'package:datasets':

    Orange
zsum.test(
  mean.x = 1200000,
  sigma.x = 600000,
  n.x = 40,
  conf.level = 0.95
)

    One-sample z-Test

data:  Summarized x
z = 12.649, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 1014061 1385939
sample estimates:
mean of x 
  1200000 

Kesimpulan:

SK 95% bagi rata-rata penghasilan perbulan karyawan adalah Rp 1.014.061 s.d Rp 1.385.939.

Ilustrasi 2

Rataan 1 Populasi ( σ tidak diketahui, n > 30)

Menurut sebuah penelitian, konsumsi sereal yang telah diberi pemanis secara terus menerus menyebabkan pembusukan gigi, penyakit jantung, dan penyakit menurunnya fungsi tubuh lainnya. Dari suatu contoh acak 64 bungkus α Bits diperoleh rata-rata kadar gula 11.3 gram dengan simpangan baku 2.45 gram. Bila kadar gula itu menyebar normal, susun selang kepercayaan 95% bagi nilai tengah kadar gula per bungkus α-Bits.

Cara 1

# Diketahui
xbar <- 11.3
s <- 2.45
n <- 64
alpha <- 0.05

# Nilai z kritis
z <- qnorm(1 - alpha/2)

# Standard Error
SE <- s / sqrt(n)

# Selang kepercayaan
lower <- xbar - z * SE
upper <- xbar + z * SE

lower
[1] 10.69976
upper
[1] 11.90024

Cara 2

zsum.test(
  mean.x = 11.3,
  sigma.x = 2.45,
  n.x = 64,
  conf.level = 0.95
)

    One-sample z-Test

data:  Summarized x
z = 36.898, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 10.69976 11.90024
sample estimates:
mean of x 
     11.3 

Kesimpulan :

SK 95% bagi rata-rata kadar gula per bungkus α-Bits adalah 10,69976 s.d. 11,90024

Ilustrasi 3

Rataan 1 Populasi ( σ tidak diketahui, n < 30)

Suatu perusahaan memproduksi bohlam yang umurnya menyebar normal. Bila dari contoh acak sebanyak 25 bohlam mencapai umur rata-rata 780 jam dengan simpangan baku 40 jam, buatlah selang kepercayaan 96% bagi rata-rata umur bohlam yang diproduksi.

Cara 1

# Diketahui
xbar <- 780
s <- 40
n <- 25
alpha <- 0.04
sk <- 0.96

# Nilai t kritis
t <- qt(1 - alpha/2, df = n - 1)

# Standard Error
SE <- s / sqrt(n)

# Selang kepercayaan
lower <- xbar - t * SE
upper <- xbar + t * SE

lower
[1] 762.6276
upper
[1] 797.3724

Cara 2

# Selang kepercayaan menggunakan tsum.test
tsum.test(
  mean.x = xbar,      # rata-rata sampel
  s.x = s,            # simpangan baku sampel
  n.x = n,            # jumlah sampel
  conf.level = sk   # tingkat kepercayaan (96%)
)
Warning in tsum.test(mean.x = xbar, s.x = s, n.x = n, conf.level = sk):
argument 'var.equal' ignored for one-sample test.

    One-sample t-Test

data:  Summarized x
t = 97.5, df = 24, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
96 percent confidence interval:
 762.6276 797.3724
sample estimates:
mean of x 
      780 

Kesimpulan:

SK 96% bagi rata-rata umur bohlam yang diproduksi adalah 762,628 s.d. 797,372

Ilustrasi 4

Proporsi 1 Populasi

Sebelum memutuskan untuk memperkenalkan produk baru pada tahun 1985, perusahaan Coca Cola memperkenalkan produk baru (tanpa diberi label) kepada 40.000 pelanggan di 30 kota. Sekitar 55% pelanggan lebih menyukai produk baru dibanding produk lama. Jika diasumsikan 40.000 pelanggan tersebut sebagai sebuah contoh acak dari populasi pelanggan Coca Cola di 30 kota:

a. Tentukan selang kepercayaan 95% bagi p (proporsi konsumen yang menyukai produk baru tersebut)!

# Diketahui
phat <- 0.55      # proporsi sampel yang menyukai produk baru
n <- 40000        # ukuran sampel
alpha <- 0.05     # tingkat signifikansi

# Nilai z kritis
z <- qnorm(1 - alpha/2)

# Standard Error
SE <- sqrt(phat * (1 - phat) / n)

# Selang kepercayaan
lower <- phat - z * SE
upper <- phat + z * SE

lower
[1] 0.5451247
upper
[1] 0.5548753
# Jumlah konsumen yang menyukai produk baru
x <- 0.55 * 40000

# Menghitung selang kepercayaan proporsi
prop.test(
  x = x,        # jumlah sukses (menyukai produk baru)
  n = 40000,    # jumlah sampel
  conf.level = 0.95
)

    1-sample proportions test with continuity correction

data:  x out of 40000, null probability 0.5
X-squared = 399.8, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
 0.5451076 0.5548828
sample estimates:
   p 
0.55 

Kesimpulan:

Selang kepercayaan 95% bagi p (proporsi konsumen yang menyukai produk baru adalah 54,5% sampai 55,5%

b. Tentukan selang kepercayaan 95% bagi proporsi konsumen yang lebih menyukai produk lama!

# Diketahui
phat <- 0.45 # proporsi yang menyukai produk lama ( 1 - proporsi produk baru)
n <- 40000
alpha <- 0.05

# Nilai z kritis
z <- qnorm(1 - alpha/2)

# Standard Error
SE <- sqrt(phat * (1 - phat) / n)

# Selang kepercayaan
lower <- phat - z * SE
upper <- phat + z * SE

lower
[1] 0.4451247
upper
[1] 0.4548753
# Jumlah konsumen yang menyukai produk lama
x <- 0.45 * 40000

# Selang kepercayaan proporsi
prop.test(
  x = x,        # jumlah sukses (menyukai produk lama)
  n = 40000,    # ukuran sampel
  conf.level = 0.95
)

    1-sample proportions test with continuity correction

data:  x out of 40000, null probability 0.5
X-squared = 399.8, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
 0.4451172 0.4548924
sample estimates:
   p 
0.45 

Kesimpulan :

selang kepercayaan 95% bagi proporsi konsumen yang lebih menyukai produk lama adalah 44,5% sampai 45,5%

Pendugaan Parameter 2 Populasi

Jika \(\bar{x}_1\) dan \(\bar{x}_2\) masing-masing merupakan rata-rata sampel dari populasi pertama dan kedua, maka selang kepercayaan untuk perbedaan rata-rata populasi dinyatakan sebagai

\[ (\bar{x}_1 - \bar{x}_2) \pm (\text{nilai kritis}) \times (\text{standard error}) \]

Pemilihan distribusi yang digunakan bergantung pada apakah simpangan baku populasi diketahui dan apakah ragam kedua populasi dapat diasumsikan sama.


Selang Kepercayaan Perbedaan Dua Rataan Populasi

Kondisi Distribusi Rumus Selang Kepercayaan
\(\sigma_1,\sigma_2\) diketahui Normal (Z) \((\bar{x}_1-\bar{x}_2) \pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\)
\(\sigma_1,\sigma_2\) tidak diketahui dan \(\sigma_1=\sigma_2\) t (pooled) \((\bar{x}_1-\bar{x}_2) \pm t_{\alpha/2,df}\sqrt{s_p^2(\frac{1}{n_1}+\frac{1}{n_2})}\)
\(s_p^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}\)
\(df=n_1+n_2-2\)
\(\sigma_1,\sigma_2\) tidak diketahui dan \(\sigma_1\ne\sigma_2\) t (Welch) \((\bar{x}_1-\bar{x}_2) \pm t_{\alpha/2,df}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\)
\(df=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(\frac{s_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{s_2^2}{n_2})^2}{n_2-1}}\)

Ilustrasi 5

Rataan 2 Populasi ( σ1 & σ1 tidak diketahui, n1, n2 > 30)

Soal ujian kimia diberikan pada 75 mahasiswa dan 50 mahasiswi. Nilai mahasiswa mencapai rata-rata 82 dengan simpangan baku 8, sedangkan nilai mahasiswi memperoleh rata-rata 76 dengan simpangan baku 6. Tentukan selang kepercayaan 96% bagi beda μ₁ − μ₂, dalam hal ini μ₁ adalah rata-rata skor nilai semua mahasiswa dan μ₂ adalah rata-rata skor nilai semua mahasiswi yang mungkin mengambil ujian ini.

# Diketahui
xbar1 <- 82
xbar2 <- 76

s1 <- 8
s2 <- 6

n1 <- 75
n2 <- 50

alpha <- 0.04

# Nilai z kritis
z <- qnorm(1 - alpha/2)

# Standard Error
SE <- sqrt((s1^2 / n1) + (s2^2 / n2))

# Selang kepercayaan
lower <- (xbar1 - xbar2) - z * SE
upper <- (xbar1 - xbar2) + z * SE

lower
[1] 3.42393
upper
[1] 8.57607

Kesimpulan :

SK 96% bagi selisih skor nilai semua mahasiswa dan mahasiswi yang mungkin mengambil ujian ini adalah 3,424 s.d. 8.576.

Ilustrasi 6

Rataan 2 Populasi ( σ1 & σ1 tidak diketahui, n1, n2 > 30)

Seorang pakar ekonomi mengatakan bahwa rata-rata tingkat pendapatan nelayan di daerah A lebih besar dibandingkan rata-rata tingkat pendapatan nelayan di daerah B.

Untuk membuktikan pendapat tersebut, seorang mahasiswa melakukan penelitian mengenai tingkat pendapatan nelayan di dua wilayah pesisir pantai (A dan B). Mahasiswa tersebut melakukan survei terhadap 45 nelayan, yang terdiri dari 40% nelayan di daerah A dan 60% nelayan di daerah B.

Data yang terkumpul tercatat sebagai berikut.

Daerah Rata-rata Pendapatan (dalam ribu) Simpangan Baku
A 254 3
B 225 2

Apakah data hasil penelitian mahasiswa tersebut mendukung pernyataan pakar ekonomi pada tingkat kepercayaan 95%?


a. Asumsikan ragam kedua populasi sama

# Diketahui
xbar1 <- 254    # rata-rata pendapatan daerah A
xbar2 <- 225    # rata-rata pendapatan daerah B

s1 <- 3
s2 <- 2

n1 <- 18    # jumlah sampel daerah A (40% × 45)
n2 <- 27    # jumlah sampel daerah B (60% × 45)

alpha <- 0.05

# Nilai t kritis
t <- qt(1 - alpha/2, df = n1 + n2 - 2)

# Ragam gabungan
sp2 <- ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1 + n2 - 2)

# Standard Error
SE <- sqrt(sp2 * (1/n1 + 1/n2))

# Selang kepercayaan
lower <- (xbar1 - xbar2) - t * SE
upper <- (xbar1 - xbar2) + t * SE

lower
[1] 27.49976
upper
[1] 30.50024
#cara 2
tsum.test(
  mean.x = 254,
  s.x = 3,
  n.x = 18,
  mean.y = 225,
  s.y = 2,
  n.y = 27,
  var.equal = TRUE,   # asumsi ragam sama
  conf.level = 0.95
)

    Standard Two-Sample t-Test

data:  Summarized x and y
t = 38.983, df = 43, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 27.49976 30.50024
sample estimates:
mean of x mean of y 
      254       225 

Kesimpulan:

  • SK 95% bagi selisih rata-rata tingkat pendapatan nelayan di daerah A dan daerah B adalah antara 27,50 ribu rupiah dan 30,50 ribu rupiah.

  • SK tidak mencakup nilai negatif atau 0, sehingga benar bahwa tingkat pendapatan nelayan di daerah A lebih besar dibandingkan daerah B.


b. Asumsikan ragam kedua populasi tidak sama

# Diketahui
xbar1 <- 254
xbar2 <- 225

s1 <- 3
s2 <- 2

n1 <- 18
n2 <- 27

alpha <- 0.05

# Standard Error
SE <- sqrt((s1^2/n1) + (s2^2/n2))

# Derajat bebas Welch
df <- ( (s1^2/n1 + s2^2/n2)^2 ) /
      ( ((s1^2/n1)^2/(n1-1)) + ((s2^2/n2)^2/(n2-1)) )

# Nilai t kritis
t <- qt(1 - alpha/2, df)

# Selang kepercayaan
lower <- (xbar1 - xbar2) - t * SE
upper <- (xbar1 - xbar2) + t * SE

lower
[1] 27.34816
upper
[1] 30.65184
tsum.test(
  mean.x = 254,
  s.x = 3,
  n.x = 18,
  mean.y = 225,
  s.y = 2,
  n.y = 27,
  var.equal = FALSE,
  conf.level = 0.95
)

    Welch Modified Two-Sample t-Test

data:  Summarized x and y
t = 36.021, df = 27.016, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 27.34816 30.65184
sample estimates:
mean of x mean of y 
      254       225 

Kesimpulan :

  • SK 95% bagi perbedaan rata-rata tingkat pendapatan nelayan di daerah A dan daerah B adalah 27.3481 ribu rupiah s.d 30.651 ribu rupiah.
  • SK 95% tidak mencakup nilai 0 atau negatif, sehingga benar bahwa tingkat pendapatan nelayan di daerah A berbeda dibandingkan rata-rata tingkat pendapatan nelayan di daerah B.