Selang Kepercayaan & Uji Hipotesis

Author

Syaifullah yusuf ramadhan

Selang Kepercayaan

Pengantar Selang Kepercayaan

Selang kepercayaan adalah rentang nilai yang diperkirakan mengandung parameter populasi dengan tingkat kepercayaan tertentu. Semakin tinggi tingkat kepercayaan, semakin lebar selang kepercayaan yang diperoleh.

Konsep Dasar:

  • Penduga titik: Estimasi tunggal dari parameter populasi, misalnya rata-rata sampel

  • Penduga selang: Interval yang digunakan untuk mengestimasi parameter populasi.

  • Tingkat kepercayaan: Probabilitas bahwa selang yang dihitung mengandung parameter populasi (misalnya 90%, 95%, 99%). Semakin tinggi tingkat kepercayaan, semakin lebar selang kepercayaan, karena kita ingin memastikan dengan kepastian yang lebih tinggi bahwa parameter populasi berada dalam selang tersebut.

Selang Kepercayaan untuk Mean

Jika Varians Populasi Diketahui (Z-Interval)

Digunakan jika simpangan baku populasi \(\sigma\) diketahui dan ukuran sampel cukup besar (\(n>30\)).

Contoh Soal Sebuah survei terhadap 200 pedagang menunjukkan rata-rata pendapatan harian 120 ribu rupiah dengan simpangan baku populasi 40 ribu rupiah. Hitung selang kepercayaan 95%.

# Data
x_bar <- 120   # Rata-rata sampel
sigma <- 40    # Simpangan baku populasi
n <- 200       # Ukuran sampel
alpha <- 0.05  # Tingkat signifikansi

# Hitung Z-score
z_alpha <- qnorm(1 - alpha/2)

# Hitung Margin of Error
ME <- z_alpha * (sigma / sqrt(n))

# Hitung Selang Kepercayaan
lower_bound <- x_bar - ME
upper_bound <- x_bar + ME

c(lower_bound, upper_bound)
[1] 114.4564 125.5436

Jika Varians Populasi Tidak Diketahui (t-Interval)

Digunakan jika \(\sigma\) tidak diketahui dan ukuran sampel kecil (\(n\le30\)).

Contoh Soal Seorang peneliti meneliti rata-rata pengeluaran mahasiswa untuk internet. Sampel 25 mahasiswa diperoleh rata-rata 155 ribu rupiah dengan simpangan baku sampel 10 ribu rupiah. Hitung selang kepercayaan 95%.

# Data
x_bar <- 155   # Rata-rata sampel
s <- 10        # Simpangan baku sampel
n <- 25        # Ukuran sampel
alpha <- 0.05  # Tingkat signifikansi

# Hitung t-score
t_alpha <- qt(1 - alpha/2, df = n-1)

# Hitung Margin of Error
ME <- t_alpha * (s / sqrt(n))

# Hitung Selang Kepercayaan
lower_bound <- x_bar - ME
upper_bound <- x_bar + ME

c(lower_bound, upper_bound)
[1] 150.8722 159.1278

Selang Kepercayaan Untuk Proporsi

Selang kepercayaan untuk proporsi digunakan untuk mengestimasi proporsi populasi berdasarkan sampel besar.

Contoh Soal Sebuah survei terhadap 2000 UMKM menunjukkan bahwa 1600 mengalami penurunan omzet. Hitung selang kepercayaan 95% untuk proporsi UMKM yang mengalami penurunan omzet.

# Data
p_hat <- 1600 / 2000  # Proporsi sampel
n <- 2000             # Ukuran sampel
alpha <- 0.05         # Tingkat signifikansi

# Hitung Z-score
z_alpha <- qnorm(1 - alpha/2)

# Hitung Margin of Error
ME <- z_alpha * sqrt((p_hat * (1 - p_hat)) / n)

# Hitung Selang Kepercayaan
lower_bound <- p_hat - ME
upper_bound <- p_hat + ME

c(lower_bound, upper_bound)
[1] 0.7824695 0.8175305

Keputusan Berdasarkan Selang Kepercayaan

  • Jika selang kepercayaan tidak mencakup nilai yang diuji dalam hipotesis nol, maka kita menolak \(H_0\).

  • Jika selang kepercayaan mencakup nilai hipotesis nol, maka kita gagal menolak \(H_0\).

Latihan

  • Hitung selang kepercayaan 99% untuk rata-rata pendapatan harian pedagang makanan keliling jika diketahui rata-rata 120 ribu, simpangan baku 40 ribu, dan sampel 200 pedagang.

  • Dari 500 mahasiswa yang disurvei, 300 mengakses internet melalui WiFi rumah. Hitung selang kepercayaan 90% untuk proporsi mahasiswa yang menggunakan WiFi rumah.

Uji Hipotesis

Pengantar Uji Hipotesis

Uji hipotesis adalah prosedur statistik untuk menguji klaim atau asumsi terhadap parameter populasi berdasarkan data sampel. Dalam R, uji hipotesis dapat dilakukan dengan berbagai metode tergantung pada jenis data dan asumsi yang digunakan.

Langkah-langkah dalam Uji Hipotesis

  1. Menentukan \(H_0\) dan \(H_1\)

  2. Menentukan tingkat signifikasi (\(\alpha\)). catatan: Jika tidak disebutkan di soal, biasanya menggunakan \(\alpha=0.05\).

  3. Memilih Statistik Uji yang sesuai (Uji Z, Uji t, uji \(X^2\), dll)

  4. Menghitung nilai p atau statistik uji

  5. Membandingkan nilai p dengan \(\alpha\) atau menggunakan daerah kritis.

  6. Mengambil keputusan

Uji Hipotesis untuk rata-rata

Uji Z

Digunakan jika varians populasi diketahui dan sampel cukup besar (\(n>30\)).

Contoh soal

Seorang manajer ingin menguji apakah rata-rata jam kerja karyawan lebih dari 8 jam per hari. Diasumsikan bahwa simpangan baku populasi adalah 1.5 jam, dan data dari 64 karyawan diperoleh rata-rata 8.2 jam per hari.

  • \(H_0: \mu\le8\) (Rata-rata jam kerja karyawan tidak lebih dari 8 jam per hari)

  • \(H_1: \mu>8\) (Rata-rata jam kerja karyawan lebih dari 8 jam per hari)

\(\alpha=0.05\)

# Data
x_bar <- 8.2    # Rata-rata sampel
mu_0 <- 8       # Hipotesis nol
sigma <- 1.5    # Simpangan baku populasi
n <- 64         # Ukuran sampel

# Hitung Z-statistik
z_hitung <- (x_bar - mu_0) / (sigma / sqrt(n))
z_hitung
[1] 1.066667
# Hitung nilai p
p_value <- 1 - pnorm(z_hitung)
p_value
[1] 0.1430612
# Keputusan
alpha <- 0.05
if (p_value < alpha) {
  print("Tolak H0: Rata-rata jam kerja lebih dari 8 jam")
} else {
  print("Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan rata-rata lebih dari 8 jam")
}
[1] "Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan rata-rata lebih dari 8 jam"

Uji t

Digunakan jika varians populasi tidak diketahui atau sampel kecil (\(n\le30\))

Contoh soal Seorang peneliti ingin menguji apakah rata-rata pengeluaran mahasiswa untuk internet per bulan adalah 150 ribu rupiah. Sebuah sampel acak dari 25 mahasiswa diperoleh rata-rata 155 ribu rupiah dengan simpangan baku 10 ribu rupiah.

  • \(H_0: \mu=150\) (Rata-rata pengeluaran mahasiswa untuk internet per bulan adalah 150 ribu)

  • \(H_1: \mu\ne150\) (Rata-rata pengeluaran mahasiswa untuk internet per bulan bukanlah 150 ribu)

\(\alpha=0.05\)

# Data
x_bar <- 155    # Rata-rata sampel
mu_0 <- 150     # Hipotesis nol
s <- 10         # Simpangan baku sampel
n <- 25         # Ukuran sampel

# Hitung t-statistik
t_hitung <- (x_bar - mu_0) / (s / sqrt(n))
t_hitung
[1] 2.5
# Hitung nilai p
p_value <- 2 * (1 - pt(abs(t_hitung), df = n - 1))
p_value
[1] 0.01965418
# Keputusan
alpha <- 0.05
if (p_value < alpha) {
  print("Tolak H0: Pengeluaran mahasiswa berbeda dari 150 ribu")
} else {
  print("Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan perbedaan")
}
[1] "Tolak H0: Pengeluaran mahasiswa berbeda dari 150 ribu"

Uji Hipotesis untuk Proporsi

Digunakan untuk menguji klaim tentang proporsi populasi berdasarkan data sampel.

Contoh Soal Sebuah perusahaan mengklaim bahwa 8% dari email promosi mereka mendapatkan respons. Untuk menguji klaim ini, diambil sampel 500 email, dan ditemukan bahwa hanya 25 yang mendapatkan respons.

  • \(H_0: p=0.08\) (Proporsi email yang mendapatkan respons adalah 8%)

  • \(H_1: p\ne0.08\) (Proporsi email yang mendapatkan respons berbeda dari 8%)

\(\alpha=0.05\)

# Data
p_hat <- 25 / 500  # Proporsi sampel
p_0 <- 0.08        # Hipotesis nol
n <- 500           # Ukuran sampel

# Hitung Z-statistik
z_hitung <- (p_hat - p_0) / sqrt((p_0 * (1 - p_0)) / n)
z_hitung
[1] -2.472677
# Hitung nilai p
p_value <- 2 * (1 - pnorm(abs(z_hitung)))
p_value
[1] 0.01341054
# Keputusan
alpha <- 0.05
if (p_value < alpha) {
  print("Tolak H0: Proporsi berbeda dari 8%")
} else {
  print("Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan perbedaan")
}
[1] "Tolak H0: Proporsi berbeda dari 8%"

Keputusan berdasarkan nilai p-value

  • Jika \(p-value < \alpha\), tolak \(H_0\) (Ada cukup bukti untuk menerima \(H_1\))

  • Jika \(p-value \ge \alpha\), gagal menolak \(H_0\) (tidak cukup bukti untuk menerima \(H_1\))

Latihan

  • Uji apakah rata-rata pendapatan harian pedagang makanan keliling lebih dari 120 ribu rupiah, jika diketahui simpangan baku adalah 40 ribu rupiah dengan sampel 200 pedagang.

  • Uji apakah proporsi mahasiswa yang menggunakan internet rumahan lebih dari 34%, jika dari 1000 mahasiswa, 350 di antaranya menggunakan internet rumahan.

Tugas Kelompok

Gunakan data(mtcars) yang sudah tersedia di r.

data("mtcars")
str(mtcars)
'data.frame':   32 obs. of  11 variables:
 $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
 $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
 $ disp: num  160 160 108 258 360 ...
 $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
 $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
 $ qsec: num  16.5 17 18.6 19.4 17 ...
 $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
 $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
 $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
 $ carb: num  4 4 1 1 2 1 4 2 2 4 ...
  • Ambil sampel acak sebanyak 25 pengamatan. Gunakan set.seed(123) untuk reproduktabilitas model

  • Tampilkan ringkasan statistik dari sampel yang kamu ambil

  • Hitung interval kepercayaan 95% untuk rata-rata konsumsi bahan bakar mpg

  • Interpretasikan hasilnya

  • Ulangi perhitungan untuk interval kepercayaan 99% dan bandingkan hasilnya. Apakah intervalnya menjadi lebih lebar atau sempit?

** Uji Hipotesis **

Sebuah perusahaan otomotif mengklaim bahwa rata-rata tenaga (hp – horsepower) mobil yang diproduksi oleh mereka adalah 150 hp.

  • Gunakan data dari Dataset mtcars untuk menguji hipotesis pada taraf signifikasi 5%.

Uji Hipotesis Dua Sampel

Uji hipotesis dua sampel digunakan untuk membandingkan rata-rata atau proporsi dari dua kelompok yang berbeda. Uji ini membantu menentukan apakah terdapat perbedaan yang signifikan antara dua kelompok dalam suatu populasi.

Jenis Uji Hipotesis Dua Sampel:

  • Uji t Dua Sampel (Independent t-test): Digunakan untuk membandingkan dua kelompok yang tidak berhubungan.

  • Uji t Berpasangan (Paired t-test): Digunakan untuk membandingkan dua kelompok yang berhubungan (misalnya, sebelum dan sesudah perlakuan).

Independent t-test

Terdapat 3 situasi dalam uji independent t-test.

  1. \(\sigma_1^2\) dan \(\sigma_2^2\) diketahui ; Uji Z

  2. \(\sigma_1^2\) dan \(\sigma_2^2\) tidak diketahui dan diasumsikan bernilai sama ; Uji t

  3. \(\sigma_1^2\) dan \(\sigma_2^2\) tidak diketahui dan diasumsikan bernilai berbeda ; Uji t

Contoh Kasus

  1. Seorang peneliti ingin mengetahui apakah terdapat perbedaan rata-rata pendapatan antara pekerja yang memiliki pelatihan profesional dan yang tidak.
# Membuat Data
set.seed(123)
pelatihan <- data.frame(
  pendapatan = c(rnorm(50, mean = 6000, sd = 500), rnorm(50, mean = 6500, sd = 500)),
  grup = rep(c("Tanpa Pelatihan", "Dengan Pelatihan"), each = 50)
)

# Uji t Dua Sampel
t.test(pendapatan ~ grup, data = pelatihan, var.equal = TRUE)

    Two Sample t-test

data:  pendapatan by grup
t = 6.0718, df = 98, p-value = 2.403e-08
alternative hypothesis: true difference in means between group Dengan Pelatihan and group Tanpa Pelatihan is not equal to 0
95 percent confidence interval:
 374.2816 737.7231
sample estimates:
mean in group Dengan Pelatihan  mean in group Tanpa Pelatihan 
                      6573.204                       6017.202 

p-value < 0.05, maka kita menolak hipotesis nol (\(H_0\)). Ini berarti terdapat perbedaan yang sangat signifikan antara dua kelompok yang diuji.

  1. Andaikan Anda adalah seorang analis keuangan di suatu perusahaan sekuritas, dan ingin menguji apakah ada perbedaan besaran dividen dari emiten di NYSE dan NASDAQ. Ringkasan datanya adalah sebagai berikut

Lakuan pengujian apakah ada perbedaan rata-rata antara keduanya pada \(\alpha = 0.05\), dengan mengasumsikan ragam keduanya sama.

# Data ringkasan dari NYSE dan NASDAQ
n_nyse <- 21
mean_nyse <- 3.27
sd_nyse <- 1.30

n_nasdaq <- 25
mean_nasdaq <- 2.53
sd_nasdaq <- 1.16

# Uji t dua sampel dengan asumsi varians sama
t.test(
  x = rnorm(n_nyse, mean_nyse, sd_nyse),
  y = rnorm(n_nasdaq, mean_nasdaq, sd_nasdaq),
  var.equal = TRUE
)

    Two Sample t-test

data:  rnorm(n_nyse, mean_nyse, sd_nyse) and rnorm(n_nasdaq, mean_nasdaq, sd_nasdaq)
t = 1.6991, df = 44, p-value = 0.09636
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.1051896  1.2355077
sample estimates:
mean of x mean of y 
 2.832336  2.267177 

p-value > 0.05, gagal menolak \(H_0\). Tidak ada bukti cukup bahwa rata-rata deviden berbeda.

  1. Seorang peneliti ingin mengetahui apakah terdapat perbedaan rata-rata skor ujian antara dua kelas yang diberikan metode pengajaran berbeda. Diketahui:
  • Kelas A: n = 30, rata-rata = 78, standar deviasi = 10

  • Kelas B: n = 35, rata-rata = 82, standar deviasi = 12

Lakukan pengujian dengan tingkat signifikansi α = 0.05 dan asumsikan varians kedua kelompok diketahui.

# Data ringkasan
n_A <- 30
mean_A <- 78
sd_A <- 10

n_B <- 35
mean_B <- 82
sd_B <- 12

# Menghitung statistik uji Z
z_value <- (mean_A - mean_B) / sqrt((sd_A^2 / n_A) + (sd_B^2 / n_B))
z_value
[1] -1.465721
p_value <- 2 * (1 - pnorm(abs(z_value)))
p_value
[1] 0.1427244

p-value > 0.05, maka tidak ada cukup bukti untuk menyatakan bahwa terdapat perbedaan yang signifikan.

Paired t-test

Contoh kasus

  1. Andaikan sebuah perusahaan mengirimkan karyawannya ke suatu pelatihan “layanan prima untuk pelanggan”. Apakah pelatihan ini berdampak pada perubahan jumlah keluhan pelanggan? Data yang diperoleh dari contoh 5 (lima) karyawan adalah sebagai berikut:

# Data jumlah keluhan sebelum dan sesudah pelatihan
keluhan_sebelum <- c(6, 20, 3, 0, 4)
keluhan_sesudah <- c(4, 6, 2, 0, 0)

# Uji t berpasangan
t.test(keluhan_sebelum, keluhan_sesudah, paired = TRUE)

    Paired t-test

data:  keluhan_sebelum and keluhan_sesudah
t = 1.655, df = 4, p-value = 0.1733
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
 -2.845828 11.245828
sample estimates:
mean difference 
            4.2 

p-value > 0.05, maka tidak ada cukup bukti untuk menyatakan bahwa pelatihan berdampak pada jumlah keluhan