Selang kepercayaan adalah rentang nilai yang diperkirakan mengandung parameter populasi dengan tingkat kepercayaan tertentu. Semakin tinggi tingkat kepercayaan, semakin lebar selang kepercayaan yang diperoleh.
Konsep Dasar:
Penduga titik: Estimasi tunggal dari parameter populasi, misalnya rata-rata sampel
Penduga selang: Interval yang digunakan untuk mengestimasi parameter populasi.
Tingkat kepercayaan: Probabilitas bahwa selang yang dihitung mengandung parameter populasi (misalnya 90%, 95%, 99%). Semakin tinggi tingkat kepercayaan, semakin lebar selang kepercayaan, karena kita ingin memastikan dengan kepastian yang lebih tinggi bahwa parameter populasi berada dalam selang tersebut.
Selang Kepercayaan untuk Mean
Jika Varians Populasi Diketahui (Z-Interval)
Digunakan jika simpangan baku populasi \(\sigma\) diketahui dan ukuran sampel cukup besar (\(n>30\)).
Contoh Soal Sebuah survei terhadap 200 pedagang menunjukkan rata-rata pendapatan harian 120 ribu rupiah dengan simpangan baku populasi 40 ribu rupiah. Hitung selang kepercayaan 95%.
# Datax_bar <-120# Rata-rata sampelsigma <-40# Simpangan baku populasin <-200# Ukuran sampelalpha <-0.05# Tingkat signifikansi# Hitung Z-scorez_alpha <-qnorm(1- alpha/2)# Hitung Margin of ErrorME <- z_alpha * (sigma /sqrt(n))# Hitung Selang Kepercayaanlower_bound <- x_bar - MEupper_bound <- x_bar + MEc(lower_bound, upper_bound)
[1] 114.4564 125.5436
Jika Varians Populasi Tidak Diketahui (t-Interval)
Digunakan jika \(\sigma\) tidak diketahui dan ukuran sampel kecil (\(n\le30\)).
Contoh Soal Seorang peneliti meneliti rata-rata pengeluaran mahasiswa untuk internet. Sampel 25 mahasiswa diperoleh rata-rata 155 ribu rupiah dengan simpangan baku sampel 10 ribu rupiah. Hitung selang kepercayaan 95%.
# Datax_bar <-155# Rata-rata sampels <-10# Simpangan baku sampeln <-25# Ukuran sampelalpha <-0.05# Tingkat signifikansi# Hitung t-scoret_alpha <-qt(1- alpha/2, df = n-1)# Hitung Margin of ErrorME <- t_alpha * (s /sqrt(n))# Hitung Selang Kepercayaanlower_bound <- x_bar - MEupper_bound <- x_bar + MEc(lower_bound, upper_bound)
[1] 150.8722 159.1278
Selang Kepercayaan Untuk Proporsi
Selang kepercayaan untuk proporsi digunakan untuk mengestimasi proporsi populasi berdasarkan sampel besar.
Contoh Soal Sebuah survei terhadap 2000 UMKM menunjukkan bahwa 1600 mengalami penurunan omzet. Hitung selang kepercayaan 95% untuk proporsi UMKM yang mengalami penurunan omzet.
Jika selang kepercayaan tidak mencakup nilai yang diuji dalam hipotesis nol, maka kita menolak \(H_0\).
Jika selang kepercayaan mencakup nilai hipotesis nol, maka kita gagal menolak \(H_0\).
Latihan
Hitung selang kepercayaan 99% untuk rata-rata pendapatan harian pedagang makanan keliling jika diketahui rata-rata 120 ribu, simpangan baku 40 ribu, dan sampel 200 pedagang.
Dari 500 mahasiswa yang disurvei, 300 mengakses internet melalui WiFi rumah. Hitung selang kepercayaan 90% untuk proporsi mahasiswa yang menggunakan WiFi rumah.
Uji Hipotesis
Pengantar Uji Hipotesis
Uji hipotesis adalah prosedur statistik untuk menguji klaim atau asumsi terhadap parameter populasi berdasarkan data sampel. Dalam R, uji hipotesis dapat dilakukan dengan berbagai metode tergantung pada jenis data dan asumsi yang digunakan.
Langkah-langkah dalam Uji Hipotesis
Menentukan \(H_0\) dan \(H_1\)
Menentukan tingkat signifikasi (\(\alpha\)). catatan: Jika tidak disebutkan di soal, biasanya menggunakan \(\alpha=0.05\).
Memilih Statistik Uji yang sesuai (Uji Z, Uji t, uji \(X^2\), dll)
Menghitung nilai p atau statistik uji
Membandingkan nilai p dengan \(\alpha\) atau menggunakan daerah kritis.
Mengambil keputusan
Uji Hipotesis untuk rata-rata
Uji Z
Digunakan jika varians populasi diketahui dan sampel cukup besar (\(n>30\)).
Contoh soal
Seorang manajer ingin menguji apakah rata-rata jam kerja karyawan lebih dari 8 jam per hari. Diasumsikan bahwa simpangan baku populasi adalah 1.5 jam, dan data dari 64 karyawan diperoleh rata-rata 8.2 jam per hari.
\(H_0: \mu\le8\) (Rata-rata jam kerja karyawan tidak lebih dari 8 jam per hari)
\(H_1: \mu>8\) (Rata-rata jam kerja karyawan lebih dari 8 jam per hari)
\(\alpha=0.05\)
# Datax_bar <-8.2# Rata-rata sampelmu_0 <-8# Hipotesis nolsigma <-1.5# Simpangan baku populasin <-64# Ukuran sampel# Hitung Z-statistikz_hitung <- (x_bar - mu_0) / (sigma /sqrt(n))z_hitung
[1] 1.066667
# Hitung nilai pp_value <-1-pnorm(z_hitung)p_value
[1] 0.1430612
# Keputusanalpha <-0.05if (p_value < alpha) {print("Tolak H0: Rata-rata jam kerja lebih dari 8 jam")} else {print("Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan rata-rata lebih dari 8 jam")}
[1] "Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan rata-rata lebih dari 8 jam"
Uji t
Digunakan jika varians populasi tidak diketahui atau sampel kecil (\(n\le30\))
Contoh soal Seorang peneliti ingin menguji apakah rata-rata pengeluaran mahasiswa untuk internet per bulan adalah 150 ribu rupiah. Sebuah sampel acak dari 25 mahasiswa diperoleh rata-rata 155 ribu rupiah dengan simpangan baku 10 ribu rupiah.
\(H_0: \mu=150\) (Rata-rata pengeluaran mahasiswa untuk internet per bulan adalah 150 ribu)
\(H_1: \mu\ne150\) (Rata-rata pengeluaran mahasiswa untuk internet per bulan bukanlah 150 ribu)
\(\alpha=0.05\)
# Datax_bar <-155# Rata-rata sampelmu_0 <-150# Hipotesis nols <-10# Simpangan baku sampeln <-25# Ukuran sampel# Hitung t-statistikt_hitung <- (x_bar - mu_0) / (s /sqrt(n))t_hitung
[1] 2.5
# Hitung nilai pp_value <-2* (1-pt(abs(t_hitung), df = n -1))p_value
[1] 0.01965418
# Keputusanalpha <-0.05if (p_value < alpha) {print("Tolak H0: Pengeluaran mahasiswa berbeda dari 150 ribu")} else {print("Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan perbedaan")}
[1] "Tolak H0: Pengeluaran mahasiswa berbeda dari 150 ribu"
Uji Hipotesis untuk Proporsi
Digunakan untuk menguji klaim tentang proporsi populasi berdasarkan data sampel.
Contoh Soal Sebuah perusahaan mengklaim bahwa 8% dari email promosi mereka mendapatkan respons. Untuk menguji klaim ini, diambil sampel 500 email, dan ditemukan bahwa hanya 25 yang mendapatkan respons.
\(H_0: p=0.08\) (Proporsi email yang mendapatkan respons adalah 8%)
\(H_1: p\ne0.08\) (Proporsi email yang mendapatkan respons berbeda dari 8%)
# Hitung nilai pp_value <-2* (1-pnorm(abs(z_hitung)))p_value
[1] 0.01341054
# Keputusanalpha <-0.05if (p_value < alpha) {print("Tolak H0: Proporsi berbeda dari 8%")} else {print("Gagal menolak H0: Tidak cukup bukti untuk menyimpulkan perbedaan")}
[1] "Tolak H0: Proporsi berbeda dari 8%"
Keputusan berdasarkan nilai p-value
Jika \(p-value < \alpha\), tolak \(H_0\) (Ada cukup bukti untuk menerima \(H_1\))
Jika \(p-value \ge \alpha\), gagal menolak \(H_0\) (tidak cukup bukti untuk menerima \(H_1\))
Latihan
Uji apakah rata-rata pendapatan harian pedagang makanan keliling lebih dari 120 ribu rupiah, jika diketahui simpangan baku adalah 40 ribu rupiah dengan sampel 200 pedagang.
Uji apakah proporsi mahasiswa yang menggunakan internet rumahan lebih dari 34%, jika dari 1000 mahasiswa, 350 di antaranya menggunakan internet rumahan.
Ambil sampel acak sebanyak 25 pengamatan. Gunakan set.seed(123) untuk reproduktabilitas model
Tampilkan ringkasan statistik dari sampel yang kamu ambil
Hitung interval kepercayaan 95% untuk rata-rata konsumsi bahan bakar mpg
Interpretasikan hasilnya
Ulangi perhitungan untuk interval kepercayaan 99% dan bandingkan hasilnya. Apakah intervalnya menjadi lebih lebar atau sempit?
** Uji Hipotesis **
Sebuah perusahaan otomotif mengklaim bahwa rata-rata tenaga (hp – horsepower) mobil yang diproduksi oleh mereka adalah 150 hp.
Gunakan data dari Dataset mtcars untuk menguji hipotesis pada taraf signifikasi 5%.
Uji Hipotesis Dua Sampel
Uji hipotesis dua sampel digunakan untuk membandingkan rata-rata atau proporsi dari dua kelompok yang berbeda. Uji ini membantu menentukan apakah terdapat perbedaan yang signifikan antara dua kelompok dalam suatu populasi.
Jenis Uji Hipotesis Dua Sampel:
Uji t Dua Sampel (Independent t-test): Digunakan untuk membandingkan dua kelompok yang tidak berhubungan.
Uji t Berpasangan (Paired t-test): Digunakan untuk membandingkan dua kelompok yang berhubungan (misalnya, sebelum dan sesudah perlakuan).
Independent t-test
Terdapat 3 situasi dalam uji independent t-test.
\(\sigma_1^2\) dan \(\sigma_2^2\) diketahui ; Uji Z
\(\sigma_1^2\) dan \(\sigma_2^2\) tidak diketahui dan diasumsikan bernilai sama ; Uji t
\(\sigma_1^2\) dan \(\sigma_2^2\) tidak diketahui dan diasumsikan bernilai berbeda ; Uji t
Contoh Kasus
Seorang peneliti ingin mengetahui apakah terdapat perbedaan rata-rata pendapatan antara pekerja yang memiliki pelatihan profesional dan yang tidak.
# Membuat Dataset.seed(123)pelatihan <-data.frame(pendapatan =c(rnorm(50, mean =6000, sd =500), rnorm(50, mean =6500, sd =500)),grup =rep(c("Tanpa Pelatihan", "Dengan Pelatihan"), each =50))# Uji t Dua Sampelt.test(pendapatan ~ grup, data = pelatihan, var.equal =TRUE)
Two Sample t-test
data: pendapatan by grup
t = 6.0718, df = 98, p-value = 2.403e-08
alternative hypothesis: true difference in means between group Dengan Pelatihan and group Tanpa Pelatihan is not equal to 0
95 percent confidence interval:
374.2816 737.7231
sample estimates:
mean in group Dengan Pelatihan mean in group Tanpa Pelatihan
6573.204 6017.202
p-value < 0.05, maka kita menolak hipotesis nol (\(H_0\)). Ini berarti terdapat perbedaan yang sangat signifikan antara dua kelompok yang diuji.
Andaikan Anda adalah seorang analis keuangan di suatu perusahaan sekuritas, dan ingin menguji apakah ada perbedaan besaran dividen dari emiten di NYSE dan NASDAQ. Ringkasan datanya adalah sebagai berikut
Lakuan pengujian apakah ada perbedaan rata-rata antara keduanya pada \(\alpha = 0.05\), dengan mengasumsikan ragam keduanya sama.
# Data ringkasan dari NYSE dan NASDAQn_nyse <-21mean_nyse <-3.27sd_nyse <-1.30n_nasdaq <-25mean_nasdaq <-2.53sd_nasdaq <-1.16# Uji t dua sampel dengan asumsi varians samat.test(x =rnorm(n_nyse, mean_nyse, sd_nyse),y =rnorm(n_nasdaq, mean_nasdaq, sd_nasdaq),var.equal =TRUE)
Two Sample t-test
data: rnorm(n_nyse, mean_nyse, sd_nyse) and rnorm(n_nasdaq, mean_nasdaq, sd_nasdaq)
t = 1.6991, df = 44, p-value = 0.09636
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1051896 1.2355077
sample estimates:
mean of x mean of y
2.832336 2.267177
p-value > 0.05, gagal menolak \(H_0\). Tidak ada bukti cukup bahwa rata-rata deviden berbeda.
Seorang peneliti ingin mengetahui apakah terdapat perbedaan rata-rata skor ujian antara dua kelas yang diberikan metode pengajaran berbeda. Diketahui:
Kelas A: n = 30, rata-rata = 78, standar deviasi = 10
Kelas B: n = 35, rata-rata = 82, standar deviasi = 12
Lakukan pengujian dengan tingkat signifikansi α = 0.05 dan asumsikan varians kedua kelompok diketahui.
p-value > 0.05, maka tidak ada cukup bukti untuk menyatakan bahwa terdapat perbedaan yang signifikan.
Paired t-test
Contoh kasus
Andaikan sebuah perusahaan mengirimkan karyawannya ke suatu pelatihan “layanan prima untuk pelanggan”. Apakah pelatihan ini berdampak pada perubahan jumlah keluhan pelanggan? Data yang diperoleh dari contoh 5 (lima) karyawan adalah sebagai berikut:
# Data jumlah keluhan sebelum dan sesudah pelatihankeluhan_sebelum <-c(6, 20, 3, 0, 4)keluhan_sesudah <-c(4, 6, 2, 0, 0)# Uji t berpasangant.test(keluhan_sebelum, keluhan_sesudah, paired =TRUE)
Paired t-test
data: keluhan_sebelum and keluhan_sesudah
t = 1.655, df = 4, p-value = 0.1733
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
-2.845828 11.245828
sample estimates:
mean difference
4.2
p-value > 0.05, maka tidak ada cukup bukti untuk menyatakan bahwa pelatihan berdampak pada jumlah keluhan