STA1512-Pengujian Hipotesis
1. Pengujian Hipotesis untuk Rata-Rata
Statistik Uji
Untuk sampel besar:
Untuk sampel kecil:
dengan df=n-1.
Contoh 1
- Jim Nasium mengklaim bahwa A.C.T. skor yang dicapai oleh mahasiswa adalah 22. Al Dente menduga klaim ini terlalu rendah dan memilih sampel acak dari 121 mahasiswa. Rata-rata sampel adalah 23.3 dan standar deviasi populasi diasumsikan 3.3. Uji pada tingkat signifikansi 5% (alfa).
I. Hipotesis
H0: \(\mu\leq22\)
H1: \(\mu>22\)
Tingkat Signifikansi (\(\alpha=0.05\))
Statistik Uji:
=22
mean0=23.3
xbar=3.3
s=121
n
=(xbar-mean0)/(s/sqrt(n))
z_value z_value
## [1] 4.333333
=qnorm(0.95,lower.tail = TRUE)
z_table z_table
## [1] 1.644854
- Daerah Kritis
H0 ditolak jika z_value>z_table. (Uji sisi kanan)
V. Kesimpulan
Karena z_value=4.333333 lebih besar dari z_table=1.645, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 5%.
Contoh 2
- Sekretaris asosiasi tukang kebun profesional mengklaim bahwa rata-rata biaya layanan kepada pelanggan adalah 90 USD per bulan. Merasa angka ini terlalu tinggi, dilakukan penarikan sampel acak dari 14 pelanggan yang diberi pertanyaan terkait biaya layanan. Berdasarkan sampel diperoleh biaya rata-rata 85 USD dan standar deviasi 10 USD. Uji pada tingkat signifikansi 0,10. Asumsikan bahwa biaya tersebut terdistribusi secara normal.
I. Hipotesis
H0: \(\mu\geq 90\)
H1: \(\mu<90\)
Tingkat signifikansi (\(\alpha=0.10\))
Statistik Uji:
=90
mean0=85
xbar=10
s=14
n
=(xbar-mean0)/(s/sqrt(n))
t_value t_value
## [1] -1.870829
=qt(0.10, df=13,lower.tail = TRUE)
t_table t_table
## [1] -1.350171
- Daerah Kritis
H0 ditolak jika t_value<t_table(0,10;df=13). (Uji sisi kiri)
V. Kesimpulan
Karena t_value=-1.870829 lebih rendah dari t_table=-1.350171, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 10%.
Contoh 3
- Hasil harian untuk pabrik kimia rata-rata mencapai 880 ton selama beberapa tahun terakhir. Manajer pabrik ingin mengetahui apakah rata-rata ini telah berubah. Kemudian manajer memilih secara acak hasil harian dalam 50 hari dan mencatat hasilnya. Berdasarkan hasil penarikan sampel diperoleh rata-rata 871 ton dengan standar deviasi 21 ton. Dengan menggunakan α = 0.01, lakukan pengujian apakah rata-rata hasil harian pabrik telah berubah.
I. Hipotesis
H0: \(\mu=880\)
H1: \(\mu\neq880\)
Tingkat signifikansi (\(\alpha=0.01\))
Statistik Uji:
=880
mean0=871
xbar=21
s=50
n
=(xbar-mean0)/(s/sqrt(n))
z_value z_value
## [1] -3.030458
=qnorm(0.975,lower.tail = TRUE)
z_table z_table
## [1] 1.959964
- Daerah Kritis
H0 ditolak jika |z_value|>z_table=1.96. (Uji dua sisi)
V. Kesimpulan
Karena |z_value|=3.03 lebih besar dari z_table=1.96, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 1% (terdapat perbedaan rata-rata hasil harian pabrik).
2. Pengujian Hipotesis untuk Proporsi
Statistik Uji
Contoh
A marketing company claims that it receives 8% responses from its mailing. To test this claim, a random sample of 500 were surveyed with 25 responses. Test at the α = 0.05 significance level.
I. Hipotesis
H0: \(p=0.08\)
H1: \(p\neq0.08\)
Tingkat signifikansi (\(\alpha=0.05\))
Statistik Uji:
=0.08
p0=25/500
phat=500
n
<-sqrt(p0*(1-p0)/n)
sp1
=(phat-p0)/(sp1)
z_value z_value
## [1] -2.472677
=qnorm(0.975,lower.tail = TRUE)
z_table z_table
## [1] 1.959964
- Daerah Kritis
H0 ditolak jika |z_value|>z_table=1.96. (Uji dua sisi)
V. Conclusion
Karena |z_value|=-2.47 lebih besar dari z_table=1.96, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 5% (Ada cukup bukti untuk menolak klaim perusahaan tentang tingkat respons 8%).
3. Pengujian Hipotesis untuk Perbandingan Rata-Rata Dua Populasi (Independent Samples)
Statistik Uji
Untuk sampel besar:
Statistik Uji untuk sampel kecil:
Equality of variance
Contoh 1
1.Apakah ada perbedaan skor rata-rata Daftar Periksa Nikotin (HONC) untuk pria versus wanita? (gunakan \(\alpha=0.05\))
I. Hipotesis
H0: \(\mu_{1}-\mu_{2}=0\) (same)
H1: \(\mu_{1}-\mu_{2}\neq0\) (different)
Tingkat signifikansi (\(\alpha=0.05\))
Statistik Uji:
<-0
delta0<-2.8
mean1<-1.6
mean2
<-150
n1<-182
n2
<-3.6
sd1<-2.9
sd2
<-((mean1-mean2)-delta0)/sqrt((sd1^2/n1)+(sd2^2/n2))
z_value z_value
## [1] 3.295301
IV.Daerah Kritis
<-qnorm(0.025,lower.tail = FALSE)
z_table z_table
## [1] 1.959964
H0 ditolak jika \(|z_{value}|>z_{table}\) . (Uji dua sisi)
V. Kesimpulan
Karena |z_value|= 3.29 lebih besar dari z_table= 1.96 , sehingga dapat disimpulan bahwa H0 ditolak pada tingkat signifikansi 5%.
Contoh 2
- Dua prosedur pelatihan dibandingkan dengan mengukur waktu yang diperlukan peserta pelatihan untuk merakit perangkat. Kelompok peserta pelatihan yang berbeda dilatih menggunakan setiap metode. Apakah ada perbedaan dalam kedua metode tersebut? Gunakan α = 0,01.
I. Hipotesis
H0: \(\mu_{1}-\mu_{2}=0\) (Tidak ada perbedaan)
H1: \(\mu_{1}-\mu_{2}\neq0\) (Ada perbedaan)
Tingkat signifikansi (\(\alpha=0.05\))
Statistik Uji:
- Equality of Variances Checking
<-4.9
sd1<-4.5
sd2
<-sd1^2
larger_s2<-sd2^2
smaller_s2
#divide larger and smaller
<- larger_s2/smaller_s2
div_result div_result
## [1] 1.185679
Karena hasilnya lebih kecil dari 3, sehingga akan digunakan statistik uji dengan asumsi ragamnya sama (Equal Variances Assumption).
- Statistik Uji menggunakan Equal Variances Assumption:
<-10
n1<-12
n2
<-35
mean1<-31
mean2
<-4.9
sd1<-4.5
sd2
<-0
delta0
<-((n1-1)*sd1^2 + (n2-1)*sd2^2)/(n1+n2-2)
s2 s2
## [1] 21.942
<-((mean1-mean2)-delta0)/sqrt((s2)*(1/n1+1/n2))
t_value t_value
## [1] 1.994349
IV.Daerah Kritis
<-qt(0.005,df=20,lower.tail = FALSE)
t_table t_table
## [1] 2.84534
H0 ditolak jika \(|t_{value}|>t_{0.005;20}\) . (Uji dua sisi)
V. Kesimpulan
Karena |t_value|= 1.99 lebih kecil dari \(t_{0.005;20}\)= 2.845 , sehingga dapat disimpulkan bahwa H0 tidak ditolak pada tingkat signifikansi 1% (tidak terdapat perbedaan antara dua metode pelatihan).
4. Uji t untuk Contoh Berpasangan
t-test for Difference between Means
To perform a two-sample hypothesis test with dependent samples.Three conditions are required to conduct the test.
The samples must be randomly selected.
The samples must be dependent (paired).
Both populations must be normally distributed.
Statistik Uji
Contoh
Pusat kelas membaca mengklaim bahwa siswa akan tampil lebih baik pada tes membaca standar setelah melalui kursus membaca yang ditawarkan oleh pusat mereka. Dengan menggunakan α = 0.05, apakah ada cukup bukti untuk menyimpulkan bahwa nilai siswa setelah kursus lebih baik daripada nilai sebelum kursus? Tabel berikut menunjukkan skor membaca dari 6 siswa sebelum dan sesudah kursus.
library(dplyr)
<-c(85,96,70,76,81,78)
before<-c(88,85,89,86,92,89)
after
# Create a data frame
<- data.frame(
my_data group = rep(c("before", "after"), each = 6),
score = c(before, after)
)
print(my_data)
## group score
## 1 before 85
## 2 before 96
## 3 before 70
## 4 before 76
## 5 before 81
## 6 before 78
## 7 after 88
## 8 after 85
## 9 after 89
## 10 after 86
## 11 after 92
## 12 after 89
group_by(my_data, group) %>%
summarise(
count = n(),
mean = mean(score, na.rm = TRUE),
sd = sd(score, na.rm = TRUE)
)
## # A tibble: 2 x 4
## group count mean sd
## <chr> <int> <dbl> <dbl>
## 1 after 6 88.2 2.48
## 2 before 6 81 8.90
I. Hipotesis
H0: \(\mu_{d}\leq0\)
H1: \(\mu_{d}>0\) (Claim)
Tingkat signifikansi (\(\alpha=0.05\))
Statistik Uji:
# compute the difference
<- with(my_data,
d == "after"] - score[group == "before"])
score[group d
## [1] 3 -11 19 10 11 11
#compute t-test (cara 1)
<-(mean(d)-0)/(sd(d)/sqrt(6))
t_valuea t_valuea
## [1] 1.713433
# Compute t-test
<- t.test(after,before, paired = TRUE)
t_value t_value
##
## Paired t-test
##
## data: after and before
## t = 1.7134, df = 5, p-value = 0.1473
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -3.585142 17.918475
## sample estimates:
## mean of the differences
## 7.166667
IV.Daerah Kritis
<-qt(0.05,df=5,lower.tail = FALSE)
t_table t_table
## [1] 2.015048
H0 ditolak jika \(|t_{value}|>t_{table}\) . (uji dua sisi)
V. Kesimpulan
Karena t_value=1.7134 lebih kecil dari t_table= 2.015048 , sehingga dapat disimpulkan bahwa H0 tidak ditolak pada tingkat signifikansi 5%.
Excercise
Peningkatan kadar kolesterol sering dikaitkan dengan penyakit kardiovaskular. Tingkat kolesterol sering dianggap terkait dengan jenis makanan, jumlah olahraga, dan faktor genetik yang terkait. Penelitian terbaru meneliti tingkat kolesterol di antara imigran baru dari China. Para peneliti tidak memiliki informasi sebelumnya tentang kelompok ini dan ingin mengevaluasi apakah kadar kolesterol rata-rata mereka berbeda dari kadar kolesterol rata-rata wanita paruh baya di Amerika Serikat. Distribusi kadar kolesterol pada wanita AS berusia 30-50 tahun diketahui berdistribusi normal dengan rata-rata 190mg/dL. Sebuah sampel acak dengan n=100 perempuan imigran Cina berusia 30-50 tahun yang telah berimigrasi ke Amerika Serikat pada tahun lalu dipilih dari catatan INS. Mereka diberikan tes darah yang menghasilkan kadar kolesterol rata-rata 178.2 mg/dL dan standar deviasi 45.3 mg/dL. Apakah terdapat bukti signifikan dalam data yang menunjukkan bahwa rata-rata kadar kolesterol imigran baru berbeda dari 190 mg/dL? (Gunakan α = 0.05)
Seiring meningkatnya kekhawatiran masyarakat akan infeksi bakteri, sebuah pabrik sabun mempromosikan produk baru untuk memenuhi permintaan sabun antibakteri. Produk baru ini memiliki harga yang jauh lebih tinggi daripada “sabun biasa” di pasaran. Sebuah lembaga pengujian konsumen mencatat bahwa sabun biasa juga membunuh bakteri dan mempertanyakan apakah sabun antibakteri yang baru merupakan peningkatan yang substansial dibandingkan sabun biasa. Prosedur untuk menguji kemampuan sabun dalam membunuh bakteri adalah dengan meletakkan larutan yang mengandung sabun tersebut ke dalam cawan petri kemudian menambahkan bakteri E. coli. Setelah masa inkubasi 24 jam, dilakukan penghitungan jumlah koloni bakteri pada cawan. Dari penelitian sebelumnya yang menggunakan berbagai merek sabun biasa, jumlah bakteri rata-rata adalah 33 untuk produk sabun biasa. Kelompok konsumen menguji sabun antibakteri menggunakan 35 cawan petri. Hasil dari 35 cawan petri rata-rata jumlah bakteri 31.2 dengan standar deviasi 8.4. Apakah data memberikan bukti yang cukup bahwa sabun antibakteri lebih efektif daripada sabun biasa dalam mengurangi jumlah bakteri? Gunakan α = 0.05.
Dua prosedur pelatihan dibandingkan dengan mengukur waktu yang diperlukan peserta pelatihan untuk merakit perangkat. Kelompok peserta pelatihan yang berbeda dilatih menggunakan setiap metode. Apakah ada perbedaan dalam kedua metode tersebut? Gunakan α = 0.01.
- Penyesuai asuransi khawatir dengan estimasi tinggi yang mereka terima untuk perbaikan otomatis dari garage (bengkel) I dibandingkan dengan garage (bengkel) II. Untuk memverifikasi kecurigaan mereka, masing-masing dari 15 mobil yang baru-baru ini mengalami kecelakaan dibawa ke kedua bengkel untuk perkiraan biaya perbaikan yang terpisah. Estimasi dari dua bengkel diberikan pada Tabel berikut. Lakukan pengujian menggunakan paired t-test dengan tingkat signifikansi α = 0.05.
Tugas dikumpulkan melalui link berikut: Click here