STA1512-Pengujian Hipotesis

1. Pengujian Hipotesis untuk Rata-Rata

Statistik Uji

Untuk sampel besar:

Untuk sampel kecil:

dengan df=n-1.

Contoh 1

  1. Jim Nasium mengklaim bahwa A.C.T. skor yang dicapai oleh mahasiswa adalah 22. Al Dente menduga klaim ini terlalu rendah dan memilih sampel acak dari 121 mahasiswa. Rata-rata sampel adalah 23.3 dan standar deviasi populasi diasumsikan 3.3. Uji pada tingkat signifikansi 5% (alfa).

I. Hipotesis

H0: \(\mu\leq22\)

H1: \(\mu>22\)

  1. Tingkat Signifikansi (\(\alpha=0.05\))

  2. Statistik Uji:

mean0=22
xbar=23.3
s=3.3
n=121

z_value=(xbar-mean0)/(s/sqrt(n))
z_value
## [1] 4.333333
z_table=qnorm(0.95,lower.tail = TRUE)
z_table
## [1] 1.644854
  1. Daerah Kritis

H0 ditolak jika z_value>z_table. (Uji sisi kanan)

V. Kesimpulan

Karena z_value=4.333333 lebih besar dari z_table=1.645, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 5%.

Contoh 2

  1. Sekretaris asosiasi tukang kebun profesional mengklaim bahwa rata-rata biaya layanan kepada pelanggan adalah 90 USD per bulan. Merasa angka ini terlalu tinggi, dilakukan penarikan sampel acak dari 14 pelanggan yang diberi pertanyaan terkait biaya layanan. Berdasarkan sampel diperoleh biaya rata-rata 85 USD dan standar deviasi 10 USD. Uji pada tingkat signifikansi 0,10. Asumsikan bahwa biaya tersebut terdistribusi secara normal.

I. Hipotesis

H0: \(\mu\geq 90\)

H1: \(\mu<90\)

  1. Tingkat signifikansi (\(\alpha=0.10\))

  2. Statistik Uji:

mean0=90
xbar=85
s=10
n=14

t_value=(xbar-mean0)/(s/sqrt(n))
t_value
## [1] -1.870829
t_table=qt(0.10, df=13,lower.tail = TRUE)
t_table
## [1] -1.350171
  1. Daerah Kritis

H0 ditolak jika t_value<t_table(0,10;df=13). (Uji sisi kiri)

V. Kesimpulan

Karena t_value=-1.870829 lebih rendah dari t_table=-1.350171, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 10%.

Contoh 3

  1. Hasil harian untuk pabrik kimia rata-rata mencapai 880 ton selama beberapa tahun terakhir. Manajer pabrik ingin mengetahui apakah rata-rata ini telah berubah. Kemudian manajer memilih secara acak hasil harian dalam 50 hari dan mencatat hasilnya. Berdasarkan hasil penarikan sampel diperoleh rata-rata 871 ton dengan standar deviasi 21 ton. Dengan menggunakan α = 0.01, lakukan pengujian apakah rata-rata hasil harian pabrik telah berubah.

I. Hipotesis

H0: \(\mu=880\)

H1: \(\mu\neq880\)

  1. Tingkat signifikansi (\(\alpha=0.01\))

  2. Statistik Uji:

mean0=880
xbar=871
s=21
n=50

z_value=(xbar-mean0)/(s/sqrt(n))
z_value
## [1] -3.030458
z_table=qnorm(0.975,lower.tail = TRUE)
z_table
## [1] 1.959964
  1. Daerah Kritis

H0 ditolak jika |z_value|>z_table=1.96. (Uji dua sisi)

V. Kesimpulan

Karena |z_value|=3.03 lebih besar dari z_table=1.96, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 1% (terdapat perbedaan rata-rata hasil harian pabrik).

2. Pengujian Hipotesis untuk Proporsi

Statistik Uji

Contoh

A marketing company claims that it receives 8% responses from its mailing. To test this claim, a random sample of 500 were surveyed with 25 responses. Test at the α = 0.05 significance level.

I. Hipotesis

H0: \(p=0.08\)

H1: \(p\neq0.08\)

  1. Tingkat signifikansi (\(\alpha=0.05\))

  2. Statistik Uji:

p0=0.08
phat=25/500
n=500

sp1<-sqrt(p0*(1-p0)/n)

z_value=(phat-p0)/(sp1)
z_value
## [1] -2.472677
z_table=qnorm(0.975,lower.tail = TRUE)
z_table
## [1] 1.959964
  1. Daerah Kritis

H0 ditolak jika |z_value|>z_table=1.96. (Uji dua sisi)

V. Conclusion

Karena |z_value|=-2.47 lebih besar dari z_table=1.96, sehingga dapat disimpulkan bahwa H0 ditolak pada tingkat signifikansi 5% (Ada cukup bukti untuk menolak klaim perusahaan tentang tingkat respons 8%).

3. Pengujian Hipotesis untuk Perbandingan Rata-Rata Dua Populasi (Independent Samples)

Statistik Uji

Untuk sampel besar:

Statistik Uji untuk sampel kecil:

Equality of variance

Contoh 1

1.Apakah ada perbedaan skor rata-rata Daftar Periksa Nikotin (HONC) untuk pria versus wanita? (gunakan \(\alpha=0.05\))

I. Hipotesis

H0: \(\mu_{1}-\mu_{2}=0\) (same)

H1: \(\mu_{1}-\mu_{2}\neq0\) (different)

  1. Tingkat signifikansi (\(\alpha=0.05\))

  2. Statistik Uji:

delta0<-0
mean1<-2.8
mean2<-1.6

n1<-150
n2<-182

sd1<-3.6
sd2<-2.9

z_value<-((mean1-mean2)-delta0)/sqrt((sd1^2/n1)+(sd2^2/n2))
z_value
## [1] 3.295301

IV.Daerah Kritis

z_table<-qnorm(0.025,lower.tail = FALSE)
z_table
## [1] 1.959964

H0 ditolak jika \(|z_{value}|>z_{table}\) . (Uji dua sisi)

V. Kesimpulan

Karena |z_value|= 3.29 lebih besar dari z_table= 1.96 , sehingga dapat disimpulan bahwa H0 ditolak pada tingkat signifikansi 5%.

Contoh 2

  1. Dua prosedur pelatihan dibandingkan dengan mengukur waktu yang diperlukan peserta pelatihan untuk merakit perangkat. Kelompok peserta pelatihan yang berbeda dilatih menggunakan setiap metode. Apakah ada perbedaan dalam kedua metode tersebut? Gunakan α = 0,01.

I. Hipotesis

H0: \(\mu_{1}-\mu_{2}=0\) (Tidak ada perbedaan)

H1: \(\mu_{1}-\mu_{2}\neq0\) (Ada perbedaan)

  1. Tingkat signifikansi (\(\alpha=0.05\))

  2. Statistik Uji:

  • Equality of Variances Checking
sd1<-4.9
sd2<-4.5

larger_s2<-sd1^2
smaller_s2<-sd2^2

#divide larger and smaller

div_result<- larger_s2/smaller_s2
div_result
## [1] 1.185679

Karena hasilnya lebih kecil dari 3, sehingga akan digunakan statistik uji dengan asumsi ragamnya sama (Equal Variances Assumption).

  • Statistik Uji menggunakan Equal Variances Assumption:
n1<-10
n2<-12

mean1<-35
mean2<-31

sd1<-4.9
sd2<-4.5

delta0<-0

s2<-((n1-1)*sd1^2 + (n2-1)*sd2^2)/(n1+n2-2)
s2
## [1] 21.942
t_value<-((mean1-mean2)-delta0)/sqrt((s2)*(1/n1+1/n2))
t_value
## [1] 1.994349

IV.Daerah Kritis

t_table<-qt(0.005,df=20,lower.tail = FALSE)
t_table
## [1] 2.84534

H0 ditolak jika \(|t_{value}|>t_{0.005;20}\) . (Uji dua sisi)

V. Kesimpulan

Karena |t_value|= 1.99 lebih kecil dari \(t_{0.005;20}\)= 2.845 , sehingga dapat disimpulkan bahwa H0 tidak ditolak pada tingkat signifikansi 1% (tidak terdapat perbedaan antara dua metode pelatihan).

4. Uji t untuk Contoh Berpasangan

t-test for Difference between Means

To perform a two-sample hypothesis test with dependent samples.Three conditions are required to conduct the test.

  1. The samples must be randomly selected.

  2. The samples must be dependent (paired).

  3. Both populations must be normally distributed.

Statistik Uji

Contoh

Pusat kelas membaca mengklaim bahwa siswa akan tampil lebih baik pada tes membaca standar setelah melalui kursus membaca yang ditawarkan oleh pusat mereka. Dengan menggunakan α = 0.05, apakah ada cukup bukti untuk menyimpulkan bahwa nilai siswa setelah kursus lebih baik daripada nilai sebelum kursus? Tabel berikut menunjukkan skor membaca dari 6 siswa sebelum dan sesudah kursus.

library(dplyr)
before<-c(85,96,70,76,81,78)
after<-c(88,85,89,86,92,89)

# Create a data frame
my_data <- data.frame( 
                group = rep(c("before", "after"), each = 6),
                score = c(before,  after)
                )

print(my_data)
##     group score
## 1  before    85
## 2  before    96
## 3  before    70
## 4  before    76
## 5  before    81
## 6  before    78
## 7   after    88
## 8   after    85
## 9   after    89
## 10  after    86
## 11  after    92
## 12  after    89
group_by(my_data, group) %>%
  summarise(
    count = n(),
    mean = mean(score, na.rm = TRUE),
    sd = sd(score, na.rm = TRUE)
  )
## # A tibble: 2 x 4
##   group  count  mean    sd
##   <chr>  <int> <dbl> <dbl>
## 1 after      6  88.2  2.48
## 2 before     6  81    8.90

I. Hipotesis

H0: \(\mu_{d}\leq0\)

H1: \(\mu_{d}>0\) (Claim)

  1. Tingkat signifikansi (\(\alpha=0.05\))

  2. Statistik Uji:

# compute the difference
d <- with(my_data, 
        score[group == "after"] - score[group == "before"])
d
## [1]   3 -11  19  10  11  11
#compute t-test (cara 1)
t_valuea<-(mean(d)-0)/(sd(d)/sqrt(6))
t_valuea
## [1] 1.713433
# Compute t-test
t_value <- t.test(after,before, paired = TRUE)
t_value
## 
##  Paired t-test
## 
## data:  after and before
## t = 1.7134, df = 5, p-value = 0.1473
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -3.585142 17.918475
## sample estimates:
## mean of the differences 
##                7.166667

IV.Daerah Kritis

t_table<-qt(0.05,df=5,lower.tail = FALSE)
t_table
## [1] 2.015048

H0 ditolak jika \(|t_{value}|>t_{table}\) . (uji dua sisi)

V. Kesimpulan

Karena t_value=1.7134 lebih kecil dari t_table= 2.015048 , sehingga dapat disimpulkan bahwa H0 tidak ditolak pada tingkat signifikansi 5%.

Excercise

  1. Peningkatan kadar kolesterol sering dikaitkan dengan penyakit kardiovaskular. Tingkat kolesterol sering dianggap terkait dengan jenis makanan, jumlah olahraga, dan faktor genetik yang terkait. Penelitian terbaru meneliti tingkat kolesterol di antara imigran baru dari China. Para peneliti tidak memiliki informasi sebelumnya tentang kelompok ini dan ingin mengevaluasi apakah kadar kolesterol rata-rata mereka berbeda dari kadar kolesterol rata-rata wanita paruh baya di Amerika Serikat. Distribusi kadar kolesterol pada wanita AS berusia 30-50 tahun diketahui berdistribusi normal dengan rata-rata 190mg/dL. Sebuah sampel acak dengan n=100 perempuan imigran Cina berusia 30-50 tahun yang telah berimigrasi ke Amerika Serikat pada tahun lalu dipilih dari catatan INS. Mereka diberikan tes darah yang menghasilkan kadar kolesterol rata-rata 178.2 mg/dL dan standar deviasi 45.3 mg/dL. Apakah terdapat bukti signifikan dalam data yang menunjukkan bahwa rata-rata kadar kolesterol imigran baru berbeda dari 190 mg/dL? (Gunakan α = 0.05)

  2. Seiring meningkatnya kekhawatiran masyarakat akan infeksi bakteri, sebuah pabrik sabun mempromosikan produk baru untuk memenuhi permintaan sabun antibakteri. Produk baru ini memiliki harga yang jauh lebih tinggi daripada “sabun biasa” di pasaran. Sebuah lembaga pengujian konsumen mencatat bahwa sabun biasa juga membunuh bakteri dan mempertanyakan apakah sabun antibakteri yang baru merupakan peningkatan yang substansial dibandingkan sabun biasa. Prosedur untuk menguji kemampuan sabun dalam membunuh bakteri adalah dengan meletakkan larutan yang mengandung sabun tersebut ke dalam cawan petri kemudian menambahkan bakteri E. coli. Setelah masa inkubasi 24 jam, dilakukan penghitungan jumlah koloni bakteri pada cawan. Dari penelitian sebelumnya yang menggunakan berbagai merek sabun biasa, jumlah bakteri rata-rata adalah 33 untuk produk sabun biasa. Kelompok konsumen menguji sabun antibakteri menggunakan 35 cawan petri. Hasil dari 35 cawan petri rata-rata jumlah bakteri 31.2 dengan standar deviasi 8.4. Apakah data memberikan bukti yang cukup bahwa sabun antibakteri lebih efektif daripada sabun biasa dalam mengurangi jumlah bakteri? Gunakan α = 0.05.

  3. Dua prosedur pelatihan dibandingkan dengan mengukur waktu yang diperlukan peserta pelatihan untuk merakit perangkat. Kelompok peserta pelatihan yang berbeda dilatih menggunakan setiap metode. Apakah ada perbedaan dalam kedua metode tersebut? Gunakan α = 0.01.

  1. Penyesuai asuransi khawatir dengan estimasi tinggi yang mereka terima untuk perbaikan otomatis dari garage (bengkel) I dibandingkan dengan garage (bengkel) II. Untuk memverifikasi kecurigaan mereka, masing-masing dari 15 mobil yang baru-baru ini mengalami kecelakaan dibawa ke kedua bengkel untuk perkiraan biaya perbaikan yang terpisah. Estimasi dari dua bengkel diberikan pada Tabel berikut. Lakukan pengujian menggunakan paired t-test dengan tingkat signifikansi α = 0.05.

Tugas dikumpulkan melalui link berikut: Click here