~ Hypothesis Testing ~
Tugas Komputasi Statistika
| Kontak | : \(\downarrow\) |
| yosia.yosia@student.matanauniversity.ac.id | |
| yyosia | |
| RPubs | https://rpubs.com/yosia/ |
Sebagai data scientist, Anda mungkin mempertahankan atau menolak hipotesis berdasarkan pengukuran sampel yang diamati. Keputusan sering didasarkan pada mekanisme statistik yang disebut pengujian hipotesis. Ada tiga syarat untuk melakukan pengujian hipotesis, antara lain:
- Left Tailed Test: ketika \(\bar{x}\) secara signifikan di bawah rata-rata populasi yang dihipotesiskan \(µ_0\) kemudian \(H_0\) akan ditolak dan uji yang digunakan adalah uji arah kanan (uji daerah bawah) sejak daerah kritis.
\[\text{Left Tailed Test} = \begin{cases} {H_0: \mu \ge \mu_0} \\ {H1: \mu < \mu_0 } \end{cases}\]
- Right Tailed Test: ketika \(\bar{x}\) secara signifikan di bawah rata-rata populasi yang dihipotesiskan \(µ_0\) kemudian \(H_0\) akan ditolak dan uji yang digunakan adalah uji arah kanan (uji daerah atas) sejak daerah kritis.
\[\text{Right Tailed Test} = \begin{cases} {H_0: \mu \le \mu_0} \\ {H1: \mu > \mu_0 } \end{cases}\]
- Two Tailed Test: ketika \(\bar{x}\) berbeda secara signifikan (secara signifikan lebih tinggi atau lebih rendah dari) dari rata-rata populasi hipotesis \(µ_0\) kemudian \(H_0\) akan ditolak. Dalam hal ini, uji dua arah akan diterapkan karena akan ada dua daerah kritis (menunjukkan penolakan terhadap \(H_0\)) pada kedua ekor kurva normal (mewakili distribusi sampling statistik sampel \(\bar{x}\))
\[\text{Two Tailed Test} = \begin{cases} {H_0: \mu = \mu_0} \\ {H1: \mu \neq \mu_0 } \end{cases}\]
Daerah kritis untuk Hypothesis Testing ditunjukkan
sebagai bagian yang diarsir pada gambar berikut:
Ada empat kemungkinan untuk membuat keputusan:
- Tolak \(H_0\) ketika itu false Positive
- Terima \(H_0\) ketika itu true Positive
- Tolak \(H_\alpha\) ketika itu false Negative
- Terima \(H_\alpha\) ketika itu true Negative
Jelas, yang pertama menolak hipotesis nol ketika itu false Positive, yang disebut kesalahan tipe I. Probabilitas melakukan kesalahan tipe I dilambangkan dengan \(\alpha\) \[P(\text{type I error})=P() \text{Rejecting $(H_0|H_\alpha)$ is false positive}\]
Kedua menolak hipotesis alternatif ketika itu false Negative, yang disebut kesalahan tipe II. Probabilitas melakukan kesalahan tipe II dilambangkan dengan \(\beta\)
\[P(\text{type II error})=P() \text{Rejecting $(H_a|H_\beta)$ is false negative}\]
Pada perbandingan nilai yang diamati dari statistik uji dengan nilai kritis, dapat di identifikasi apakah nilai yang diamati terletak di wilayah kritis (tolak \(H_0\)) atau di wilayah penerimaan (jangan menolak \(H_0\)) dan memutuskannya.
- Left Tailed Test : Jika \(Z_{crit} < -1.645\), Kemudian menolak \(H_0\) pada tingkat signifikansi 5% (\(α\) diambil sebagai 5% di sebagian besar situasi analitik).
- Right Tailed Test : Jika \(Z_{crit} > -1.645\), Kemudian menolak \(H_0\) pada tingkat signifikansi 5%.
- Two Tailed Test : Jika \(Z_{crit} > 1.96\) atau jika \(Z_{crit} > -1.96\), Kemudian menolak \(H_0\) pada tingkat signifikansi 5%.
Selain itu terdapat juga pendekatan alternatif untuk pengujian hipotesis, pendekatan ini sangat banyak digunakan dalam semua paket perangkat lunak. Ini dikenal sebagai nilai probabilitas/ prob. nilai/ p-value. Dimana memberikan probabilitas untuk mendapatkan nilai statistik sejauh ini atau lebih jauh dari nilai hipotesis jika \(H_0\) benar. Ini menunjukkan seberapa besar kemungkinan hasil yang telah kami amati. Ini dapat dijelaskan lebih lanjut sebagai probabilitas mengamati statistik uji jika \(H_0\) benar yaitu apa peluang dalam mendukung terjadinya \(H_0\). Jika nilai-p kecil, itu berarti ada lebih sedikit peluang (kasus langka) yang mendukung \(H_0\) terjadi, karena perbedaan antara nilai sampel dan nilai hipotesis secara signifikan besar sehingga \(H_0\) dapat ditolak, jika tidak mungkin terjadi dipertahankan.
- Jika \(pvalue < α\) : Menolak \(H_0\)
- Jika \(pvalue ≥ α\) : Gagal Menolak \(H_0\)
Prosedur untuk Menemukan Nilai-P:
One-Tailed (Population Mean and Standard Deviation)
Hipotesis nol dari uji satu-pihak (kiri/kanan) dari rata-rata populasi \(μ\) dan \(σ\) dapat lihat sebagai berikut :
\[\text{Hypothesis Testing $H_0$} = \begin{cases} {\mu \ge \mu_0} & \text{Left Tail} \\ {\mu \le \mu_0} & \text{Right Tail} \end{cases}\]
di mana \(μ_0\) adalah batas kiri/kanan yang dihipotesis dari rata -rata \(μ\).
Selanjutnya adalah menentukan statistik uji Z dalam hal rata -rata sampel, ukuran sampel dan standar deviasi populasi \(σ\):
\[z={\bar{x}-\mu_0 \over \sigma/\sqrt{n}}\]
Kemudian hipotesis nol dari left tail test harus ditolak jika \(z≤ - z_α\), di mana \(z_α\) adalah persentil \(100 (1 - α)\) dari distribusi normal standar.
Kasus 20
Misalkan pabrikan mengklaim bahwa kecepatan rata -rata sepeda motor lebih dari 100 km/jam. Dalam sampel 30 sepeda motor, ditemukan bahwa mereka hanya berlangsung 99 km/jam rata -rata. Asumsikan standar deviasi populasi adalah 1,2 km/jam. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim oleh pabrikan?
mu0 = 100 # Nilai Hipotesis
xbar = 99 # Rata-Rata Sampel
sigma = 1.2 # Standar Deviasi Populasi
n = 30 # Ukuran Sample
z = (xbar-mu0)/(sigma/sqrt(n));z # test statistik## [1] -4.564355
alpha = .05 # .05 Tingkat Siqnifikansi
z.alpha = qnorm(1-alpha) # Nilai right tail critical
-z.alpha # Nilai left tail critical ## [1] -1.644854
Dikarenakan \(μ_0≥μ\), dalam kasus ini diharuskan untuk fokus pada nilai kritis left tail. Di sini, menemukan bahwa statistik uji -4.5644 kurang dari nilai kritis -1.6449. Akibatnya, pada tingkat signifikansi 0,05,artinya menolak klaim bahwa berarti benar klaimnya kecepatan sepeda motor di atas 100 km/jam.
SOLUSI ALTERNATIF
Dapat menerapkan fungsi pnorm untuk menghitung
p-value left tail dari statistik uji. Karena ternyata
kurang dari tingkat signifikansi 0,05, dapat menolak hipotesis nol bahwa
\(μ ≥ 100\)
pval = pnorm(z) # left tail p−value
pval # print p−value## [1] 2.505166e-06
Latihan 9
Right Tail : Sebuah perusahaan makanan berpendapat bahwa untuk masing -masing kantong kue produk mereka, paling banyak ada 2 gram lemak jenuh dalam satu kue. Dalam sampel 40 cookie, ditemukan bahwa jumlah rata -rata lemak jenuh per cookie adalah 2,1 gram. Asumsikan bahwa standar deviasi populasi adalah 0,25 gram. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim?
m = 2
xb = 2.1
sigma = 0.25
n = 40
z1 = (xb-m)/(sigma/sqrt(n))
z1 ## [1] 2.529822
alpha = .05
z.alpha = qnorm(1-alpha)
-z.alpha ## [1] -1.644854
nilaip = pnorm(z1)
nilaip## [1] 0.994294
Lalu dapat Disimpulkan bahwa statistik uji 2.529822 lebih dari nilai kritis -1.644854. Akibatnya, pada tingkat signifikansi 0,05, dapat menerima klaim bahwa 2 gram lemak jenuh dalam satu cookie.
Two-Tailed (Population Mean and Standard Deviation)
Hipotesis nol dari uji dua sisi dari rata-rata populasi \(μ\) dan \(σ\) dapat dinyatakan sebagai berikut:
\[μ_0=μ\]
di mana \(μ_0\) adalah nilai hipotesis dari rata -rata populasi sebenarnya \(μ\).
Selanjutnya Menentukan statistik uji Z dalam hal rata -rata sampel, ukuran sampel dan standar deviasi populasi \(σ\)L:
\[z = \frac{\bar{x}-μ_0}{σ/\sqrt{n}}\]
Maka hipotesis nol dari tes dua-ekor harus ditolak jika \(z≤-z_{α / 2}\) atau \(z≥-z_{α / 2}\), di mana zz_{α / 2} adalah Persentil \(100 (1 - α / 2)\) dari distribusi normal standar.
Kasus 21
Memisalkan berat rata -rata penguin raja yang ditemukan di koloni Antartika tahun lalu adalah 15,4 kg. Dalam sampel 35 penguin waktu yang sama tahun ini di koloni yang sama, berat penguin rata -rata adalah 14,6 kg. Asumsikan standar deviasi populasi adalah 2,5 kg. Pada tingkat signifikansi 0,05, dapatkah kita menolak hipotesis nol bahwa berat penguin rata -rata tidak berbeda dari tahun lalu?
mu0 = 15.4 # Nilai Hipotesis
xbar = 14.6 # Rata-Rata Sample
sigma = 2.5 # population standard deviation
n = 35 # Ukuran Sample
z = (xbar-mu0)/(sigma/sqrt(n));z # test statistic ## [1] -1.893146
alpha = .05 # Tingkat Siqnifikansi .05
z.half.alpha = qnorm(1-alpha/2) # per-one tail .025 significance level
c(-z.half.alpha, z.half.alpha) # Two-Tailed 0.05 significance level ## [1] -1.959964 1.959964
Statistik uji -1.8931 terletak di antara nilai kritis -1.9600 dan 1.9600. Oleh karena itu, pada tingkat signifikansi 0,05, tidak menolak hipotesis nol bahwa berat penguin rata -rata tidak berbeda dari tahun lalu.
One-Tailed (Population Mean and Unknown Standard Deviation)
Hipotesis nol dari uji satu-ekor (kiri/kanan) dari rata-rata populasi \(μ\) dan \(σ\) yang tidak diketahui dapat dinyatakan sebagai berikut:
\[\text{Hypothesis Testing $H_0$} = \begin{cases} {\mu \le \mu_0} & \text{Left Tail} \\ {\mu \ge \mu_0} & \text{Right Tail} \end{cases}\]
Di mana \(μ_0\) adalah batas kiri/kanan yang dihipotesis dari rata -rata \(μ_0\).
Lalu menentukan statistik uji dalam hal rata -rata sampel, ukuran sampel dan standar deviasi sampel s:
\[t = \frac{\bar{x}-μ_0}{s/\sqrt{n}}\]
Maka hipotesis nol dari uji lower tail harus ditolak jika \(t≤ - t_α\), di mana \(t_α\) adalah persentil \(100 (1 - α)\) dari distribusi student t dengan n - 1 derajat kebebasan.
Latihan 22
Misalkan pabrikan mengklaim bahwa rata -rata umur bola lampu lebih dari 10.000 jam. Dalam sampel 30 bola lampu, ditemukan bahwa rata -rata hanya berlangsung 9.900 jam. Asumsikan standar deviasi sampel adalah 125 jam. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim oleh pabrikan?
mu0 = 10000 # hypothesized value
xbar = 9900 # sample mean
s = 125 # sample standard deviation
n = 30 # sample size
t = (xbar-mu0)/(s/sqrt(n));t # test statistic ## [1] -4.38178
alpha = .05 # use 0.05 left tail significant level
t.alpha = qt(1-alpha, df=n-1) # right tail critical value
-t.alpha # left tail critical value ## [1] -1.699127
Statistik uji -4.3818 kurang dari nilai kritis -1.6991. Oleh karena itu, pada tingkat signifikansi 0,05, kita dapat menolak klaim bahwa berarti seumur hidup bola lampu di atas 10.000 jam.
SOLUSI ALTERNATIF Dapat menerapkan fungsi PT untuk menghitung nilai p ekor bawah dari statistik uji. Karena ternyata kurang dari tingkat signifikansi 0.05, Lalu menolak hipotesis nol bahwa \(μ ≥ 10000\)
pval = pt(t, df=n-1) # left tail p−value
pval # print p−value## [1] 7.035026e-05
Latihan 10
Right tail: Garuda-food Indonesia mengklaim bahwa untuk masing-masing tas kue dari produk mereka, ada paling banyak 2 gram lemak jenuh dalam satu kue. Dalam sampel 40 cookie, ditemukan bahwa jumlah rata -rata lemak jenuh per cookie adalah 2,1 gram. Asumsikan bahwa standar deviasi sampel adalah 0,3 gram. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim?
xbar= 2.1 # sample mean
mu0 = 2 # hypothesized value
s= 0.3 # sample standard deviation
n = 40 # sample size
t = (xbar-mu0)/(s/sqrt(n))
t## [1] 2.108185
alpha = .05
t.alpha = qt(1-alpha, df = n-1)
t.alpha # critical value ## [1] 1.684875
Two-Tailed (Population Mean and Unknown Standard Deviation)
Hipotesis nol dari uji dua sisi dari rata-rata populasi \(μ\) dan tidak diketahui \(σ\) dapat dinyatakan sebagai berikut:
\[μ_0=μ\]
di mana \(μ_0\) adalah nilai hipotesis dari rata -rata populasi sebenarnya \(μ\).
Selanjutnya Menentukan statistik uji t dalam hal rata -rata sampel, ukuran sampel dan standar deviasi populasi \(σ\):
\[z = \frac{\bar{x}-μ_0}{s/\sqrt{n}}\]
Maka hipotesis nol dari tes dua-ekor harus ditolak jika \(t≤-t_{α / 2}\) atau \(t≥-t_{α / 2}\), di mana \(t_{α / 2}\) adalah Persentil \(100 (1 - α )\) dari distribusi normal standar.
Kasus 23
Beberapa jurnal menyimpulkan bahwa berat rata -rata anjing hachiko di seluruh dunia sepuluh tahun terakhir adalah 15,4 kg. Para peneliti ingin memastikan apakah ada perubahan dalam berat rata -rata varietas ini setelah sepuluh tahun. Oleh karena itu, mereka mengambil sampel acak dari 35 anjing dari varietas yang sama dan pada saat yang sama tahun ini, mereka menemukan bahwa berat penguin rata -rata adalah 14,6 kg. Asumsikan standar deviasi sampel adalah 2,5 kg. Pada tingkat signifikansi 0,05, dapatkah kita menolak hipotesis nol bahwa rata -rata anjing hachiko tidak berbeda dari sepuluh tahun terakhir?
mu0 = 15.4 # hypothesized value
xbar = 14.6 # sample mean
s = 2.5 # sample standard deviation
n = 35 # sample size
t = (xbar-mu0)/(s/sqrt(n));t # test statistic ## [1] -1.893146
alpha = .05 # .05 significance level
t.half.alpha = qt(1-alpha/2, df=n-1) # per-one tail .025 significance level
c(-t.half.alpha, t.half.alpha) # Two-Tailed 0.05 significance level## [1] -2.032245 2.032245
Statistik uji -1.8931 terletak di antara nilai kritis -2.0322, dan 2.0322. Oleh karena itu, pada tingkat signifikansi 0,05, Maka tidak menolak hipotesis nol bahwa rata -rata anjing hachiko tidak berbeda dari sepuluh tahun terakhir.
SOLUSI ALTERNATIF Dapat menerapkan fungsi PT untuk menghitung nilai-p dua sisi dari statistik uji. Karena ternyata lebih besar dari tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa μ = 15,4.
pval = 2*pt(t, df=n-1) # left tail p−value
pval # print p−value## [1] 0.06687552
One-Tailed (Population Proportion)
Hipotesis nol dari tes left tail tentang proporsi populasi dapat dinyatakan sebagai berikut:
\[\text{Hypothesis Testing $H_0$} = \begin{cases} {p \ge p_0} & \text{Left Tail} \\ {p \le p_0} & \text{Right Tail} \end{cases}\]
di mana \(p_0\) adalah batas bawah yang dihipotesiskan dari proporsi populasi sebenarnya \(p\).
Selanjutnya menentukan statistik uji z dalam hal proporsi sampel dan ukuran sampel:
\[z = \frac{\bar{p}-p_0}{\sqrt{p_0(1-p_0)/n}}\]
Kemudian hipotesis nol dari uji ekor kiri harus ditolak jika \(z≤ - z_α\), di mana \(z_α\) adalah persentil \(100 (1 - α)\) dari distribusi normal standar.
Kasus 24
Misalkan 60% orang Indonesia memberikan suara dalam pemilihan terakhir. 85 dari 148 orang dalam survei telepon mengatakan bahwa mereka memberikan suara dalam pemilihan saat ini. Pada tingkat signifikansi 0,5, dapatkah kita menolak hipotesis nol bahwa proporsi pemilih dalam populasi di atas 60% untuk pemilihan berikutnya?
p0 = .6 # hypothesized value
pbar = 85/148 # sample proportion
n = 148 # sample size
z = (pbar-p0)/sqrt(p0*(1-p0)/n);z # test statistic ## [1] -0.6375983
## [1] -0.64
alpha = .05 # use 0.05 left tail significant level
z.alpha = qnorm(1-alpha) # right tail critical value
-z.alpha # left tail critical value## [1] -1.644854
Statistik uji -0.6376 tidak kurang dari nilai kritis -1.6449. Oleh karena itu, pada tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa proporsi pemilih dalam populasi adalah di atas 60% untuk pemilihan berikutnya.
SOLUSI ALTERNATIF 1 Dapat menerapkan fungsi
pnorm untuk menghitung nilai p ekor kiri dari statistik
uji. Karena ternyata lebih besar dari tingkat signifikansi 0,05, kami
tidak menolak hipotesis nol bahwa p ≥ 0,6 p≥0,6.
pval = pnorm(z) # left tail p−value
pval ## [1] 0.2618676
SOLUSI ALTERNATIF 2 Dapat menerapkan fungsi
prop.test untuk menghitung nilai-p secara langsung.
prop.test(85, 148, p=.6, alt="less", correct=FALSE) ##
## 1-sample proportions test without continuity correction
##
## data: 85 out of 148, null probability 0.6
## X-squared = 0.40653, df = 1, p-value = 0.2619
## alternative hypothesis: true p is less than 0.6
## 95 percent confidence interval:
## 0.0000000 0.6392527
## sample estimates:
## p
## 0.5743243
Latihan 11
Right tail: Memisalkan 12% mangga yang dipanen di kebun tahun lalu busuk. 30 dari 214 apel dalam sampel panen tahun ini ternyata busuk. Pada tingkat signifikansi 0,05, dapatkah kita menolak hipotesis nol bahwa proporsi mangga busuk dalam panen tetap di bawah 12% tahun ini?
pbar = 30/214 # sample proportion
p0 = .12 # hypothesized value
n = 214 # sample size
z = (pbar-p0)/sqrt(p0*(1-p0)/n)
z # test statistic## [1] 0.908751
alpha = .05
z.alpha = qnorm(1-alpha)
z.alpha # critical value## [1] 1.644854
Statistik uji 0,90875 tidak lebih besar dari nilai kritis 1,6449. Oleh karena itu, pada tingkat signifikansi 0,05, sehingga tidak menolak hipotesis nol bahwa proporsi apel busuk dalam panen tetap di bawah 12% tahun ini.
pval = pnorm(z, lower.tail=FALSE)
pval # upper tail p−value## [1] 0.1817408
prop.test(30, 214, p=.12, alt="greater", correct=FALSE)##
## 1-sample proportions test without continuity correction
##
## data: 30 out of 214, null probability 0.12
## X-squared = 0.82583, df = 1, p-value = 0.1817
## alternative hypothesis: true p is greater than 0.12
## 95 percent confidence interval:
## 0.1056274 1.0000000
## sample estimates:
## p
## 0.1401869
Two-Tailed (Population Proportion)
Hipotesis nol dari tes dua sisi tentang proporsi populasi dapat dinyatakan sebagai berikut
\[p_0=p\]
di mana \(p_0\) adalah nilai hipotesis dari proporsi populasi yang sebenarnya p.
Lalu menentukan statistik uji zz dalam hal proporsi sampel dan ukuran sampel
\[z = \frac{\bar{p}-p_0}{\sqrt{p_0(1-p_0)/n}}\] Kemudian hipotesis nol dari uji ekor kiri harus ditolak jika \(z≤ - z_α\), di mana \(z_α\) adalah persentil \(100 (1 - α)\) dari distribusi normal standar.
Kasus 25
Misalkan lemparan koin muncul 12 kepala dari 20 percobaan. Pada tingkat signifikansi 0,05, dapatkah seseorang menolak hipotesis nol bahwa lemparan koin itu adil?
p0 = .5 # hypothesized value
pbar = 12/20 # sample proportion
n = 20 # sample size
z = (pbar-p0)/sqrt(p0*(1-p0)/n)
z # test statistic ## [1] 0.8944272
alpha = .05 # .05 significance level
z.half.alpha = qnorm(1-alpha/2) # per-one tail .025 significance level
c(-z.half.alpha, z.half.alpha) # Two-Tailed 0.05 significance level## [1] -1.959964 1.959964
Statistik uji 0,89443 terletak di antara nilai kritis -1.9600 dan 1.9600. Oleh karena itu, pada tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa lemparan koin itu adil.
SOLUSI ALTERNATIF 1 Dapar menerapkan fungsi
PNORM untuk menghitung nilai-p dua sisi dari statistik uji.
Ini menggandakan nilai-p ekor kanan karena proporsi sampel lebih besar
dari nilai hipotesis. Karena ternyata lebih besar dari tingkat
signifikansi 0,05, kami tidak menolak hipotesis nol bahwa p = 0,5.
pval = 2 * pnorm(z, lower.tail=FALSE) # right tail
pval # two−tailed p−value ## [1] 0.3710934
SOLUSI ALTERNATIF 2 Kami menerapkan fungsi
prop.test untuk menghitung nilai-p secara langsung.
prop.test(12, 20, p=0.5, correct=FALSE) ##
## 1-sample proportions test without continuity correction
##
## data: 12 out of 20, null probability 0.5
## X-squared = 0.8, df = 1, p-value = 0.3711
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
## 0.3865815 0.7811935
## sample estimates:
## p
## 0.6
Dapat dilihat kesalahan Tipe II adalah karena kegagalan menolak hipotesis nol yang tidak valid. Probabilitas menghindari kesalahan tipe II disebut kekuatan uji hipotesis, dan dilambangkan dengan kuantitas \(1 - β\).
Type II Error One-Tail (Population Mean and Standard Deviation)
Dalam uji tail kiri/kanan rata -rata populasi, hipotesis nol mengklaim bahwa rata -rata populasi sebenarnya \(μ\) lebih besar dari nilai hipotetis yang diberikan \(μ_0\).
\[\text{Type II Error $H_a$} = \begin{cases} {\mu \ge \mu_0} & \text{Left Tail} \\ {\mu \le \mu_0} & \text{Right Tail} \end{cases}\]
Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya rata -rata μ μ sebenarnya kurang dari \(μ_0\).
Kasus 26
Misalkan pabrikan mengklaim bahwa kecepatan rata -rata sepeda motor lebih dari 100 km/jam. Asumsikan standar deviasi populasi adalah 1,2 km/jam. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 30 sepeda motor?
n = 30 # sample size
sigma = 1.2 # population standard deviation
sem = sigma/sqrt(n)
sem # standard error ## [1] 0.219089
alpha = .05 # significance level
mu0 = 100 # hypothetical lower bound
q = qnorm(alpha, mean=mu0, sd=sem)
q ## [1] 99.63963
Oleh karena itu, selama rata -rata sampel lebih besar dari 99,64 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena mengasumsikan bahwa rata -rata populasi aktual adalah 99,50, selanjutnya dapat menghitung probabilitas rata -rata sampel di atas 99,64, dan dengan demikian menemukan probabilitas kesalahan tipe II.
mu = 99.50 # assumed actual mean
pnorm(q, mean=mu, sd=sem, lower.tail=FALSE) ## [1] 0.261957
Jika ukuran sampel sepeda motor adalah 30, kecepatan motor rata -rata aktual adalah 9.950 jam dan standar deviasi populasi adalah 120 jam, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≥ 10000 μ≥10000 pada tingkat signifikansi .05 adalah 26.2 %, dan kekuatan tes hipotesis adalah 73,8%.
Latihan 12
Di bawah asumsi yang sama seperti kasus 26, jika kecepatan motor rata -rata aktual adalah 9.965 jam, berapa probabilitas kesalahan tipe II pada tingkat signifikansi 0,05? Apa kekuatan tes hipotesis?
Latihan 13
Right tail: Garuda-food Indonesia mengklaim bahwa untuk masing-masing tas kue dari produk mereka, ada paling banyak 2 gram lemak jenuh dalam satu kue. Asumsikan jumlah rata -rata aktual lemak jenuh per cookie adalah 2,075 gram dan standar deviasi sampel adalah 0,25 gram. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 cookie?
n = 35 # sample size
sigma = 0.25 # population standard deviation
sem = sigma/sqrt(n); sem # standard error## [1] 0.04225771
alpha = .05 # significance level
mu0 = 2 # hypothetical upper bound
q = qnorm(alpha, mean=mu0, sd=sem, lower.tail=FALSE); q ## [1] 2.069508
Oleh karena itu, selama rata -rata sampel kurang dari 2.1 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena kami mengasumsikan bahwa rata -rata populasi aktual adalah 2.09, kami dapat menghitung probabilitas rata -rata sampel di bawah 2.0695, dan dengan demikian menemukan probabilitas kesalahan tipe II.
mu = 2.075 # assumed actual mean
pnorm(q, mean=mu, sd=sem) ## [1] 0.448295
Jika ukuran sampel cookie adalah 35, jumlah rata -rata aktual lemak jenuh per cookie adalah 2,075 gram dan standar deviasi populasi adalah 0,25 gram, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≤ 2 pada tingkat signifikansi .05 adalah tingkat signifikansi adalah 45%, dan kekuatan tes hipotesis adalah 54%.
Type II Error in Two-Tailed (Population Mean and Standard Deviation)
Dalam tes dua sisi rata-rata populasi, hipotesis nol mengklaim bahwa rata-rata populasi sebenarnya \(μ\) sama dengan nilai hipotetis yang diberikan \(μ_0\).
\[μ_0=μ\] Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya rata -rata μ sebenarnya berbeda dari μ0.
Mengasumsikan bahwa populasi memiliki standar deviasi yang diketahui σ. Dengan Teorema Batas Pusat, populasi semua cara yang mungkin dari sampel dengan ukuran yang cukup besar n kira -kira mengikuti distribusi normal. Oleh karena itu kita dapat menghitung kisaran sarana sampel yang hipotesis nol tidak akan ditolak, dan kemudian mendapatkan perkiraan probabilitas kesalahan tipe II.
Kasus 27
Beberapa jurnal menyimpulkan bahwa berat rata -rata anjing hachiko di seluruh dunia sepuluh tahun terakhir adalah 15,4 kg. Para peneliti ingin memastikan apakah ada perubahan dalam berat rata -rata varietas ini setelah sepuluh tahun. Asumsikan berat populasi rata -rata aktual adalah 15,1 kg, dan standar deviasi populasi adalah 2,5 kg. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 anjing hachiko?
n = 35 # sample size
sigma = 2.5 # population standard deviation
sem = sigma/sqrt(n)
sem # standard error ## [1] 0.4225771
alpha = .05 # significance level
mu0 = 15.4 # hypothetical mean
I = c(alpha/2, 1-alpha/2)
q = qnorm(I, mean=mu0, sd=sem)
q ## [1] 14.57176 16.22824
Oleh karena itu, selama rata -rata sampel adalah antara 14.572 dan 16.228 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena disini berasumsi bahwa rata -rata populasi yang sebenarnya adalah 15.1, dapat menghitung probabilitas ekor yang lebih rendah dari kedua titik akhir.
mu = 15.1 # assumed actual mean
p = pnorm(q, mean=mu, sd=sem); p ## [1] 0.1056435 0.9962062
Akhirnya, probabilitas kesalahan tipe II adalah probabilitas antara dua titik akhir.
diff(p) # p[2]-p[1] ## [1] 0.8905627
Jika ukuran sampel anjing hachiko adalah 35, berat populasi rata -rata aktual adalah 15,1 kg dan standar deviasi populasi adalah 2,5 kg, maka probabilitas kesalahan tipe II untuk menguji level signifikansi nol μ = 15,4 pada tingkat signifikansi 0,05 adalah 89,1%, dan kekuatan tes hipotesis adalah 10,9%.
Latihan 14
Di bawah asumsi yang sama seperti kasus 27, jika berat populasi rata -rata aktual adalah 14,9 kg, berapa probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?
n = 35 # sample size
sigma = 2.5 # population standard deviation
sem = sigma/sqrt(n)
sem # standard error ## [1] 0.4225771
Selanjutnya adalah menghitung batas bawah dan atas rata-rata sampel yang hipotesis nolnya = 15.4 tidak akan ditolak.
alpha = .05 # significance level
mu0 = 15.4 # hypothetical mean
I = c(alpha/2, 1-alpha/2)
q = qnorm(I, mean=mu0, sd=sem)
q ## [1] 14.57176 16.22824
Maka, selama rata-rata sampel antara 15 dan 16 dalam suatu pengujian hipotesis, hipotesis nol tidak akan ditolak. Karena kita berasumsi bahwa rata-rata populasi sebenarnya adalah 14.9, maka hipotesis nol ditolak.
Type II Error One-Tailed (Population Mean and Unknown Standard Deviation)
Dalam uji tal kiri/kanan rata -rata populasi, hipotesis nol mengklaim bahwa rata -rata populasi sebenarnya μ lebih besar dari nilai hipotetis yang diberikan \(μ_0\).
\[\text{Type II Error $H_a$} = \begin{cases} {\mu \ge \mu_0} & \text{Left Tail} \\ {\mu \le \mu_0} & \text{Right Tail} \end{cases}\]
Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak
gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya
rata -rata μ sebenarnya kurang dari \(μ_0\).
Untuk n yang cukup besar, populasi statistik berikut dari semua sampel yang mungkin berukuran n adalah sekitar distribusi student dengan n - 1 derajat kebebasan.
\[ \frac{\bar{x}-μ}{s/\sqrt{n}}\] Disini dapat memungkinkan untuk menghitung rentang sarana sampel yang hipotesis nol tidak akan ditolak, dan untuk mendapatkan probabilitas kesalahan tipe II.
Kasus 28
Misalkan pabrikan mengklaim bahwa kecepatan rata -rata sepeda motor lebih dari 100 km/jam. Asumsikan seumur hidup bola lampu rata -rata adalah 99,50 jam dan standar deviasi masa pakai adalah 1,25 jam. Berapa probabilitas kesalahan tipe II untuk tes hipotesis pada tingkat signifikansi 0,05?
n = 30 # sample size
s = 1.25 # sample standard deviation
SE = s/sqrt(n)
SE # standard error estimate ## [1] 0.2282177
alpha = .05 # significance level
mu0 = 100 # hypothetical lower bound
q = mu0 + qt(alpha, df=n-1) * SE;
q ## [1] 99.61223
Oleh karena itu, selama rata -rata sampel lebih besar dari 99,612 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena diasumsikan bahwa rata -rata populasi aktual adalah 99,50, selanjutnya dapat menghitung probabilitas rata -rata sampel di atas 99,612, dan dengan demikian menemukan probabilitas kesalahan tipe II.
mu = 99.50 # assumed actual mean
pt((q - mu)/SE, df=n-1, lower.tail=FALSE)## [1] 0.3132943
Jika kecepatan motor ukuran sampel adalah 30, standar deviasi sampel adalah 1,25 jam dan masa pakai bola lampu rata -rata aktual adalah 9.950 jam, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≥ 10000 μ≥10000 pada 0,05 signifikansi Level adalah 31,3%, dan kekuatan uji hipotesis adalah 68,7%.
Latihan 15
Di bawah asumsi yang sama seperti di atas, jika rata -rata seumur hidup bola lampu adalah 9.965 jam, berapa probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?
n = 30 # sample size
s = 1.25 # sample standard deviation
SE = s/sqrt(n); SE # standard error estimate ## [1] 0.2282177
Selanjutnya hitung batas kiri rata-rata sampel yang hipotesis nolnya \(μ≥10000\) tidak akan ditolak.
alpha = .05 # significance level
mu0 = 100 # hypothetical lower bound
q = mu0 + qt(alpha, df=n-1) * SE
q ## [1] 99.61223
Oleh karena itu, selama rata-rata sampel lebih besar dari 99,612 dalam suatu pengujian hipotesis, hipotesis nol tidak akan ditolak. Karena kita berasumsi bahwa rata-rata populasi sebenarnya adalah 99,50, kita dapat menghitung probabilitas rata-rata sampel di atas 99,612, dan dengan demikian menemukan probabilitas kesalahan tipe II.
mu = 9.965 # assumed actual mean
pt((q - mu)/SE, df=n-1, lower.tail=FALSE)## [1] 6.889006e-56
Kasus 29
Garuda-food Indonesia mengklaim bahwa untuk masing-masing tas kue dari produk mereka, ada paling banyak 2 gram lemak jenuh dalam satu kue. Asumsikan jumlah rata -rata aktual lemak jenuh per cookie adalah 2,09 gram dan standar deviasi sampel adalah 0,3 gram. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 cookie?
n = 35 # sample size
s = 0.3 # sample standard deviation
SE = s/sqrt(n)
SE # standard error estimate ## [1] 0.05070926
alpha = .05 # significance level
mu0 = 2 # hypothetical upper bound
q = mu0 + qt(alpha, df=n-1, lower.tail=FALSE) * SE
q ## [1] 2.085746
Oleh karena itu, selama rata -rata sampel kurang dari 2.0857 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena dapat diasumsikan bahwa rata -rata populasi aktual adalah 2.09, kami dapat menghitung probabilitas rata -rata sampel di bawah 2.0857, dan dengan demikian menemukan probabilitas kesalahan tipe II.
mu = 2.09 # assumed actual mean
pt((q - mu)/SE, df=n-1) ## [1] 0.4668141
Jika ukuran sampel cookie adalah 35, standar sampel deviasi lemak jenuh per cookie adalah 0,3 gram dan jumlah rata -rata aktual lemak jenuh per cookie adalah 2,09 gram, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≤2 pada tingkat signifikansi 0,05 adalah 46,7%, dan kekuatan uji hipotesis adalah 53,3%.
Latihan 16
Di bawah asumsi yang sama seperti kasus 29, jika rata -rata lemak jenuh aktual per cookie adalah 2,075 gram, berapakah probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?
n = 35 # sample size
s = 0.3 # sample standard deviation
SE = s/sqrt(n); SE # standard error estimate ## [1] 0.05070926
Kemudian menghitung batas atas rata-rata sampel yang hipotesis nolnya μ≤2 tidak akan ditolak.
alpha = .05 # significance level
mu0 = 2 # hypothetical upper bound
q = mu0 + qt(alpha, df=n-1, lower.tail=FALSE) * SE
q ## [1] 2.085746
Oleh karena itu, selama rata-rata sampel kurang dari 2,0857 dalam suatu pengujian hipotesis, hipotesis nol tidak akan ditolak. Karena diasumsikan bahwa rata-rata populasi sebenarnya adalah 2,09, lalu dapat menghitung probabilitas rata-rata sampel di bawah 2,0857, dan dengan demikian menemukan probabilitas kesalahan tipe II.
mu = 2.075 # assumed actual mean
pt((q - mu)/SE, df=n-1) ## [1] 0.5832766
Jika ukuran sampel kue adalah 35, standar deviasi sampel lemak jenuh per kue adalah 0,3 gram dan jumlah rata-rata sebenarnya dari lemak jenuh per kue adalah 2,075 gram, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol \(μ≤2\) pada taraf signifikansi 0,05 sebesar 58%, dan daya uji hipotesis sebesar 42%.
Type II Error in Two-Tailed (Population Mean and Unknown Standard Deviation)
Dalam tes dua sisi rata-rata populasi, hipotesis nol mengklaim bahwa rata-rata populasi sebenarnya μ sama dengan nilai hipotetis yang diberikan \(μ_0\).
\[μ_0=μ\]
Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya rata -rata μ sebenarnya berbeda dari \(μ_0\).
Untuk n yang cukup besar, populasi statistik berikut dari semua sampel yang mungkin berukuran n adalah sekitar distribusi siswa dengan (n - 1) derajat kebebasan. \[ \frac{\bar{x}-μ}{s/\sqrt{n}}\] Ini dapat memungkinkan untuk menghitung rentang sarana sampel yang hipotesis nol tidak akan ditolak, dan untuk mendapatkan probabilitas kesalahan tipe II.
Kasus 30
Beberapa jurnal menyimpulkan bahwa berat rata -rata anjing hachiko di seluruh dunia sepuluh tahun terakhir adalah 15,4 kg. Para peneliti ingin memastikan apakah ada perubahan dalam berat rata -rata varietas ini setelah sepuluh tahun. Asumsikan berat populasi rata -rata aktual adalah 15,1 kg, dan standar deviasi populasi adalah 2,5 kg. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 anjing hachiko?
n = 35 # sample size
s = 2.5 # sample standard deviation
SE = s/sqrt(n)
SE # standard error estimate ## [1] 0.4225771
alpha = .05 # significance level
mu0 = 15.4 # hypothetical mean
I = c(alpha/2, 1-alpha/2)
q = mu0 + qt(I, df=n-1) * SE
q ## [1] 14.54122 16.25878
Oleh karena itu, selama rata -rata sampel adalah antara 14.541 dan 16.259 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena diasumsikan bahwa rata -rata populasi yang sebenarnya adalah 15.1, kami dapat menghitung probabilitas ekor yang lebih rendah dari kedua titik.
mu = 15.1 # assumed actual mean
p = pt((q - mu)/SE, df=n-1)
p ## [1] 0.09744507 0.99516802
diff(p) # p[2]-p[1] ## [1] 0.8977229
Jika ukuran sampel penguin adalah 35, standar deviasi sampel berat penguin adalah 2,5 kg dan berat populasi rata -rata aktual adalah 15,1 kg, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ = 15,4 pada 0,05 signifikansi signifikansi Level adalah 89,8%, dan kekuatan tes hipotesis adalah 10,2%.
Latihan 17
Di bawah asumsi yang sama seperti di atas, jika berat populasi rata -rata aktual adalah 14,9 kg, berapa probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?
n = 35 # sample size
s = 2.5 # sample standard deviation
SE = s/sqrt(n); SE # standard error estimate ## [1] 0.4225771
Kemudian menghitung batas bawah dan atas rata-rata sampel yang hipotesis nolnya \(μ=15.4\) tidak akan ditolak.
alpha = .05 # significance level
mu0 = 15.4 # hypothetical mean
I = c(alpha/2, 1-alpha/2)
q = mu0 + qt(I, df=n-1) * SE
q ## [1] 14.54122 16.25878
Oleh karena itu, selama rata-rata sampel antara 14,541 dan 16,259 dalam uji hipotesis, hipotesis nol tidak akan ditolak. Karena kita berasumsi bahwa rata-rata populasi sebenarnya adalah 15,1, kita dapat menghitung probabilitas ekor bawah dari kedua titik akhir.
mu = 14.9 # assumed actual mean
p = pt((q - mu)/SE, df=n-1); p ## [1] 0.2009020 0.9985729
Akhirnya, probabilitas kesalahan tipe II adalah probabilitas antara dua titik akhir.
diff(p) # p[2]-p[1] ## [1] 0.797671
R NOTES
Pengujian hipotesis untuk bingkai data, dapat mempertimbangkan paket -paket berikut:
t.test [stats Package]
library(stats) # package for t.test
#t.test(df$x, mu=mu_initial, alternative = "less", conf.level = 0.95) # left tail t-tets
#t.test(df$x, mu=mu_initial, alternative = "greater", conf.level = 0.95) # right tail t-tets
#t.test(Before, After, mu=0, alternative = "two.sided", conf.level = 0.99) # two tail
#?t.test # for t.tets (n<30 sampel)z.test [BSDA Package]
Fungsi ini didasarkan pada distribusi normal standar dan menciptakan interval kepercayaan dan menguji hipotesis untuk satu dan dua masalah sampel.
library(BSDA) # package for z.test
?z.test # for z.test (n >= 30 sample)Levene’s Test [car Package]
library(car)
?leveneTest