~ Hypothesis Testing ~

Tugas Komputasi Statistika

Kontak	: $\downarrow$
Email	yosia.yosia@student.matanauniversity.ac.id
Instagram	yyosia
RPubs	https://rpubs.com/yosia/

Sebagai data scientist, Anda mungkin mempertahankan atau menolak hipotesis berdasarkan pengukuran sampel yang diamati. Keputusan sering didasarkan pada mekanisme statistik yang disebut pengujian hipotesis. Ada tiga syarat untuk melakukan pengujian hipotesis, antara lain:

Left Tailed Test: ketika $\bar{x}$ secara signifikan di bawah rata-rata populasi yang dihipotesiskan $µ_0$ kemudian $H_0$ akan ditolak dan uji yang digunakan adalah uji arah kanan (uji daerah bawah) sejak daerah kritis.

\[\text{Left Tailed Test} = \begin{cases} {H_0: \mu \ge \mu_0} \\ {H1: \mu < \mu_0 } \end{cases}\]

Right Tailed Test: ketika $\bar{x}$ secara signifikan di bawah rata-rata populasi yang dihipotesiskan $µ_0$ kemudian $H_0$ akan ditolak dan uji yang digunakan adalah uji arah kanan (uji daerah atas) sejak daerah kritis.

\[\text{Right Tailed Test} = \begin{cases} {H_0: \mu \le \mu_0} \\ {H1: \mu > \mu_0 } \end{cases}\]

Two Tailed Test: ketika $\bar{x}$ berbeda secara signifikan (secara signifikan lebih tinggi atau lebih rendah dari) dari rata-rata populasi hipotesis $µ_0$ kemudian $H_0$ akan ditolak. Dalam hal ini, uji dua arah akan diterapkan karena akan ada dua daerah kritis (menunjukkan penolakan terhadap $H_0$) pada kedua ekor kurva normal (mewakili distribusi sampling statistik sampel $\bar{x}$)

\[\text{Two Tailed Test} = \begin{cases} {H_0: \mu = \mu_0} \\ {H1: \mu \neq \mu_0 } \end{cases}\]

Daerah kritis untuk Hypothesis Testing ditunjukkan sebagai bagian yang diarsir pada gambar berikut:

Ada empat kemungkinan untuk membuat keputusan:

Tolak $H_0$ ketika itu false Positive
Terima $H_0$ ketika itu true Positive
Tolak $H_\alpha$ ketika itu false Negative
Terima $H_\alpha$ ketika itu true Negative

Jelas, yang pertama menolak hipotesis nol ketika itu false Positive, yang disebut kesalahan tipe I. Probabilitas melakukan kesalahan tipe I dilambangkan dengan $\alpha$ \[P(\text{type I error})=P() \text{Rejecting $(H_0|H_\alpha)$ is false positive}\]

Kedua menolak hipotesis alternatif ketika itu false Negative, yang disebut kesalahan tipe II. Probabilitas melakukan kesalahan tipe II dilambangkan dengan $\beta$

\[P(\text{type II error})=P() \text{Rejecting $(H_a|H_\beta)$ is false negative}\]

Pada perbandingan nilai yang diamati dari statistik uji dengan nilai kritis, dapat di identifikasi apakah nilai yang diamati terletak di wilayah kritis (tolak $H_0$) atau di wilayah penerimaan (jangan menolak $H_0$) dan memutuskannya.

Left Tailed Test : Jika $Z_{crit} < -1.645$, Kemudian menolak $H_0$ pada tingkat signifikansi 5% ($α$ diambil sebagai 5% di sebagian besar situasi analitik).
Right Tailed Test : Jika $Z_{crit} > -1.645$, Kemudian menolak $H_0$ pada tingkat signifikansi 5%.
Two Tailed Test : Jika $Z_{crit} > 1.96$ atau jika $Z_{crit} > -1.96$, Kemudian menolak $H_0$ pada tingkat signifikansi 5%.

Selain itu terdapat juga pendekatan alternatif untuk pengujian hipotesis, pendekatan ini sangat banyak digunakan dalam semua paket perangkat lunak. Ini dikenal sebagai nilai probabilitas/ prob. nilai/ p-value. Dimana memberikan probabilitas untuk mendapatkan nilai statistik sejauh ini atau lebih jauh dari nilai hipotesis jika $H_0$ benar. Ini menunjukkan seberapa besar kemungkinan hasil yang telah kami amati. Ini dapat dijelaskan lebih lanjut sebagai probabilitas mengamati statistik uji jika $H_0$ benar yaitu apa peluang dalam mendukung terjadinya $H_0$. Jika nilai-p kecil, itu berarti ada lebih sedikit peluang (kasus langka) yang mendukung $H_0$ terjadi, karena perbedaan antara nilai sampel dan nilai hipotesis secara signifikan besar sehingga $H_0$ dapat ditolak, jika tidak mungkin terjadi dipertahankan.

Jika $pvalue < α$ : Menolak $H_0$
Jika $pvalue ≥ α$ : Gagal Menolak $H_0$

Prosedur untuk Menemukan Nilai-P:

One-Tailed (Population Mean and Standard Deviation)

Hipotesis nol dari uji satu-pihak (kiri/kanan) dari rata-rata populasi $μ$ dan $σ$ dapat lihat sebagai berikut :

\[\text{Hypothesis Testing $H_0$} = \begin{cases} {\mu \ge \mu_0} & \text{Left Tail} \\ {\mu \le \mu_0} & \text{Right Tail} \end{cases}\]

di mana $μ_0$ adalah batas kiri/kanan yang dihipotesis dari rata -rata $μ$.

Selanjutnya adalah menentukan statistik uji Z dalam hal rata -rata sampel, ukuran sampel dan standar deviasi populasi $σ$:

\[z={\bar{x}-\mu_0 \over \sigma/\sqrt{n}}\]

Kemudian hipotesis nol dari left tail test harus ditolak jika $z≤ - z_α$, di mana $z_α$ adalah persentil $100 (1 - α)$ dari distribusi normal standar.

Kasus 20

Misalkan pabrikan mengklaim bahwa kecepatan rata -rata sepeda motor lebih dari 100 km/jam. Dalam sampel 30 sepeda motor, ditemukan bahwa mereka hanya berlangsung 99 km/jam rata -rata. Asumsikan standar deviasi populasi adalah 1,2 km/jam. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim oleh pabrikan?

mu0 = 100                                              # Nilai Hipotesis
xbar = 99                                              # Rata-Rata Sampel 
sigma = 1.2                                            # Standar Deviasi Populasi 
n = 30                                                 # Ukuran Sample 
z = (xbar-mu0)/(sigma/sqrt(n));z                       # test statistik

## [1] -4.564355

alpha = .05                                            # .05 Tingkat Siqnifikansi
z.alpha = qnorm(1-alpha)                               # Nilai right tail critical 
-z.alpha                                               # Nilai left tail critical

## [1] -1.644854

Dikarenakan $μ_0≥μ$, dalam kasus ini diharuskan untuk fokus pada nilai kritis left tail. Di sini, menemukan bahwa statistik uji -4.5644 kurang dari nilai kritis -1.6449. Akibatnya, pada tingkat signifikansi 0,05,artinya menolak klaim bahwa berarti benar klaimnya kecepatan sepeda motor di atas 100 km/jam.

SOLUSI ALTERNATIF

Dapat menerapkan fungsi pnorm untuk menghitung p-value left tail dari statistik uji. Karena ternyata kurang dari tingkat signifikansi 0,05, dapat menolak hipotesis nol bahwa $μ ≥ 100$

pval = pnorm(z)                                        # left tail p−value
pval                                                   # print p−value

## [1] 2.505166e-06

Latihan 9

Right Tail : Sebuah perusahaan makanan berpendapat bahwa untuk masing -masing kantong kue produk mereka, paling banyak ada 2 gram lemak jenuh dalam satu kue. Dalam sampel 40 cookie, ditemukan bahwa jumlah rata -rata lemak jenuh per cookie adalah 2,1 gram. Asumsikan bahwa standar deviasi populasi adalah 0,25 gram. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim?

m = 2
xb = 2.1
sigma = 0.25
n = 40

z1 = (xb-m)/(sigma/sqrt(n))
z1

## [1] 2.529822

alpha = .05                                         
z.alpha = qnorm(1-alpha)                            
-z.alpha

## [1] -1.644854

nilaip = pnorm(z1)                                
nilaip

## [1] 0.994294

Lalu dapat Disimpulkan bahwa statistik uji 2.529822 lebih dari nilai kritis -1.644854. Akibatnya, pada tingkat signifikansi 0,05, dapat menerima klaim bahwa 2 gram lemak jenuh dalam satu cookie.

Two-Tailed (Population Mean and Standard Deviation)

Hipotesis nol dari uji dua sisi dari rata-rata populasi $μ$ dan $σ$ dapat dinyatakan sebagai berikut:

\[μ_0=μ\]

di mana $μ_0$ adalah nilai hipotesis dari rata -rata populasi sebenarnya $μ$.

Selanjutnya Menentukan statistik uji Z dalam hal rata -rata sampel, ukuran sampel dan standar deviasi populasi $σ$L:

\[z = \frac{\bar{x}-μ_0}{σ/\sqrt{n}}\]

Maka hipotesis nol dari tes dua-ekor harus ditolak jika $z≤-z_{α / 2}$ atau $z≥-z_{α / 2}$, di mana zz_{α / 2} adalah Persentil $100 (1 - α / 2)$ dari distribusi normal standar.

Kasus 21

Memisalkan berat rata -rata penguin raja yang ditemukan di koloni Antartika tahun lalu adalah 15,4 kg. Dalam sampel 35 penguin waktu yang sama tahun ini di koloni yang sama, berat penguin rata -rata adalah 14,6 kg. Asumsikan standar deviasi populasi adalah 2,5 kg. Pada tingkat signifikansi 0,05, dapatkah kita menolak hipotesis nol bahwa berat penguin rata -rata tidak berbeda dari tahun lalu?

mu0 = 15.4                                             # Nilai Hipotesis
xbar = 14.6                                            # Rata-Rata Sample
sigma = 2.5                                            # population standard deviation 
n = 35                                                 # Ukuran Sample
z = (xbar-mu0)/(sigma/sqrt(n));z                       # test statistic

## [1] -1.893146

alpha = .05                                            # Tingkat Siqnifikansi .05
z.half.alpha = qnorm(1-alpha/2)                        # per-one tail .025 significance level
c(-z.half.alpha, z.half.alpha)                         # Two-Tailed 0.05 significance level

## [1] -1.959964  1.959964

Statistik uji -1.8931 terletak di antara nilai kritis -1.9600 dan 1.9600. Oleh karena itu, pada tingkat signifikansi 0,05, tidak menolak hipotesis nol bahwa berat penguin rata -rata tidak berbeda dari tahun lalu.

One-Tailed (Population Mean and Unknown Standard Deviation)

Hipotesis nol dari uji satu-ekor (kiri/kanan) dari rata-rata populasi $μ$ dan $σ$ yang tidak diketahui dapat dinyatakan sebagai berikut:

\[\text{Hypothesis Testing $H_0$} = \begin{cases} {\mu \le \mu_0} & \text{Left Tail} \\ {\mu \ge \mu_0} & \text{Right Tail} \end{cases}\]

Di mana $μ_0$ adalah batas kiri/kanan yang dihipotesis dari rata -rata $μ_0$.

Lalu menentukan statistik uji dalam hal rata -rata sampel, ukuran sampel dan standar deviasi sampel s:

\[t = \frac{\bar{x}-μ_0}{s/\sqrt{n}}\]

Maka hipotesis nol dari uji lower tail harus ditolak jika $t≤ - t_α$, di mana $t_α$ adalah persentil $100 (1 - α)$ dari distribusi student t dengan n - 1 derajat kebebasan.

Latihan 22

Misalkan pabrikan mengklaim bahwa rata -rata umur bola lampu lebih dari 10.000 jam. Dalam sampel 30 bola lampu, ditemukan bahwa rata -rata hanya berlangsung 9.900 jam. Asumsikan standar deviasi sampel adalah 125 jam. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim oleh pabrikan?

mu0 = 10000                                            # hypothesized value  
xbar = 9900                                            # sample mean 
s = 125                                                # sample standard deviation 
n = 30                                                 # sample size 
t = (xbar-mu0)/(s/sqrt(n));t                           # test statistic

## [1] -4.38178

alpha = .05                                            # use 0.05 left tail significant level 
t.alpha = qt(1-alpha, df=n-1)                          # right tail critical value    
-t.alpha                                               # left tail critical value

## [1] -1.699127

Statistik uji -4.3818 kurang dari nilai kritis -1.6991. Oleh karena itu, pada tingkat signifikansi 0,05, kita dapat menolak klaim bahwa berarti seumur hidup bola lampu di atas 10.000 jam.

SOLUSI ALTERNATIF Dapat menerapkan fungsi PT untuk menghitung nilai p ekor bawah dari statistik uji. Karena ternyata kurang dari tingkat signifikansi 0.05, Lalu menolak hipotesis nol bahwa $μ ≥ 10000$

pval = pt(t, df=n-1)                                   # left tail p−value
pval                                                   # print p−value

## [1] 7.035026e-05

Latihan 10

Right tail: Garuda-food Indonesia mengklaim bahwa untuk masing-masing tas kue dari produk mereka, ada paling banyak 2 gram lemak jenuh dalam satu kue. Dalam sampel 40 cookie, ditemukan bahwa jumlah rata -rata lemak jenuh per cookie adalah 2,1 gram. Asumsikan bahwa standar deviasi sampel adalah 0,3 gram. Pada tingkat signifikansi 0,05, dapatkah kita menolak klaim?

xbar= 2.1                    # sample mean 
mu0 = 2                       # hypothesized value 
s= 0.3                       # sample standard deviation 
n = 40                        # sample size 
t = (xbar-mu0)/(s/sqrt(n))
t

## [1] 2.108185

alpha = .05 
t.alpha = qt(1-alpha, df = n-1)
t.alpha                       # critical value

## [1] 1.684875

Two-Tailed (Population Mean and Unknown Standard Deviation)

Hipotesis nol dari uji dua sisi dari rata-rata populasi $μ$ dan tidak diketahui $σ$ dapat dinyatakan sebagai berikut:

\[μ_0=μ\]

di mana $μ_0$ adalah nilai hipotesis dari rata -rata populasi sebenarnya $μ$.

Selanjutnya Menentukan statistik uji t dalam hal rata -rata sampel, ukuran sampel dan standar deviasi populasi $σ$:

\[z = \frac{\bar{x}-μ_0}{s/\sqrt{n}}\]

Maka hipotesis nol dari tes dua-ekor harus ditolak jika $t≤-t_{α / 2}$ atau $t≥-t_{α / 2}$, di mana $t_{α / 2}$ adalah Persentil $100 (1 - α )$ dari distribusi normal standar.

Kasus 23

Beberapa jurnal menyimpulkan bahwa berat rata -rata anjing hachiko di seluruh dunia sepuluh tahun terakhir adalah 15,4 kg. Para peneliti ingin memastikan apakah ada perubahan dalam berat rata -rata varietas ini setelah sepuluh tahun. Oleh karena itu, mereka mengambil sampel acak dari 35 anjing dari varietas yang sama dan pada saat yang sama tahun ini, mereka menemukan bahwa berat penguin rata -rata adalah 14,6 kg. Asumsikan standar deviasi sampel adalah 2,5 kg. Pada tingkat signifikansi 0,05, dapatkah kita menolak hipotesis nol bahwa rata -rata anjing hachiko tidak berbeda dari sepuluh tahun terakhir?

mu0 = 15.4                                             # hypothesized value 
xbar = 14.6                                            # sample mean 
s = 2.5                                                # sample standard deviation 
n = 35                                                 # sample size 
t = (xbar-mu0)/(s/sqrt(n));t                           # test statistic

## [1] -1.893146

alpha = .05                                            # .05 significance level
t.half.alpha = qt(1-alpha/2, df=n-1)                   # per-one tail .025 significance level
c(-t.half.alpha, t.half.alpha)                         # Two-Tailed 0.05 significance level

## [1] -2.032245  2.032245

Statistik uji -1.8931 terletak di antara nilai kritis -2.0322, dan 2.0322. Oleh karena itu, pada tingkat signifikansi 0,05, Maka tidak menolak hipotesis nol bahwa rata -rata anjing hachiko tidak berbeda dari sepuluh tahun terakhir.

SOLUSI ALTERNATIF Dapat menerapkan fungsi PT untuk menghitung nilai-p dua sisi dari statistik uji. Karena ternyata lebih besar dari tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa μ = 15,4.

pval = 2*pt(t, df=n-1)                                 # left tail p−value
pval                                                   # print p−value

## [1] 0.06687552

One-Tailed (Population Proportion)

Hipotesis nol dari tes left tail tentang proporsi populasi dapat dinyatakan sebagai berikut:

\[\text{Hypothesis Testing $H_0$} = \begin{cases} {p \ge p_0} & \text{Left Tail} \\ {p \le p_0} & \text{Right Tail} \end{cases}\]

di mana $p_0$ adalah batas bawah yang dihipotesiskan dari proporsi populasi sebenarnya $p$.

Selanjutnya menentukan statistik uji z dalam hal proporsi sampel dan ukuran sampel:

\[z = \frac{\bar{p}-p_0}{\sqrt{p_0(1-p_0)/n}}\]

Kemudian hipotesis nol dari uji ekor kiri harus ditolak jika $z≤ - z_α$, di mana $z_α$ adalah persentil $100 (1 - α)$ dari distribusi normal standar.

Kasus 24

Misalkan 60% orang Indonesia memberikan suara dalam pemilihan terakhir. 85 dari 148 orang dalam survei telepon mengatakan bahwa mereka memberikan suara dalam pemilihan saat ini. Pada tingkat signifikansi 0,5, dapatkah kita menolak hipotesis nol bahwa proporsi pemilih dalam populasi di atas 60% untuk pemilihan berikutnya?

p0 = .6                                                # hypothesized value 
pbar = 85/148                                          # sample proportion 
n = 148                                                # sample size 
z = (pbar-p0)/sqrt(p0*(1-p0)/n);z                      # test statistic

## [1] -0.6375983

## [1] -0.64

alpha = .05                                            # use 0.05 left tail significant level 
z.alpha = qnorm(1-alpha)                               # right tail critical value  
-z.alpha                                               # left tail critical value

## [1] -1.644854

Statistik uji -0.6376 tidak kurang dari nilai kritis -1.6449. Oleh karena itu, pada tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa proporsi pemilih dalam populasi adalah di atas 60% untuk pemilihan berikutnya.

SOLUSI ALTERNATIF 1 Dapat menerapkan fungsi pnorm untuk menghitung nilai p ekor kiri dari statistik uji. Karena ternyata lebih besar dari tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa p ≥ 0,6 p≥0,6.

pval = pnorm(z)                                        # left tail p−value 
pval

## [1] 0.2618676

SOLUSI ALTERNATIF 2 Dapat menerapkan fungsi prop.test untuk menghitung nilai-p secara langsung.

prop.test(85, 148, p=.6, alt="less", correct=FALSE)

## 
##  1-sample proportions test without continuity correction
## 
## data:  85 out of 148, null probability 0.6
## X-squared = 0.40653, df = 1, p-value = 0.2619
## alternative hypothesis: true p is less than 0.6
## 95 percent confidence interval:
##  0.0000000 0.6392527
## sample estimates:
##         p 
## 0.5743243

Latihan 11

Right tail: Memisalkan 12% mangga yang dipanen di kebun tahun lalu busuk. 30 dari 214 apel dalam sampel panen tahun ini ternyata busuk. Pada tingkat signifikansi 0,05, dapatkah kita menolak hipotesis nol bahwa proporsi mangga busuk dalam panen tetap di bawah 12% tahun ini?

pbar = 30/214          # sample proportion 
p0 = .12               # hypothesized value 
n = 214                # sample size 
z = (pbar-p0)/sqrt(p0*(1-p0)/n) 
z                      # test statistic

## [1] 0.908751

alpha = .05 
z.alpha = qnorm(1-alpha) 
z.alpha                # critical value

## [1] 1.644854

Statistik uji 0,90875 tidak lebih besar dari nilai kritis 1,6449. Oleh karena itu, pada tingkat signifikansi 0,05, sehingga tidak menolak hipotesis nol bahwa proporsi apel busuk dalam panen tetap di bawah 12% tahun ini.

pval = pnorm(z, lower.tail=FALSE) 
pval                   # upper tail p−value

## [1] 0.1817408

prop.test(30, 214, p=.12, alt="greater", correct=FALSE)

## 
##  1-sample proportions test without continuity correction
## 
## data:  30 out of 214, null probability 0.12
## X-squared = 0.82583, df = 1, p-value = 0.1817
## alternative hypothesis: true p is greater than 0.12
## 95 percent confidence interval:
##  0.1056274 1.0000000
## sample estimates:
##         p 
## 0.1401869

Two-Tailed (Population Proportion)

Hipotesis nol dari tes dua sisi tentang proporsi populasi dapat dinyatakan sebagai berikut

\[p_0=p\]

di mana $p_0$ adalah nilai hipotesis dari proporsi populasi yang sebenarnya p.

Lalu menentukan statistik uji zz dalam hal proporsi sampel dan ukuran sampel

\[z = \frac{\bar{p}-p_0}{\sqrt{p_0(1-p_0)/n}}\] Kemudian hipotesis nol dari uji ekor kiri harus ditolak jika $z≤ - z_α$, di mana $z_α$ adalah persentil $100 (1 - α)$ dari distribusi normal standar.

Kasus 25

Misalkan lemparan koin muncul 12 kepala dari 20 percobaan. Pada tingkat signifikansi 0,05, dapatkah seseorang menolak hipotesis nol bahwa lemparan koin itu adil?

p0 = .5                                                # hypothesized value 
pbar = 12/20                                           # sample proportion 
n = 20                                                 # sample size 
z = (pbar-p0)/sqrt(p0*(1-p0)/n)
z                     # test statistic

## [1] 0.8944272

alpha = .05                                            # .05 significance level
z.half.alpha = qnorm(1-alpha/2)                        # per-one tail .025 significance level
c(-z.half.alpha, z.half.alpha)                         # Two-Tailed 0.05 significance level

## [1] -1.959964  1.959964

Statistik uji 0,89443 terletak di antara nilai kritis -1.9600 dan 1.9600. Oleh karena itu, pada tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa lemparan koin itu adil.

SOLUSI ALTERNATIF 1 Dapar menerapkan fungsi PNORM untuk menghitung nilai-p dua sisi dari statistik uji. Ini menggandakan nilai-p ekor kanan karena proporsi sampel lebih besar dari nilai hipotesis. Karena ternyata lebih besar dari tingkat signifikansi 0,05, kami tidak menolak hipotesis nol bahwa p = 0,5.

pval = 2 * pnorm(z, lower.tail=FALSE)                  # right tail 
pval                                                   # two−tailed p−value

## [1] 0.3710934

SOLUSI ALTERNATIF 2 Kami menerapkan fungsi prop.test untuk menghitung nilai-p secara langsung.

prop.test(12, 20, p=0.5, correct=FALSE)

## 
##  1-sample proportions test without continuity correction
## 
## data:  12 out of 20, null probability 0.5
## X-squared = 0.8, df = 1, p-value = 0.3711
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.3865815 0.7811935
## sample estimates:
##   p 
## 0.6

Dapat dilihat kesalahan Tipe II adalah karena kegagalan menolak hipotesis nol yang tidak valid. Probabilitas menghindari kesalahan tipe II disebut kekuatan uji hipotesis, dan dilambangkan dengan kuantitas $1 - β$.

Type II Error One-Tail (Population Mean and Standard Deviation)

Dalam uji tail kiri/kanan rata -rata populasi, hipotesis nol mengklaim bahwa rata -rata populasi sebenarnya $μ$ lebih besar dari nilai hipotetis yang diberikan $μ_0$.

\[\text{Type II Error $H_a$} = \begin{cases} {\mu \ge \mu_0} & \text{Left Tail} \\ {\mu \le \mu_0} & \text{Right Tail} \end{cases}\]

Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya rata -rata μ μ sebenarnya kurang dari $μ_0$.

Kasus 26

Misalkan pabrikan mengklaim bahwa kecepatan rata -rata sepeda motor lebih dari 100 km/jam. Asumsikan standar deviasi populasi adalah 1,2 km/jam. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 30 sepeda motor?

n = 30                                                 # sample size 
sigma = 1.2                                            # population standard deviation 
sem = sigma/sqrt(n)
sem                               # standard error

## [1] 0.219089

alpha = .05                                            # significance level 
mu0 = 100                                              # hypothetical lower bound 
q = qnorm(alpha, mean=mu0, sd=sem)
q

## [1] 99.63963

Oleh karena itu, selama rata -rata sampel lebih besar dari 99,64 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena mengasumsikan bahwa rata -rata populasi aktual adalah 99,50, selanjutnya dapat menghitung probabilitas rata -rata sampel di atas 99,64, dan dengan demikian menemukan probabilitas kesalahan tipe II.

mu = 99.50                                              # assumed actual mean 
pnorm(q, mean=mu, sd=sem, lower.tail=FALSE)

## [1] 0.261957

Jika ukuran sampel sepeda motor adalah 30, kecepatan motor rata -rata aktual adalah 9.950 jam dan standar deviasi populasi adalah 120 jam, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≥ 10000 μ≥10000 pada tingkat signifikansi .05 adalah 26.2 %, dan kekuatan tes hipotesis adalah 73,8%.

Latihan 12

Di bawah asumsi yang sama seperti kasus 26, jika kecepatan motor rata -rata aktual adalah 9.965 jam, berapa probabilitas kesalahan tipe II pada tingkat signifikansi 0,05? Apa kekuatan tes hipotesis?

Latihan 13

Right tail: Garuda-food Indonesia mengklaim bahwa untuk masing-masing tas kue dari produk mereka, ada paling banyak 2 gram lemak jenuh dalam satu kue. Asumsikan jumlah rata -rata aktual lemak jenuh per cookie adalah 2,075 gram dan standar deviasi sampel adalah 0,25 gram. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 cookie?

n = 35                # sample size 
sigma = 0.25          # population standard deviation 
sem = sigma/sqrt(n); sem   # standard error

## [1] 0.04225771

alpha = .05           # significance level 
mu0 = 2               # hypothetical upper bound 
q = qnorm(alpha, mean=mu0, sd=sem, lower.tail=FALSE); q

## [1] 2.069508

Oleh karena itu, selama rata -rata sampel kurang dari 2.1 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena kami mengasumsikan bahwa rata -rata populasi aktual adalah 2.09, kami dapat menghitung probabilitas rata -rata sampel di bawah 2.0695, dan dengan demikian menemukan probabilitas kesalahan tipe II.

mu = 2.075             # assumed actual mean 
pnorm(q, mean=mu, sd=sem)

## [1] 0.448295

Jika ukuran sampel cookie adalah 35, jumlah rata -rata aktual lemak jenuh per cookie adalah 2,075 gram dan standar deviasi populasi adalah 0,25 gram, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≤ 2 pada tingkat signifikansi .05 adalah tingkat signifikansi adalah 45%, dan kekuatan tes hipotesis adalah 54%.

Type II Error in Two-Tailed (Population Mean and Standard Deviation)

Dalam tes dua sisi rata-rata populasi, hipotesis nol mengklaim bahwa rata-rata populasi sebenarnya $μ$ sama dengan nilai hipotetis yang diberikan $μ_0$.

\[μ_0=μ\] Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya rata -rata μ sebenarnya berbeda dari μ0.

Mengasumsikan bahwa populasi memiliki standar deviasi yang diketahui σ. Dengan Teorema Batas Pusat, populasi semua cara yang mungkin dari sampel dengan ukuran yang cukup besar n kira -kira mengikuti distribusi normal. Oleh karena itu kita dapat menghitung kisaran sarana sampel yang hipotesis nol tidak akan ditolak, dan kemudian mendapatkan perkiraan probabilitas kesalahan tipe II.

Kasus 27

Beberapa jurnal menyimpulkan bahwa berat rata -rata anjing hachiko di seluruh dunia sepuluh tahun terakhir adalah 15,4 kg. Para peneliti ingin memastikan apakah ada perubahan dalam berat rata -rata varietas ini setelah sepuluh tahun. Asumsikan berat populasi rata -rata aktual adalah 15,1 kg, dan standar deviasi populasi adalah 2,5 kg. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 anjing hachiko?

n = 35                                                # sample size 
sigma = 2.5                                           # population standard deviation 
sem = sigma/sqrt(n)
sem                              # standard error

## [1] 0.4225771

alpha = .05                                           # significance level 
mu0 = 15.4                                            # hypothetical mean 
I = c(alpha/2, 1-alpha/2) 
q = qnorm(I, mean=mu0, sd=sem) 
q

## [1] 14.57176 16.22824

Oleh karena itu, selama rata -rata sampel adalah antara 14.572 dan 16.228 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena disini berasumsi bahwa rata -rata populasi yang sebenarnya adalah 15.1, dapat menghitung probabilitas ekor yang lebih rendah dari kedua titik akhir.

mu = 15.1                                             # assumed actual mean 
p = pnorm(q, mean=mu, sd=sem); p

## [1] 0.1056435 0.9962062

Akhirnya, probabilitas kesalahan tipe II adalah probabilitas antara dua titik akhir.

diff(p)                                               # p[2]-p[1]

## [1] 0.8905627

Jika ukuran sampel anjing hachiko adalah 35, berat populasi rata -rata aktual adalah 15,1 kg dan standar deviasi populasi adalah 2,5 kg, maka probabilitas kesalahan tipe II untuk menguji level signifikansi nol μ = 15,4 pada tingkat signifikansi 0,05 adalah 89,1%, dan kekuatan tes hipotesis adalah 10,9%.

Latihan 14

Di bawah asumsi yang sama seperti kasus 27, jika berat populasi rata -rata aktual adalah 14,9 kg, berapa probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?

n = 35                # sample size 
sigma = 2.5           # population standard deviation 
sem = sigma/sqrt(n)
sem   # standard error

## [1] 0.4225771

Selanjutnya adalah menghitung batas bawah dan atas rata-rata sampel yang hipotesis nolnya = 15.4 tidak akan ditolak.

alpha = .05           # significance level 
mu0 = 15.4            # hypothetical mean 
I = c(alpha/2, 1-alpha/2) 
q = qnorm(I, mean=mu0, sd=sem)
q

## [1] 14.57176 16.22824

Maka, selama rata-rata sampel antara 15 dan 16 dalam suatu pengujian hipotesis, hipotesis nol tidak akan ditolak. Karena kita berasumsi bahwa rata-rata populasi sebenarnya adalah 14.9, maka hipotesis nol ditolak.

Type II Error One-Tailed (Population Mean and Unknown Standard Deviation)

Dalam uji tal kiri/kanan rata -rata populasi, hipotesis nol mengklaim bahwa rata -rata populasi sebenarnya μ lebih besar dari nilai hipotetis yang diberikan $μ_0$.

\[\text{Type II Error $H_a$} = \begin{cases} {\mu \ge \mu_0} & \text{Left Tail} \\ {\mu \le \mu_0} & \text{Right Tail} \end{cases}\]

Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya rata -rata μ sebenarnya kurang dari $μ_0$.

Untuk n yang cukup besar, populasi statistik berikut dari semua sampel yang mungkin berukuran n adalah sekitar distribusi student dengan n - 1 derajat kebebasan.

\[ \frac{\bar{x}-μ}{s/\sqrt{n}}\] Disini dapat memungkinkan untuk menghitung rentang sarana sampel yang hipotesis nol tidak akan ditolak, dan untuk mendapatkan probabilitas kesalahan tipe II.

Kasus 28

Misalkan pabrikan mengklaim bahwa kecepatan rata -rata sepeda motor lebih dari 100 km/jam. Asumsikan seumur hidup bola lampu rata -rata adalah 99,50 jam dan standar deviasi masa pakai adalah 1,25 jam. Berapa probabilitas kesalahan tipe II untuk tes hipotesis pada tingkat signifikansi 0,05?

n = 30                                                # sample size 
s = 1.25                                              # sample standard deviation 
SE = s/sqrt(n)
SE                                    # standard error estimate

## [1] 0.2282177

alpha = .05                                           # significance level 
mu0 = 100                                             # hypothetical lower bound 
q = mu0 + qt(alpha, df=n-1) * SE; 
q

## [1] 99.61223

Oleh karena itu, selama rata -rata sampel lebih besar dari 99,612 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena diasumsikan bahwa rata -rata populasi aktual adalah 99,50, selanjutnya dapat menghitung probabilitas rata -rata sampel di atas 99,612, dan dengan demikian menemukan probabilitas kesalahan tipe II.

mu = 99.50                                            # assumed actual mean 
pt((q - mu)/SE, df=n-1, lower.tail=FALSE)

## [1] 0.3132943

Jika kecepatan motor ukuran sampel adalah 30, standar deviasi sampel adalah 1,25 jam dan masa pakai bola lampu rata -rata aktual adalah 9.950 jam, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≥ 10000 μ≥10000 pada 0,05 signifikansi Level adalah 31,3%, dan kekuatan uji hipotesis adalah 68,7%.

Latihan 15

Di bawah asumsi yang sama seperti di atas, jika rata -rata seumur hidup bola lampu adalah 9.965 jam, berapa probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?

n = 30                         # sample size 
s = 1.25                       # sample standard deviation 
SE = s/sqrt(n); SE             # standard error estimate

## [1] 0.2282177

Selanjutnya hitung batas kiri rata-rata sampel yang hipotesis nolnya $μ≥10000$ tidak akan ditolak.

alpha = .05                           # significance level 
mu0 = 100                             # hypothetical lower bound 
q = mu0 + qt(alpha, df=n-1) * SE 
q

## [1] 99.61223

Oleh karena itu, selama rata-rata sampel lebih besar dari 99,612 dalam suatu pengujian hipotesis, hipotesis nol tidak akan ditolak. Karena kita berasumsi bahwa rata-rata populasi sebenarnya adalah 99,50, kita dapat menghitung probabilitas rata-rata sampel di atas 99,612, dan dengan demikian menemukan probabilitas kesalahan tipe II.

mu = 9.965                                  # assumed actual mean 
pt((q - mu)/SE, df=n-1, lower.tail=FALSE)

## [1] 6.889006e-56

Kasus 29

Garuda-food Indonesia mengklaim bahwa untuk masing-masing tas kue dari produk mereka, ada paling banyak 2 gram lemak jenuh dalam satu kue. Asumsikan jumlah rata -rata aktual lemak jenuh per cookie adalah 2,09 gram dan standar deviasi sampel adalah 0,3 gram. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 cookie?

n = 35                                                # sample size 
s = 0.3                                               # sample standard deviation 
SE = s/sqrt(n)
SE                                    # standard error estimate

## [1] 0.05070926

alpha = .05                                           # significance level 
mu0 = 2                                               # hypothetical upper bound 
q = mu0 + qt(alpha, df=n-1, lower.tail=FALSE) * SE
q

## [1] 2.085746

Oleh karena itu, selama rata -rata sampel kurang dari 2.0857 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena dapat diasumsikan bahwa rata -rata populasi aktual adalah 2.09, kami dapat menghitung probabilitas rata -rata sampel di bawah 2.0857, dan dengan demikian menemukan probabilitas kesalahan tipe II.

mu = 2.09                                             # assumed actual mean 
pt((q - mu)/SE, df=n-1)

## [1] 0.4668141

Jika ukuran sampel cookie adalah 35, standar sampel deviasi lemak jenuh per cookie adalah 0,3 gram dan jumlah rata -rata aktual lemak jenuh per cookie adalah 2,09 gram, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ ≤2 pada tingkat signifikansi 0,05 adalah 46,7%, dan kekuatan uji hipotesis adalah 53,3%.

Latihan 16

Di bawah asumsi yang sama seperti kasus 29, jika rata -rata lemak jenuh aktual per cookie adalah 2,075 gram, berapakah probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?

n = 35                        # sample size 
s = 0.3                       # sample standard deviation 
SE = s/sqrt(n); SE            # standard error estimate

## [1] 0.05070926

Kemudian menghitung batas atas rata-rata sampel yang hipotesis nolnya μ≤2 tidak akan ditolak.

alpha = .05                     # significance level 
mu0 = 2                         # hypothetical upper bound 
q = mu0 + qt(alpha, df=n-1, lower.tail=FALSE) * SE
q

## [1] 2.085746

Oleh karena itu, selama rata-rata sampel kurang dari 2,0857 dalam suatu pengujian hipotesis, hipotesis nol tidak akan ditolak. Karena diasumsikan bahwa rata-rata populasi sebenarnya adalah 2,09, lalu dapat menghitung probabilitas rata-rata sampel di bawah 2,0857, dan dengan demikian menemukan probabilitas kesalahan tipe II.

mu = 2.075                 # assumed actual mean 
pt((q - mu)/SE, df=n-1)

## [1] 0.5832766

Jika ukuran sampel kue adalah 35, standar deviasi sampel lemak jenuh per kue adalah 0,3 gram dan jumlah rata-rata sebenarnya dari lemak jenuh per kue adalah 2,075 gram, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol $μ≤2$ pada taraf signifikansi 0,05 sebesar 58%, dan daya uji hipotesis sebesar 42%.

Type II Error in Two-Tailed (Population Mean and Unknown Standard Deviation)

Dalam tes dua sisi rata-rata populasi, hipotesis nol mengklaim bahwa rata-rata populasi sebenarnya μ sama dengan nilai hipotetis yang diberikan $μ_0$.

\[μ_0=μ\]

Kesalahan tipe II terjadi jika tes hipotesis berdasarkan sampel acak gagal untuk menolak hipotesis nol bahkan ketika populasi yang sebenarnya rata -rata μ sebenarnya berbeda dari $μ_0$.

Untuk n yang cukup besar, populasi statistik berikut dari semua sampel yang mungkin berukuran n adalah sekitar distribusi siswa dengan (n - 1) derajat kebebasan. \[ \frac{\bar{x}-μ}{s/\sqrt{n}}\] Ini dapat memungkinkan untuk menghitung rentang sarana sampel yang hipotesis nol tidak akan ditolak, dan untuk mendapatkan probabilitas kesalahan tipe II.

Kasus 30

Beberapa jurnal menyimpulkan bahwa berat rata -rata anjing hachiko di seluruh dunia sepuluh tahun terakhir adalah 15,4 kg. Para peneliti ingin memastikan apakah ada perubahan dalam berat rata -rata varietas ini setelah sepuluh tahun. Asumsikan berat populasi rata -rata aktual adalah 15,1 kg, dan standar deviasi populasi adalah 2,5 kg. Pada tingkat signifikansi 0,05, berapa probabilitas memiliki kesalahan tipe II untuk ukuran sampel 35 anjing hachiko?

n = 35                                                # sample size 
s = 2.5                                               # sample standard deviation 
SE = s/sqrt(n)
SE                                    # standard error estimate

## [1] 0.4225771

alpha = .05                                           # significance level 
mu0 = 15.4                                            # hypothetical mean 
I = c(alpha/2, 1-alpha/2) 
q = mu0 + qt(I, df=n-1) * SE
q

## [1] 14.54122 16.25878

Oleh karena itu, selama rata -rata sampel adalah antara 14.541 dan 16.259 dalam tes hipotesis, hipotesis nol tidak akan ditolak. Karena diasumsikan bahwa rata -rata populasi yang sebenarnya adalah 15.1, kami dapat menghitung probabilitas ekor yang lebih rendah dari kedua titik.

mu = 15.1                                             # assumed actual mean 
p = pt((q - mu)/SE, df=n-1)
p

## [1] 0.09744507 0.99516802

diff(p)               # p[2]-p[1]

## [1] 0.8977229

Jika ukuran sampel penguin adalah 35, standar deviasi sampel berat penguin adalah 2,5 kg dan berat populasi rata -rata aktual adalah 15,1 kg, maka probabilitas kesalahan tipe II untuk menguji hipotesis nol μ = 15,4 pada 0,05 signifikansi signifikansi Level adalah 89,8%, dan kekuatan tes hipotesis adalah 10,2%.

Latihan 17

Di bawah asumsi yang sama seperti di atas, jika berat populasi rata -rata aktual adalah 14,9 kg, berapa probabilitas kesalahan tipe II? Apa kekuatan tes hipotesis?

n = 35                         # sample size 
s = 2.5                        # sample standard deviation 
SE = s/sqrt(n); SE             # standard error estimate

## [1] 0.4225771

Kemudian menghitung batas bawah dan atas rata-rata sampel yang hipotesis nolnya $μ=15.4$ tidak akan ditolak.

alpha = .05                        # significance level 
mu0 = 15.4                         # hypothetical mean 
I = c(alpha/2, 1-alpha/2) 
q = mu0 + qt(I, df=n-1) * SE
q

## [1] 14.54122 16.25878

Oleh karena itu, selama rata-rata sampel antara 14,541 dan 16,259 dalam uji hipotesis, hipotesis nol tidak akan ditolak. Karena kita berasumsi bahwa rata-rata populasi sebenarnya adalah 15,1, kita dapat menghitung probabilitas ekor bawah dari kedua titik akhir.

mu = 14.9                      # assumed actual mean 
p = pt((q - mu)/SE, df=n-1); p

## [1] 0.2009020 0.9985729

Akhirnya, probabilitas kesalahan tipe II adalah probabilitas antara dua titik akhir.

diff(p)    # p[2]-p[1]

## [1] 0.797671

R NOTES

Pengujian hipotesis untuk bingkai data, dapat mempertimbangkan paket -paket berikut:

t.test [stats Package]

library(stats)                                                            # package for t.test 
#t.test(df$x, mu=mu_initial, alternative = "less", conf.level = 0.95)      # left tail t-tets
#t.test(df$x, mu=mu_initial, alternative = "greater", conf.level = 0.95)   # right tail t-tets
#t.test(Before, After, mu=0, alternative = "two.sided", conf.level = 0.99) # two tail
#?t.test                                                                   # for t.tets (n<30 sampel)

z.test [BSDA Package]

Fungsi ini didasarkan pada distribusi normal standar dan menciptakan interval kepercayaan dan menguji hipotesis untuk satu dan dua masalah sampel.

library(BSDA)                                                             # package for z.test 
?z.test                                                                   # for z.test (n >= 30 sample)

Levene’s Test [car Package]

library(car)
?leveneTest

Referensi

https://bookdown.org/BaktiSiregar/data-science-for-beginners-part-2/3-Hypothesis-Testing.html#two-tailed-population-mean-and-unknown-standard-deviation

Kontak	: \(\downarrow\)
Email	yosia.yosia@student.matanauniversity.ac.id
Instagram	yyosia
RPubs	https://rpubs.com/yosia/