統計的検定における過誤

統計的検定においては,第一種の過誤と第二種の過誤という二種類の誤りを犯す可能性が常にある.第一種の過誤とは,棄却すべきでない(真の値を言い当てている)帰無仮説を誤って棄却してしまうことである.第二種の過誤とは,棄却すべき(真の値を言い当てていない)帰無仮説を誤って採択してしまうことである.

第一種の過誤を犯す確率は\(\alpha\)で表され,有意水準などとも呼ばれる.つまり棄却域に観測値が入っている確率のことである.実際には帰無仮説が正しい可能性もあるのだから,たとえ観測値が棄却域に入っていたとしても帰無仮説を棄却できない可能性は常について回る.

第二種の過誤を犯す確率は\(\beta\)で表される.また,\(1-\beta\)を検出力と呼ぶ.つまり検出力とは,帰無仮説が誤っているときに棄却できる確率のことである.

検出力とは

有意水準が直観的に理解しやすいのに対し,検出力はやや理解しにくい.そこで,比較的わかりやすいと思われる例で考えよう.

母比率の検定の例を考える.\(\pi=50\)という帰無仮説を立てたとする.有意水準はなんでもいいが仮に下側2.5%とすると,観測値が30.4未満であれば帰無仮説を棄却できる.

しかしこのとき,真の分布では\(\pi=45\)だったとしたらどうだろうか.この場合,帰無仮説が間違っているのだから,理想をいえばどんな観測値のもとでも帰無仮説を棄却しなくてはならない.もちろん,実際にはそんなことはできない.

ただこの場合は観測値が30.4未満のケースにかぎり,理想通りに帰無仮説を棄却できる.ここで観測値は\(\pi=50\)ではなく\(\pi=45\)の分布に従っているので,観測値が図の赤色の範囲に含まれていたときにかぎり理想通り帰無仮説を棄却できる.

検出力は帰無仮説が間違っているときに帰無仮説を棄却できる確率のことなので,図の赤色の範囲が検出力を表していることがわかる.これを計算すると0.0721…であるから,検出力は7.21%である.

ちなみに確率密度関数を端から端まで積分すると1で,確率密度関数の任意の範囲の面積は確率を表す.したがって下図の薄い赤の範囲が第二種過誤の確率\(\beta\)である.この場合は第二種過誤の確率は92%以上あるということである.

第二種過誤の確率の変動

上の図からわかるように,帰無仮説における母比率\(\pi\)の仮定値が真の値に近づけば近づくほど検出力は下がり,第二種過誤の確率は上がる.つまり帰無仮説の間違いの程度は下がるが,そのぶん観測値の表れ方が真の分布に近いので間違った帰無仮説を採択してしまう可能性も上がるということである.

ここからわかるのは,統計的検定はあくまで帰無仮説が棄却できるどうかを判断しているだけで,帰無仮説が棄却できなかったからといって帰無仮説における仮定値が正しく真の値を指し示しているかどうかはわからない(そうでない可能性が非常に大きい)ということである.

Rのコード

描画に使用したRのコードを下に掲載する.

検出力の図示

#検出力の図示
par(family = "HiraKakuProN-W3") #日本語設定
curve(dnorm(x, 50, 10), from = 10, to = 90, 
      xlab = "π", ylab = "density", main = "検出力の図示") #確率密度関数
curve(dnorm(x, 45, 10), from = 10, to = 90, 
      col = rgb(1, 0, 0, 1), add = TRUE)
curve(dnorm(x, 50, 10), from = 10, to = qnorm(0.025, 50, 10), #棄却域
      type = "h", col = rgb(0, 0, 0, 1), add = TRUE)
curve(dnorm(x, 45, 10), from = 10, to = qnorm(0.025, 50, 10), #検出力
      type = "h", col = rgb(1, 0, 0, 0.6), add = TRUE)
text(x = 18, y = 0.011, labels = "検出力", col = "red") #テキスト
text(x = 18, y = 0.008, labels = "(1-β)", col = "red") 
text(x = 43, y = 0.003, labels = "棄却域(π<30.4)")
text(x = 73, y = 0.04, labels = "帰無仮説で想定した分布(π=50)",
     cex = 0.8)
text(x = 30, y = 0.04, labels = "真の分布(π=45)", col = "red",
     cex = 0.8)

第二種過誤の図示

#第二種過誤の図示
par(family = "HiraKakuProN-W3") #日本語設定
curve(dnorm(x, 50, 10), from = 10, to = 90, 
      col = rgb(0, 0, 0, 0.7),
      xlab = "π", ylab = "density", main = "第二種過誤の図示") #確率密度関数
curve(dnorm(x, 45, 10), from = 10, to = 90, 
      col = rgb(1, 0, 0, 1), add = TRUE)
curve(dnorm(x, 50, 10), from = 10, to = qnorm(0.025, 50, 10), #棄却域
      type = "h", col = rgb(0, 0, 0, 0.5), add = TRUE)
curve(dnorm(x, 45, 10), from = 10, to = qnorm(0.025, 50, 10), #検出力
      type = "h", col = rgb(1, 0, 0, 0.6), add = TRUE)
curve(dnorm(x, 45, 10), from = qnorm(0.025, 50, 10), to = 90, #第二種過誤
      type = "h", col = rgb(1, 0, 0, 0.3), add = TRUE)
text(x = 18, y = 0.011, labels = "検出力", col = "red") #テキスト
text(x = 18, y = 0.008, labels = "(1-β)", col = "red") 
text(x = 48, y = 0.003, labels = "第二種過誤の確率(β)",
     cex = 1.0, col = "red")

参考文献

盛山和夫, 2004, 『社会調査法入門』有斐閣.