第20回 区間推定(11.5)

作者

村澤 康友

公開

2025年12月8日

今日のポイント
  1. 母数を含む領域を定める推定を区間推定という.ある確率で母数を含む確率的な領域を,その母数の信頼域という.信頼域が母数を含む確率を,その信頼域の信頼係数という.
  2. 正規母集団の母平均・母分散の信頼区間は標本平均・標本分散の標本分布から求まる.2 標本問題も同様.
  3. ベルヌーイ母集団の母比率(=母平均)の信頼区間は標本比率(=標本平均)の漸近分布から求まる.

1 信頼域(p. 225)

定義 1 母数を含む領域を定める推定を区間推定という.

定義 2 ある確率で母数を含む確率的な領域を,その母数の信頼域という.

定義 3 1次元の信頼域を信頼区間という.

定義 4 信頼域が母数を含む確率を,その信頼域の信頼係数という.

注釈. 「信頼係数 \alpha の信頼域」を「100\alpha%信頼域」と略すことが多い.

2 正規母集団

2.1 母平均の信頼区間(p. 226)

2.1.1 母分散が既知

母集団分布を \mathrm{N}\left(\mu,\sigma^2\right) とする.\mu の 95%信頼区間を求める.ただし \sigma^2 は既知とする.大きさ n の無作為標本の標本平均を \bar{X} とすると

\bar{X} \sim \mathrm{N}\left(\mu,\frac{\sigma^2}{n}\right)

標準化すると

\frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}} \sim \mathrm{N}(0,1)

標準正規分布表より

\Pr\left[-1.96 \le \frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}} \le 1.96\right]=0.95

式変形より

\begin{align*} -1.96 \le \frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}} \le 1.96 & \Longleftrightarrow -1.96\sqrt{\frac{\sigma^2}{n}} \le \bar{X}-\mu \le 1.96\sqrt{\frac{\sigma^2}{n}} \\ & \Longleftrightarrow \bar{X}-1.96\sqrt{\frac{\sigma^2}{n}} \le \mu \le \bar{X}+1.96\sqrt{\frac{\sigma^2}{n}} \end{align*}

したがって \mu の 95%信頼区間は

\left[\bar{X}-1.96\sqrt{\frac{\sigma^2}{n}},\bar{X}+1.96\sqrt{\frac{\sigma^2}{n}}\right]

図 1 を参照.

図 1: 母平均の 95%信頼区間(母分散は既知)

2.1.2 母分散が未知

標本分散を s^2 とする.\sigma^2s^2 に置き換えると

\frac{\bar{X}-\mu}{\sqrt{s^2/n}} \sim \mathrm{t}(n-1)

t 分布表より,例えば n=10 なら

\Pr\left[-2.262 \le \frac{\bar{X}-\mu}{\sqrt{s^2/10}} \le 2.262\right]=0.95

式変形より

\begin{align*} -2.262 \le \frac{\bar{X}-\mu}{\sqrt{s^2/10}} \le 2.262 & \Longleftrightarrow -2.262\sqrt{\frac{s^2}{10}} \le \bar{X}-\mu \le 2.262\sqrt{\frac{s^2}{10}} \\ & \Longleftrightarrow \bar{X}-2.262\sqrt{\frac{s^2}{10}} \le \mu \le \bar{X}+2.262\sqrt{\frac{s^2}{10}} \end{align*}

したがって n=10 なら \mu の 95%信頼区間は

\left[ \bar{X}-2.262\sqrt{\frac{s^2}{10}},\bar{X}+2.262\sqrt{\frac{s^2}{10}} \right]

例 1 (p. 226) n=100\bar{X}=2.346s=0.047 のとき,\mu の 90%信頼区間を求める.正規母集団なら

\frac{\bar{X}-\mu}{s/\sqrt{n}} \sim \mathrm{t}(n-1)

t 分布表より,n=100 なら

\Pr\left[-1.661 \le \frac{\bar{X}-\mu}{s/10} \le 1.661\right]=0.9

式変形より

\begin{align*} -1.661 \le \frac{\bar{X}-\mu}{s/10} \le 1.661 & \Longleftrightarrow -0.1661s \le \bar{X}-\mu \le 0.1661s \\ & \Longleftrightarrow \bar{X}-0.1661s \le \mu \le \bar{X}+0.1661s \end{align*}

したがって \mu の 90%信頼区間は

[2.346-0.1661 \cdot 0.047, 2.346+0.1661 \cdot 0.047]

すなわち [2.338,2.354]

2.2 母分散の信頼区間(p. 226)

2.2.1 母平均が既知

\sigma^2 の 95%信頼区間を求める.ただし \mu は既知とする.標本分散は

\hat{\sigma}^2:=\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2

このとき

\frac{n\hat{\sigma}^2}{\sigma^2} \sim \chi^2(n)

\chi^2 分布表より,例えば n=10 なら

\Pr\left[3.24697 \le \frac{10\hat{\sigma}^2}{\sigma^2} \le 20.4832\right]=0.95

式変形より

\begin{align*} 3.24697 \le \frac{10\hat{\sigma}^2}{\sigma^2} \le 20.4832 & \Longleftrightarrow \frac{1}{20.4832} \le \frac{\sigma^2}{10\hat{\sigma}^2} \le \frac{1}{3.24697} \\ & \Longleftrightarrow \frac{10\hat{\sigma}^2}{20.4832} \le \sigma^2 \le \frac{10\hat{\sigma}^2}{3.24697} \end{align*}

したがって n=10 なら \sigma^2 の 95%信頼区間は

\left[\frac{10}{20.4832}\hat{\sigma}^2,\frac{10}{3.24697}\hat{\sigma}^2\right]

2.2.2 母平均が未知

\mu が未知なら標本分散は

s^2:=\frac{1}{n-1}\sum_{i=1}^n\left(X_i-\bar{X}\right)^2

このとき

\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)

\chi^2 分布表より,例えば n=10 なら

\Pr\left[2.70039 \le \frac{9s^2}{\sigma^2} \le 19.0228\right]=0.95

式変形より

\begin{align*} 2.70039 \le \frac{9s^2}{\sigma^2} \le 19.0228 & \Longleftrightarrow \frac{1}{19.0228} \le \frac{\sigma^2}{9s^2} \le \frac{1}{2.70039} \\ & \Longleftrightarrow \frac{9s^2}{19.0228} \le \sigma^2 \le \frac{9s^2}{2.70039} \end{align*}

したがって n=10 なら \sigma^2 の 95%信頼区間は

\left[\frac{9}{19.0228}s^2,\frac{9}{2.70039}s^2\right]

図 2 を参照.

図 2: 母分散の95%信頼区間(母平均は未知)

2.3 母平均の差の信頼区間(p. 227)

2.3.1 母分散が既知

母集団分布を \mathrm{N}\left(\mu_X,\sigma_X^2\right)\mathrm{N}\left(\mu_Y,\sigma_Y^2\right) とする.\mu_X-\mu_Y の 95%信頼区間を求める.ただし \sigma_X^2,\sigma_Y^2 は既知とする.各母集団から独立に抽出した大きさ m,n の無作為標本の標本平均を \bar{X},\bar{Y} とすると

\begin{align*} \bar{X} & \sim \mathrm{N}\left(\mu_X,\frac{\sigma_X^2}{m}\right) \\ \bar{Y} & \sim \mathrm{N}\left(\mu_Y,\frac{\sigma_Y^2}{n}\right) \end{align*}

両者は独立だから

\bar{X}-\bar{Y} \sim \mathrm{N}\left(\mu_X-\mu_Y,\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}\right)

標準化すると

\frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2/m+\sigma_Y^2/n}} \sim \mathrm{N}(0,1)

標準正規分布表より

\Pr\left[-1.96 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2/m+\sigma_Y^2/n}} \le 1.96\right]=0.95

式変形より

\begin{align*} & -1.96 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2/m+\sigma_Y^2/n}} \le 1.96 \\ & \Longleftrightarrow -1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \le \bar{X}-\bar{Y}-(\mu_X-\mu_Y) \le 1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \\ & \Longleftrightarrow \bar{X}-\bar{Y}-1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \le \mu_X-\mu_Y \le \bar{X}-\bar{Y}+1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \end{align*}

したがって \mu_X-\mu_Y の 95%信頼区間は

\begin{align*} \left[ \bar{X}-\bar{Y}-1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}}, \bar{X}-\bar{Y}+1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \right] \end{align*}

2.3.2 母分散が未知で等しい場合

\sigma_X^2=\sigma_Y^2=\sigma^2 なら

\frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma^2(1/m+1/n)}} \sim \mathrm{N}(0,1)

プールした標本分散を s^2 とする.\sigma^2s^2 に置き換えると

\frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{s^2(1/m+1/n)}} \sim \mathrm{t}(m+n-2)

t 分布表より,例えば m=4n=6 なら

\Pr\left[-2.306 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{s^2(1/4+1/6)}} \le 2.306\right]=0.95

式変形より

\begin{align*} & -2.306 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{s^2(1/4+1/6)}} \le 2.306 \\ & \Longleftrightarrow -2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \le \bar{X}-\bar{Y}-(\mu_X-\mu_Y) \le 2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \\ & \Longleftrightarrow \bar{X}-\bar{Y}-2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \le \mu_X-\mu_Y \le \bar{X}-\bar{Y}+2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \end{align*}

したがって m=4n=6 なら \mu_X-\mu_Y の95%信頼区間は

\begin{align*} \left[ \bar{X}-\bar{Y}-2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)}, \bar{X}-\bar{Y}+2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \right] \end{align*}

2.3.3 母分散が未知で異なる場合

\sigma_X^2 \ne \sigma_Y^2 なら近似的な信頼区間を用いる.詳細は略.

2.4 母分散の比の信頼区間(p. 229)

2.4.1 F 分布の上側確率と下側確率

補題 1 X \sim \mathrm{F}(m,n) \Longrightarrow \frac{1}{X} \sim \mathrm{F}(n,m)

証明. F 分布の定義より

X=\frac{U/m}{V/n}

ただし U \sim \chi^2(m)V \sim \chi^2(n) は独立.逆数は

\frac{1}{X}=\frac{V/n}{U/m}

したがって 1/X \sim \mathrm{F}(n,m)

注釈. \mathrm{F}(m,n) の下側確率は

\Pr[X \le x]=\Pr\left[\frac{1}{X} \ge \frac{1}{x}\right]

より \mathrm{F}(n,m) の上側確率から求まる(図 3).

図 3: F(5,25) の 10%下側確率と F(25,5) の 10%上側確率

2.4.2 母平均が既知

\sigma_X^2/\sigma_Y^2 の 95%信頼区間を求める.ただし \mu_X,\mu_Y は既知とする.標本分散を \hat{\sigma}_X^2,\hat{\sigma}_Y^2 とすると

\begin{align*} \frac{m\hat{\sigma}_X^2}{\sigma_X^2} & \sim \chi^2(m) \\ \frac{n\hat{\sigma}_Y^2}{\sigma_Y^2} & \sim \chi^2(n) \end{align*}

両者は独立だから

\frac{\hat{\sigma}_X^2/\sigma_X^2}{\hat{\sigma}_Y^2/\sigma_Y^2} \sim \mathrm{F}(m,n)

すなわち

\frac{\hat{\sigma}_X^2/\hat{\sigma}_Y^2}{\sigma_X^2/\sigma_Y^2} \sim \mathrm{F}(m,n)

F 分布表より,例えば m=4n=6 なら

\Pr\left[\frac{1}{9.197} \le \frac{\hat{\sigma}_X^2/\hat{\sigma}_Y^2}{\sigma_X^2/\sigma_Y^2} \le 6.227\right]=0.95

式変形より

\begin{align*} \frac{1}{9.197} \le \frac{\hat{\sigma}_X^2/\hat{\sigma}_Y^2}{\sigma_X^2/\sigma_Y^2} \le 6.227 & \Longleftrightarrow \frac{1}{6.227} \le \frac{\sigma_X^2/\sigma_Y^2}{\hat{\sigma}_X^2/\hat{\sigma}_Y^2} \le 9.197 \\ & \Longleftrightarrow \frac{1}{6.227}\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2} \le \frac{\sigma_X^2}{\sigma_Y^2} \le 9.197\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2} \end{align*}

したがって m=4n=6 なら \sigma_X^2/\sigma_Y^2 の 95%信頼区間は

\left[ \frac{1}{6.227}\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2}, 9.197\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2} \right]

2.4.3 母平均が未知

標本分散を s_X^2,s_Y^2 とすると

\begin{align*} \frac{(m-1)s_X^2}{\sigma_X^2} & \sim \chi^2(m-1) \\ \frac{(n-1)s_Y^2}{\sigma_Y^2} & \sim \chi^2(n-1) \end{align*}

両者は独立だから

\frac{s_X^2/\sigma_X^2}{s_Y^2/\sigma_Y^2} \sim \mathrm{F}(m-1,n-1)

すなわち

\frac{s_X^2/s_Y^2}{\sigma_X^2/\sigma_Y^2} \sim \mathrm{F}(m-1,n-1)

F 分布表より,例えば m=4n=6 なら

\Pr\left[\frac{1}{14.885} \le \frac{s_X^2/s_Y^2}{\sigma_X^2/\sigma_Y^2} \le 7.764\right]=0.95

式変形より

\begin{align*} \frac{1}{14.885} \le \frac{s_X^2/s_Y^2}{\sigma_X^2/\sigma_Y^2} \le 7.764 & \Longleftrightarrow \frac{1}{7.764} \le \frac{\sigma_X^2/\sigma_Y^2}{s_X^2/s_Y^2} \le 14.885 \\ & \Longleftrightarrow \frac{1}{7.764}\frac{s_X^2}{s_Y^2} \le \frac{\sigma_X^2}{\sigma_Y^2} \le 14.885\frac{s_X^2}{s_Y^2} \end{align*}

したがって m=4n=6 なら \sigma_X^2/\sigma_Y^2 の 95%信頼区間は

\left[\frac{1}{7.764}\frac{s_X^2}{s_Y^2},14.885\frac{s_X^2}{s_Y^2}\right]

3 ベルヌーイ母集団

3.1 母比率と標本比率(p. 250)

母集団分布を \mathrm{Bin}(1,p) とする.

定義 5 ベルヌーイ母集団における成功(=1)の比率を母比率という.

注釈. \mathrm{Bin}(1,p) の平均は p なので母比率=母平均.

定義 6 ベルヌーイ母集団からの標本における成功(=1)の比率を標本比率という.

注釈. 値が 1 か 0 なので標本比率=標本平均.

3.2 母比率の信頼区間(p. 229)

p の 95%信頼区間を近似的に求める.\mathrm{Bin}(1,p) の平均は p,分散は p(1-p).したがって母平均の信頼区間を近似的に求めればよい.大きさ n の無作為標本の標本平均を \hat{p} とすると,中心極限定理より

\hat{p} \stackrel{a}{\sim}\mathrm{N}\left(p,\frac{p(1-p)}{n}\right)

標準化すると

\frac{\hat{p}-p}{\sqrt{p(1-p)/n}} \stackrel{a}{\sim}\mathrm{N}(0,1)

分母の p\hat{p} に置き換えると

\frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}} \stackrel{a}{\sim}\mathrm{N}(0,1)

標準正規分布表より

\Pr\left[-1.96 \le \frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}} \le 1.96\right] \approx 0.95

式変形より

\begin{align*} -1.96 \le \frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}} \le 1.96 & \Longleftrightarrow -1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le \hat{p}-p \le 1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \\ & \Longleftrightarrow \hat{p}-1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le p \le \hat{p}+1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \end{align*}

したがって p の 95%信頼区間は近似的に

\left[ \hat{p}-1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p}+1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \right]

例 2 100 世帯を対象にある番組の視聴率を調査したら 10%の視聴率であった.真の視聴率 p の 95%信頼区間は n=100\hat{p}=0.1 を代入すると

\left[ 0.1-1.96\frac{\sqrt{0.1 \cdot 0.9}}{10}, 0.1+1.96\frac{\sqrt{0.1 \cdot 0.9}}{10} \right]

計算すると [0.0412,0.1588],すなわち 4.12〜15.88%となる.

3.3 母比率の差の信頼区間

母平均の差の信頼区間(母分散が未知で異なる場合)と同様.詳細は略.

まとめ

今日のキーワード

区間推定, 信頼域, 信頼区間, 信頼係数, 母平均の信頼区間, 母分散の信頼区間, 母平均の差の信頼区間, 母分散の比の信頼区間, 母比率, 標本比率, 母比率の信頼区間, 母比率の差の信頼区間

次回までの準備