第20回 区間推定(11.5)
- 母数を含む領域を定める推定を区間推定という.ある確率で母数を含む確率的な領域を,その母数の信頼域という.信頼域が母数を含む確率を,その信頼域の信頼係数という.
- 正規母集団の母平均・母分散の信頼区間は標本平均・標本分散の標本分布から求まる.2 標本問題も同様.
- ベルヌーイ母集団の母比率(=母平均)の信頼区間は標本比率(=標本平均)の漸近分布から求まる.
1 信頼域(p. 225)
定義 1 母数を含む領域を定める推定を区間推定という.
定義 2 ある確率で母数を含む確率的な領域を,その母数の信頼域という.
定義 3 1次元の信頼域を信頼区間という.
定義 4 信頼域が母数を含む確率を,その信頼域の信頼係数という.
注釈. 「信頼係数 \alpha の信頼域」を「100\alpha%信頼域」と略すことが多い.
2 正規母集団
2.1 母平均の信頼区間(p. 226)
2.1.1 母分散が既知
母集団分布を \mathrm{N}\left(\mu,\sigma^2\right) とする.\mu の 95%信頼区間を求める.ただし \sigma^2 は既知とする.大きさ n の無作為標本の標本平均を \bar{X} とすると
\bar{X} \sim \mathrm{N}\left(\mu,\frac{\sigma^2}{n}\right)
標準化すると
\frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}} \sim \mathrm{N}(0,1)
標準正規分布表より
\Pr\left[-1.96 \le \frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}} \le 1.96\right]=0.95
式変形より
\begin{align*} -1.96 \le \frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}} \le 1.96 & \Longleftrightarrow -1.96\sqrt{\frac{\sigma^2}{n}} \le \bar{X}-\mu \le 1.96\sqrt{\frac{\sigma^2}{n}} \\ & \Longleftrightarrow \bar{X}-1.96\sqrt{\frac{\sigma^2}{n}} \le \mu \le \bar{X}+1.96\sqrt{\frac{\sigma^2}{n}} \end{align*}
したがって \mu の 95%信頼区間は
\left[\bar{X}-1.96\sqrt{\frac{\sigma^2}{n}},\bar{X}+1.96\sqrt{\frac{\sigma^2}{n}}\right]
図 1 を参照.
2.1.2 母分散が未知
標本分散を s^2 とする.\sigma^2 を s^2 に置き換えると
\frac{\bar{X}-\mu}{\sqrt{s^2/n}} \sim \mathrm{t}(n-1)
t 分布表より,例えば n=10 なら
\Pr\left[-2.262 \le \frac{\bar{X}-\mu}{\sqrt{s^2/10}} \le 2.262\right]=0.95
式変形より
\begin{align*} -2.262 \le \frac{\bar{X}-\mu}{\sqrt{s^2/10}} \le 2.262 & \Longleftrightarrow -2.262\sqrt{\frac{s^2}{10}} \le \bar{X}-\mu \le 2.262\sqrt{\frac{s^2}{10}} \\ & \Longleftrightarrow \bar{X}-2.262\sqrt{\frac{s^2}{10}} \le \mu \le \bar{X}+2.262\sqrt{\frac{s^2}{10}} \end{align*}
したがって n=10 なら \mu の 95%信頼区間は
\left[ \bar{X}-2.262\sqrt{\frac{s^2}{10}},\bar{X}+2.262\sqrt{\frac{s^2}{10}} \right]
例 1 (p. 226) n=100,\bar{X}=2.346,s=0.047 のとき,\mu の 90%信頼区間を求める.正規母集団なら
\frac{\bar{X}-\mu}{s/\sqrt{n}} \sim \mathrm{t}(n-1)
t 分布表より,n=100 なら
\Pr\left[-1.661 \le \frac{\bar{X}-\mu}{s/10} \le 1.661\right]=0.9
式変形より
\begin{align*} -1.661 \le \frac{\bar{X}-\mu}{s/10} \le 1.661 & \Longleftrightarrow -0.1661s \le \bar{X}-\mu \le 0.1661s \\ & \Longleftrightarrow \bar{X}-0.1661s \le \mu \le \bar{X}+0.1661s \end{align*}
したがって \mu の 90%信頼区間は
[2.346-0.1661 \cdot 0.047, 2.346+0.1661 \cdot 0.047]
すなわち [2.338,2.354].
2.2 母分散の信頼区間(p. 226)
2.2.1 母平均が既知
\sigma^2 の 95%信頼区間を求める.ただし \mu は既知とする.標本分散は
\hat{\sigma}^2:=\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2
このとき
\frac{n\hat{\sigma}^2}{\sigma^2} \sim \chi^2(n)
\chi^2 分布表より,例えば n=10 なら
\Pr\left[3.24697 \le \frac{10\hat{\sigma}^2}{\sigma^2} \le 20.4832\right]=0.95
式変形より
\begin{align*} 3.24697 \le \frac{10\hat{\sigma}^2}{\sigma^2} \le 20.4832 & \Longleftrightarrow \frac{1}{20.4832} \le \frac{\sigma^2}{10\hat{\sigma}^2} \le \frac{1}{3.24697} \\ & \Longleftrightarrow \frac{10\hat{\sigma}^2}{20.4832} \le \sigma^2 \le \frac{10\hat{\sigma}^2}{3.24697} \end{align*}
したがって n=10 なら \sigma^2 の 95%信頼区間は
\left[\frac{10}{20.4832}\hat{\sigma}^2,\frac{10}{3.24697}\hat{\sigma}^2\right]
2.2.2 母平均が未知
\mu が未知なら標本分散は
s^2:=\frac{1}{n-1}\sum_{i=1}^n\left(X_i-\bar{X}\right)^2
このとき
\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)
\chi^2 分布表より,例えば n=10 なら
\Pr\left[2.70039 \le \frac{9s^2}{\sigma^2} \le 19.0228\right]=0.95
式変形より
\begin{align*} 2.70039 \le \frac{9s^2}{\sigma^2} \le 19.0228 & \Longleftrightarrow \frac{1}{19.0228} \le \frac{\sigma^2}{9s^2} \le \frac{1}{2.70039} \\ & \Longleftrightarrow \frac{9s^2}{19.0228} \le \sigma^2 \le \frac{9s^2}{2.70039} \end{align*}
したがって n=10 なら \sigma^2 の 95%信頼区間は
\left[\frac{9}{19.0228}s^2,\frac{9}{2.70039}s^2\right]
図 2 を参照.
2.3 母平均の差の信頼区間(p. 227)
2.3.1 母分散が既知
母集団分布を \mathrm{N}\left(\mu_X,\sigma_X^2\right),\mathrm{N}\left(\mu_Y,\sigma_Y^2\right) とする.\mu_X-\mu_Y の 95%信頼区間を求める.ただし \sigma_X^2,\sigma_Y^2 は既知とする.各母集団から独立に抽出した大きさ m,n の無作為標本の標本平均を \bar{X},\bar{Y} とすると
\begin{align*} \bar{X} & \sim \mathrm{N}\left(\mu_X,\frac{\sigma_X^2}{m}\right) \\ \bar{Y} & \sim \mathrm{N}\left(\mu_Y,\frac{\sigma_Y^2}{n}\right) \end{align*}
両者は独立だから
\bar{X}-\bar{Y} \sim \mathrm{N}\left(\mu_X-\mu_Y,\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}\right)
標準化すると
\frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2/m+\sigma_Y^2/n}} \sim \mathrm{N}(0,1)
標準正規分布表より
\Pr\left[-1.96 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2/m+\sigma_Y^2/n}} \le 1.96\right]=0.95
式変形より
\begin{align*} & -1.96 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2/m+\sigma_Y^2/n}} \le 1.96 \\ & \Longleftrightarrow -1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \le \bar{X}-\bar{Y}-(\mu_X-\mu_Y) \le 1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \\ & \Longleftrightarrow \bar{X}-\bar{Y}-1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \le \mu_X-\mu_Y \le \bar{X}-\bar{Y}+1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \end{align*}
したがって \mu_X-\mu_Y の 95%信頼区間は
\begin{align*} \left[ \bar{X}-\bar{Y}-1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}}, \bar{X}-\bar{Y}+1.96\sqrt{\frac{\sigma_X^2}{m}+\frac{\sigma_Y^2}{n}} \right] \end{align*}
2.3.2 母分散が未知で等しい場合
\sigma_X^2=\sigma_Y^2=\sigma^2 なら
\frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{\sigma^2(1/m+1/n)}} \sim \mathrm{N}(0,1)
プールした標本分散を s^2 とする.\sigma^2 を s^2 に置き換えると
\frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{s^2(1/m+1/n)}} \sim \mathrm{t}(m+n-2)
t 分布表より,例えば m=4,n=6 なら
\Pr\left[-2.306 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{s^2(1/4+1/6)}} \le 2.306\right]=0.95
式変形より
\begin{align*} & -2.306 \le \frac{\bar{X}-\bar{Y}-(\mu_X-\mu_Y)}{\sqrt{s^2(1/4+1/6)}} \le 2.306 \\ & \Longleftrightarrow -2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \le \bar{X}-\bar{Y}-(\mu_X-\mu_Y) \le 2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \\ & \Longleftrightarrow \bar{X}-\bar{Y}-2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \le \mu_X-\mu_Y \le \bar{X}-\bar{Y}+2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \end{align*}
したがって m=4,n=6 なら \mu_X-\mu_Y の95%信頼区間は
\begin{align*} \left[ \bar{X}-\bar{Y}-2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)}, \bar{X}-\bar{Y}+2.306\sqrt{s^2\left(\frac{1}{4}+\frac{1}{6}\right)} \right] \end{align*}
2.3.3 母分散が未知で異なる場合
\sigma_X^2 \ne \sigma_Y^2 なら近似的な信頼区間を用いる.詳細は略.
2.4 母分散の比の信頼区間(p. 229)
2.4.1 F 分布の上側確率と下側確率
補題 1 X \sim \mathrm{F}(m,n) \Longrightarrow \frac{1}{X} \sim \mathrm{F}(n,m)
証明. F 分布の定義より
X=\frac{U/m}{V/n}
ただし U \sim \chi^2(m) と V \sim \chi^2(n) は独立.逆数は
\frac{1}{X}=\frac{V/n}{U/m}
したがって 1/X \sim \mathrm{F}(n,m).
注釈. \mathrm{F}(m,n) の下側確率は
\Pr[X \le x]=\Pr\left[\frac{1}{X} \ge \frac{1}{x}\right]
より \mathrm{F}(n,m) の上側確率から求まる(図 3).
2.4.2 母平均が既知
\sigma_X^2/\sigma_Y^2 の 95%信頼区間を求める.ただし \mu_X,\mu_Y は既知とする.標本分散を \hat{\sigma}_X^2,\hat{\sigma}_Y^2 とすると
\begin{align*} \frac{m\hat{\sigma}_X^2}{\sigma_X^2} & \sim \chi^2(m) \\ \frac{n\hat{\sigma}_Y^2}{\sigma_Y^2} & \sim \chi^2(n) \end{align*}
両者は独立だから
\frac{\hat{\sigma}_X^2/\sigma_X^2}{\hat{\sigma}_Y^2/\sigma_Y^2} \sim \mathrm{F}(m,n)
すなわち
\frac{\hat{\sigma}_X^2/\hat{\sigma}_Y^2}{\sigma_X^2/\sigma_Y^2} \sim \mathrm{F}(m,n)
F 分布表より,例えば m=4,n=6 なら
\Pr\left[\frac{1}{9.197} \le \frac{\hat{\sigma}_X^2/\hat{\sigma}_Y^2}{\sigma_X^2/\sigma_Y^2} \le 6.227\right]=0.95
式変形より
\begin{align*} \frac{1}{9.197} \le \frac{\hat{\sigma}_X^2/\hat{\sigma}_Y^2}{\sigma_X^2/\sigma_Y^2} \le 6.227 & \Longleftrightarrow \frac{1}{6.227} \le \frac{\sigma_X^2/\sigma_Y^2}{\hat{\sigma}_X^2/\hat{\sigma}_Y^2} \le 9.197 \\ & \Longleftrightarrow \frac{1}{6.227}\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2} \le \frac{\sigma_X^2}{\sigma_Y^2} \le 9.197\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2} \end{align*}
したがって m=4,n=6 なら \sigma_X^2/\sigma_Y^2 の 95%信頼区間は
\left[ \frac{1}{6.227}\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2}, 9.197\frac{\hat{\sigma}_X^2}{\hat{\sigma}_Y^2} \right]
2.4.3 母平均が未知
標本分散を s_X^2,s_Y^2 とすると
\begin{align*} \frac{(m-1)s_X^2}{\sigma_X^2} & \sim \chi^2(m-1) \\ \frac{(n-1)s_Y^2}{\sigma_Y^2} & \sim \chi^2(n-1) \end{align*}
両者は独立だから
\frac{s_X^2/\sigma_X^2}{s_Y^2/\sigma_Y^2} \sim \mathrm{F}(m-1,n-1)
すなわち
\frac{s_X^2/s_Y^2}{\sigma_X^2/\sigma_Y^2} \sim \mathrm{F}(m-1,n-1)
F 分布表より,例えば m=4,n=6 なら
\Pr\left[\frac{1}{14.885} \le \frac{s_X^2/s_Y^2}{\sigma_X^2/\sigma_Y^2} \le 7.764\right]=0.95
式変形より
\begin{align*} \frac{1}{14.885} \le \frac{s_X^2/s_Y^2}{\sigma_X^2/\sigma_Y^2} \le 7.764 & \Longleftrightarrow \frac{1}{7.764} \le \frac{\sigma_X^2/\sigma_Y^2}{s_X^2/s_Y^2} \le 14.885 \\ & \Longleftrightarrow \frac{1}{7.764}\frac{s_X^2}{s_Y^2} \le \frac{\sigma_X^2}{\sigma_Y^2} \le 14.885\frac{s_X^2}{s_Y^2} \end{align*}
したがって m=4,n=6 なら \sigma_X^2/\sigma_Y^2 の 95%信頼区間は
\left[\frac{1}{7.764}\frac{s_X^2}{s_Y^2},14.885\frac{s_X^2}{s_Y^2}\right]
3 ベルヌーイ母集団
3.1 母比率と標本比率(p. 250)
母集団分布を \mathrm{Bin}(1,p) とする.
定義 5 ベルヌーイ母集団における成功(=1)の比率を母比率という.
注釈. \mathrm{Bin}(1,p) の平均は p なので母比率=母平均.
定義 6 ベルヌーイ母集団からの標本における成功(=1)の比率を標本比率という.
注釈. 値が 1 か 0 なので標本比率=標本平均.
3.2 母比率の信頼区間(p. 229)
p の 95%信頼区間を近似的に求める.\mathrm{Bin}(1,p) の平均は p,分散は p(1-p).したがって母平均の信頼区間を近似的に求めればよい.大きさ n の無作為標本の標本平均を \hat{p} とすると,中心極限定理より
\hat{p} \stackrel{a}{\sim}\mathrm{N}\left(p,\frac{p(1-p)}{n}\right)
標準化すると
\frac{\hat{p}-p}{\sqrt{p(1-p)/n}} \stackrel{a}{\sim}\mathrm{N}(0,1)
分母の p を \hat{p} に置き換えると
\frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}} \stackrel{a}{\sim}\mathrm{N}(0,1)
標準正規分布表より
\Pr\left[-1.96 \le \frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}} \le 1.96\right] \approx 0.95
式変形より
\begin{align*} -1.96 \le \frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})/n}} \le 1.96 & \Longleftrightarrow -1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le \hat{p}-p \le 1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \\ & \Longleftrightarrow \hat{p}-1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le p \le \hat{p}+1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \end{align*}
したがって p の 95%信頼区間は近似的に
\left[ \hat{p}-1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p}+1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \right]
例 2 100 世帯を対象にある番組の視聴率を調査したら 10%の視聴率であった.真の視聴率 p の 95%信頼区間は n=100,\hat{p}=0.1 を代入すると
\left[ 0.1-1.96\frac{\sqrt{0.1 \cdot 0.9}}{10}, 0.1+1.96\frac{\sqrt{0.1 \cdot 0.9}}{10} \right]
計算すると [0.0412,0.1588],すなわち 4.12〜15.88%となる.
3.3 母比率の差の信頼区間
母平均の差の信頼区間(母分散が未知で異なる場合)と同様.詳細は略.
まとめ
区間推定, 信頼域, 信頼区間, 信頼係数, 母平均の信頼区間, 母分散の信頼区間, 母平均の差の信頼区間, 母分散の比の信頼区間, 母比率, 標本比率, 母比率の信頼区間, 母比率の差の信頼区間