太郎丸 博
2025-04-03
標本から計算した平均と母集団の平均のあいだには多少のズレがあるので、そのズレの大きさを知りたい。 このような場合、平均値や比率の区間推定が役に立つ。
自殺数も安打数も偶然多くなったり少なくなったりすることがあるため、測定期間が短かったり、打席数が少なかったりすると、知りたい真の値と実現値のあいだのズレが大きくなることがある。それゆえ、このズレの大きさを知りたい。
\[ \begin{align} \mathrm{se} &= \frac{母集団での標準偏差}{\sqrt{N}} \tag{1}\\ 95\%信頼区間 &= 平均値 - t\times \mathrm{se} \quad ~ \quad 平均値 + t\times \mathrm{se} \tag{2} \end{align} \]
| N | 信頼区間 |
|---|---|
| 5 | 平均値 \(-\) 2.78 \(\times\) se ~ 平均値 \(+\) 2.78 \(\times\) se |
| 10 | 平均値 \(-\) 2.26 \(\times\) se ~ 平均値 \(+\) 2.26 \(\times\) se |
| 20 | 平均値 \(-\) 2.09 \(\times\) se ~ 平均値 \(+\) 2.09 \(\times\) se |
| 50 | 平均値 \(-\) 2.01 \(\times\) se ~ 平均値 \(+\) 2.01 \(\times\) se |
| 100 | 平均値 \(-\) 1.98 \(\times\) se ~ 平均値 \(+\) 1.98 \(\times\) se |
| 500 | 平均値 \(-\) 1.96 \(\times\) se ~ 平均値 \(+\) 1.96 \(\times\) se |
ある大学の学生を無作為抽出して身長を調べたところ、168, 163, 159, 177, 167 (cm) であった。平均身長は、 \[ \frac{168 + 163 + 159 + 177 + 167}{5}= 166.8 \] で、母集団での標準偏差の推定値は、 \[ \sqrt{\frac{(168 - 166.8)^2 + (163 - 166.8)^2 + (159 - 166.8)^2 + (177 - 166.8)^2 + (167 - 166.8)^2}{5-1}}= 6.7 \]
ある大学の学生から200人無作為抽出して違法薬物の使用経験を尋ねたら、20人が経験があると答えたとする。この大学の学生の違法薬物経験率の 95% 信頼区間を求めよ。
標本での経験率: \(20/200=0.1\)
母集団での薬物経験の標準偏差の推定値: \(\sqrt{\frac{200}{200-1} 0.1 (1-0.1)} = 0.301\)
薬物経験率の標準誤差: \(\frac{0.301}{\sqrt{200}}= 0.021\)
\(N = 200\) のとき \(t = 1.97\) (パソコンに計算させた)
95%信頼区間の下限値: \(0.1 - 1.97 \times 0.021 = 0.058\)
95%信頼区間の上限値: \(0.1 + 1.97 \times 0.021 = 0.142\)