中級統計学:復習テスト25
すべての質問に解答しなければ提出とは認めない.正答に修正した上で,復習テスト 21〜26 を順に重ねて左上でホチキス止めし,定期試験実施日(1月27日の予定)に提出すること.
- 2 変量データを ((y_1,x_1),\dots,(y_n,x_n)) とする.y_i の x_i 上への定数項なしの古典的線形回帰モデルは
\begin{align*} y_i & =\beta x_i+u_i \\ \operatorname{E}(u_i) & =0 \\ \operatorname{var}(u_i) & =\sigma^2 \\ \operatorname{cov}(u_i,u_j) & =0 \quad \text{for $i \ne j$} \end{align*}
\beta の OLS 推定量を b とする.
b を式で与えなさい.
b の期待値を求めなさい.
b の分散を求めなさい.
- OLS 問題は
\begin{align*} \min_b & \quad \sum_{i=1}^n(y_i-bx_i)^2 \\ \text{and} & \quad b \in \mathbb{R} \end{align*}
1 階の条件より
\sum_{i=1}^n(-x_i)2(y_i-bx_i)=0
すなわち
\sum_{i=1}^nx_i(y_i-bx_i)=0
正規方程式は
\sum_{i=1}^nx_iy_i-b\sum_{i=1}^nx_i^2=0
\sum_{i=1}^nx_i^2 \ne 0 なら
b=\frac{\sum_{i=1}^nx_iy_i}{\sum_{i=1}^nx_i^2}
- 前問の式に回帰式 y_i=\beta x_i+u_i を代入すると
\begin{align*} b & =\frac{\sum_{i=1}^nx_i(\beta x_i+u_i)}{\sum_{i=1}^nx_i^2} \\ & =\frac{\beta\sum_{i=1}^nx_i^2+\sum_{i=1}^nx_iu_i}{\sum_{i=1}^nx_i^2} \\ & =\beta+\frac{\sum_{i=1}^nx_iu_i}{\sum_{i=1}^nx_i^2} \end{align*}
期待値の線形性より
\begin{align*} \operatorname{E}(b) & =\operatorname{E}\left(\beta+\frac{\sum_{i=1}^nx_iu_i}{\sum_{i=1}^nx_i^2}\right) \\ & =\beta+\frac{\sum_{i=1}^nx_i\operatorname{E}(u_i)}{\sum_{i=1}^nx_i^2} \\ & =\beta \end{align*}
- u_1,\dots,u_n は無相関で分散が均一なので
\begin{align*} \operatorname{var}(b) & =\operatorname{var}\left(\beta+\frac{\sum_{i=1}^nx_iu_i}{\sum_{i=1}^nx_i^2}\right) \\ & =\operatorname{var}\left(\frac{\sum_{i=1}^nx_iu_i}{\sum_{i=1}^nx_i^2}\right) \\ & =\frac{\operatorname{var}(x_1u_1+\dots+x_nu_n)}{(\sum_{i=1}^nx_i^2)^2} \\ & =\frac{\operatorname{var}(x_1u_1)+\dots+\operatorname{var}(x_nu_n)}{(\sum_{i=1}^nx_i^2)^2} \\ & =\frac{x_1^2\operatorname{var}(u_1)+\dots+x_n^2\operatorname{var}(u_n)}{(\sum_{i=1}^nx_i^2)^2} \\ & =\frac{x_1^2\sigma^2+\dots+x_n^2\sigma^2}{(\sum_{i=1}^nx_i^2)^2} \\ & =\frac{\sigma^2\sum_{i=1}^nx_i^2}{(\sum_{i=1}^nx_i^2)^2} \\ & =\frac{\sigma^2}{\sum_{i=1}^nx_i^2} \end{align*}
- 2 変量データを ((y_1,x_1),\dots,(y_n,x_n)) とする.y_i の x_i 上への定数項なしの古典的正規線形回帰モデルは
\begin{align*} y_i & =\beta x_i+u_i \\ \{u_i\} & \sim \mathrm{IN}\left(0,\sigma^2\right) \end{align*}
\beta の OLS 推定量を b とする.\sigma^2 を既知として次の片側検定問題を考える.
H_0:\beta=c \quad \text{vs} \quad H_1:\beta>c
b の分布を求めなさい.
検定統計量を与えなさい.
検定統計量の H_0 の下での分布を与えなさい.
分布表を利用して,有意水準 5%の検定の棄却域を定めなさい.
分布表を利用して,検定統計量の値が 2.0 のときの p 値を求めなさい.
- b は (y_1,\dots,y_n) の線形変換だから正規分布.Q1 (b) (c) より
b \sim \mathrm{N}\left(\beta,\frac{\sigma^2}{\sum_{i=1}^nx_i^2}\right)
- 前問の結果を標準化すると
\frac{b-\beta}{\sqrt{\sigma^2/\sum_{i=1}^nx_i^2}} \sim \mathrm{N}(0,1)
H_0:\beta=c を代入すると,検定統計量は
Z:=\frac{b-c}{\sqrt{\sigma^2/\sum_{i=1}^nx_i^2}}
- H_0 の下で
Z \sim \mathrm{N}(0,1)
- 標準正規分布表より H_0 の下で
\Pr[Z \ge 1.65]=.05
したがって棄却域は [1.65,\infty).
- 標準正規分布表より H_0 の下で
\Pr[Z \ge 2.00]=.02275
したがって p 値=.02275.