第11回　操作変数法（8）

作者

村澤康友

公開

2026年6月24日

今日のポイント

説明変数と誤差項が無相関であることが OLS 推定量の一致性の必要十分条件．説明変数の欠落は OLS 推定量に偏りをもたらす（欠落変数バイアス）．
システム（連立方程式）の外部で決定される変数を外生変数という．外生変数を所与としてシステムの内部で決定される変数を内生変数という．説明変数に内生変数があることで生じる OLS 推定量の偏りを内生性バイアスという．
母数の一致推定量が存在するなら母数は識別可能という．説明変数と相関があり，誤差項と相関がない変数を操作変数（IV）という．線形モデルの係数の識別には推定する係数の数だけ IV が必要．IV を用いる推定手法を操作変数（IV）法という．
説明変数と相関が低い IV を弱い IV という．弱い IV を用いた IV 推定量は不安定．
各説明変数を全ての IV に回帰して回帰予測を求め，それに被説明変数を回帰する手法を 2 段階最小 2 乗法（2SLS）という．IV 法は 2SLS で実行する．

1 OLS 推定量の偏り

1.1 OLS 推定量の一致性（p. 191）

((y_1,x_1),\dots,(y_n,x_n)) を無作為標本とする．簡単化のため定数項なしのモデルで考える．y_i の x_i 上への定数項なしの線形モデルは \begin{align*} y_i & =\beta x_i+u_i \\ \operatorname{E}(u_i) & =0 \end{align*} \beta の OLS 推定量を b_n とすると b_n=\frac{\sum_{i=1}^nx_iy_i}{\sum_{i=1}^nx_i^2} \operatorname{E}\left(x_i^2\right)>0（x_i は 0 以外の値を取り得る）とする．

定理 1 \operatorname{E}(x_iu_i)=0 \Longleftrightarrow \plim_{n \to \infty}b_n=\beta

証明. b_n の式に y_i=\beta x_i+u_i を代入すると \begin{align*} b_n & =\frac{\sum_{i=1}^nx_i(\beta x_i+u_i)}{\sum_{i=1}^nx_i^2} \\ & =\beta+\frac{\sum_{i=1}^nx_iu_i}{\sum_{i=1}^nx_i^2} \\ & =\beta+\frac{(1/n)\sum_{i=1}^nx_iu_i}{(1/n)\sum_{i=1}^nx_i^2} \end{align*} 大数の法則より \begin{align*} \plim_{n \to \infty}\frac{1}{n}\sum_{i=1}^nx_i^2 & =\operatorname{E}\left(x_i^2\right) \\ \plim_{n \to \infty}\frac{1}{n}\sum_{i=1}^nx_iu_i & =\operatorname{E}(x_iu_i) \end{align*} スルツキーの定理より \plim_{n \to \infty}b_n=\beta+\frac{\operatorname{E}(x_iu_i)}{\operatorname{E}\left(x_i^2\right)} したがって一致性の必要十分条件は \operatorname{E}(x_iu_i)=0．

注釈. \operatorname{E}(u_i)=0 より \operatorname{E}(x_iu_i)=\operatorname{cov}(x_i,u_i)．

注釈. 回帰モデルなら繰り返し期待値の法則より \operatorname{E}(u_i|x_i)=0 \Longrightarrow \operatorname{E}(x_iu_i)=0．すなわち一致性の必要十分条件を満たす．

1.2 欠落変数バイアス（p. 139）

(Y,X,Z) を確率ベクトルとする．Y の (X,Z) 上への重回帰モデルは \begin{align*} Y & =\alpha+\beta X+\gamma Z+U \\ \operatorname{E}(U|X,Z) & =0 \end{align*} 説明変数から Z が欠落すると Y=\alpha+\beta X+V ただし V:=\gamma Z+U．

定理 2 \operatorname{E}(XV)=\gamma\operatorname{E}(XZ)

証明. \begin{align*} \operatorname{E}(XV) & =\operatorname{E}(X(\gamma Z+U)) \\ & =\gamma\operatorname{E}(XZ)+\operatorname{E}(XU) \end{align*} 繰り返し期待値の法則より第 2 項は \begin{align*} \operatorname{E}(XU) & =\operatorname{E}(\operatorname{E}(XU|X,Z)) \\ & =\operatorname{E}(X\operatorname{E}(U|X,Z)) \\ & =0 \end{align*}

注釈. したがって \gamma=0 または \operatorname{E}(XZ)=0 でない限り OLS 推定量は偏りをもつ．

定義 1 説明変数の欠落によって生じる OLS 推定量の偏りを 欠落変数バイアス という．

1.3 内生性バイアス（p. 191）

確率ベクトル (Y_1,Y_2,X) は次の連立方程式を満たす． \begin{align*} Y_1 & =-\gamma_{1,2}Y_2+\beta X+U_1 \\ Y_2 & =-\gamma_{2,1}Y_1+\beta X+U_2 \\ \operatorname{E}\left(\begin{pmatrix} U_1 \\ U_2 \\ \end{pmatrix}|X\right) & =\boldsymbol{0}\\ \operatorname{var}\left(\begin{pmatrix} U_1 \\ U_2 \\ \end{pmatrix}|X\right) & =\begin{bmatrix} \sigma_{1,1} & \sigma_{1,2} \\ \sigma_{2,1} & \sigma_{2,2} \\ \end{bmatrix} \end{align*} 第 1 式の OLS 推定を考える．

定理 3 \operatorname{E}(Y_2U_1)=\frac{-\gamma_{2,1}\sigma_{1,1}+\sigma_{1,2}}{1-\gamma_{2,1}\gamma_{1,2}}

証明. 繰り返し期待値の法則より \operatorname{E}(U_1|X)=0 \Longrightarrow \operatorname{E}(XU_1)=0 なので \begin{align*} \operatorname{E}(Y_2U_1) & =\operatorname{E}((-\gamma_{2,1}Y_1+\beta X+U_2)U_1) \\ & =-\gamma_{2,1}\operatorname{E}(Y_1U_1)+\sigma_{1,2} \\ & =-\gamma_{2,1}\operatorname{E}((-\gamma_{1,2}Y_2+\beta X+U_1)U_1)+\sigma_{1,2} \\ & =\gamma_{2,1}\gamma_{1,2}\operatorname{E}(Y_2U_1)-\gamma_{2,1}\sigma_{1,1}+\sigma_{1,2} \end{align*} これを \operatorname{E}(Y_2U_1) について解けばよい．

注釈. したがって \gamma_{2,1}=0 かつ \sigma_{1,2}=0 でない限り OLS 推定量は偏りをもつ．

定義 2 システム（連立方程式）の外部で決定される変数を 外生変数 という．

定義 3 外生変数を所与としてシステムの内部で決定される変数を 内生変数 という．

定義 4 説明変数に内生変数があることで生じる OLS 推定量の偏りを 内生性バイアス という．

2 操作変数（IV）法

2.1 操作変数（IV）（p. 192）

(Y,X,Z) を確率ベクトルとする．簡単化のため定数項なしのモデルで考える．Y の X 上への定数項なしの線形モデルは \begin{align*} Y & =\beta X+U \\ \operatorname{E}(U) & =0 \end{align*}

定義 5 線形モデルの説明変数と相関があり，誤差項と相関がない変数を 操作変数（Instrumental Variable, IV） という．

注釈. \operatorname{E}(ZX) \ne 0 で \operatorname{E}(ZU)=0 なら Z は \beta の推定の IV．

注釈. 回帰モデルなら繰り返し期待値の法則より \operatorname{E}(U|X)=0 \Longrightarrow \operatorname{E}(XU)=0．また X が 0 以外の値を取り得るなら \operatorname{E}(XX)=\operatorname{E}\left(X^2\right) \ne 0．したがって X が IV となる．

定義 6 操作変数を用いる推定手法を 操作変数（IV）法 という．

定理 4 \beta=\frac{\operatorname{E}(ZY)}{\operatorname{E}(ZX)}

証明. U:=Y-\beta X より \begin{align*} \operatorname{E}(ZU) & =\operatorname{E}(Z(Y-\beta X)) \\ & =\operatorname{E}(ZY)-\beta\operatorname{E}(ZX) \end{align*} 左辺＝0 より結果が得られる．

注釈. この式に MM 法を適用して \beta を推定する．

2.2 識別（p. 195）

定義 7 母数の一致推定量が存在するなら母数は 識別可能 という．

注釈. 線形モデルの係数の識別には推定する係数の数だけ IV が必要．

2.3 IV 推定量（p. 194）

((y_1,x_1,z_1),\dots,(y_n,x_n,z_n)) を無作為標本とする．簡単化のため定数項なしのモデルで考える．y_i の x_i 上への定数項なしの線形モデルは \begin{align*} y_i & =\beta x_i+u_i \\ \operatorname{E}(u_i) & =0 \end{align*}

定義 8 \beta の IV 推定量 は b_n:=\frac{\sum_{i=1}^nz_iy_i}{\sum_{i=1}^nz_ix_i}

注釈. IV を用いた MM 法と解釈できる．

注釈. z_i=x_i なら IV 推定量＝OLS 推定量．

定理 5 \plim_{n \to \infty}b_n=\beta

証明. 復習テスト．

定理 6 \sqrt{n}(b_n-\beta) \stackrel{d}{\longrightarrow}\mathrm{N}\left(0,\frac{\operatorname{var}(z_iu_i)}{\operatorname{E}(z_ix_i)^2}\right)

証明. b_n の式に y_i=\beta x_i+u_i を代入すると \begin{align*} b_n & =\frac{\sum_{i=1}^nz_i(\beta x_i+u_i)}{\sum_{i=1}^nz_ix_i} \\ & =\beta+\frac{\sum_{i=1}^nz_iu_i}{\sum_{i=1}^nz_ix_i} \end{align*} 式変形すると \sqrt{n}(b_n-\beta) =\frac{(1/\sqrt{n})\sum_{i=1}^nz_iu_i}{(1/n)\sum_{i=1}^nz_ix_i} 大数の法則より \plim_{n \to \infty}\frac{1}{n}\sum_{i=1}^nz_ix_i=\operatorname{E}(z_ix_i) \operatorname{E}(z_iu_i)=0 なので中心極限定理より \frac{1}{\sqrt{n}}\sum_{i=1}^nz_iu_i \stackrel{d}{\longrightarrow}\mathrm{N}(0,\operatorname{var}(z_iu_i)) スルツキーの定理とクラーメルの定理より \frac{(1/\sqrt{n})\sum_{i=1}^nz_iu_i}{(1/n)\sum_{i=1}^nz_ix_i} \stackrel{d}{\longrightarrow}\mathrm{N}\left(0,\frac{\operatorname{var}(z_iu_i)}{\operatorname{E}(z_ix_i)^2}\right)

注釈. \operatorname{var}(z_iu_i) は White の推定量で推定する．

系 1 \operatorname{var}(u_i|z_i)=\sigma^2 なら \sqrt{n}(b_n-\beta) \stackrel{d}{\longrightarrow}\mathrm{N}\left(0,\frac{\sigma^2}{\operatorname{E}(z_ix_i)^2/\operatorname{E}(z_i^2)}\right)

証明. \operatorname{E}(z_iu_i)=0 より \begin{align*} \operatorname{var}(z_iu_i) & =\operatorname{E}\left((z_iu_i)^2\right) \\ & =\operatorname{E}\left(z_i^2u_i^2\right) \end{align*} 繰り返し期待値の法則より \begin{align*} \operatorname{E}\left(z_i^2u_i^2\right) & =\operatorname{E}\left(\operatorname{E}\left(z_i^2u_i^2|z_i\right)\right) \\ & =\operatorname{E}\left(z_i^2\operatorname{E}\left(u_i^2|z_i\right)\right) \\ & =\operatorname{E}\left(z_i^2\operatorname{var}(u_i|z_i)\right) \\ & =\sigma^2\operatorname{E}\left(z_i^2\right) \end{align*} これを前定理の結果に代入すればよい．

注釈. したがって \sqrt{n}(b_n-\beta) \stackrel{d}{\longrightarrow}\mathrm{N}\left(0,\frac{\sigma^2}{\rho_{zx}^2\operatorname{E}(x_i^2)}\right) ただし \rho_{zx}:=\frac{\operatorname{E}(z_ix_i)}{\sqrt{\operatorname{E}(z_i^2)\operatorname{E}(x_i^2)}}

2.4 弱い IV（p. 202）

定義 9 \operatorname{E}(ZX) \approx 0 で \operatorname{E}(ZU)=0 なら Z は 弱い IV という．

注釈. \beta=\operatorname{E}(ZY)/\operatorname{E}(ZX) より \operatorname{E}(ZX) \approx 0 だと推定値が不安定になる．また前定理より IV 推定量の漸近分散は \operatorname{var}(ZU)/\operatorname{E}(ZX)^2．したがって \operatorname{E}(ZX) \approx 0 だと推定の精度が低い．

3 2 段階最小 2 乗法（2SLS）

3.1 2 段階最小 2 乗法（2SLS）（p. 205）

(Y,X,Z) を確率ベクトルとする．Y の X 上への線形モデルは \begin{align*} Y & =\alpha+\beta X+U \\ \operatorname{E}(U) & =0 \end{align*} Z を \beta の推定の IV とする．X を Z に回帰した回帰予測を \hat{X} とすると，\hat{X} は Z の線形変換なので \operatorname{E}(ZU)=0 \Longrightarrow \operatorname{E}\left(\hat{X}U\right)=0．すなわち \hat{X} も IV．

定義 10 各説明変数を全ての IV に回帰して回帰予測を求め，それに被説明変数を回帰する手法を 2 段階最小 2 乗法（2-Stage Least Squares, 2SLS） という．

注釈. IV 法は 2SLS で実行する．「IV の数＞係数の数」でも 2SLS なら全ての IV を使える．

注釈. 本当に 2 段階で実行すると正しい標準誤差が得られない．実際は（一般化した）MM 法で実行する．

3.2 構造形と誘導形（pp. 196, 206）

定義 11 変数間の理論的な関係を表した連立方程式を 構造形 という．

注釈. 説明変数に内生変数がある式は 2SLS で推定する．

定義 12 内生変数について構造形を解いた式を 誘導形 という．

注釈. 誘導形の説明変数は外生変数（＝IV）のみなので，2SLS の第 1 段階で使う．

まとめ

今日のキーワード

欠落変数バイアス，外生変数，内生変数，内生性バイアス，操作変数（IV），操作変数（IV）法，識別可能， IV推定量，弱いIV， 2段階最小2乗法（2SLS），構造形，誘導形

次回までの準備

提出：宿題 8
復習：教科書第 8 章，復習テスト 11
予習：教科書第 9 章