第12回 DID法とパネル・データ(9)
- 処置が無作為でなく共変量が欠落すると,平均処置効果(ATE)を OLS で推定できない.処置群と対照群の 変化の差 で ATE を推定する手法を差分の差分(DID)法という.共変量の変化の期待値が処置群と対照群で等しければ(平行トレンドの仮定),DID 法で ATE を推定できる.
- 個体に固有で観測を通じて一定の効果を個別効果という.観測できない個別効果は欠落変数バイアスをもたらす.パネル・データなら観測できない個別効果を統制できる.
- 非確率的な個別効果を固定効果という.固定効果は個別ダミーで統制する.確率的な個別効果を変量効果という.変量効果が説明変数と無相関なら欠落変数バイアスは生じない.変量効果モデルの定式化は Hausman 検定で検定できる.
1 差分の差分(DID)法
1.1 欠落変数バイアス
(Y,D,X) を確率ベクトルとする.ただし Y は結果,D は処置群ダミー,X は共変量とする.Y に対する D の平均処置効果(ATE)を推定したい.Y の (D,X) 上への重回帰モデルは \operatorname{E}(Y|D,X)=\alpha+\mathrm{ATE} \cdot D+\beta X X が欠落すると,繰り返し期待値の法則より \operatorname{E}(Y|D)=\alpha+\mathrm{ATE} \cdot D+\beta\operatorname{E}(X|D) 処置群の母平均を \mu_1:=\operatorname{E}(Y|D=1),対照群の母平均を \mu_0:=\operatorname{E}(Y|D=0) とする.
定理 1 \mu_1-\mu_0=\mathrm{ATE}+\beta(\operatorname{E}(X|D=1)-\operatorname{E}(X|D=0))
証明. \begin{align*} \mu_1-\mu_0 & =\operatorname{E}(Y|D=1)-\operatorname{E}(Y|D=0) \\ & =\alpha+\mathrm{ATE}+\beta\operatorname{E}(X|D=1)-(\alpha+\beta\operatorname{E}(X|D=0)) \\ & =\mathrm{ATE}+\beta(\operatorname{E}(X|D=1)-\operatorname{E}(X|D=0)) \end{align*}
注釈. 処置が無作為なら \operatorname{E}(X|D)=\operatorname{E}(X) より第 2 項は 0.そうでなければ \mu_1-\mu_0 \ne \mathrm{ATE}(欠落変数バイアス).
定義 1 処置を自ら選択することを 自己選択 という.
注釈. 人間が対象だと処置を強制できない.処置の選択に個人差があるなら \operatorname{E}(X|D=1) \ne \operatorname{E}(X|D=0).
1.2 差分の差分(DID)法(p. 214)
(Y_t,X_t) を時点 t=0,1 の確率ベクトルとし,処置群に対して時点 1 に処置を行う.処置群ダミーを D とすると,Y_t の (D,X_t) 上への回帰モデルは \begin{align*} \operatorname{E}(Y_0|D,X_0) & =\alpha+\beta X_0 \\ \operatorname{E}(Y_1|D,X_1) & =\alpha+\mathrm{ATE} \cdot D+\beta X_1 \end{align*} \{X_t\} が欠落すると,繰り返し期待値の法則より \begin{align*} \operatorname{E}(Y_0|D) & =\alpha+\beta\operatorname{E}(X_0|D) \\ \operatorname{E}(Y_1|D) & =\alpha+\mathrm{ATE} \cdot D+\beta\operatorname{E}(X_1|D) \end{align*} \Delta Y:=Y_1-Y_0,\Delta X:=X_1-X_0 とする.
補題 1 (差分) d=0,1 について \operatorname{E}(\Delta Y|D=d)=\mathrm{ATE} \cdot d+\beta\operatorname{E}(\Delta X|D=d)
証明. d=0,1 について \begin{align*} \operatorname{E}(\Delta Y|D=d) & =\operatorname{E}(Y_1-Y_0|D=d) \\ & =\operatorname{E}(Y_1|D=d)-\operatorname{E}(Y_0|D=d) \\ & =\alpha+\mathrm{ATE} \cdot d+\beta\operatorname{E}(X_1|D=d)-(\alpha+\beta\operatorname{E}(X_0|D=d)) \\ & =\mathrm{ATE} \cdot d+\beta\operatorname{E}(\Delta X|D=d) \end{align*}
定理 2 (差分の差分) \operatorname{E}(\Delta Y|D=1)-\operatorname{E}(\Delta Y|D=0)=\mathrm{ATE}+\beta(\operatorname{E}(\Delta X|D=1)-\operatorname{E}(\Delta X|D=0))
証明. 補題より明らか.
系 1 \operatorname{E}(\Delta X|D=1)=\operatorname{E}(\Delta X|D=0) なら \operatorname{E}(\Delta Y|D=1)-\operatorname{E}(\Delta Y|D=0)=\mathrm{ATE}
定義 2 共変量の変化の期待値が処置群と対照群で等しいという仮定を 平行トレンドの仮定 という.
注釈. すなわち \operatorname{E}(\Delta X|D=1)=\operatorname{E}(\Delta X|D=0).t=0,1 について \operatorname{E}(X_t|D=1) \ne \operatorname{E}(X_t|D=0) でも平行トレンドの仮定は成立し得る.
定義 3 処置群と対照群の変化の差でATEを推定する手法を 差分の差分(difference in differences, DID)法 という.
定義 4 DID 法による ATE の推定量を DID推定量 という.
定義 5 偶然に生じた実験環境を 自然実験 という.
例 1 自然災害・制度変更など.
注釈. 自然実験の処置群と対照群において,共変量の 変化 が平均的に等しいと想定できるなら,DID 法で ATE を推定できる(図 1).
1.3 回帰モデル(p. 218)
(Y,D,T) を確率ベクトルとする.ただし T は観測時点(0 か 1)を表す.Y の (D,T,DT) 上への重回帰モデルは \operatorname{E}(Y|D,T,DT)=\alpha+\beta D+\gamma T+\delta DT
定理 3 \operatorname{E}(\Delta Y|D=1)-\operatorname{E}(\Delta Y|D=0)=\delta
証明. d=0,1 について \begin{align*} \operatorname{E}(\Delta Y|D=d) & =\operatorname{E}(Y_1-Y_0|D=d) \\ & =\operatorname{E}(Y_1|D=d)-\operatorname{E}(Y_0|D=d) \\ & =\operatorname{E}(Y|D=d,T=1)-\operatorname{E}(Y|D=d,T=0) \\ & =\alpha+\beta d+\gamma+\delta d-(\alpha+\beta d) \\ & =\gamma+\delta d \end{align*} したがって \begin{align*} \operatorname{E}(\Delta Y|D=1)-\operatorname{E}(\Delta Y|D=0) & =\gamma+\delta-\gamma \\ & =\delta \end{align*}
注釈. 2 時点の繰り返し横断面データを利用して,処置群ダミー・時点ダミーとその交差項で結果を説明する重回帰モデルを推定すれば,交差項の回帰係数の OLS 推定量=DID 推定量となる.
注釈. 観測できる共変量については共変量調整を併せて行う方がよい.
2 パネル・データ
2.1 個別効果(p. 221)
(Y,X,Z) を確率ベクトルする.Y の (X,Z) 上への重回帰モデルは \operatorname{E}(Y|X,Z)=\alpha+\beta X+\gamma Z Z が欠落すると,繰り返し期待値の法則より \operatorname{E}(Y|X)=\alpha+\beta X+\gamma\operatorname{E}(Z|X) したがって \operatorname{cov}(X,Z) \ne 0 なら \beta の OLS 推定量に偏りが生じる(欠落変数バイアス).
定義 6 個体に固有で観測を通じて一定の効果を 個別効果 という.
例 2 能力,性格.
注釈. 観測できない個別効果は欠落変数バイアスをもたらす.
2.2 パネル・データ(p. 221)
(Y_t,X_t,Z) を時点 t=0,1 の確率ベクトルする.ただし Z は個別効果とする.Y_t の (X_t,Z) 上への重回帰モデルは \begin{align*} Y_t & =\alpha+\beta X_t+\gamma Z+U_t \\ \operatorname{E}(U_t|X_t,Z) & =0 \end{align*} \Delta Y:=Y_1-Y_0,\Delta X:=X_1-X_0,\Delta U:=U_1-U_0 とすると \Delta Y=\beta\Delta X+\Delta U すなわちパネル・データなら観測できない個別効果を消すことができる(1 階差分法).
2.3 差分の回帰モデル(p. 223)
\Delta Y の \Delta X 上への回帰モデルを得るには追加的な仮定が必要.
定義 7 t=0,1 について \operatorname{E}(U_t|X_0,X_1)=0 なら \{X_t\} は 強外生 という.
注釈. 繰り返し期待値の法則より \operatorname{E}(U_t|X_0,X_1)=0 \Longrightarrow \operatorname{E}(U_t|X_t)=0.逆は必ずしも成立しない.
定理 4 \{X_t\} が強外生なら \operatorname{E}(\Delta U|\Delta X)=0
証明. 繰り返し期待値の法則より \operatorname{E}(\Delta U|\Delta X)=\operatorname{E}(\operatorname{E}(\Delta U|X_0,X_1)|\Delta X) ここで \begin{align*} \operatorname{E}(\Delta U|X_0,X_1) & =\operatorname{E}(U_1-U_0|X_0,X_1) \\ & =\operatorname{E}(U_1|X_0,X_1)-\operatorname{E}(U_0|X_0,X_1) \end{align*} \{X_t\} は強外生なので 2 項とも 0.
3 固定効果と変量効果
3.1 固定効果モデル(p. 232)
\{(y_{i,1},x_{i,1}),\dots,(y_{i,T},x_{i,T})\} を大きさ n の 2 変量 T 期間パネル・データとする.i=1,\dots,n について \bm x_i:=(x_{i,1},\dots,x_{i,T}) とする.各変量の時間方向の平均は \begin{align*} \bar{y}_i & :=\frac{1}{T}\sum_{t=1}^Ty_{i,t} \\ \bar{x}_i & :=\frac{1}{T}\sum_{t=1}^Tx_{i,t} \end{align*}
定義 8 非確率的な個別効果を 固定効果 という.
定義 9 (y_{i,1},\dots,y_{i,T}) の \bm x_i 上への 固定効果モデル は \begin{align*} \operatorname{E}(y_{i,1}|\bm x_i) & =\alpha_i+\beta x_{i,1} \\ & \vdots \\ \operatorname{E}(y_{i,T}|\bm x_i) & =\alpha_i+\beta x_{i,T} \end{align*} ただし \alpha_i は個体 i の固定効果.
注釈. d_{i,1},\dots,d_{i,n} を個別ダミーとすると,固定効果モデルは y_{i,t} の (d_{i,1},\dots,d_{i,n},\bm x_i) 上への重回帰モデル.
補題 2 i=1,\dots,n について \operatorname{E}(\bar{y}_i|\bm x_i)=\alpha_i+\beta\bar{x}_i
証明. i=1,\dots,n について \begin{align*} \operatorname{E}(\bar{y}_i|\bm x_i) & =\operatorname{E}\left(\frac{1}{T}\sum_{t=1}^Ty_{i,t}|\bm x_i\right) \\ & =\frac{1}{T}\sum_{t=1}^T\operatorname{E}(y_{i,t}|\bm x_i) \\ & =\frac{1}{T}\sum_{t=1}^T(\alpha_i+\beta x_{i,t}) \\ & =\alpha_i+\beta\cdot\frac{1}{T}\sum_{t=1}^Tx_{i,t} \\ & =\alpha_i+\beta\bar{x}_i \end{align*}
定理 5 i=1,\dots,n について \begin{align*} \operatorname{E}(y_{i,1}-\bar{y}_i|\bm x_i) & =\beta(x_{i,1}-\bar{x}_i) \\ & \vdots \\ \operatorname{E}(y_{i,T}-\bar{y}_i|\bm x_i) & =\beta(x_{i,T}-\bar{x}_i) \end{align*}
証明. 補題より明らか.
3.2 変量効果モデル(p. 232)
無作為抽出なら個別効果は確率変数.
定義 10 確率的な個別効果を 変量効果 という.
定義 11 (y_{i,1},\dots,y_{i,T}) の \bm x_i 上への 変量効果モデル は \begin{align*} y_{i,1} & =\alpha+\beta x_{i,1}+c_i+w_{i,1} \\ & \vdots \\ y_{i,T} & =\alpha+\beta x_{i,T}+c_i+w_{i,T} \end{align*} ただし c_i は個体 i の変量効果で \begin{align*} \operatorname{E}(c_i|\bm x_i) & =0 \\ \operatorname{var}(c_i|\bm x_i) & =\sigma_c^2 \\ \operatorname{E}(w_{i,t}|\bm x_i) & =0, \quad t=1,\dots,T \\ \operatorname{var}(w_{i,t}|\bm x_i) & =\sigma_w^2, \quad t=1,\dots,T \\ \operatorname{cov}(c_i,w_{i,t}|\bm x_i) & =0, \quad t=1,\dots,T \end{align*}
注釈. \operatorname{E}(c_i|\bm x_i)=0 より欠落変数バイアスは生じない.したがって変量効果モデルは OLS でも推定できる(ただし BLUE ではない).
注釈. \operatorname{E}(c_i|\bm x_i) \ne 0 なら固定効果モデルを用いる.
3.3 Hausman 検定(p. 234)
\hat{\theta}_n,\tilde{\theta}_n を \theta の推定量とする.ただし
- \hat{\theta}_n は H_0 の下で漸近有効,H_1 の下で一致性なし
- \tilde{\theta}_n は H_0,H_1 の下で一致性あり
このとき \hat{\theta}_n-\tilde{\theta}_n は H_0 の下でのみ 0 に確率収束.
定義 12 (Durbin–Wu–)Hausman 検定統計量 は D_n:=\frac{\left(\tilde{\theta}_n-\hat{\theta}_n\right)^2}{ \hat{\operatorname{var}}\left(\tilde{\theta}_n\right)-\hat{\operatorname{var}}\left(\hat{\theta}_n\right) }
注釈. \bm \theta がベクトルなら D_n :=\left(\tilde{\bm \theta}_n-\hat{\bm \theta}_n\right)'\left( \hat{\operatorname{var}}\left(\tilde{\bm \theta}_n\right)-\hat{\operatorname{var}}\left(\hat{\bm \theta}_n\right) \right)^{-1}\left(\tilde{\bm \theta}_n-\hat{\bm \theta}_n\right)
定理 6 H_0 の下で D_n \stackrel{d}{\longrightarrow}\chi^2(k) ただし k は \bm \theta の次元.
証明. 省略(大学院レベル).
注釈. Hausman 検定は様々な状況に応用できる.
例 3 (固定効果と変量効果) パネル・データの個別効果について次の検定問題を考える. H_0:\text{変量効果} \quad \text{vs} \quad H_1:\text{固定効果} 正規分布を仮定すると
- 変量効果モデルの回帰係数の一般化最小 2 乗(GLS)推定量は H_0 の下で漸近有効,H_1 の下で一致性なし
- 固定効果モデルの回帰係数の OLS 推定量は H_0,H_1 の下で一致性あり
例 4 (説明変数と誤差項の相関) 線形モデルの説明変数と誤差項の相関について次の検定問題を考える. H_0:\text{相関なし} \quad \text{vs} \quad H_1:\text{相関あり} 正規分布を仮定すると
- 係数の OLS 推定量は H_0 の下で漸近有効,H_1 の下で一致性なし
- 係数の IV 推定量は H_0,H_1 の下で一致性あり
まとめ
自己選択, 平行トレンドの仮定, 差分の差分(DID)法, DID推定量, 自然実験, 個別効果, 強外生, 固定効果, 固定効果モデル, 変量効果, 変量効果モデル, Hausman検定統計量