差分の差と3変数間の関連

太郎丸 博

2025-06-25

自然実験と差分の差 difference in differences デザイン

John Snow のコレラの感染源研究 1

John Snow のコレラの感染源研究 2

1849年 1854年
A社 85 19
B社 135 147

差分の差の計算

A社利用世帯のコレラ患者数の変化量(差分)は、 \[ 19-85= -66 \] B社の変化量は \[ 147-135 = 12 \] A社の変化量から B社の変化量をひくと \[ -66-12 = -78 \] A社だけで 1849-1854の間に起きた何かが 78人患者を減らした

なぜ処置後のクロスセクショナルな比較だけでは不十分?

なぜ 処置群(A社)の時系列的な比較だけでは不十分?

差分の差の前提条件:並行性の仮定

並行性の仮定に説得力を持たせる方法:トレンドのチェック

並行性の仮定に説得力がない例二つ

図 処置の前後でトレンドが平行でない架空例

図 処置の前後でトレンドが平行でない架空例

差分の差まとめ

問題:3変数の関係

3変数分析が必要な場合1: 交絡の統制 control

3変数分析が必要な場合2: 交互作用効果の推定

3変数分析が必要な場合3: 媒介関係 mediation

・直接効果・間接効果・総効果

概念の整理:独立変数と従属変数

独立変数の分類

交互作用効果の図示

視点による呼び名の相対性

実際の研究で必要なこと: 第三変数による統制/層化

  1. 交絡要因を統制して、処置の因果的な効果がどれぐらいか推定
  2. 媒介変数を統制して、処置の直接効果がどれぐらいか推定
  3. 調整変数の値によって、処置の効果がどれぐらい変わるか推定

交絡要因、媒介変数、調整変数を第三変数と呼ぶならば、いずれも第三変数の統制 control が必要になる、ということ。

交絡要因の統制の架空例: 統制なし

交絡要因の統制の架空例: 統制あり

交絡要因の統制 架空例まとめ

交絡要因の統制/層化まとめ

交絡要因の統制:補足

間接/直接効果分割の架空例: 総効果

間接/直接効果分割の架空例: 直接効果

間接効果の計算

第三変数の統制/層化の限界

マッチング

マッチングの架空例

id 処置 性別 年齢 年収 幸福感
1 処置群 18 0 4
2 処置群 42 300 3
3 処置群 37 200 3
4 処置群 55 700 5
5 統制群 18 0 3
6 統制群 42 300 4
7 統制群 37 200 3
8 統制群 55 700 2

ATT の計算

平均処置効果 \((1 - 1 + 0 + 3)\div 4 = 0.75\)

マッチングの実際

交互作用効果

パネルデータ panel data による交絡要因の統制

パネルデータの架空例

id 性格 親切1週目 親切2週目 親切3週目 幸福感1週目 幸福感2週目 幸福感3週目
1 A 1 0 1 9 5 10
2 A 0 1 0 5 10 5
3 A 1 1 1 8 9 9
4 A 1 0 1 10 4 10
5 B 0 1 0 5 8 3
6 B 0 0 0 5 0 3
7 B 0 0 1 1 1 9
8 B 1 0 0 9 1 2

ロングフォーマットへの変換

id 性格 親切 幸福感
1.1 1 A 1 1 9
1.2 1 A 2 0 5
1.3 1 A 3 1 10
2.1 2 A 1 0 5
2.2 2 A 2 1 10
2.3 2 A 3 0 5
3.1 3 A 1 1 8
3.2 3 A 2 1 9
3.3 3 A 3 1 9
4.1 4 A 1 1 10
4.2 4 A 2 0 4
4.3 4 A 3 1 10
5.1 5 B 1 0 5
5.2 5 B 2 1 8
5.3 5 B 3 0 3
6.1 6 B 1 0 5
6.2 6 B 2 0 0
6.3 6 B 3 0 3
7.1 7 B 1 0 1
7.2 7 B 2 0 1
7.3 7 B 3 1 9
8.1 8 B 1 1 9
8.2 8 B 2 0 1
8.3 8 B 3 0 2

個人id による層化

親切にした時 しなかったとき 平均処置効果
1 9.5 5.0 4.5
2 10.0 5.0 5.0
3 8.7 NA NA
4 10.0 4.0 6.0
5 8.0 4.0 4.0
6 NA 2.7 NA
7 9.0 1.0 8.0
8 9.0 1.5 7.5

全体の平均処置効果とパネルデータ分析の限界

理論的知識の活用

理論的知識の活用の例 (Rosenbaum 2017 の例をアレンジ)

参考: 3変数の関連のパターン

文献

Cunningham, Scott. 2021. Causal Inference: The Mixtape. Yale University Press (加藤真大他訳, 2023, 『因果推論入門 ミックステープ:基礎から現代的アプローチまで』技術評論社).
Lave, Charles A., and James G. March. 1975. An Introduction to Models in the Social Sciences. New York: Harper & Row (佐藤嘉倫・大澤定順・都築一治訳, 1992, 『社会科学のためのモデル入門』ハーベスト社).
Rosenbaum, Paul. 2017. Observation and Experiment: An Introduction to Causal Inference. Harvard University Press(阿部貴行・岩崎学訳, 2021, 『ローゼンバウム統計的因果推論入門: 観察研究とランダム化実験』共立出版).
Wickens, Thomas D. 1989. Multiway Contingency Tables Analysis for the Social Sciences. Mahwah: Lawrence Erlbaum Associations.
今井耕介. 2018. 社会科学のためのデータ分析入門 (上) (下). 岩波書店.
太郎丸博. 2005. 人文・社会科学のためのカテゴリカル・データ解析入門. ナカニシヤ出版.
小杉孝司, and 清水裕士, eds. 2014. M-plusとRによる構造方程式モデリング入門. 北大路書房.
豊田秀樹, ed. 2014. 共分散構造分析 : 構造方程式モデリング R編. 東京: 東京図書.
高橋将宜. 2022. 統計的因果推論の理論と実装: 潜在的結果変数と欠測データ. 共立出版.