『社会科学のリサーチ・デザイン』

書籍情報

King, G., R. O. Keohane and S. Verba, 1994, Designing Social Inquiry: Scientific Inference in Qualitative Research, Princeton, NJ: Princeton University Press.(=2004，真渕勝監訳『社会科学のリサーチ・デザイン定性的研究における科学的推論』勁草書房.)

このレジュメはオンライン上でもみられます(https://rpubs.com/keisato/kkv)

1. 社会科学の「科学性」

1-1. はじめに

本書における科学的研究の定義
- 目的は推論である
  - 直接的なデータを超えて直接には観察されないより広範囲の何かを推論しようとすること
  - 観察を用いて他の観察されていない事実を学ぶ記述的推論
  - 観察されたデータから因果関係を学ぶ因果的推論
- 手続きが公開されている
- 結論は不確実である
- 研究方法を遵守している
科学は社会的な営為となっているとき最も理想的である
- 間違いを指摘される可能性が常にある，など

1-2. 研究設計の主要な構成要素

本書では，研究設計を以下の四要素に分ける．この順番で研究が進められるわけではないが
- 研究の問い
- 理論
- データ
- データの使用

1-2-1. 研究の問いの改善

そもそもどのようにして研究者が対象を選ぶべきかという決まったルールはない．個人的な動機がきっかけであることもある
ただし，学界に対して価値を持ちうる研究であるためには，以下の二つの基準を満たすべき
- 現実の世界において重要な問いを立てること
  - もし現実の世界における重要な問題への関心から研究を進めるならば，研究しようとしているテーマが妥当な記述的推論もしくは因果的推論を生み出すようなプロジェクトに洗練されそうにない場合，そうなるように研究テーマを修正もしくは放棄するべきである
- 現実の世界の一側面を実証的・科学的に説明する学界全体の能力を高めることによって，特定の学問研究の発展に具体的な貢献をすること
  - どのように研究を設計したら学界に貢献＝第二の基準を満たすことができるのだろうか？
    - 先行研究で取り上げられている理論の妥当性を検証する
    - 先行研究における論争を解決したり，一方の立場が正しいことを示したり，そもそも論争自体が無意味であることを示す
    - 先行研究で不問になっていた仮定を解明する
    - 先行研究で重要なテーマが見過ごされていたことを指摘し，それに関する体系的な研究をする
    - ある分野で設計された理論や証拠を他の分野の問題を解くのに使う

1-2-2. 理論の改善

理論を研究する際に重要と思われるアプローチは以下のようなもの
- 間違う可能性のある理論を選択する
- できるだけ多くの観察可能な含意(observable implications)をつくれるような理論を選択する
  - より多様なデータを用いて検証することが可能になるように
- 理論を作る場合には，できるだけ具体的なものにする
データを観察したあとで理論を修正する場合の基本的なルールとして，理論の対象範囲を拡張するように修正してもよいが，新しいデータを集めることなしに，理論を限定的に修正してはならない

1-2-3. データの質の改善

データの質の改善のための指針は以下のようなもの

データを作り出す過程を記録し，報告すること
- 推論にバイアスがかかっていないか判断できるように
理論をしっかりと検証するためにできるだけ多くの観察可能な含意に関係するデータを集めること
測定の妥当性を最大化すること
信頼できる方法でデータを収集すること
できるだけ追試可能な方法でデータ分析を行うこと

1-2-4. 既存データの利用の改善

（略）

1-3. 本書のテーマ

理論とデータをつなぐ観察可能な含意を用いること
- いかなる理論に対しても，その観察可能な含意は何かを問わなければならない．また，いかなる経験的研究に対しても，観察された事実は理論がもつ含意と関連しているのかを問わなければならず，もし関連しているのであれば，その観察された事実によって，理論の正しさについて何を推論することができるのかを問わなければならない
てこ比(leverage)を最大化すること
- できるだけ少ないことがらでできるだけ多くのことを説明できるのが優れた社会科学の研究
- てこ比を高める基本的な方法は，仮説がもつ観察可能な含意の数を増やして，それを確かめようとすること．具体的には，
  - 理論を改善して，理論がより多くの観察可能な含意をもつようにする
  - データを改善して，より多くの観察可能な含意を実際に観察し，理論を検証するために用いる
  - データの使用方法を改善して，より多くの観察可能な含意を既存データから引き出せるようにする
- てこ比を高めるため，自分の立てた仮説に関して，自分のデータや他人のデータを用いて検証できるかもしれない観察可能な含意を，考えられる限りリストアップするよう常日頃から心がけておくことが大事
不確実性を報告すること
- 推論の不確実性について判断し記述すること
社会科学者のように考えること：懐疑主義と対抗仮説
- つねに違う理論が正しい可能性を考える

2. 記述的推論

記述は説明と並び社会科学の目的の一つである
科学的記述の特徴は以下のようなもの
- 推論を含むこと．観察された事実から観察されない事実に関する情報を推論すること
- 観察された事実の中で体系的部分をそうでない非体系的な部分から区別すること

2-1. 一般的知識と個別的事実

社会科学者が研究対象とする世界は個別の事象によって成り立っている
社会科学研究の中には，個々の出来事や観察単位については特に触れることなく，ある種類の出来事や観察単位をひとまとまりとして扱うものもあれば，ある具体的な事例に関して何らかの知見を得ようとする研究もある

2-1-1. 「解釈」と推論

人文科学者には「解釈」によって特定の知識を得たり歴史を正確に要約することを目標とする立場がある．解釈を重視する研究者は，人間の行動の意図的側面を「了解」(Verstehen)によって明らかにしようとする
解釈は，本書で定義するような意味での社会科学とかけ離れた行為ではない
- 了解によって解釈を行うためには研究対象について根掘り葉掘り調べることが必要で，その過程で優れた因果的仮説が生み出されることもある
- ただし，その仮説の正しさを検討するためには，本書で述べるような科学的推論の手順が必要

2-1-2. 「固有性，複雑性，そして単純化」

研究者のなかには，できごとの固有性(uniqueness)を重視し，「一般的なことを取り扱おうとすれば，個々の事例への説明力を失うと考えている」人もいる．しかし，固有性を強調すれば，科学的な一般化になじむ状況と，なじまない状況とを区別する意味はなくなってしまう
固有性の議論が生み出す本当の疑問は複雑性(complexity)の問題である．事例が本質的に固有であるかどうかが問題なのではなく，理解しようとする社会的現実の鍵となる特徴を，数多くの事実の中から取り出すこと(＝単純化)ができるのかが問題である
単純化はすべての研究にとって避けては通れない．「現実の世界の複雑さと分厚い記述の複雑さとの間の相違は，分厚い記述の複雑さと抽象的な計量・数理研究の持つ複雑さとの間の相違よりも，はるかに大きい」
- ただ，単純化はできるだけ研究対象の歴史と文化について学んでから行うべき
特定の出来事を理解する最善の方法は，科学的な推論の方法を用いることによって，類似した出来事のなかにある体系的なパターンを研究すること

2-1-3. 比較事例研究

最終的な目的が説明でなく記述にある研究もある．その際，因果関係に関する仮説を発展させること(「なぜ」という疑問に答えること)を意識しながら研究すれば，最終的に説明が不可能だとしても焦点の定まった意味のある記述ができる
Alexander Georgeの「構造的な，焦点を絞った比較」の方法論では，複数の観察単位から同一の変数を体系的に収集すること，最終的に推論が可能なときにおいては十分に考え抜いた上で「なぜ」という疑問を持つことの重要性が強調されている

2-2. 推論：データ収集の科学的目的

推論とは，既知の事実を用いて未知の事実を推測する過程
- 研究の問い，理論，仮説の主題が，推測されるべき未知の事実
一般的な知識を獲得するために事実を整理する方法として有用なのは，事実を理論や仮説の持つ観察可能な含意として整理すること．検証に値する理論があれば，それ自体が事実の中から理論の観察可能な含意となっているものを選び出す指針となる
この方法には以下のような有益な効果がある
- 理論の持つ観察可能な含意の数を増やせば増やすほど，仮説検証がしやすくなること
- 理論そのものを見直すことができる．すなわち，データを新しい理論の観察可能な含意として整理しなおすことができる．
- 定量的研究と定性的研究の，理論を検証するためにその観察可能な含意を収集するという共通点がわかる

2-3. 定性的研究の数式モデル

次節の導入的な節
モデルとは世界のある側面を単純化あるいは近似したもの
2-3と2-4ではデータ収集とデータ要約のためのモデルを数式を使って説明する

2-4. データ収集の数式モデル

あらゆるデータ収集において最も重要なルールは，そのデータが作成された方法と，そのデータを入手した方法を明示すること
データ収集のモデルは，変数(variable)，観察単位(units)，それぞれの観察(observation, 本書では変数の実現値)からなる
- 複数の人物に収入を尋ねた場合，変数は収入，観察単位は個々の人物，観察は個々の収入となる
- 事例と観察の混同に注意．事例はひとつでもたくさんの観察が含まれていることもある

2-5. 細かな歴史的事実の要約

収集したデータ(ここでいう，細かな歴史的事実)の要約は研究の出発点
この節では，要約統計量(標本平均，最大値)をその数式モデルとして示す
データの要約に関するルール
- 要約は記述し説明しようとする現象に焦点を当てたものでなければならない(例：代表的な事例(平均)を知りたいのか，ばらつき(分散)を知りたいのか)
- 要約は利用しやすいように情報を単純化したものでなければならない

2-6. 記述的推論

記述的推論は，観察したものから観察されない現象を理解する過程である
推論の根本的な目標の一つは，研究対象となった現象に含まれる体系的な要素を非体系的な要素から区別することにある
例(少し翻案)
- 「収入が生活満足度に影響を与える」という仮説を検証したいので全国から1000人を無作為抽出して調査した．この場合，注目する変数は，生活満足度(5件法)
- \(i\)番目の人の生活満足度を\(y_i(y_i=1, 2, 3, 4, 5)\)とする
- 12番目の人に着目する．\(y_{12} = 4\)であった
- これは本当に収入その他の，調査に含められた変数の効果(体系的な要素)かどうか．たまたま前日に嫌いな同僚が辞職した(非体系的な要素)からかもしれない
- 生活満足度に影響を与える非体系的な要素はほかにも色々あるだろう．そのなかの一部は正の効果を，他のものは負の効果をもたらすだろう．そう考えると，反実仮想的に12番目の人に繰り返し何回も調査して平均をとったら非体系的要素が相殺されて12番目の人の真の生活満足度がわかるかもしれない
このような発想に基づき，実現変数と確率変数を区別する
- 実現変数とは観察された値のこと(たとえば，\(y_{12} = 4\))
- 上述のように同じ調査を繰り返せば，生活満足度は非体系的要素によってランダムに値が変化すると予想される．12番目の人の確率変数は\(Y_{12}\)と表せる
- 確率変数の平均値\(E(Y_{12})\)は体系的要素のみによるものと考えられる．社会構造に関心のある研究者は実現変数\(y_{12}\)よりも\(E(Y_{12})\)を重視するだろう
- もっといえば，\(E(Y_{12})\)は一人の観察にすぎない．日本全体の社会構造に関心があるなら，すべての被調査者の確率変数としての生活満足度の平均値\(\mu\)を知りたいだろう．すなわち \[ \frac{1}{1000}\sum_{i = 1}^{1000}E(Y_i) = \mu \]
- また，分散\(\sigma^2\)も同様に関心の対象となることがあるだろう．すなわち \[ \frac{1}{1000}\sum_{i = 1}^{1000}(Y_i - \mu)^2 = \sigma^2 \]
体系的な要素と非体系的な要素の区別に関して，「すべての事象からランダムな変化は排除できない」という立場と「ランダムな変化は説明変数の設定次第で予測可能なものになる」という立場の二つがあるが，どちらの立場をとるにせよある社会現象がどちらの影響で生じたのかを決めるのは研究者次第
「研究対象の体系的特徴を取り出す努力を怠るならば，歴史の教訓は失われ，そして将来の出来事や研究にとって，研究対象のどの側面が持続的でかつ重要なのかについて，何も学ぶことはできないだろう」

2-7. 記述的推論の判定基準

推測統計学で推論の方法を判定する際に用いられる三つの基準を記述的推論の例に即して説明する
- 不偏性(unbiasness)
- 有効性(efficiency)

2-7-1. バイアスのない推論

ある推論の方法を繰り返し適用した場合，推定値が平均的に正しい場合，この方法あるいは推定値にはバイアスがない(不偏性がある)といえる
より具体的にいえば，測定を繰り返したときに推定値が一定方向に偏るような体系的な誤差が存在するときにバイスがあるという
- 例：日曜日に選挙を行った場合，労働者が支持する政党の得票が低くなる
何がバイアスとなるかは検証しようとする理論によって変化する．この点を理解するために「実質的バイアス」と「統計的バイアス」を区別する必要がある
- 例：必ず日曜日に選挙が行われていて労働党の得票率が下がるとしたら実質的バイアスだが，選挙のある回にたまたま雨が降って政治に関心のない層が投票に行かなくなったとしたら統計的バイアス？

2-7-2. 有効性

有効性は，仮想的な反復実験において得られた推定量の分散から測定でき，分散の小さいものほど有効性の高い推定量であるといえる
すべての条件が同一の場合，観察が多いほど分散が低下し，有効性が上昇するので，観察は多い方がよい
ただし，観察は多いがバイアスのあるデータも存在する．そのようなデータと，単一の事例を扱っているが情報が豊富なデータとの間のどちらが適切か(不偏性と有効性のトレードオフ)という問題が生じることもある

3. 因果関係と因果的推論

現在の社会科学研究では，最終的な目的が記述にあるのか因果推論にあるのか混同していることが多い．そこで本書は第4章以降で，以下の二つのことを明らかにする
- 因果的推論を行うのが適切な状況
- どうすれば定性的研究が因果的仮説について信頼するに足る証拠を与えることができるか
本章はそのための準備の章

3-1. 因果関係の定義

この節では，因果関係を因果関係を知るために用いられるデータとは独立した理論的概念として定義する

3-1-1. 因果関係の定義と定量的研究の例

因果的効果とはなにか
- 例：アメリカの議員選挙の民主党の候補者において現職であることは得票数を高めるのか
  - 従属変数：得票数
  - 独立変数：現職かどうか(二値変数)
- ニューヨーク州第4選挙区で民主党の現職が実際に得た得票数を\(y_4^I\)とする
- ここから因果的効果を測定するためには，反実仮想的に，もしも現職でない候補が出ていたらどれほどの票を獲得できたかと考える．反実仮想においてニューヨーク州第4選挙区で民主党の新人が得た得票数を\(y_4^N\)とする．\(y_4^I - y_4^N\)が現職であることの因果的効果(実現因果的効果)
- もちろん，他の条件(その地域における民主党の強さなど)はすべて同じである必要がある
上からわかるように，因果的効果は実際には測定できず，理論的にしか導かれない(Hollandの因果的推論の根本的問題)
2-6と同様，確率変数\(Y_4^I\), \(Y_4^N\)も想定できる．\(Y_4^I - Y_4^N\)を，ニューヨーク州第4選挙区において民主党候補が現職であることの確率因果的効果という
また，\(E(Y_i^I) - E(Y_i^N)\)を全選挙区において民主党候補が現職であることの平均因果的効果という
同様に平均因果的効果の分散も\(V(Y_i^I) - V(Y_i^N)\)と計算できる
まとめると，「因果的効果とは，説明変数がある値を取るときに得られる観察の体系的な要素と説明変数が別の値を取るときに得られる観察の体系的な要素との差」

3-1-2. 定性的研究の例

(略)

3-2. 因果関係のその他の定義

これまで因果関係の他の表現が提唱されてきたが，どれも実際の研究で用いるには不十分な定義しかなされていない

3-3. 因果的効果を推定するために必要な仮定

因果推論の根本問題を回避し因果的効果を推定するために必要な仮定を二つ述べる

3-3-1. 単位同質性の仮定

観察単位に関する仮定
説明変数がある値をとった際，二つの観察単位における従属変数の期待値(実現値ではない)が同じであるならば，この二つの観察単位は同質的であると考えられる

3-3-2. 条件付独立の仮定

説明変数の値が従属変数がとる値とは独立に割り当てられるという仮定
以下の三点の問題を回避するための仮定
- 従属変数が独立変数に影響を及ぼしているために因果的効果の推定が困難になるという内生性(endogeneity)問題
- セレクション・バイアス
- 変数無視(omitted variable)のバイアス

3-4. 因果的推論の判定基準

記述的推論の可否を判断するときに用いる基準(2-7)を因果的推論にも使う方法を数式を用いて考察
- 不偏性：確率因果的効果の推定値の期待値が確率因果的効果の期待値と一致する
- 有効性：確率因果的効果の分散は独立変数の分散が大きいほど小さくなる

3-5. 因果的理論を構築するためのルール

3-5-1. ルール1：反証可能な理論をつくること

Popperの反証可能性の議論(科学においては立証よりも反証が重要)は理論をつくる際には重要
しかし，既存の理論を検証する際は，反証可能性は重要ではない．どの理論にも反証は一つや二つはあるので，Popper流にいえば「反証があるからすべての理論は間違い」ということになってしまう
むしろ，その理論が世界のどの程度の範囲を説明できるのかということが重要
反証可能性がなくなるまで理論を修正し続けたり，例外を多く設定しすぎるのはよくない
一方で，部品の少ない理論で世界を説明するのが望ましいとする規範的な考え方も一般的に適用できない
大事なのはてこ比を高めることを意識すること(その理論でより多くの観察可能な含意が得られるように努めること)

3-5-2. ルール2：内的に一貫した理論を立てること

内的に一貫していない理論とは，その理論から複数の仮説が導かれ，それらが互いに矛盾している理論のこと
この目的を果たす上で数理的なフォーマル・モデルは有用だが，非現実的な仮定のもとに成り立つ抽象化されたものなので，経験的な検証を行うにふさわしいモデルを与えてくれるわけではないことに注意

3-5-3. ルール3：従属変数を注意深く選ぶこと

従属変数は独立変数に影響を与えるものであってはならない
従属変数の値が一定になるような観察を選んではならない
説明しようとする変動を代表するような従属変数を選ぶべきである(ある程度のばらつきが必要)

3-5-4. ルール4：具体性を最大化させること

経験的な実証あるいは反証の対象となるよう，観察可能な結果を伴うアイデアを選択すべき

3-5-5. ルール5：可能なかぎり包括的に理論を述べること

ルール4と緊張関係にあるが，その理論が反証可能でありまた具体的であるかぎり，なるべく広い範囲に適用できる理論を記述すべき
どんな具体的な理論や観察とも両立してしまうような(Parsons的な)理論はよくない

本書は理論に基づいた(あるいは理論との対話に基づいた)実証研究を推奨しているわけだが，そもそも理論とは何を指しているのか，どういうものを理論と呼ぶべきなのか
- Abend, G. (2008). The Meaning of ‘Theory.’ Sociological Theory, 26(2), 173–199. https://doi.org/10.1111/j.1467-9558.2008.00324.x　によれば社会学の文献で「理論」(theory, theorize)という言葉の使われ方には7つあるらしい
  - 変数間の普遍的関係を明らかにすること(本書の用法)
  - 特定の社会事象の起きた要因や条件を明らかにすること(本書の用法)
  - 特定の社会事象の意味を解釈すること
  - いわゆる理論研究というときの理論
    - 社会学者の記述を精読したり再構成したりする
  - 社会で生きる人々の世界観や認識枠組そのもの(エスノメソドロジー的な意味？)
  - フェミニズム理論や批判理論，社会理論といったときの，規範的，政治的な主張
  - ミクロマクロリンク，ストラクチャー／エージェンシー問題(などの認識論的問題？)や，価値自由など社会科学方法論のこと