本章将重点探讨因果图示法——这是一种通过图形化方式呈现数据生成过程的建模方法。因果图示将成为后续章节的核心分析工具,我们将借助这些图示完成以下工作:规划研究设计、确定数据处理方法,以及识别研究问题的因果答案。
在深入探讨因果图示的”图示”部分之前,我们有必要先厘清”因果”的本质。之所以采用因果图示进行研究设计,正是因为这种方法能帮助我们处理因果关系这一核心问题。究竟何为”因果”?因果关系的本质是什么?当我们说”\(X\)导致\(Y\)“时,这个论断背后具体指向什么?
那么,为何要如此执着于因果关系?因为我们关注的绝大多数研究问题本质上都是因果性问题。我们不仅想知道最低工资更高的国家是否贫困率更低,更想知道提高最低工资能否减少贫困;不仅想知道服用感冒特效药的患者是否康复更快,更想知道药物是否加速了康复进程;不仅想知道央行降息后是否出现经济衰退,更想知道降息是否直接导致了衰退。
当然,我们可能确实也想了解那些非因果性的关联1。但多数时候,即便表面是非因果的分析和研究问题,其背后往往潜藏着因果追问。试问有多少次你看到这样的标题:“每晚睡眠不足八小时与早逝相关!”而实际研究本身可能根本没有做出因果断言——“相关”这个表述在技术上也不涉及因果推断。但正因为”睡眠不足会导致死亡吗?“(因果性问题)远比”早逝人群是否恰好睡眠较少?“(非因果性问题)更具吸引力,我们读者往往会一厢情愿地将相关性结果误读为因果结论2。
在学术表述中,存在大量暗示因果关系的术语,也存在仅描述关联性的中性词汇,更有一些”滑头用语”——这些表述虽在技术上规避了因果断言,却明显试图诱导读者产生因果联想。
以下是一些表达方式:
我们可以通过以下方式表达\(X\)导致\(Y\):\(X\)导致\(Y\),\(X\)影响\(Y\),\(X\)对\(Y\)的影响,\(X\)增加/减少\(Y\),\(X\)改变\(Y\),\(X\)引起\(Y\),\(X\)决定\(Y\),\(X\)触发\(Y\),\(X\)改善\(Y\),\(X\)对\(Y\)负有责任,等等……
我们可以通过以下方式表达\(X\)和\(Y\)相关但不暗示因果关系:\(X\)和\(Y\):相关联,相关,有关系,往往同时发生,往往不同时发生,相伴出现,等等……
如果一个滑头的作者(当然不是我们)不想明说因果关系,却想让读者往那方面联想,他们可能会这样说:\(X\)与\(Y\)有关联,\(X\)之后会发生\(Y\),\(X\)对\(Y\)有影响,\(X\)能预测\(Y\),做\(X\)的人更可能\(Y\),\(Y\)随着\(X\)的发生而发生,以及许多类似的表达。
了解这些术语可以帮助你理解科学研究真正想表达的意思,也能让你识破某些人试图误导你的把戏。
此外,观察这些用词或许能帮助我们更准确地理解因果关系的本质。看看那些表示因果的短语——它们都带有方向性,明确告诉我们 \(X\) 对 \(Y\) 产生了某种作用。相比之下,那些明确表示非因果的术语甚至无需指明 \(X\) 和 \(Y\) 孰先孰后,只是描述这两个变量如何共同变化。而“滑头用词”之所以狡猾,正是因为它们的表述方式隐含着从 \(X\) 到 \(Y\) 的方向性,即便字面上并未直接宣称因果关系3。
这个核心概念——“\(X\)对\(Y\)施加了某种影响”——将帮助我们理解因果关系的本质。
关于因果关系,其实并不存在唯一的定义。但至少就本书的讨论而言,一个有效的思考框架是:若我们通过干预改变\(X\)的取值,而\(Y\)的分布也随之发生变化,那么就可以认为\(X\)导致了\(Y\)。
让我们用这个定义来做个实验。
假设「青霉素会导致细菌死亡」。现在想象一个培养皿里有一群细菌,目前没有青霉素(\(X\) = “细菌是否接触青霉素” 取值为「否」),此时细菌存活(\(Y\) = “细菌是否存活” 取值为「是」)。
当我们进行干预——向培养皿加入青霉素(将\(X\)的值改为「是」),结果细菌死亡(\(Y\)的值相应变为「否」)。
完美验证。
这个定义让我们能明确区分相关关系与因果关系。
例如,我们可以观察到:人们吃冰淇淋的日子,穿短裤的人数往往更多。但如果我们进行干预——强行把某人的长裤换成短裤,会让他们更可能吃冰淇淋吗?显然不会!因此,这只是一个非因果的关联。
我们甚至可以用这个定义来关联看似遥远的变量。
例如,单看香烟价格本身,它显然不会直接影响你的健康。但如果我们进行干预——提高香烟价格,很可能会减少吸烟量。因此,香烟价格(通过干预)导致了吸烟量的(下降)。进一步,如果我们干预降低吸烟量,就会(通过干预)改善健康状况。于是形成因果链:香烟价格 → 吸烟量 → 健康水平。
结论:香烟价格(通过上述机制)影响了健康水平。
需要特别注意的是,单纯声明”\(X\)导致\(Y\)“并不自动包含方向性。比如光说”香烟影响健康”,既可以理解为”香烟改善健康”,也可能指”香烟危害健康”。若想明确具体影响方向,就必须额外说明!这里需要补充说明的是:即使改变\(X\)不总是改变\(Y\),而只是改变\(Y\)发生的概率,我们依然可以说\(X\)导致\(Y\)。正如前文所述,关键在于\(X\)改变了\(Y\)的分布(详见第3章)4。
以开灯为例:通常按下开关(改变\(X\)),电灯就会亮起(\(Y\)随之改变)——这看似明显的因果关系。但若灯泡烧毁时,同样的操作就不会产生效果。尽管如此,我们仍然认定「按下开关」导致了「电灯亮起」5。
这一点在社会科学中尤为重要——毕竟社会现象极少存在绝对确定性。比如:给孩子买《爱丽丝梦游仙境》就一定会促使他阅读吗? 显然未必!有些孩子无论如何都不愿读,有些则无需你买书自会找来读。但总体而言,购买此书的行为确实提高了孩子阅读该书的概率——因此我们仍可认定”买书”导致了”阅读行为”6。
既然已经理解因果关系的基本概念,现在让我们看看如何运用它——如何通过变量间的因果联系来解答研究问题?
截至目前,我们掌握了哪些关键点?
•
要解答多数研究问题,必须理解背后的数据生成过程(详见第5章)
•
若某些变量能引发其他变量的变化,那么这些因果关系本身就是数据生成过程的核心组成部分。若X导致Y,则X必然参与塑造了我们观测到的Y
那么关键问题来了:如何有效表征数据生成过程及其内部的因果关系,从而找到解答研究问题的路径?
因果图(Causal Diagram) 是数据生成过程\(DGP\)的图形化表征。这一开创性工具由计算机科学家朱迪亚·珀尔(Judea Pearl)在90年代中期提出7——他试图为人工智能系统开发因果推理能力8。
珀尔的革命性洞见在于:要让计算机也能轻松理解数据生成过程与因果关系。而他确实做到了!这种全新的因果思维范式,比传统方法直观得多。
因果图仅包含两个要素:
数据生成过程\(DGP\)中的变量:以节点\(node\)表示
变量间的因果关系:用箭头\(arrow\)表示,方向从因变量指向果变量
让我们从一个基础案例开始:假设布拉德拿走了最后一块蛋糕9。此时你也想要这块蛋糕,于是提议用抛硬币决定归属——若硬币正面朝上,蛋糕就归你。布拉德接受了这个方案。
这个例子中存在两个可观测变量:
抛硬币结果(二分变量:正面/反面)
蛋糕归属状态(二分变量:获得/未获得)
该案例中存在一个明确的因果关系:抛硬币结果决定蛋糕归属。我们可以用箭头将其表示为:硬币 → 蛋糕
Figure 6.1: The Effect of a Coinflip on Cake
至此,我们已完整构建了这个因果图!该模型中仅涉及两个关键变量:
决定变量:抛硬币结果(因)
结果变量:蛋糕获取状态(果)
两者间的因果关系已通过箭头准确表征。
这里需要注意几点:
首先,图中的每个变量都可以取多个值。这里只有一个”抛硬币\(CoinFlip\)“节点,而不是分别为”正面\(Heads\)“和”反面\(Tails\)“设置两个节点10。同样,也只有一个”蛋糕\(Cake\)“节点,而不是分别设置”你得到蛋糕”和”你没得到蛋糕”两个节点。
其次,箭头仅表示变量间的因果关系,并不体现该作用是正向还是负向。图中仅表明抛硬币的结果会影响蛋糕的归属状态。
第三,我们在此关注的是核心因果关系。虽然现实中存在诸多可能干扰因素——比如一阵风可能改变抛硬币结果,或者蒙面人可能在你们抛硬币时偷走蛋糕(导致无论结果如何你都得不到蛋糕)——但我们可以忽略这些次要可能性,集中分析数据生成过程中的关键要素11。
根据”聚焦关键要素”的原则,因果图通常围绕特定结果变量构建。这样做的好处是:可以忽略所有被该结果变量引发的后续效应12。以当前模型为例,当我们将”蛋糕\(Cake\)“设为结果变量时,就无需考虑”吃蛋糕可能导致胃痛\(StomachAche\)“这类后续影响——这无疑是个解脱,否则每张因果图都将不得不包含整个世界的影响链条。
当然,大多数数据生成过程都涉及两个以上的相关变量。现在让我们扩展蛋糕案例的复杂度:首先,布拉德只接受这样的赌约——若他输了,硬币仍归他所有;其次,你知道朋友特里可能随时进入房间,若他看到你输掉硬币,出于同情会补偿你两枚硬币13。 那么现在相关变量有哪些?
抛硬币\(CoinFlip\):同前
蛋糕\(Cake\):同前
资金\(Money\):包含两种可能情形,保留或失去原有硬币后的金额;可能获得特里补偿后的总额
特里在场\(TerryInRoom\):特里是否出现的二值变量
该数据生成过程中的因果关系如下:
抛硬币\(CoinFlip\) → 蛋糕\(Cake\) & 资金\(Money\):同时影响两个下游变量
蛋糕\(Cake\):终端变量(无输出箭头)
资金\(Money\):终端变量(无输出箭头)
特里在场\(TerryInRoom\) → 资金\(Money\):通过补偿机制产生影响
Figure 6.2: Coin Flips, Cake, and How Great Terry I
随着因果图复杂度增加,需要注意以下几点:
首先,必须系统考量所有变量间的因果关系。某些变量可能引发多重效应(如抛硬币结果同时影响蛋糕归属和资金变化),而某些变量可能受多重因素影响(如资金状况既取决于赌局结果,也受特里是否在场的影响)。
其次,当某个变量受多重因素影响时,因果图本身并不展示这些因素的具体作用机制。以特里补偿为例:仅当抛硬币失利时,特里才会补偿资金。因此严格来说,“资金”并非单纯由”特里在场”导致,而是”抛硬币结果与特里在场共同作用”的结果——尽管图中仅用两个独立箭头(特里在场\(\rightarrow\)资金、抛硬币\(\rightarrow\)资金)表示。这提醒我们:解读因果图时,必须注意变量间可能存在的复杂交互效应14。 最后需要牢记的关键原则是:所有与数据生成过程相关的重要变量(无论是否可观测)都必须纳入模型——这在社会科学研究中尤为常见。
以职场晋升研究为例:“客户好感度”显然是影响晋升的关键因素,但研究者往往既难以获取相关数据,也无法准确量化这种主观态度。因此,“客户好感度”就成为数据生成过程中必须包含却无法观测的潜在变量。
在本书中,我们将用灰色标识未观测变量 。现在假设特里的入场行为并非随机,而是取决于当日心情——由于心情无法量化,这就构成了一个典型的未观测变量案例。
Figure 6.3: Terry’s Unobservable Mood
未测量变量在因果图中具有双重作用:它们不仅是数据生成过程的关键组成部分,有时还能替代那些我们确信存在却无法具体确定的变量。
具体而言,假设存在两个相关但互不因果的变量。以前文的例子来说:人们在吃冰淇淋的日子更可能穿短裤,但穿短裤不会促使你吃冰淇淋,吃冰淇淋也不会导致你穿短裤。
那么该如何处理?二者之间必然存在某种关联因素——否则就不会出现相关性15。但我们不能简单地用箭头连接它们,因为两者并不构成因果关系。
这种情况下,我们会假设存在某个潜在变量(可标记为”\(L1\)“或”\(U1\)“等符号,若存在第二个未观测变量则标记为”\(U2\)“,以此类推) 同时影响这两个观测变量。通过在因果图中添加这个”\(U1\)“变量,并绘制其指向”冰淇淋消费”和”短裤穿着”的双重箭头,即可表征这种未知的共同诱因结构。
Figure 6.4: Shorts and Ice Cream
部分因果图绘制方法会选择省略\(U1\)变量,转而直接在短裤与冰淇淋之间绘制双箭头(如短裤\(\leftrightarrow\)冰淇淋)或无方向线段(如短裤\(-%\)冰淇淋)。但我认为这种表示法容易与”短裤和冰淇淋互为因果”的解读混淆,因此本书将统一采用潜在变量表示法。不过若您在其他文献中见到此类表示,需知它们实际表征的正是这种共同潜在诱因关系。
至此,因果图看似相当简单——从技术层面而言确实如此。但正如所有理论工具的宿命:当这个精巧的理论模型遭遇混乱的现实世界时,复杂性便会骤然显现。
让我们通过一个经典社会科学问题来观察这种张力:警方布控对犯罪率的影响。该案例的因果图将揭示现实建模中的诸多挑战。
直觉上,无论您是否认同该政策,增加街头警力部署似乎必然降低犯罪率——这个推论看似不言而喻,对吗?
然而数据却呈现截然相反的图景(见图6.5):警力增强与犯罪率上升始终存在显著相关性16。
Figure 6.5: Police Presence and Crime Rate by County, North Carolina 1981—1987
要解开这个悖论,我们需要构建该数据生成过程的因果图。关键在于:历史犯罪率(即”滞后犯罪量”) 很可能是当下警力部署的原因。原始相关性实际反映的是”高犯罪率地区会被部署更多警力”这一决策机制。
Figure 6.6: Police Presence and Crime
在这个模型中,我们纳入了滞后犯罪量(LaggedCrime)对人均警力(PolicePerCapita)和犯罪率(Crime)的影响,同时还加入了其他重要变量。其中,不可观测变量”犯罪预期收益”(ExpectedCrimePayout)指犯罪分子在实施犯罪前对其可能获利的合理预估,这种预估取决于当地警力规模(警力越多被捕概率越高)和量刑法律(若被捕将面临更长的刑期)。而量刑法律和人均警力本身又受到”法律与秩序政治倾向”(LawAndOrderPolitics)这个不可测量变量的影响,该变量反映了当地政治体系对犯罪的打击力度。
我们可以清晰地看到因果图中包含的所有变量,以及这些变量之间的箭头指向。相信您也会认同,这些变量及其因果关系设定都是合理且符合逻辑的。
然而,图中未包含的内容与已包含的内容同等重要!每个未被纳入的变量和缺失的箭头,本质上都是我们作出的建模假设:
变量省略假设
图中未出现的变量 → 假定其对数据生成过程影响不显著
箭头省略假设
变量间无箭头连接 →
假定二者不存在直接因果关系
在警力与犯罪率的因果图中,我们的建模隐含了若干重要假设:
历史犯罪率不影响法治政治倾向(LaggedCrime↛LawAndOrderPolitics)
贫困率被排除在数据生成过程之外(PovertyRate∉DGP)
历史警力配置不影响当前警力配置(LaggedPolicePerCapita↛PolicePerCapita)
犯罪题材影视作品不影响实际犯罪率(RecentPopularCrimeMovie↛Crime)
这些假设堪称大胆——其中很可能存在不成立的情况。
构建因果图实则是场精妙的平衡术:一方面,我们力求剔除图中所有可省略的变量和箭头——模型越简洁,可解释性就越强,也越有利于我们找到研究问题的解答路径。
因果图建模中一个常见误区是过度保守——研究者往往纳入过多变量,最终得到数十个节点相互连接的混乱模型17。这种”万物互联”的做法,可能让某些无关紧要的变量或箭头彻底阻断您解答核心研究问题的可能性18!
另一方面,变量省略虽能简化模型,却面临现实复杂性的挑战——我们可能在追求简洁时,遗漏了关键变量。例如”贫困率(PovertyRate)“显然应纳入该模型,不是吗?若在缺失重要变量的情况下进行分析,很可能导致识别策略错误。相信您已发现该因果图中其他应补充的关键变量。
正如第5章所述,任何研究都存在缺陷——我们永远无法完全掌握数据生成过程的全貌。我们所能做的,是构建一个实用的因果图:既涵盖所有关键要素,又尽可能剥离无关干扰。当认知不完全时如何筛选核心变量?第11章将专门探讨这一方法论难题。
归根结底,若要对研究问题作出有意义的推断,我们必须构建某种理论模型。这个模型虽不完美,但应力求:
完整性:涵盖所有关键变量和因果关系
简洁性:保持足够的可操作性
敢于断言”这个变量确实可以省略”——这种决断力才是解答研究问题的关键!这是必要的方法论勇气:任何研究者若不主动作出简化抉择,实际上仍在隐性接受这些假设,只是未将其明确化。这些为识别答案而必须作出的假设,就称为识别性假设 。
这种隐性假设可能带来风险——而这正是因果图的核心优势所在:它能将你对数据生成过程的假设显性化。虽然公开这些假设会面临审视(这确实令人忐忑),但正是这种审视能让研究结论更加坚实可靠。
当我们确信手中的因果图已足够准确时,它便成为解答研究问题的强大工具。但具体该如何运用这一工具呢?
掌握因果图后,我们便可借助它来定位研究问题的解答路径。因果图的核心功用在于:区分数据变异中可用于识别的有效部分与干扰部分。
以警力-犯罪率模型为例(暂假设该模型成立,尽管并不完美),我们将演示如何通过因果图解答:“增加警力部署能否降低犯罪率?”
Figure 6.7: Police Presence and Crime
通过审视该因果图,我们应能识别出解答核心研究问题的关键路径——具体而言,需要聚焦所有能体现”人均警力\(PloicePerCapital\)\(\rightarrow\)犯罪率\(Crime\)“因果关系的有效通道。
该模型中存在两类关键路径:
直接效应
人均警力\(\rightarrow\)犯罪率\(PolicePerCapital \space \rightarrow
Crime\)
间接效应
人均警力\(\rightarrow\)犯罪预期收益\(\rightarrow\)犯罪率\(PolicePerCapital \space \rightarrow
ExpectedCrimePayout \space \rightarrow Crime\)
试问:若警力降低犯罪率的机制是通过提高罪犯被捕预期(即降低犯罪预期收益),这不正是警力奏效的体现吗19? 因此,解答研究问题所需的数据变异必须满足:
警力配置\(\rightarrow\)犯罪率 的直接因果变异
警力配置\(\rightarrow\)犯罪预期→犯罪率 的间接因果变异
识别答案的关键在于:提取这部分有效变异,同时阻断其他干扰性解释。
因果图的优势正在于能清晰呈现干扰性解释:
历史犯罪率干扰
\(LaggedCrime\) \(\rightarrow\) \(PolicePerCapital\) ;\(LaggedCrime \space \rightarrow
Crime\)(导致警力与犯罪率伪相关)
政治倾向干扰
\(LawAndOrderPolitics \space \rightarrow
PolicePerCapital\)
\(LawAndOrderPolices \space \rightarrow
SentencingLaws \space \rightarrow ExpectedCrimePayout \space \rightarrow
Crime\)
若采信该因果图,后续步骤便十分明确:必须剔除由历史犯罪率\(LaggedCrime\)与法治政治倾向\(LawAndOrderPolices\)引发的数据变异,以隔离出目标因果效应。具体操作方法将在第\(8\)章深入探讨。
接下来的内容颇具趣味性:它探讨的因果图特性往往困扰资深研究者,却可能完全不会困扰新手研究者——那就是:调节变量该如何处理?
调节变量是指那些不必然导致其他变量变化(尽管也可能具有这种作用)的变量,其核心功能在于改变一个变量对另一个变量的影响效应。举例来说,某种促孕药物\(X\)对怀孕概率\(Y\)的作用效果,会受到”是否拥有子宫”\(Z\)这个变量的调节:若无子宫,药物基本无效;若有子宫,药物则能显著提高受孕几率。
但现有因果图仅支持变量间的单向箭头连接\(X \space \rightarrow Y\),而无法直接表征”箭头修饰箭头”的调节关系——这恰是表达调节效应时所需的语法。
从技术层面说,调节效应其实已隐含在现有因果图中——因为图中变量受所有输入箭头的集体影响,而我们无需预先限定这些影响的具体函数形式(如\(图6.2\)中特里的案例所示)。
Figure 6.8: X and Z Cause Y , But in What Way?
以图6.8为例,该图仅表明\(X \space \rightarrow Y\)和\(Z \space \rightarrow Y\)两条基本因果关系20。但这一简单结构可能对应以下任意一种数据生成过程21:
\(Y = .2X + .3Z\)
\(Y = 4X + 3Z + 2Z^2\)
\(Y = 1.5X + 5Z + 3XZ\)
\(Y = 2X + 3XZ\)
(类似情形可无限列举)。需特别注意列表中的第\(3\)种情况:变量\(Z\)对\(X\)的效应具有调节作用——当\(Z=1\)时,\(X\)每增加\(1\)单位会使\(Y\)增加\(4.5=1.5+3\times1\);而当\(Z=2\)时,相同幅度的\(X\)增长会使\(Y\)增加\(7.5=1.5+3\times2\)。这种调节作用是双向的:\(X\)同样会调节\(Z\)的效应强度(例如当\(X=3\)和\(X=5\)时,\(Z\)对\(Y\)的影响程度不同)。第\(4\)种情况则更为特殊:\(Z\)对\(Y\)并无直接影响,但仍可调节\(X\)对\(Y\)的作用效果。 总算搞明白了!我们确实能在因果图中处理调节变量——虽然这种方法在技术上可行,却难以清晰传达数据生成过程的实质。试想:若存在关键调节效应,\(图6.8\)这种标准箭头真能准确传递您的理论构想吗?
在本书中,我们将适度突破规范——为提升可读性22,直接在因果图上标注调节效应(尽管从技术规范而言这并非标准做法)23。
在这种稍显灵活的因果图表示方法中,我们可以用\(图6.9\)来展现前文列表中的第\(3\)种数据生成过程。该图中,\(X\)和\(Z\)都直接影响\(Y\),但同时还会形成交互项\(X \times Z\)来共同影响\(Y\)——这明确展示了\(X\)与\(Z\)之间存在交互作用,彼此相互调节对方的效应强度。
Figure 6.9: X and Z Cause Y , Each Moderating the Other’s Effect
对于前文列表中第\(4\)种情形(\(Z\)无直接效应但调节\(X\)的作用),我们可用\(图6.10\)表示:\(Z\)仅通过改变\(X\)的效应来影响\(Y\),这一机制通过\(X \times Z\)交互节点体现。
Figure 6.10: X Causes Y and Z Moderates That Effect
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.0.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(Cairo)
library(extrafont)
## Registering fonts with R
library(ggpubr)
# Police and crime
library(wooldridge)
data(crime4)
ggplot(crime4, aes(x=polpc, y=crmrte)) +
geom_point() +
theme_pubr() +
scale_x_log10() +
scale_y_log10() +
theme(text = element_text(size=10, family="sans"),
axis.title.x = element_text(size=10, family="sans"),
axis.title.y = element_text(size=10, family= "sans")) +
labs(x = "Police per Capita (log scale)",
y = "Crime Rate (log scale)")
ggsave('CausalDiagrams/crime1.pdf', width = 6, height = 5, device=cairo_pdf)
若真如此,我们面对的便只是一个描述性研究问题。↩︎
不妨坦白相告:本书作者对这类伪因果问题的愤怒程度,确实远超过对真实研究难题的反应。↩︎
关键在于,所有这些模棱两可的说法,即使调换\(X\)和\(Y\)的位置也同样成立——尽管调换后我们对结论的理解会完全不同。
比如:“阿司匹林与头痛有关联”;“头痛与阿司匹林有关联”
两句话在字面上真假程度完全相同,但前者会让人下意识联想到”阿司匹林导致头痛”(这是错误的)。这种表述之所以能蒙混过关,正是因为”有关联”在技术上没有撒谎(确实存在统计关联),却通过语序暗示了根本不存在的因果关系。↩︎
根据我采用的定义,这确实引发了一个问题:那些实际上无法被干预的变量(例如种族)是否具有因果影响力?学界对此争论不休,但我认为答案是肯定的。虽然我们无法实际改变一个人的种族,但完全可以提出这样的假设性问题——“如果这个人的种族不同,事情结果会有何差异?” 这本质上是一种理论层面的干预推演。↩︎
可能有极少数读者已经注意到,这种因果定义与法律层面的因果关系有所不同——后者要求实际损害结果的发生。法律思维总会给人带来些奇特的认知扭曲(说得好听点就是:我们的因果概念若直接套用于司法实践将引发混乱,毕竟那样人人都能宣称彼此造成了伤害)。比如:「法官大人,被告发出的噪音让我当事人摔倒的概率增加了\(0.05\%\)。虽然实际并未摔倒,但我们要求赔偿\(100万\)美元的\(0.05\%\)!」↩︎
这个定义还能推导出一些耐人寻味的结论。以朱迪亚·珀尔著名的航海例子来说:
西风本应驱使帆船向东航行(\(X\)=风向,\(Y\)=航向)。但事实上,水手会通过调整船帆(\(Z\)=操作)来抵消风力影响,使船只保持直线前进。于是出现一个反直觉现象:虽然风向与航向之间观测不到任何相关性,但西风确实对航向产生了因果效应——它改变了航向的潜在分布,只不过这种影响恰好被「风力→水手操作→航向」的因果链完全抵消了。↩︎
Judea Pearl. Causality.Cambridge University
Press,Cambridge, MA,2nd edition, 2009.
↩︎
若您精通图论(说实话,在座各位谁不是呢?),会发现这里许多概念都很熟悉。若完全不了解图论也无需担心——完全不影响理解。↩︎
这很符合布拉德的作风。↩︎
这与流程图\(flowchart\)的处理方式截然不同——在流程图中,变量的每个取值都会导向不同的分支路径。↩︎
这些例子看似简单明了,但”数据生成过程中哪些部分足够重要需要纳入”这个问题本身,不就极具主观性且常引发激烈争论吗?确实如此!唉,科研真不容易。↩︎
大多数情况下如此。但有时仍需考虑结果变量引发的后续影响——例如为避免碰撞偏差\(collider \space bias\)时(详见第8章)。↩︎
特里可真是位绝世好友啊。↩︎
在本书后续章节中,为提升可读性,我们会将部分交互作用直接标注在因果图上(例如本章末尾”因果图中的调节变量”一节所示)。这种做法虽在技术上略微突破标准因果图规范,却能显著提升模型的表述清晰度。↩︎
在这个案例中,潜在机制其实显而易见:温度变化同时影响着这两个变量。但假设我们对冰淇淋和短裤都极度陌生,以至于既无法识别也无法测量这个共同诱因。↩︎
Data is from Cornwell & Trumbull (1994) via
Wooldridge (2016) and Shea (2018).
↩︎
根据我的观察,这种建模倾向在教育学院系中尤为普遍——平心而论,他们大概会觉得本书的整个方法论都徒劳无功。↩︎
在可安全省略的变量清单中,“犯罪电影”就是个典型例子。虽然某部大制作劫案电影上映或许会诱发几起随机犯罪,但其整体影响微乎其微。↩︎
您可能认为间接效应不应计入——这完全合理!许多研究问题仅关注直接效应。但务必预先明确您的研究目标究竟是否需要排除间接效应。↩︎
严格来说,我们仅能确定:\(Y\)是\(X\)与\(Z\)的因果函数。↩︎
这份列表中所有数值均为任意设定值。↩︎
本书偶尔也会在因果图中标注函数形式限制(如第20章所示的情况)。↩︎
【求放过】朱迪亚·珀尔老师↩︎