1 引言

在观察性研究中,我们常常担心未测混杂(unmeasured confounding)会导致暴露与结局之间出现“表观关联”,即观察到的关联并不完全代表真实的因果效应。

E-value 是一种敏感性分析指标,用来回答这样一个问题:

要把观察到的暴露-结局关联完全解释掉,一个未测混杂因素需要与暴露和结局分别有多强的关联?

E-value 越大,意味着要解释掉该关联所需的未测混杂强度越大,因此结果通常越稳健;反之,E-value 越小,则说明相对较弱的混杂也可能足以解释观察到的关联。

本教程将使用 EValue R 包,通过几个经典例子说明如何:

  1. 计算风险比(RR)对应的 E-value;
  2. 计算比值比(OR)对应的 E-value;
  3. 对保护性效应(RR < 1)计算 E-value;
  4. 使用 bias_plot() 可视化“需要多强的混杂才能解释结果”。

2 准备工作

如果尚未安装 EValue,可以先运行:

然后加载该包:

library(EValue)

3 E-value 的基本思想

E-value 衡量的是:若想将观察到的关联完全归因于某个未测混杂因素,那么这个混杂因素需要同时满足多强的两类关系:

  • 暴露-混杂因素关系:混杂因素在暴露组和非暴露组中的分布差异有多大;
  • 混杂因素-结局关系:混杂因素与结局之间的关联有多强。

通常我们把这两类关系分别记为:

  • RREU:暴露与未测混杂之间的风险比参数;
  • RRUD:未测混杂与结局之间的风险比参数。

E-value 可以理解为:当这两个参数取相同强度时,它们至少需要达到多大,才足以将观察到的效应完全解释掉。

4 例1:吸烟与肺癌

4.1 背景

Hammond 和 Horn 估计,吸烟会使肺癌风险增加超过 10 倍。
Fisher 曾提出,遗传因素可能同时影响吸烟行为和肺癌风险,因此这种强关联也许可以完全由遗传混杂解释。

假设研究报告的风险比为:

  • 点估计:RR = 10.73
  • 95% 置信区间:8.02, 14.36

我们可以用 E-value 来评估:要完全解释这样强的观察关联,未测混杂需要达到多高的强度。

4.2 计算点估计及置信区间下限的 E-value

evalues.RR(est = 10.73, lo = 8.02, hi = 14.36)
##             point    lower upper
## RR       10.73000  8.02000 14.36
## E-values 20.94777 15.52336    NA

4.3 结果解释

在这个例子中,点估计对应的 E-value 为 20.95。这意味着:

若要将观察到的 RR = 10.73 完全解释为未测混杂,而不是因果效应,那么某个未测混杂因素(或一组混杂因素)必须同时:

  1. 与肺癌风险升高具有约 20 倍的关联;
  2. 并且在吸烟者中的发生率相对于非吸烟者也高达约 20 倍

换句话说,只有当未测混杂与暴露结局都存在极强关联时,才可能把这一观察结果完全解释掉。

同时,置信区间下限 8.02 对应的 E-value 也很大,这表明即便考虑随机误差后,研究结论仍然对未测混杂具有较强稳健性。

5 使用图形展示偏倚强度需求

除了数值结果,EValue 包还可以通过 bias_plot() 绘制出不同混杂参数组合下,何种程度的未测混杂才能完全解释观察到的关联。

5.1 对点估计绘图

bias_plot(10.73, xmax = 40)

5.2 图形解读

该图展示了:若要使 RR = 10.73 完全由未测混杂造成,则 RREURRUD 必须满足怎样的组合关系。

例如,图形所表达的含义之一是:

如果暴露-混杂因素参数 RREU = 15,即该混杂因素在吸烟者中的发生率是非吸烟者的 15 倍,那么混杂-结局参数 RRUD 就需要大约达到 40,才可能完全解释观察到的关联。

这说明:

  • 如果未测混杂与暴露的关联稍弱;
  • 那么它与结局的关联就必须更强;

反之亦然。也就是说,解释掉这个结果所需的混杂强度非常高。

5.3 对置信区间下限绘图

我们也可以针对 95% 置信区间下限 8.02 进行敏感性分析:

bias_plot(8.02, xmax = 40)

这个图反映的是:

若要把“最保守但仍与原假设不一致”的结果(即置信区间下限)解释掉,未测混杂仍然需要多强。

通常,研究者会特别关注置信区间下限对应的 E-value,因为它更保守。

6 将估计值移动到非无效值时的 E-value

前面的例子讨论的是:需要多强的混杂,才能把观察到的效应完全解释到无效值(null),例如 RR = 1。

但在实际研究中,有时我们关心的并不是“效应是否为零”,而是:

需要多强的混杂,才能把观察到的效应削弱到某个较小但仍有意义的值?

例如,假设观察到的相对风险为 2.5,我们想知道要多强的未测混杂,才能把它降低到真实因果相对风险 1.5。

summary(evalues.RR(est = 2.5, true = 1.5))
## You are calculating a "non-null" E-value, i.e., an E-value for the
## minimum amount of unmeasured confounding needed to move the estimate
## and confidence interval to your specified true value rather than to the
## null value.
## [1] 2.720759

结果解释

这里的 E-value 不再是“把效应解释到 1”,而是:

把观察到的 RR = 2.5 解释到 RR = 1.5 所需的最小混杂强度。

这种分析特别适用于以下情形:

  • 研究者并不认为真实效应一定为 0;
  • 而是想知道结果是否可能被未测混杂“显著削弱”。

7 例2:母乳喂养与婴儿呼吸道感染死亡

7.1 背景

Victora 等人的研究探讨了母乳喂养与婴儿因呼吸道感染死亡之间的关系,结果发现:

  • 纯配方奶喂养婴儿的死亡率增加了 3.9 倍
  • 95% 置信区间为 1.8 到 8.7

假设研究中未测量的吸烟因素可能构成混杂,我们可以计算该关联的 E-value。

由于这里使用的是比值比(OR),并且结局较为罕见,因此可以使用 rare = TRUE

7.2 计算 OR 的 E-value

evalues.OR(est = 3.9, lo = 1.8, hi = 8.7, rare = TRUE)
##             point lower upper
## RR       3.900000   1.8   8.7
## E-values 7.263034   3.0    NA

7.3 结果解释

这里的 E-value 反映的是:

要把纯配方奶喂养与更高婴儿死亡风险之间的观察关联完全解释为未测混杂,需要多强的未测混杂因素。

设定 rare = TRUE 的含义是:

  • 当结局罕见时,OR 可以较好近似 RR;
  • 因此可以按稀有结局近似进行 E-value 计算。

7.4 绘制偏倚图

bias_plot(3.9, xmax = 20)

这个图可以帮助我们更直观地判断:

  • 如果怀疑某个未测混杂因素(如母亲吸烟)存在;
  • 那么它必须与暴露和结局各自有多强的关联;
  • 才足以完全解释掉观察到的 OR = 3.9。

8 例3:保护性效应的 E-value

8.1 背景

美国医疗保健研究与质量局的一项研究发现,母乳喂养可能降低儿童白血病风险,文章报告:

  • RR = 0.80
  • 95% 置信区间:0.71, 0.91

这个例子说明:当暴露表现为保护性效应(RR < 1)时,同样可以计算 E-value。

8.2 计算保护性效应的 E-value

evalues.RR(est = 0.80, lo = 0.71, hi = 0.91)
##             point lower    upper
## RR       0.800000  0.71 0.910000
## E-values 1.809017    NA 1.428571

8.3 结果解释

当 RR 小于 1 时,说明暴露可能具有保护作用。此时 E-value 的含义仍然是:

需要多强的未测混杂,才能将观察到的保护性关联完全解释掉。

也就是说,某个未测混杂因素必须同时与:

  • 是否接受母乳喂养;
  • 儿童白血病风险;

存在足够强的关联,才可能使这个保护性结果不再成立。

9 如何解读 E-value

在实际应用中,可以从以下几个角度解读 E-value:

9.1 E-value 大,说明结果更稳健

如果 E-value 很大,说明只有非常强的未测混杂才能解释掉观察到的关联。
这通常意味着研究结论对未测混杂较为稳健。

例如,吸烟与肺癌例子中的 E-value 超过 20,说明要推翻该结果,需要极其强大的混杂因素。

9.2 E-value 小,说明结果更容易受混杂影响

如果 E-value 较小,则说明即便是中等强度的未测混杂,也可能足以解释掉观察结果。
这时研究者需要更加谨慎。

9.3 应同时关注点估计和置信区间下限

  • 点估计的 E-value:反映解释整个估计值所需的混杂强度;
  • 置信区间下限的 E-value:反映将最保守仍显著的结果解释到无效值所需的混杂强度。

在论文写作中,通常建议两者都报告。

10 一个简短的报告模板

在实证研究中,可以用类似下面的文字报告 E-value 结果:

我们使用 E-value 评估未测混杂对研究结果的潜在影响。对于观察到的效应估计值,E-value 为 XX;对于 95% 置信区间最接近无效值的界限,E-value 为 YY。这表明,若要完全解释掉观察到的关联,某个未测混杂因素必须同时与暴露和结局分别具有至少 XX(或 YY)倍的关联,且已测量混杂因素不能解释这些关联。

11 Finally

如果对你有帮助欢迎关注本Up Bilibili LogitLegendary