张昱城（教授博导）

本小节课程来源：Hayes, A. F. (2013). Introduction to Mediation, Moderation, and Conditional Process Analysis: A Regression-Based Approach. New York: Guilford Publications.

1 线性回归分析基础

这一章利用一项研究数据来介绍OLS回归分析的原理，包括估计过程，模型的拟合度，线性回归结果的解释，以及统计推断的基本原理。

1.1 相关和预测

研究问题：人们对于政府在减轻全球性危机潜在影响中的角色的看法，与他们对这种危机的情绪反应之间的相关程度有多大？

为了回答这个问题，利用美国815名居民（417名女性，398名男性）的调查数据来进行分析（数据集名为GLBWARM）。

Y（GOVACT）：多大程度上支持美国政府缓解全球气候变化威胁的各项政策或行动。由 5个问题构成；回答选项（1=“强烈反对”；7=“强烈支持”）。
X（NEGEMOT）：参与者对气候变化前景的负面情绪反应。回答想到全球变暖时感受到的关切、担忧和恐慌；回答选项（1=“根本不”；6=“很多”）。

图1 关于气候变化的负面情绪（X）与支持缓解气候变化的政府行动（Y）之间关系的散点图

图1呈现了一种趋势，即那些对于气候变化表现出相对强烈负面情绪的人，也相对更支持政府采取行动来帮助缓解气候变化。

接下来量化关联：皮尔逊相关系数r(Person’s r)

图2 SPSS输出显示对气候变化的负面情绪（X）和对政府行动的支持（Y）的皮尔逊相关

## Pearson's r and 95% confidence intervals:
## ─────────────────────────────────────────
##            r       [95% CI]     p       N
## ─────────────────────────────────────────
## Y-X2    0.04 [-0.03,  0.11]  .220     815
## Y-X1    0.58 [ 0.53,  0.62] <.001 *** 815
## Y-X3   -0.42 [-0.47, -0.36] <.001 *** 815
## Y-X5   -0.10 [-0.16, -0.03]  .006 **  815
## Y-X4   -0.10 [-0.17, -0.03]  .005 **  815
## Y-X6   -0.36 [-0.42, -0.30] <.001 *** 815
## X2-X1   0.13 [ 0.06,  0.19] <.001 *** 815
## X2-X3  -0.03 [-0.10,  0.04]  .402     815
## X2-X5   0.04 [-0.03,  0.11]  .227     815
## X2-X4   0.07 [ 0.01,  0.14]  .034 *   815
## X2-X6  -0.04 [-0.10,  0.03]  .308     815
## X1-X3  -0.35 [-0.41, -0.29] <.001 *** 815
## X1-X5  -0.06 [-0.13,  0.01]  .105     815
## X1-X4  -0.12 [-0.18, -0.05] <.001 *** 815
## X1-X6  -0.32 [-0.38, -0.26] <.001 *** 815
## X3-X5   0.21 [ 0.15,  0.28] <.001 *** 815
## X3-X4   0.13 [ 0.06,  0.20] <.001 *** 815
## X3-X6   0.62 [ 0.58,  0.66] <.001 *** 815
## X5-X4   0.17 [ 0.10,  0.23] <.001 *** 815
## X5-X6   0.15 [ 0.09,  0.22] <.001 *** 815
## X4-X6   0.11 [ 0.04,  0.18]  .002 **  815
## ─────────────────────────────────────────

如图2显示： r=0.578，表明研究中对气候变化的负面情绪相对较强的人也相对更支持政府的行动。

*解读r三种符号的：

显著+：r的符号对应了X和Y之间线性关系的方向，如果X相对较高的值与Y相对较高的值对应，相对较低的X值倾向于与Y相对较低的值对应，那么皮尔逊系数r是正的；
显著-：如果X相对较高的值趋向于与Y相对较低的值对应，相对较低的X趋向于与相对较高的Y对应，则皮尔逊系数，为负。
不显著：当X和Y的值的配对没有明显的顺序，或者当关联更加非线性时，皮尔逊系数r将接近于零(因为皮尔逊系数r是线性关联的度量，而不是任何关联类型的度量)

*解读r：提供了一个估计值，即对于一个个案，已知它的X值距离样本均值多少个标准差，它的Y值距离样本均值的多少个标准差。即 \[ \ \hat { Z }_{Y_i}=r_{XY}Z_{X_i} \]

实例1：一个人的负面情绪（X1）处于均值之上0.5个标准差(Zx=0.5),那么可以估算出他对政府行动的支持度离均值Zx=0.578*0.5=0.289个标准差。Z y的符号为正，意味着这个人在样本均值之上(比平均水平更加支持)。
实例2：负面情绪在均值之下2个标准差的人(Zx=-2),被估算出对政府行为支持度离均值Zy=0.578*(-2)=-1.156个标准差。在这种情况下，Zy为负，意思是估计出这个人对政府行动的支持度是低于样本均值的(即支持度低于平均水平)

相关和预测是密切相关的概念。如果两个变量是相互关联的，那么就应该能够使用一个变量上配对的X、Y的值的信息，以某种精确度来估计对应的另一个变量的值，如果想要从解释的角度出发提供更多的解释信息就要用更加复杂的建模方法。

1.2 X与Y皆是连续变量的简单线性回归模型

线性回归模型是通过利用输入和输出之间的关联信息将一个或多个输入变量（预测变量、自变量、解释变量或前因变量）连接到输出变量（结果变量、准则变量或因变量）的方程。

进行线性回归分析时的目标：估计回归模型的各种参数，使产生的方程从一个或多个前因变量得到结果变量的估计值（parameters）。

1.2.0.0.1 *解读公式

简单线性回归模型是：

\[ Y_j=\underbrace{i_Y+b X_j}_{\hat Y}+e_j \]

变量：Y_j和X_j分别表示个案j的结果和前因变量的度量
系数：b是前因变量X的回归系数
截距：i_Y是回归常数
残差：e_j是从个案j的X值估计样本j的Y值产生的误差，也被称为残差。
估计回归模型的过程称为Y在X上的回归。

回归的原理：通过最小二乘法使得残差最小（公式推导：罗胜强和姜嬿，2014，7.1.3），过程如下：

寻找最好的估计：以上方程有无穷多对i和b的值，可以用来生成Y的估计值。一个普通最小二乘(OLS)回归过程是找到一个最好的估计，该估计产生的回归常数和系数这两个值的特别之处在于，它最小化了残差平方和 (Sum of squares for residual: SSresidual)：\[ \ SS_{residual}=\sum_{j=1}^{n}(Y_j-\hat Y_j)^2=\sum e_j^2 \]
最差的估计：SSresidual的最大值则是仅使用均值作为预测变量的模型（即只含有截距而不加入任何预测变量，在R中该模型为lm(y~1)），即为其总平方和（Total sum of squares：SST）

\[ \ SS_{total}=\sum_{j=1}^{n}(Y_j-\bar Y_j)^2 \]

找出已解释部分：总平方和减去残差平方和的部分，即为其回归平方和 (Sum of squares for regresion: SSregresion)：

\[ \ SS_{regression}= SS_{total}- SS_{residual}\\ \sum_{j=1}^{n}(\hat Y_j-\bar Y_j)^2=\sum_{j=1}^{n}(Y_j-\bar Y_j)^2-\sum_{j=1}^{n}(Y_j-\hat Y_j)^2 \]

1.2.0.0.2 图2.3 以对气候变化的负面情绪估计对政府缓解气候变化行动支持度的简单回归分析R Studio结果

使用以下R语言命令生成的气候变化负面情绪（X）估计对政府减缓气候变化行动的支持（Y）的简单回归代码是：

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(1, 813) = 407.34, p = 1e-73 ***
## R² = 0.33379 (Adjusted R² = 0.33297)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ──────────────────────────────────────────────────────────────
##                  b    S.E.      t     p      [95% CI of b] VIF
## ──────────────────────────────────────────────────────────────
## (Intercept)  2.757 (0.099) 27.948 <.001 *** [2.564, 2.951]    
## X1           0.514 (0.025) 20.183 <.001 *** [0.464, 0.564]    
## ──────────────────────────────────────────────────────────────

## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ────────────────────────────────────────────────────────────────────
##         β    S.E.      t     p      [95% CI of β] r(partial) r(part)
## ────────────────────────────────────────────────────────────────────
## X1  0.578 (0.029) 20.183 <.001 *** [0.522, 0.634]      0.578   0.578
## ────────────────────────────────────────────────────────────────────

因此，最佳拟合OLS回归模型是：

\[ \hat{Y}_j=2.757+0.514 X_j \]

这个简单回归方程可以用二维平面图上的一条直线形式表示出来。

图4 关于气候变化负面情绪（X）对政府行动的支持度（Y）的估计的最小二乘回归方程（虚线）图示

## Error in UseMethod("ggplot_build"): no applicable method for 'ggplot_build' applied to an object of class "c('gg', 'ggplot', 'ggPredict')"

1.2.1 常数和回归系数的解释

1.2.1.0.1 *解读结果

解读回归系数：对应着直线斜率，因此回归系数有时被称为回归斜率。它量化了1个单位X的不同估计值的Y的差异。数学上b被定义为：

\[ b=[\hat{Y}_j|(X=x)]-[\hat{Y}_j|(X=x-1)] \]

- 例子，两个个案在气候变化负面情绪上1个单位的差异可以估计他们在政府行动的支持度上相差b=0.514个单位。

截距：在概念上等同于直线方程中的y轴截距。它表示当X=0时Y的估计值。
- 例子：在气候变化模型中，i_Y=2.757，这是对负面情绪测量分数为0的人对政府行动支持度的估计值。虽然这有明确的数学意义，但实际上，这毫无意义，因为负面情绪的范围界定在1到6之间。通常，回归常数没有实质性的解释，但有时它又具有一定意义。它取决于X是如何测量以及X=0时是否具有任何实质意义（调节做中心化处理的原因）。

1.2.2 标准化回归模型

标准化回归模型：通常是在模型预估之前将所有的变量首先进行标准化，即通过使用距离样本均值几个标准差来表述每个测量值。

\[ \hat{Z}_{Y_j}=\tilde{b} Z_{X_j} \]

这里Z_Y和Z_X是标准化版本的X和Y，b~是X的标准化回归系数。

1.2.2.0.1 *解读结果

系数：标准化回归系数可以解释为两个个案在X上相差1个标准差，估计它们在Y上相差多少个标准差。因此，两个在气候变化负面情绪上有1个标准差区别的人，估计在政府行动支持度方面相差b=0.578个标准差。进行OLS回归的大多数统计软件包会在输出部分提供标准化回归模型。例如，在本例中，标准化回归系数可以在”标准化系数”一栏下找到。
截距：标准化回归模型并不包含截距（因为标准化后，截距项一般为0）。
理论含义：系数为正意味着对气候变化有更多负面情绪的人估计会更加强烈地支持政府减轻气候变化的行动。
标准化回归系数与X和Y与的皮尔逊相关系数：几乎完全相等。这在只有一个前因变量的任何同归模型中是成立的，但并不能推广到具有多个前因变量的模。

1.2.3 二分前因变量的简单线性回归

在线性回归方程中，前因变量可以是定量维度或二分变量，比如性别（男性/女性）。

为了更好的说明，使用一个线性回归分析来估计男性和女性（X）在政府行动支持度（Y）上的差异；男（编码1，51.2%的参与者）或女（编码0，48.8%的参与者，即为X4的均值）。

1.2.3.0.1 图2.5 基于参与者性别（X）的政府应对减缓全球变暖采取行动的支持度（Y）的简单回归分析的R Studio输出图示

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(1, 813) = 7.98, p = 0.005 ** 
## R² = 0.00973 (Adjusted R² = 0.00851)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ─────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b] VIF
## ─────────────────────────────────────────────────────────────────
## (Intercept)   4.718 (0.066) 71.122 <.001 *** [ 4.588,  4.848]    
## X4           -0.268 (0.095) -2.826  .005 **  [-0.455, -0.082]    
## ─────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ───────────────────────────────────────────────────────────────────────
##          β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ───────────────────────────────────────────────────────────────────────
## X4  -0.099 (0.035) -2.826  .005 **  [-0.167, -0.030]     -0.099  -0.099
## ───────────────────────────────────────────────────────────────────────

因此，得到：

\[ \hat{Y}_j=4.718-0.268 X_j \]

1.2.3.0.2 *解读结果：

截距（0组值）：当X=0时，回归常数i_Y仍然是Y的估计值。这种情况下，女性被编码为X=0，所以Y=4.718。这是女性对政府行为支持度的估计值，它对应于女性的样本均值：i_Y=Y_女性=4.718。
回归系数（与0组相比的差值）：即两个在X上相差1个单位的个案在Y的估计值上的差异，而负号告诉我们，个案在X上值越大估计出的Y值越低。这与之前报告的均值是一致的。男性在编码时比女性编码高一个单位值，而普遍呈现比女性对政府行为支持度更低。再者，要注意到均值之间的差值正好是这个度量的0.268个单位（即Y_男性-Y_女性=4.450-4.718=-0.268）。因此回归系数量化了两组均值之间的差异。

通过带入理解该结果：对于女性X=0,根据模型估计女性的均值为y=4.718-0.268*0=4.718,对于男性，X=1,估计男性的均值为Y=4.718-0.268*1=4.450。

## [1] 4.718

## [1] 4.45

## 
## Independent-Samples t-test
## 
## Hypothesis: two-sided (μ2 - μ1 ≠ 0)
## 
## Descriptives:
## ──────────────────────────────────────
##  Variable Factor Level   N Mean (S.D.)
## ──────────────────────────────────────
##         Y     X4     0 417 4.72 (1.16)
##         Y     X4     1 398 4.45 (1.53)
## ──────────────────────────────────────
## 
## Levene’s test for homogeneity of variance:
## ───────────────────────────────────────────
##                Levene’s F df1 df2     p    
## ───────────────────────────────────────────
## Y: X4 (1 - 0)       27.09   1 813 <.001 ***
## ───────────────────────────────────────────
## Note: H0 = equal variance (homoscedasticity).
## If significant (violation of the assumption),
## then you should better set `var.equal=FALSE`.
## 
## Results of t-test:
## ─────────────────────────────────────────────────────────────────────────────────────
##                    t  df     p      Difference [95% CI]   Cohen’s d [95% CI]     BF10
## ─────────────────────────────────────────────────────────────────────────────────────
## Y: X4 (1 - 0)  -2.83 813  .005 **  -0.27 [-0.45, -0.08] -0.20 [-0.34, -0.06] 3.89e+00
## ─────────────────────────────────────────────────────────────────────────────────────

1.3 相关的替代性解释

相关并不意味着因果关系：如果变量X和Y是相关的，这并不意味着X会导致Y，或者Y导致X，最终能否推断因果甚至不是一件统计上的事。相反，它关乎一个人的研究设计，他所使用的数据收集程序，以及理论的合理性，这将更加直接地影响一个因果论断是否成立以及可信程度，而不仅仅是相关关系的统计系数的大小或方向。

使用回归的逻辑（控制变量）：多层回归为研究者提供了一种借助于数学化辅助的反事实推理方法，即在同归模型中，在另一个前因变量没有差异的情况下估计X和Y之间的相关程度。它通过将人(或者任意分析的单位)在这些变量上的”数学上等同”来实现这一点。这种等同过程也称为从X和Y的相关中”分离”出其他变量，或”统计性地控制”那些变量。这些其他的变量在线性模型的术语中被称为协变量，但在实践中，它们和X一样，只是Y的山归模型中的前因变量

回归与因果的关系

回归不能告诉我们的：人们永远都不知道在前因变量或结果变量之间观察到的相关是否是因果关系，或者是否要归因于模型中尚未进行统计学控制的其他一些变量
回归可以告诉我们的：当知道在保持其他东西都不变的情况下，我们所关心的关系仍然存在，至少可以消除一些替代性解释。最终，若想在数据缺失的情况下得到更为明确的因果解释，所能做的就是尝试控制那些引起批评者质疑的协变量

1.4 多层线性回归

定义：回归模型中包括多个前因变量，允许研究者同时检验对一个结果变量有多个影响的作用。多层回归模型的另一个重要的好处是，它从统计上排除某些替代性解释，提供了部分相关的各种测量方法，即，它量化了一个前因和一个结果之间的关联关系的组成部分，这与模型中的其他前因变量相比是唯一的。
一般而言，一个具有k个前因变量的多层线性回归模型采用以下形式：

\[ Y_j=i_Y+b_1 X_{1 j}+b_2 X_{2 j}+\ldots+b_k X_{k j}+e_j \]

其中X_ij是个案j的前因变量i的值，b_i是前因变量X_i的回归系数，其他所有项定义如前。

举例：使用对气候变化的负面情绪（X₁）、对气候变化的积极情绪（X₂）、政治意识形态（X₃）、性别（X₄）和年龄（X₅）同时对政府行为的支持度（Y）进行回归。

1.4.0.0.1 图2.6 关于用对气候变化的负面情绪（X₁）和积极情绪（X₂）、政治意识形态（X₃）、性别（X₄）和年龄（X₅）来估计对减轻全球气候变化的政府行动支持度（Y）的多层回归分析R Studio输出结果

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(5, 809) = 102.72, p = 7e-84 ***
## R² = 0.38832 (Adjusted R² = 0.38454)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ───────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b]   VIF
## ───────────────────────────────────────────────────────────────────
## (Intercept)   4.064 (0.205) 19.791 <.001 *** [ 3.661,  4.467]      
## X1            0.441 (0.026) 16.676 <.001 *** [ 0.389,  0.493] 1.166
## X2           -0.027 (0.028) -0.951  .342     [-0.082,  0.028] 1.026
## X3           -0.218 (0.027) -8.071 <.001 *** [-0.271, -0.165] 1.194
## X4           -0.010 (0.077) -0.131  .896     [-0.161,  0.141] 1.053
## X5           -0.001 (0.002) -0.552  .581     [-0.006,  0.003] 1.071
## ───────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ───────────────────────────────────────────────────────────────────────
##          β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ───────────────────────────────────────────────────────────────────────
## X1   0.495 (0.030) 16.676 <.001 *** [ 0.437,  0.554]      0.506   0.459
## X2  -0.027 (0.028) -0.951  .342     [-0.081,  0.028]     -0.033  -0.026
## X3  -0.243 (0.030) -8.071 <.001 *** [-0.302, -0.184]     -0.273  -0.222
## X4  -0.004 (0.028) -0.131  .896     [-0.059,  0.052]     -0.005  -0.004
## X5  -0.016 (0.028) -0.552  .581     [-0.072,  0.040]     -0.019  -0.015
## ───────────────────────────────────────────────────────────────────────

## ──────────────────────────────────────────────
##              Estimate    S.E.      t     p    
## ──────────────────────────────────────────────
## (Intercept)     0.000 (0.027)  0.000 1.000    
## scale(X1)       0.495 (0.030) 16.676 <.001 ***
## scale(X2)      -0.027 (0.028) -0.951  .342    
## scale(X3)      -0.243 (0.030) -8.071 <.001 ***
## scale(X4)      -0.004 (0.028) -0.131  .896    
## scale(X5)      -0.016 (0.028) -0.552  .581    
## ──────────────────────────────────────────────

## ──────────────────────────
##               2.5 % 97.5 %
## ──────────────────────────
## (Intercept)   3.661  4.467
## X1            0.389  0.493
## X2           -0.082  0.028
## X3           -0.271 -0.165
## X4           -0.161  0.141
## X5           -0.006  0.003
## ──────────────────────────

由此得到：

\[ \hat{Y}=4.064+0.441 X_1-0.027 X_2-0.218 X_3-0.010 X_4-0.001 X_5 \]

1.4.1 常数和偏回归系数的解释

1.4.1.0.1 *解读结果

解读非标准化多层回归的结果：
- 截距：多层回归模型中的回归常数是模型中某一案的所有前因变量的测量值为0时的值。在这个例子中，iy=4.064,但是这个估计值Y根本没有什么实质意义，因为0值超过了情绪测量量表(积极的和负面的情绪下限是1)、意识形态(1-7)以及年龄的刻度范围。
- 回归系数：如果其他回归系数是固定的，那么在Xk上相差1个单位的两个个案，Y的估计值将有bk个单位的差异。本例中，从多层回归分析中，两个有着同样对气候变化的积极情绪（X2）、政治意识形态（X3）、性别（X4）和年龄（X5），但在负面情绪中相差1个单位的个体，他们对政府行动的支持度有0.441个单位差异。数学上将其定为：

\[ b_i=[\hat{Y}_j|(X_{is}=x); X]-[\hat{Y}_j|(X_{it}=x-1; X)] \]

解读标准化后结果：
- 截距：是0
- 回归系数：两个个案Y值的标准差的估计差异，这两个个案在变量X,上有1个标准差的不同，但在模型中其他前因变量上都相等。本例中，b1=0.495,所以我们可以说两个人在负面情绪变量(X1)上相差1个标准差，但在积极情绪、意识形态、性别和年龄上得分都相同，他们在政府行动支持度上的估计值相差0.495个标准差，即负面情绪越强烈的人对政府行动的支持度越大
- 手动计公式：

\[ \tilde b_i=b_i (\frac{SD_X}{SD_Y}) \]

## [1] "0.495"

解读部分标准化后结果（前因变量为分类变量）：不应计算标准化后结果（如，性别），当模型中分类变量和连续变量共存时，只选择连续变量进行标准化，而不是选择将所有变量标准化。这必须在模型估计之前完成。一旦这么做了并且生成模型，就需要解释非标准化的回归系数而不是标准化的回归系数。对于那些之前进行了手动标准化的前因变量，非标准系数会变成标准化形式。
- 本例中：但现在b4=-0.007有个合理的解释。我们可以说，当模型中所有其他变量保持不变时，男性和女性对政府行动的支持度相差0.007个标准差。负号表示男性对政府行动的支持度不及女性

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(5, 809) = 102.72, p = 7e-84 ***
## R² = 0.38832 (Adjusted R² = 0.38454)
## 
## Unstandardized Coefficients:
## Outcome Variable: scale(Y)
## N = 815
## ───────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b]   VIF
## ───────────────────────────────────────────────────────────────────
## (Intercept)   0.004 (0.039)  0.093  .926     [-0.073,  0.080]      
## scale(X1)     0.495 (0.030) 16.676 <.001 *** [ 0.437,  0.554] 1.166
## scale(X2)    -0.027 (0.028) -0.951  .342     [-0.081,  0.028] 1.026
## scale(X3)    -0.243 (0.030) -8.071 <.001 *** [-0.302, -0.184] 1.194
## X4           -0.007 (0.056) -0.131  .896     [-0.118,  0.103] 1.053
## scale(X5)    -0.016 (0.028) -0.552  .581     [-0.072,  0.040] 1.071
## ───────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: scale(Y)
## N = 815
## ──────────────────────────────────────────────────────────────────────────────
##                 β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ──────────────────────────────────────────────────────────────────────────────
## scale(X1)   0.495 (0.030) 16.676 <.001 *** [ 0.437,  0.554]      0.506   0.459
## scale(X2)  -0.027 (0.028) -0.951  .342     [-0.081,  0.028]     -0.033  -0.026
## scale(X3)  -0.243 (0.030) -8.071 <.001 *** [-0.302, -0.184]     -0.273  -0.222
## X4         -0.004 (0.028) -0.131  .896     [-0.059,  0.052]     -0.005  -0.004
## scale(X5)  -0.016 (0.028) -0.552  .581     [-0.072,  0.040]     -0.019  -0.015
## ──────────────────────────────────────────────────────────────────────────────

1.5 模型拟合度的4种度量

4个指标可以衡量模型拟合：每一个指标对的都是对前一个指标的改进，使得拟合指数更好理解

最直观指标SSresidual的缺陷：尽管SSresidual是最直观的衡量模型拟合度，但是其严重受到样本量的影响，随着n增大，SSresidual也增大。两种变形
修正样本量的MSresidual（Mean square of residual）：当SSresidual除以自由度后，其受样本量影响的缺点即可被解决，自由度为样本量-预测变量数-1（n-k-1）其公式为：

\[ M S_{residual }=\frac{S S_{\text {residual }}}{n-k-1} \]

可解读的SEE（standard error of estimate）：MSresidual的问题是不可解读，将其开平方后的估计标准误SEE可以解释为Y与^Y平均差异数，忽略符号不计，它也近似等于残差的标准差。在本例中，估计标准误为1.067(见图2.6)。当忽略误差的符号时，它几乎就是Y与平均相差多少。因为估计标准误只是SS的变形，它也是按最小二乘法则进行最小化

\[ SSE=\sqrt {M S_{residual }} \]

最常用的R²通常被解释为模型可解释的Y值的变化的比例：R可以被看作Y和Y(估计值)之间的皮尔逊相关。这一诠释清楚地说明了R和R²如何被看作模型拟合度的一种指标。在一个好的拟合模型中，模型估计出的Y值与数据中n个个案的实际观测值Y之间的相关性应该很大。如果这种相关性小，那么很难认为这个模型在解释Y值的个体差异方面做的特别好。
- R2的最大优势：前三种方法由于无法排除测量使用量尺不同带来的影响，导致其结果很难比较。只要样本量不是很小，都可以直接比较基于不同样本大小的两个模型的R2
- *解读R2：在气候变化模型中，R²=0.388。那么负面情绪和积极情绪、年龄、性别和政治意识形态共同解释了人们对政府行动支持度的0.388×100%=38.8%的变化。

\[ R^2=1-\frac{S S_{\text {residual }}}{S S_{\text {total }}}=\frac{S S_{\text {regresion }}}{S S_{\text {total }}} \]

## ───────────────────────────────────────────────────────────────────────
##          n     k ss_total A.SS_residual B.MS_residual C.SSE D.R_squared
## ───────────────────────────────────────────────────────────────────────
## 1  815.000 5.000 1506.542       921.523         1.139 1.067       0.388
## ───────────────────────────────────────────────────────────────────────

1.6 统计推断

假设情况

前提：GLBWARM数据文件中的815个人代表了地球上的人口普查。如果地球上没有其他人了，那么GLBWARM数据集就是全体人口的数据集。
针对总体的估计：如果我们要从负面情绪、积极情绪、政治意识形态、性别和年龄等因素来估计对减轻气候变化影响的政府行动支持度，那么可以得到这个将残差平方和降到最低的总体回归模型。模型里T表示回归系数的”真值”或总体值。

\[ \hat{Y}={ }_T i_Y+{ }_T b_1 X_1+{ }_T b_2 X_2+{ }_T b_3 X_3+{ }_T b_4 X_4+{ }_T b_5 X_5 \]

基于样本推断总体：现在假设，不是人口普查，我们只研究了815个居民中的50人，而且是从815个居民的人口中随机抽取了这50个居民。用这50个样本，用五个前因变量对政府行动支持度进行回归。

图2.7
- 抽样方式：从GLBWARM数据的815个人中随机抽取50人
- b1：图7描述了重复10000次该过程得到的b₁值的直方图。
  - b1的范围：注意到_Tb₁的10000个估计值变化很大，从0.02的低点到0.85的高点，大部分估计值在0.30~0.60。这就是抽样方差。
  - b1的估计：研究者们希望这个估计值b₁接近真正的值，但不可能确切地知道它有多接近，因为我们只观察了基于可用数据的真值的单个样本估计值。从 815人中抽取出的不同随机样本会产生不同的_Tb₁估计值，因为只要当样本量小于总体时，b₁就取决于抽样方差。

1.6.0.0.1 图2.7 在样本量为50的样本中_Tb₁进行10000次估计的直方图（Hayes 2013, p51）

1.6.1 检验一个零假设

在回归中，最通常检验的零假设是，总体中的X_i和Y不是线性相关。符号上可以表示为：

\[ \begin{array}{ll} H_0: & { }_T b_i=0 \\ H_a: & { }_T b_i \neq 0 \end{array} \]

为了在零假设和备择假设之间做出判断，必须推导出X_i和Y之间相关的概率，这个概率就是所得结果中的p值。如果p值不大于检验中的显著性水平（一般来说，显著性水平或α-level为0.05），那么拒绝零假设而选择备择假设。

1.6.2 区间估计

另一种推断方法是区间估计，也称为构建_Tb_i的置信区间。

点估计：在任何单一样本中，b_i是我们对_Tb_i值的最佳猜测，它是一个_Tb_i的点估计。然而，b_i几乎肯定不等于_Tb_i。

置信区间将这种不确定性确认为：_Tb_i可能处于一个由特定的置信度所决定的范围之内。

通常使用95%置信区间，c%置信区间的公式是：

\[ b_1-t_c \%{s e}_{b_1} \leq{ }_T b_1 \leq b_1+t_{c \%} s e_{b_1} \]

*解读本例的区间结果：

\[ 0.441-1.92*0.026 \leq{ }_T b_1 \leq 0.441+1.92*0.026 \]

1.6.3 关于一组前因变量的假设检验

多重回归也可用于检验模型中包含一组前因变量的假设。例如，把情绪视作一组（即积极情绪和负面情绪），都是对气候变化的情绪反应，控制常量、意识形态、性别和年龄，来看一下情绪与政府行动支持度的相关的问题。

在我们的回归模型中，负面情绪和积极情绪分别为X₁和X₂，这个问题可以用以下的零假设和备择假设来描述：

\[ H_0:{ }_T b_1 \text { and }{ }_T b_2=0 \] \[ H_a:{ }_T b_1 \text { or }{ }_T b_2 \text { or both } \neq 0 \]

通过将多重相关系数的平方差值转换成F比，并找到对应于这个F值的p值。

\[ F\left(m, d f_{\text {residual }_2}\right)=\frac{d f_{\text {residual }_2}\left(R_2^2-R_1^2\right)}{m\left(1-R_2^2\right)}=139.632, p<.001 \]

*解读F值

拒绝零假设角度：控制政治意识形态（X3）、性别（X4）和年龄（X5）为常量后，对气候变化的情绪反应（X1和X2）与对政府行动的支持度（Y）有关
模型拟合角度：该检验也可以解释为检验模型2中包含m个其余变量的这个模型是否优于排除它们的模塑(模型1)。在这个例子中，我们可以得出结论，包括积极情绪和负面情绪的模型（5个预测变量的模型）比不包括这两个变量的模型（3个预测变量的模型）拟合度更好(即，对Y的估计更为准确)

## 
## Model Summary
## 
## ─────────────────────────────────────
##              (1) Y        (2) Y      
## ─────────────────────────────────────
## (Intercept)    6.169 ***    4.064 ***
##               (0.166)      (0.205)   
## X3            -0.371 ***   -0.218 ***
##               (0.029)      (0.027)   
## X4            -0.118       -0.010    
##               (0.088)      (0.077)   
## X5            -0.000       -0.001    
##               (0.003)      (0.002)   
## X1                          0.441 ***
##                            (0.026)   
## X2                         -0.027    
##                            (0.028)   
## ─────────────────────────────────────
## R^2            0.177        0.388    
## Adj. R^2       0.174        0.385    
## Num. obs.    815          815        
## ─────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.

##  Significance test for multiple predictors (X1 and X2) based on F-value
## ──────────────────────────────────────────
##        Model DF_Residual R_Squared F_Value
## ──────────────────────────────────────────
## 1  Model 3Xs     811.000     0.177        
## 2  Model 5Xs     809.000     0.388 139.822
## ──────────────────────────────────────────

SPSS等回归模型常做：拟合模型与空模型（仅含截距项不含有任何预测变量）比较，在图2.6中，F(5, 809)=102.717，p < 0.0005，所以可以拒绝零假设。

1.7 多分类前因变量

类别大于2的分类变量：为了在回归模型中包含一个拥有g组的多分类前因变量，它必须用多种编码系统中的一种来表示g-1个变量。一个通用的组编码系统是指示符编码（indicator coding），也称为虚拟编码（dummy coding）。本例中类别为3.

1.7.0.0.1 表2.1 g个类别的指示符

## ─────────────────────
##        X6    d1    d2
## ─────────────────────
## 1   2.000 1.000 0.000
## 2   2.000 1.000 0.000
## 3   2.000 1.000 0.000
## 4   1.000 0.000 0.000
## 5   1.000 0.000 0.000
## 6   3.000 0.000 1.000
## 7   1.000 0.000 0.000
## 8   1.000 0.000 0.000
## 9   2.000 1.000 0.000
## 10  2.000 1.000 0.000
## ─────────────────────

在GLBWARM数据中，PARTYID的变量，用于编码一个人是否被定义为民主党（d1）、独立党（d2）或共和党（d3）。以下这个编码构建了两个指示符，一个是民主党，一个是共和党，而独立党（d2）作为参照类别，所以估计模型为：

\[ \hat{Y}=b_0+b_1 D_1+b_2 D_2 \]

1.7.0.0.2 图8 民主党（d1）、独立党（d2）和共和党人（d3）在他们对减轻全球气候变化影响的政府行动支持（Y）的多分类前因变量回归分析R Studio输出结果

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(2, 812) = 61.24, p = 2e-25 ***
## R² = 0.13107 (Adjusted R² = 0.12893)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ────────────────────────────────────────────────────────────────────
##                   b    S.E.       t     p        [95% CI of b]   VIF
## ────────────────────────────────────────────────────────────────────
## (Intercept)   5.064 (0.067)  75.569 <.001 *** [ 4.933,  5.196]      
## d1           -0.459 (0.114)  -4.042 <.001 *** [-0.682, -0.236] 1.173
## d2           -1.139 (0.103) -11.065 <.001 *** [-1.341, -0.937] 1.173
## ────────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ────────────────────────────────────────────────────────────────────────
##          β    S.E.       t     p        [95% CI of β] r(partial) r(part)
## ────────────────────────────────────────────────────────────────────────
## d1  -0.143 (0.035)  -4.042 <.001 *** [-0.213, -0.074]     -0.140  -0.132
## d2  -0.392 (0.035) -11.065 <.001 *** [-0.462, -0.323]     -0.362  -0.362
## ────────────────────────────────────────────────────────────────────────

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(2, 812) = 61.24, p = 2e-25 ***
## R² = 0.13107 (Adjusted R² = 0.12893)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ──────────────────────────────────────────────────────────────────
##                   b    S.E.       t     p        [95% CI of b] VIF
## ──────────────────────────────────────────────────────────────────
## (Intercept)   5.064 (0.067)  75.569 <.001 *** [ 4.933,  5.196]    
## factor(X6)2  -0.459 (0.114)  -4.042 <.001 *** [-0.682, -0.236]    
## factor(X6)3  -1.139 (0.103) -11.065 <.001 *** [-1.341, -0.937]    
## ──────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ─────────────────────────────────────────────────────────────────────────────────
##                   β    S.E.       t     p        [95% CI of β] r(partial) r(part)
## ─────────────────────────────────────────────────────────────────────────────────
## factor(X6)2  -0.143 (0.035)  -4.042 <.001 *** [-0.213, -0.074]     -0.140  -0.132
## factor(X6)3  -0.392 (0.035) -11.065 <.001 *** [-0.462, -0.323]     -0.362  -0.362
## ─────────────────────────────────────────────────────────────────────────────────

回归方程的结果是：

\[ \hat{Y}=4.605+0.459 D_1-0.680 D_2 \]

1.7.0.0.3 *解读结果：

截距：在该方程中，b₀=4.605对应于参照组的Y，在该示例中为独立党人。我们能够拒绝零假设，并得出结论：民主党、独立党和共和党人在他们对减轻全球气候变化影响的政府行动支持度平均值上存在差异。
回归系数
- D1的回归系数为b1=0.459,这是民主党人和独立党人在对政府行动支持度方面的平均差异(5.064-4.605=0.459)。
- D2的回归系数b2= -0.680,是共和党人和独立党人在政府行动支持度上的平均差异(3.925-4.605=-0.680)。
- 拟合指标：对于该模型，R2=0.131,模型拟合度检验(参见第2.6节)得到F(2,812)=61.243,p<0.0005。这相当于来自三个均值的单因素方差分析得到的F比。
可得结论：民主党、独立党和共和党人在他们对减轻全球气候变化影响的政府行动支持度平均值上存在差异。

1.8 解释和统计推断的假设

统计模型是我们用来辅助理解我们的数据的工具，它们给予我们的仅仅是接近于现实的见解。问题不在于我们是否违背假设，而是当我们解释结果并对其进行推断时，这么做有多大程度会让我们误入歧途。

线性

当使用OLS回归模型来模拟您所感兴趣的结果变量Y时，您必须假设模型中的变量之间的关系本质上是线性（linear）的，或者至少近似线性。线性假设很重要，因为如果违背了，就会危及回归系数的解释意义。

残差正态

残差正态（normality）假设表明，以Y(估计值)为条件的结果变量Y的估计值的误差呈正态分布。
请注意，正态假设与Y自身的分布或回归模型中Y的赁测值的分布尤关，回归分析不考虑这些分布的形状。
除非样本量相当小，否则只有最严重的违反正态假设的回归分析才会大大影响统计推断的有效性。
在某些情况下，非正态可能影响抽样方差，从而降低假设检验的功效。

方差齐性

方差齐性（homoscedasticity）的假设，它表示Y的估计误差是以Y(估计值)为条件同等变化的。当不满足这个条件时，估计误差被认为是方差异质性的。
当不满足这个条件时，估计误差被认为是方差异质性的。方差异质性会影响推断的有效性，降低假设检验的统计功效，影响回归系数置信区间的准确性。
不过，轻微地违反方差齐性假设不会有太大影响。
方差异质性会通过其对回归系数的标准误差的影响从而对推断产生影响，因此，如果该假设违背，可使用在回归分析中不必假定方差齐性的推断方法，例如异方差稳健性和协方差估计器。

独立性

OLS回归也假定估计误差在统计学上是独立的（independent）。如果估计误差是独立的，这意味着对所有成对（i，j）的观测值，个案i中Y的估计误差的信息不会被用于估计个案j的Y估计值的误差。
像方差异质性一样，非独立性影响到回归系数标准误差估计的准确性，因为OLS标准误差估计最假设估计误差是独立的。

回答”何时”(when)或”对谁”(whom)的问题属于调节作用分析的范畴，关于“如何”这一类的问题才属于中介作用的范畴，这也是本章的重点。

1.9 总结

RrMp2.3 Main effect with continous X: Main.conX

RrMp2.5 Main effect with binary X (X=0/1): Main.X01

RrMp2.6 Regression with multipe Xs (both raw and standerdized results and 95%CI): Main.5Xs

2 调节分析的基本原理

2.1 概况

## [1] "id" "X"  "C1" "Y"  "W"

## [1] "Y"  "C1" "X"  "C2" "W2" "W1" "C3"

一些社会现象，可能对于某一类型的人具有正面影响，而对另一类型的人具有负面影响；或者对于某一种刺激来说没有影响，而对另一种刺激却有。

例如性别：一个效应可能对女性有较大影响，但对男性的影响却微乎其微
模型化：当研究者试图确定某一变量是否影响或与某个变量对另一变量的影响的大小有关时，调节分析是恰当的分析方法。

定义调节：如果变量W可以决定或预测自变量X对因变量Y的影响的大小、符号或强度，那么可以说自变量X对某个因变量Y的影响受到变量W的调节。在这种情况下，W被称为X对Y的影响的调节变量(moderator),或者说W和X的交互(interact)影响Y。

2.1.0.0.1 图7.1 筒单调节模型概念

调节作用与中介作用的区别

与中介分析不同：调节分析的概念模型与它相对应的统计图有很大区别，它表示这样一个模型是如何以方程形式建立起来的，与这个概念模型相对应的统计图需要三个前因变量，而不是两个，并且变量W将会是其中的一个。

调节作用在很多社会科学理论中的重要作用

The Elaboration Likelihood Model of Persuasion (Petty & Cacioppo,1986) 该理论试图解释不同的说服路径可能对个体的态度改变产生长期的、短期的或是根本没有影响.
“涵化理论”(Cultivation theory) 是另一个把调节作用作为核心的模型
- 内容：根据涵化理论，频纂接触电视，人们就会以电视中描绘的那样来感知现实世界
- 例如，有人认为，电视新闻和大众电视所描绘的世界是一个敌对和危险的地方。因此，根据涵化理论，一个人越多地接触电视媒体中所描绘的敌对和危险世界，他就越认为现实世界也是一样的残忍和敌对。电视观看频率(W)调节某些个体差异(X),如性别和种族，对个体各种态度和看法的影响(Y),如人们所感知到的现实世界的危险和暴力程度.

2.2 条件效应和无条件效应

2.2.1 无条件的限制

一个多元回归模型，以两个前因变量X和W估计因变量Y。表 7.1给出了X和W不同组合情况下的$\hat{Y}$值 \[Y=i_Y+b_1X+b_2W+e_Y \tag{7.1}\]

2.2.1.0.1 表7.1 用X和W作为前因变量的两个模型生成的Y的拟含值

## ────────────────────────────────────────────────────────
##          X     W Y = 4 + 1X + 2W Y = 4 + 1X + 2W + 1.5XW
## ────────────────────────────────────────────────────────
## 1   -1.000 0.000           3.000                   3.000
## 2    0.000 0.000           4.000                   4.000
## 3    1.000 0.000           5.000                   5.000
## 4    2.000 0.000           6.000                   6.000
## 5   -1.000 1.000           5.000                   3.500
## 6    0.000 1.000           6.000                   6.000
## 7    1.000 1.000           7.000                   8.500
## 8    2.000 1.000           8.000                  11.000
## 9   -1.000 2.000           7.000                   4.000
## 10   0.000 2.000           8.000                   8.000
## 11   1.000 2.000           9.000                  12.000
## 12   2.000 2.000          10.000                  16.000
## ────────────────────────────────────────────────────────

## ────────────────────────────────────────────────────────
##          X     W Y = 4 + 1X + 2W Y = 4 + 1X + 2W + 1.5XW
## ────────────────────────────────────────────────────────
## 1   -1.000 0.000           3.000                   3.000
## 2   -1.000 1.000           5.000                   3.500
## 3   -1.000 2.000           7.000                   4.000
## 4    0.000 0.000           4.000                   4.000
## 5    0.000 1.000           6.000                   6.000
## 6    0.000 2.000           8.000                   8.000
## 7    1.000 0.000           5.000                   5.000
## 8    1.000 1.000           7.000                   8.500
## 9    1.000 2.000           9.000                  12.000
## 10   2.000 0.000           6.000                   6.000
## 11   2.000 1.000           8.000                  11.000
## 12   2.000 2.000          10.000                  16.000
## ────────────────────────────────────────────────────────

2.2.1.0.2 *公式解读

\[ b_1=[\hat{Y}\mid(X=x,W=w)]-[\hat{Y}\mid(X=x-1,W=w)] \]

\[ b_2=[\hat{Y}\mid(W=w,X=x)]-[\hat{Y}\mid(W=w-1,X=x)] \]

b1：X每增加1个单位对Y的影响并不依赖于W。无论W的值是多少，1个单位X的变化将会转化为$b_1$个单位Y的变化。1 个单位X的变化对的影响在W上是无条件的，在此意义上，它并不依赖于W。
b2：1个单位W的变化对Y的影响在X上是无条件的，它并不依于X。

结论：这种形式的回归模型不太适合用于检验调节作用。事实上，与调节作用的概念相反。如果X对Y的影响是受到这个模中其他变量的调节，这就意味着它的影响依赖于那个变量。

2.2.2 消除无条件的限制

解决这一限制：意味着X的影响依赖于W，即W取不同值的时候，X对Y的影响也不一样的。一般来说，这样一个模型可以写成： \[Y=i_y+f(W)X+b_2W+e_Y\]

2.2.2.0.1 图7.2 表7.1中两个模型的图形表示

f(W)：其中$f(W)$是$W$的任意函数。比如一个简单的函数$f(W)=b_1+b_3W$。W 的这个函数看起来像是一个简单线性回归模型，其中$b_1$是常数，$b_2$是W的回归系数，除了不是从$W$估计某个结果变量之外，它就是一个关于X对Y的影响的模型，将$f(W)=b_1+b_3W$带入方程

\[Y=i_y+(b_1+b_3W)X+b_2W+e_Y\] \[Y=i_y+b_1X+b_2W+b_3XW+e_Y \tag{7.2}\]

模型：其中$XW$是由$X$和$W$的乘积所构造的一个变量。图 7.1是对该模型的概念性描绘，图7.3是模型的统计图形式

2.2.2.0.2 图7.3 简单调节模型统计图

## Error in nodes$no: object of type 'closure' is not subsettable

具体例子：（为观察X和W的乘积作为前因变量时会产生什么样的影响）假设$i_y=4,b_1=1,b_2=2,b_3=1.5$,那么： \[ Y=4+1X+2W+1.5XW \] f(W)：表7.1显示了$x$和$W$的不同组合所产生的$\hat{Y}$值，图7.2中面板B直观地描绘了这个模型。 \[θ_{X\rightarrow Y}= b_1+ b_3W \tag{7.3}\]

解读：总的来说，方程7.2所呈现的模型中，1个单位$X$的变化引起的$\hat{Y}$变化可以通过如下函数来表达。其中$θ_{x\rightarrow y}$是$X$对$Y$的条件效应，它被定义为两个个案在X上相差1个单位时，它们的Y的估计值相差的数量。
实例：从表7.2可以看到，不同的$W$对应$θ_{x\rightarrow y}$的值。当 $W$增加1个单位时，两个个案在$X$上相差1.5个单位，将导致 $\hat{Y}$ 相差$b_3$个单位。

2.2.2.0.3 表7.2 模型Y=4+1X+2W+1.5XW中X的条件效应和W的条件效应

## ───────────────────────────────────
##    W b1+b3W f(W)|W  X b2+b3X f(X)|X
## ───────────────────────────────────
## 1  0 b1        1   -1 b2-b3     0.5
## 2  1 b1+b3     2.5 0  b2        2  
## 3  2 b1+2b3    4   1  b2+b3     3.5
## 4  3 b1+3b3    5.5 2  b2+2b3    5  
## ───────────────────────────────────

图7.2显著说明了限定X与Y的关系是无条件的模型和允许X与Y的影响依赖于W的模型之间的差异。

在面板A中，X对的影响被限定为独立于W，所以，连接X与的每条直线都平行（即斜率都相同）。从面板A对应的表7.1中的数据，可以看出b1和b2互不影响：
- b1与Y的变化：对于W=0，W=1，W=2，任意一种情况，1个单位X的变化将会转化为$b_1$个单位Y的变化。即这三种情况下，都是X增加/降低1，Y也增加/降低1
- b2与Y的变化：对于X=0，X=0，X=1，X=2，任意一种情况，1个单位W的变化将会转化为$b_2$个单位Y的变化。即这四种情况下，都是W增加/降低1，Y也增加/降低2
在面板B中，$X$对Y的影响依赖于$W$,它表现在不同的$W$值连接$X$与的直线的斜率不同，所以，这些直线不平行。
- b1与Y的变化：取决于W，W每增加一个单位，X对Y的影响就增加1.5(b3)个单位
  - b1与Y的变化相等的情况：当W=0，X变化1个单位，Y也变化1个单位，即b1+b3=1+0X1.5
  - Y的变化比b1多1.5（=b3W=1.5X1）倍：但当W=1，X变化1个单位，Y变化了2.5个单位，即b1+b3=1+1X1.5
  - Y的变化比b1多3（=b3W=1.5X2）倍：当W=2，X变化1个单位，Y变化了4个单位，即b1+b3W=1+2X1.5
  - Y的变化比b1多4.5（=b3W=1.5X3）倍：当W=3，X变化1个单位，Y变化了5.5个单位，即b1+b3W=1+3X1.5
- Y的变化与b2，情况与b1同理
- 面板A与B的对比：可以看出面板A中其实就是添加了b3=0的限制，即
  
  \[ Y=4+1X+2W+0XW=4+1X+2W \]
b3的解读
- b3反应依赖程度：在调节作用的概念图中，直线的不平行程度取决于$b_3$的值
- 具体实例：其中$b_3$是当$W$增加1个单位时，连接$X$与$\hat{Y}$直线的斜率变化。$ $ b_3$的绝对值越大，直线斜率就越从平行发散开来

2.2.3 调节的对称性

\[Y=i_y+(b_1+b_3W)X+b_2W+e_Y \tag{7.4}\] \[Y=i_y+θ_{X\rightarrow Y}X+b_2W+e_Y \tag{7.5}\]方程7.4和7.5很清楚了地反映了X对Y的影是如何依赖于W。但是，这个方程可以表示W对Y的影响受到X的调节： \[Y=i_y+b_1X+(b_2+b_3X)W+e_Y \tag{7.6}\] \[Y=i_y+b_1X+θ_{W\rightarrow Y}W+e_Y \tag{7.7}\] 其中$θ_{W\rightarrow Y}$是W对Y的条件效应即$b_2+b_3X$。

2.2.4 解释回归系数

$b_1$：方程7.3清晰地解释了b1的意义。假设W为0，那么方程7.3可以简化为f(W)=b1因此，b1是当W=0时，X对Y的条件效应。也就是说，b1量化了当W=0时，两个个案在X上相差1个单位，它们在Y上的差异。

统计解读：$b_1$是当W=0时，X对Y的条件效应 \[b_1=[\hat{Y}\mid(X=x;W=0)]-[\hat{Y}\mid(X=x-1;W=0)] \tag{7.9}\]

b2：当X=0时，f(X)=b2。因此，b2是当X=0时W对Y的条件作用。

统计解读：$b_2$是当X=0时，W对Y的条件效应 \[b_2=[\hat{Y}\mid(W=w;X=0)]-[\hat{Y}\mid(W=w-1;X=0)] \tag{7.10}\]
b2被误读为主效应：类似于b1，b2是一个条件作用，它量化了在X=0的条件下，W变化1个单位时Y值如何变化。它不应该被解释为在控制了X和XW,或者当W对Y的平均效应，或W的主效应。
正确解读：b2描述了当X=0时W与Y之间的关系。

$b_3$的解释：对于W的不同值，X对Y的条件效应值可以在表7.2中看到，W增加1个单位，X对Y的条件作用也变化$b_3$个单位。

当W被视为X与Y之间关系的调节变量时：那么$b_3$就表示当W变化1个单位时，两个在X上相差1个单位的个案，它们的Y的差异值。
当X被定义为W与Y之间关系的调节变量时：那么$b_3$就表示当X变化1个单位时，两个在W上相差1个单位的个案，在Y上的差异值。

\[b_3=<[\hat{Y}\mid(X=x;W=w)]-[\hat{Y}\mid(X=x-1;W=w)]>\\-<{[\hat{Y}\mid(X=x;W=w-1)]-[\hat{Y}\mid(X=x-1;W=w-1)]} >\tag{7.8}\]

注意

$b_1$与$b_2$的解释与当XW不作为前因变量的解释十分不同。
- 当 XW作为一个前因变量与X和W都在Y的模型中：那么$b_1$与$b_2$就是条件作用
- 但是如果在模型中XW不作为一个前因变量：那么$b_1$与$b_2$就是无条件的。
讨论调节作用时$b_3$的重要性
- 简单调节模型允许X对Y的影响是W的线性函数：然而，如果W不能线性地调节X的影响，关于$b_3$的t统计检验可最终确定X的影响是否真的取决于W，或者确定所获得的$b_3$是否只是因巧合而在研究者们所期望的范围内。
- 判断标准：研究者都同意需要$b_3$显著不为零的证据(通过假设检验或者置信间)来判定W可以作为X的影响的线性调节变量。如果证据不能支持该论断，一个更简洁的模型可以将X对Y的影响修正为在W上是无条件的。即：如果XW在模型中，$b_1$和$b_2$就是条件作用，但是并没有证据表明X的影响受W调节，$b_1$和$b_2$则作为偏效应而不是作为条件作用的估计值。

2.2.4.0.1 图7.4 模型Y=i+b1X+b2W+b3XW中的b1、b2和b3的可视化图；此图中，b1=1,b2=2,b3=1.5

## Error in UseMethod("ggplot_build"): no applicable method for 'ggplot_build' applied to an object of class "c('gg', 'ggplot', 'ggPredict')"

2.3 两个定量变量之间的调节效应应用举例

Y：参与者被问及他们是否支持联邦政府为减轻气候变化而采取的各种政策和行动。

X：负面情绪的任何影响都与模型中的其他变量无关。

W年龄：是一个17~87岁之间的连续变量

模型：我们想要知道年龄（W）和负面情绪（X）对支持政府行动（Y）的影响之间是否存在线性关系。控制变量（C）为政治意识形态、性别和积极情绪。图 8.4的面板A是这个模型的概念图，它显示了负面情绪是焦点预测变量X，年龄是调节变量W。

2.3.0.0.1 图8.4 关于年龄调节气候变化的负面情绪与支持政府行动之间关系的而具有协变量的模型和统计图

## Error in nodes$no: object of type 'closure' is not subsettable

该模型的线性回归方程式是： \[ Y=i_Y+b_1 X+b_2 W+b_3X W+b_4C_1+b_5C_2+b_6C_3+e_Y（8.4） \]

面板B：图7.5中的面板B显示了该模型的统计图，研究者们所感兴趣的是通过推断检验来估计$b_3$的值。

b3不显著：如果$b_3$的值不是显著地不为零(通过假设检验或者$Tb_3$的置信区间包含0),这就意味着X与Y之间的关系不依赖于W(至少不是线性地)。
$b_3$的值显著地不为零：那么我们可以得出结论，即X与Y之间的关系依赖于W。估计这个模型无须特殊的建模软件。简单地构造X和W的乘积项XW,并将它作为一个前因变量，和X、W一起纳人Y的OLS回归模型中。

总结：其中X是对全球气候变化的负面情绪，W是年龄，C1、C2、C3分别是积极情绪、政治意识形态和性别。如果$b_3$显著不为零，就证明负面情绪对政府行动支持度的影响受年龄调节。

2.3.1 基于原始值的调节分析

2.3.1.0.1 表8.2 控制积极情绪、意识形态和性别时，关于年龄调节全球气候变化的负面情绪反应与支持政府行动之间关系的回归分析结果

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(6, 808) = 90.08, p = 2e-86 ***
## R² = 0.40081 (Adjusted R² = 0.39636)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ────────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b]    VIF
## ────────────────────────────────────────────────────────────────────
## (Intercept)   5.174 (0.338) 15.287 <.001 *** [ 4.510,  5.838]       
## C1           -0.021 (0.028) -0.768  .443     [-0.076,  0.033]  1.029
## C2           -0.212 (0.027) -7.883 <.001 *** [-0.264, -0.159]  1.199
## C3           -0.011 (0.076) -0.147  .883     [-0.160,  0.138]  1.053
## X             0.120 (0.083)  1.449  .148     [-0.042,  0.282] 11.595
## W            -0.024 (0.006) -3.993 <.001 *** [-0.036, -0.012]  6.949
## X:W           0.006 (0.002)  4.104 <.001 *** [ 0.003,  0.009] 16.455
## ────────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ────────────────────────────────────────────────────────────────────────
##           β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ────────────────────────────────────────────────────────────────────────
## C1   -0.021 (0.028) -0.768  .443     [-0.075,  0.033]     -0.027  -0.021
## C2   -0.235 (0.030) -7.883 <.001 *** [-0.294, -0.177]     -0.267  -0.215
## C3   -0.004 (0.028) -0.147  .883     [-0.059,  0.051]     -0.005  -0.004
## X     0.134 (0.093)  1.449  .148     [-0.048,  0.316]      0.051   0.039
## W    -0.287 (0.072) -3.993 <.001 *** [-0.428, -0.146]     -0.139  -0.109
## X:W   0.453 (0.110)  4.104 <.001 *** [ 0.236,  0.670]      0.143   0.112
## ────────────────────────────────────────────────────────────────────────

\[ Y=5.174+0.120X-0.024W+0.006X W-0.021C_1-0.212C_2-0.011C_3 \]

b3：我们的关注点是年龄和负面情绪乘积项的回归系数，它为正并且是著的，$b_3$ =0.006, t(808)=4.104, p<0.001,而且解释了支持政府动中1.25%的方差。

2.3.1.0.2 图8.5 关于全球气候变化数据的简单调节分析的PROCESS输出

## 
## ****************** PART 1. Regression Model Summary ******************
## 
## PROCESS Model ID : 1
## Model Type : Simple Moderation
## -    Outcome (Y) : Y
## -  Predictor (X) : X
## -  Mediators (M) : -
## - Moderators (W) : W
## - Covariates (C) : C1, C2, C3
## -   HLM Clusters : -
## 
## Formula of Outcome:
## -    Y ~ C1 + C2 + C3 + X*W
## 
## CAUTION:
##   Fixed effect (coef.) of a predictor involved in an interaction
##   denotes its "simple effect/slope" at the other predictor = 0.
##   Only when all predictors in an interaction are mean-centered
##   can the fixed effect be interpreted as "main effect"!
##   
## Model Summary
## 
## ─────────────────────────────────────
##              (1) Y        (2) Y      
## ─────────────────────────────────────
## (Intercept)    4.016 ***    5.174 ***
##               (0.187)      (0.338)   
## C1            -0.027       -0.021    
##               (0.028)      (0.028)   
## C2            -0.221 ***   -0.212 ***
##               (0.027)      (0.027)   
## C3            -0.016       -0.011    
##               (0.076)      (0.076)   
## X              0.440 ***    0.120    
##               (0.026)      (0.083)   
## W                          -0.024 ***
##                            (0.006)   
## X:W                         0.006 ***
##                            (0.002)   
## ─────────────────────────────────────
## R^2            0.388        0.401    
## Adj. R^2       0.385        0.396    
## Num. obs.    815          815        
## ─────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
## 
## ************ PART 2. Mediation/Moderation Effect Estimate ************
## 
## Package Use : ‘interactions’ (v1.2.0)
## Effect Type : Simple Moderation (Model 1)
## Sample Size : 815
## Random Seed : -
## Simulations : -
## 
## Interaction Effect on "Y" (Y)
## ──────────────────────────────
##            F df1 df2     p    
## ──────────────────────────────
## X * W  16.84   1 808 <.001 ***
## ──────────────────────────────
## 
## Simple Slopes: "X" (X) ==> "Y" (Y)
## ─────────────────────────────────────────────────────────────
##  "W"           Effect    S.E.      t     p           [95% CI]
## ─────────────────────────────────────────────────────────────
##  33.205 (- SD)  0.330 (0.038)  8.762 <.001 *** [0.256, 0.404]
##  49.536 (Mean)  0.433 (0.026) 16.507 <.001 *** [0.382, 0.485]
##  65.867 (+ SD)  0.537 (0.035) 15.298 <.001 *** [0.468, 0.605]
## ─────────────────────────────────────────────────────────────

调节模型：因此我们所感兴趣的是，干旱原因表述(X)对拒绝提供援助的理由强度的影响(Y)是否依赖于气候变化怀疑态度(W)。

理论模型的含义：为了检验X对Y的影响受到W的调节，另外一项允许X的效应是W的函数，纳入从X和W对Y的回归模型中。
对应的公式：这里，我们估计回归模型的系数，其中干早原因对拒绝援助的理由的影响允许随着气候变化怀疑态度呈线性变化，通过将X和W的乘积纳入X和W对Y的回归模型中作为一个前因变量： \[Y=i_Y+b_1X+b_2W+b_3XW+e_Y\]

2.4 探测交互效应

为何要可视化调节效应

辅助解读：一个具有两个自变量的乘积项的回归模型是数据的抽象数学表达，比没有乘积项的模型更难解释。
- b1和b2的解读困难：正如之前所描述的，X和W的系数是可能没有实质意义的条件效应，XW的系数解释为差异之间的差异，当没有其他更多的信息的时候，这种差异很难解释。
- b3的解读困难：虽然$b_3$的系数具有明确的数学意义，即使系数的符号与预计的方向一致，这并不意味着结果与研究者的预测一致。当试图理解一个具有前因变量所组成的乘积项的回归模型时描绘模型可以成为重要的解释性辅助手段。为了得到模型的直观呈现，建议使用回归模型从X和W的不同组合得出一系列Y的估计值，然后将绘制为X和W的函数。这可以通过使用您觉得方便的任何图形程序来完成。
精确说明：有人说一张图胜过说千言万语，但需要千言万语来使人相信。
- 就算有证据表明X对Y的影响受到W的调节，但这并不意味着X对Y的影响只对在W较高的人中才成立，而对在W较低的人却不成立。
- W取值的任意性：对于一个人所选择的W的任一值，估计出的X对Y的影响值都存在概率成分。
- 为了应对这种不确定性，通常在检验过交互效应之后，再增加一组额外的推断检验，以确定在调节变量的分布中，什么情况下X对Y的影响是显著的，什么情况下是不显著的。这个做法一般被称为”探测”交互作用，就像人们在杂货店摸一下鳄梨或者忙果以评估它的成熟度，是为了确定在调节变量的分布中，哪些情况下X和Y相关，哪些情况下不相关，以便更好地区分交互效应的实质性解释。

在本节，我将介绍探测交互作用的两种方法，一种较为常用，另一种不太常用，但是因计算机使其更容易实现，它也变得越来越受欢迎。

2.4.1 选点法

选点法(Pck-a-Point Approach)(Rogosa,1980;Bauer & Cuman,2005)：有时也称作简单斜率分析或焦点分析，它可能是目前探测交互效应最为流行的方法，并且在多重交互回归的许多讨论中也多有描述。在此过程中，涉及选择调节变量W的一个或多个值，计算当W等于这个或这些值时，X对Y条件作用$\theta_{X\rightarrow Y}$,然后进行推断检验或者产生一个置信区间。

SE：这么做的话对于选定的W值，需要得到X的条件作用的标准误估计值: \[se\theta_{X\rightarrow Y}=\sqrt{se_{b_{1}}^2+(2W)COVb_1b_3+W^2se_{b_{3}}^2} \tag{7.13}\]

其中$se_{b_{1}}^2$和$se_{b_{3}}^2$分别是$b_1$和$b_3$的标准误平方
W是调节变量的任一选定值
$COVb_1b_3$是重复采样中$b_1$和$b_3$的协方差：除了$b_1$和$b_3$的协方差所有值在OLS回归程序的标准输出中可得，$COVb_1b_3$是可选输出项W的特定值与其标准误之比$\theta_{X\rightarrow Y}$服从当取W值时$_T\theta_{X\rightarrow Y}=0$这零假设的($df_{residual}$)分布。可以从t值表中获取这个比率的p值，或者使用方程2.16,将$\theta_{X\rightarrow Y}$替换为$b$,将$se \theta_{X\rightarrow Y}$,誉换为$se\theta$,从而生成一个置倍区间。

计算机自动计算

不建议不用手工进行这些计算：因为出现错误的可能性非常大，除非您可以精确到小数点后许多位，并且您对做这些感到非常舒服且信心十足。
多个步骤自动化：如果使用计算机进行以下要介绍的回归中心化法，这种方法实现起可以非常轻易地做到高精确度。而且，如果您熟练掌握PROCESS的话，回归中心化都不必使用了，因为PROCESS中可以实现选点法。关于选点法手动计算实例可参考Aiken和West(1991)以及Cohen等(2003)。

两种选点法

+/-SD选点：正如在气候变化研究中，当W是一个定量变量，那么在探测交互作用时，一种常见策略是佔计当W等于其均值、均值之下一个标准差、均值之上一个标准差时X对Y的条件效应。这就允许您确定在那些处于调节变量的”相对较低”($\bar{W}-SD_W$)、“中等”($\bar{W}$)和”相对较高”($\bar{W}+SD_W$)值的人中，X是否与Y相关。
三分位选点：但是我建议如果您准备采用选点法，并且没有其他的方式来选择W值，那么采用W分布中的第16分位、50分位和84分位的值来对相对较低、中等和相对较高进行操作化。
- 推荐三分位法的原因：正如7.3节中讨论的，如果W偏度较大的话，均值的上下一个标准差可能会高于数据中的最大值或低于最小值，或是可能甚至超出变景的尺度范围。您不可能想去使用超过调节变量观测范围的值去探测交互效应。
- 三分位法的优势：但是无论W的分布形状如何，第16分位数和84分位数总是会在观测数据范围内，并且W分布的中位数(第50百分位数)一直是对于中心较为明智的描述，如果W是有偏的，均值可能就未必了。虽然使用百分位数有些奇怪(例如，为什么不使用第25分位、50分位和75分位这些比较好看的数字呢)，但是如果W是完全正态分布的话，那么第16分位、50分位和84分位就分别对应着均值减去1个标准差、均值和均值加上1个标准差。

如果您的模型中包含协变量：那么您在计算包含X和W的项所组成的$\hat{Y}$值时不能忽略协变量。

系数处理：在回归模型中，每一个协变量都会有一个回归系数。当计算$\hat{Y}$值进行绘图时，这些回归系数应该和它们所对应的均值一起使用。
例如，假设气候变化包含$C_1$和$C_2$这两个协变量。作为X和W的函数的Y将是那些在$C_1$和$C_2$取平均值的人的估计值。虽然看似奇怪，但是使用协变量的均值是可取的
- 二分变量的协变量：并且用两个任意数字编码。只需要使用这两个任意数值的均值。
- 协变量是具有g个类别的多分类变量：也可以这样处理。只需使用表示模型中的组别的$g-1$个代码中每个的均值。

选点法的缺陷：请记住，使用W分布的百分位数来表示调节变量的低、中和高水平是比较武断的。而且，这些只是针对具体样本的操作化。如果他/她的样本在$W$的平均水平都较低，那么您称之为低的调节变量，可能在他们那里称之为高。当然，如果您像别的研究者一样使用均值减去一个标准差，均值和均值加上一个标准差，这样做也是对的。如果您使用的调节变量是您所在的领域内所广泛使用的变量，并且对低、中、高的定义存在既有规则达成了一致看法，那么使用这些值而不是选择调节变量在特定样本中的分布的值可能会更合乎情理。

2.4.1.1 本例中基于选点法的调节图

使用第7.3节中描述的相同的过程可以生成交互效应的直观图形：W是一个连续变量，因此使用了W分布的第16分位数、50分位数和84分位数。

但由于该模型包含协变量，因此需要额外的步骤

将X和W的组合纳入交互效应图中：您选择任何值都没关系，只要它们在数据范围内。如果您打算使用选点法去探测交互效应，最好是选择对应于您将要正式估计的X的条件效应的那个W值。
协变量的处理：使用最佳拟合回归模型用X和您所选定的W值的组合生成值。但是，因为这些模型包含三个协变量，它们也要设定具体的值。虽然您可以选择使用任何值和X及W一起代入模型，一般的做法是使用协变量的均值。
- 在此例中，C1、C2和C3的平均值分别为3.132、4.083和0.488。因此，当协变量的值以均值代入时，Y的方程是： \[ \hat{Y}=5.174+0.120X-0.024W+0.006XW-0.021(3.132)-0.212(4.083)-0.011(0.488) \] 该方程可以简化为： \[ \hat{Y}=4.237+0.120X-0.024W+0.006XW \]
- 性别（SEX）作为二分的协变量的样本均值：如果二分变量被编码为0和1,那么均值就是编码为1的组内的个案所占的比例。但是无论组别是如何编码的，使用均值都能起作用，即使这些均值本身没有意义

画图工具介绍

SPSS的PROCESS免去了这个过程的很多麻烦。在使用plot选项时，PROCESS会将所有协变量设置为样本均值，然后生成一个焦点预测变量和调节变量不同组合时的Y的估计值的图表。这个图表中的结果可以导人您所喜欢的图形程序中，以生成图表。S PSS版本的PROCESS甚至可以编写出必要的代码，然后您可以将PROCESS的输出结果剪切并粘贴到语法窗口，然后执行命令生成图表。
- SPSS的PROCESS宏可以帮助您编写一个SPSS序，该程序可以从输出结果中剪切，然后粘贴到语法窗口执行运算。您以在PROCESS命令中设定plot=1,诸求PROCESS生成绘图。这样做可得到图7.6底部的结果
- 散点图：当您执行此SPSS代码时，其中包含六个点(X和W的每个组合对应1个点),两个条件组的颜色不同。您可以在SPSS中对此进行编辑，以生成图7.7那样，大多数是在SPSS中生成的，然后将其导入到更精细的图形编辑程序中进行微调。
SAS版本中的PROCESS具有类似的功能，但它不会编写生成图形的整个程序。相反，它仅可以为您生成表7.5中的数据，然后围绕生成的数据编写一个程序。
R是一种统计运算平台，因为它具有出色的绘图能力，近年来大受迎。以的R程序可以使用刚才述的程序中产生的数据，来绘制干旱灾害原因表述和气候变化怀疑态度间的交互作用图。如果对R稍有了解的话，该程序可以稍微改写以改变线条的颜色、直线的样式等。

2.4.1.1.1 图8.6 年龄(W)调节全球气候变化(X)的负面情绪与支持政府行为(Y)之间关系的示意图

2.4.1.1.2 *调节图解读

总体：图8.6可以看出，无论年龄，全球气候变化的负面情绪对支持政府减缓气候变化行动的景响都是正向的。
高组：但是，在那些年纪较大的人中，负面情绪和支持距府行为的直线的斜率更陡一些。也就是说，负面情绪的影响在年龄相对较大(在这个图中，70岁)的群体中比年龄相对较小(这里是30岁)的人中要大。
斜率角度的解读：图8.6中直线的斜率是当W取任意值时$\theta_{X \rightarrow Y}$的值。X 的条件效应有的被称为”简单斜率”，它可以被正式量化，并且使用选点法进行推断检验正如第7章中所描述的，回归模型是： \[ Y=i_Y+b_1 X+b_2 W+b_3X W+b_4C_1+b_5C_2+b_6C_3+e_Y \]

或者 \[ Y=i_Y+\theta_{X \rightarrow Y} X+b_2 W+b_4C_1+b_5C_2+b_6C_3+e_Y \]其中$\theta_{X \rightarrow Y}=b_1+b_3 W$。从模型的回归系数来看，$\theta_{X \rightarrow Y}=0.120 + 0.006W$。代入不同的W值,可以得到X在那些W值上的条件效应。无论选择什么值，一旦为这些值生成$\theta_{X \rightarrow Y}$,使用方程7.3就可以得到标准差，以及可以基于 $t\left(d f_{\text {residual }}\right)$分布计算p值。

2.4.2 詹森-内曼技术

选点随意性：选点法存在一个重大的问题，它要求通过选样W值来估计X对Y的条件作用。不同的选择可能会导致不同的结论，而这些选择常常是比较随意的。

惯例做法：选择均值，均值加减1个标准差，或者可能选择使用分布的各种百分位数来表示调节变量的低、中、高水平，都完全是随意的。虽然这种依据惯例选择W值的做法在探测交互作用的书籍和期刊文献中广泛讨论及推荐(例如，Aiken & West,1991;Cohen et al.,2003),但这并未使这些值的随意性有所减少。
缺点：正如之前所讨论的，这种指定是针对具体样本的。一个样本中相对较低的值可能在另一个样本中是中等或相对较高的值，这就可能会导致文献中关于同一主题的研究出现虚假的不一致。

JN图克服选点随意性：您可以通过使用詹森-内曼技术(The Johnson-Ncyman Technique)解决选择的W值的随意性，这种方法也被Spiller等(2013)称为探照灯分析(floodlight analysis)。

来源：最初是发明来解决当在协方差分析中回归假设的方差齐性违背时，检验两组之间的均值差异(Johnson & Neyman,1936;Johnaon & Fey,1950;Rogosa,1980)。
发展：随后出Bauer和Curranto 将其扩展到更为广泛的回归模型。它逐渐流行起来。詹森-内曼技术探测交互效应的应用实例可以参见Beach等(2012);Coronel和Federmeier(2016);Keng等(2016);Prinzie等(2012);Simons等(2012);Waldet等(2014)。

JN的原理

使用前提：詹森-内曼技术，仅当W是连续变量的时候才可以使用
本质：实质上是选点法的反向应用。
- 使用选点法，可以计算在已知W值的情况下：X对Y的条件效应与它的标准误的比值。使用t分布，可以得到这个比值的p值，然后基于p值进行推断。无须得到既定t值的p值
- 詹森-内曼技术可推导出W值：这样一来条件效应及其标准误的比值正好等于$t_{crit}$,即与$p=a$相关联的$t$的临界值，其中a是为推断选择的显著性水平。方程如下： \[t_{crit}=\frac{\theta_{X\rightarrow Y}\mid{W}}{se_{\theta_{X\rightarrow Y}\mid{W}}}\] 或者，在$\hat{Y}=i_y+b_1X+b_2W+b_3XW$的模型中： \[t_{crit}=\frac{b_1+b_3W}{\sqrt{se_{b_{1}}^2+(2W)COVb_1b_3+W^2se_{b_{3}}^2}}\] 詹森-内曼技术可以得到当W被分离出来时二次方程的根,该方程式的根将是条件效应与其标准误之比正好为$t_crit$的W值，也就是p=a。具体的计算过程参见Bauer和Curran(2005)或Hayes和Matthes(2009)。

本例中的JN图

2.4.2.0.1 图8.7 关于全球气候变化的负面情绪(X)对政府行为支持度的条件效应是年龄(W)的函数

2.4.2.0.2 *JN图解读

黑色实线：图8.7会使上述解释更加清楚。在该图中，黑色实线是X的条件效应$\theta_{X \rightarrow Y}$,它被定义为函数$b_1+b_3 W$,或在此分析中为0.120+0.006W。
虚线：$\theta_{X \rightarrow Y} \mid W$的95%置信区间的上限和下限(使用方程7.13中估计的标准误，这里大约是$\theta_{X \rightarrow Y}$加减两个标准误估计值)。
与图 7.9的对比来解读图8.7：图7.9中，对于调节变量的某些值，置信区间包含0而另外一些则没有。而图8.7中，置信区间却总是高于0。换句话说，当您选择任意年龄值时，负面情绪的条件效应的置信区间在所有年龄值上都大于0，所以负面情绪的条件效应是显著为正的。因此，X的显著区域即是W的整个分布。

JN图的三种可能性：二次方程包含两个根，意味着詹森-内曼技术会产生2个W的解，我在下面的分析中使用$JN_{w_1}$和$JN_{w_2}$来讨论,并且$JN_{w_1}$<$JN_{w_2}$。W 的这些值將W的连续轴划分为许多点，在显著性水平为a的条件下，正是在这条轴上，X对Y的条件作用在显著与不显著之间转换。因此，通过这种方式可以确定X对Y影响的”显著区域”。在实践中，通常这些值中的一个或两个可能在W的测量范围之外，或者在虚数域内。这樣的$JN_{w_1}$和$JN_{w_2}$值应该被忽略，因为他们并不存在。考虑到这个告诫，当使用詹森-内曼技术，这里会出现三种可能的结果。

第一个可能的结果是，詹森-内曼技术会产生调节变量测度内的一个解，称这个值为$JN_{W_1}$。当产生这个单一值时，就意味著，当为$W\geq{JN_{W_1}}$或当$W\leq{JN_{W_1}}$时，而不是同时在两个区间上，X对Y的条件作用在α水平上是显著的。这就是当$W\geq{JN_{W_1}}$或$W\leq{JN_{W_1}}$当作X对Y的条件作用的显著性区域。
第二个可能的结果是，管森-内曼技术产生了在调节变量的测量范围内的两个解。当这种情況发生时，X对Y的条件作用的显著区域是$JN_{W_1}\leq{W}\leq{JN_{W_2}}$,或者是${W}\leq{JN_{W_1}}$和$W\geq{JN_{W_2}}$。前者意味着当W在$W在{JN_{W_1}}$和${JN_{W_1}}$之间，X对Y的条件作用是显著的。后者意味着当${W}\leq{JN_{W_1}}$时，以及当${W}\geq{JN_{W_2}}$,X对Y的条件作用是显著的。
最后一种可能是在调节变量取值范用内没有解。这意味着可能出现以下两种解释之一
- 一种解释是，X对Y的条件作用在调节变量的整个范围内是显著的，这意味着在W的连续轴上不存在条件作用在显著与不显著之间转换的点
- 第二种解释是，在观察到的调节变量的分布中，X对Y的条件作用并不显著，这也意味不存在某些点可以使得条件作用在显着与不显著之间转换。在前一种情况下，X着对Y的条件作用在整个W测量范围区域内都显著；在后面一种情况下，不存在显著区域。

JN图的总结：

JN图的优势：相对于更传统的图8.6来说，图8.7所示的调节效应的图形描绘是一个方便的选择。图 8.7不仅提供了您所选择的调节变量任意值所对应$\theta_{X \rightarrow Y}$的点估计值，还以置信区间的形式为您所选择的值提供推断检验，从而比图8.6传达更多的信息
与调节图一致的结论
- 根据使用詹森-内曼技术的PROCESS输出结果：在这些数据中，年龄分布中并没有点使得负面情绪对政府行动支持度的条件效应在统计显著与不显著之间转换(显著水平α=0.05)。
- 结论：对于数据中的任何年龄值，负面情绪的条件效应都是显著正向的。S PSS的PROCESS输出结果，它告诉您并没有识别出转换区域。

2.4.3 检验与探测调节效应之间的差异

检验差异：探测调节效应涉及确定当W取特定值的时候，X对Y的条件效应是否与0有显著差异(如果使用选点法)。或者探测在W的分布中，哪里可以实现X对y的条件作用显著与不显著的过渡(如果使用詹森-内曼技术)。

本质：詹森-内曼技术相比选点法来说可以提供更多的信息，但是它们分析的基本目标是一样的，即W分布中的哪个区域X对Y产生影响，哪个区城X对Y没有影响。

选点法：正如Aiken和West(1991)所讨论的那样，结果证明，检验线性调节模型中X对Y的影响取决于W，等同于在检验模型中X对Y的任意两个效应值是否有差异，无论$W_{w_1}$和$W_{w_2}$取何值。在 $W_{w_1}$和$W_{w_2}$两种条件下X的两个条件效应值的差异是： \[(b_1+b_3w_2)-(b_1+b_3w_1)= b_3(w_2-w_1)\]

标准误差是： \[se_{b_3}(w_2-w_1)\]
效应差异值与标准误之比是： \[\frac{b_3(w_2-w_1)}{se_{b_3}(w_2-w_1)}\]
与检验b3的显著性一样：因此检验X的两个条件效应没有差异的零假设与检验非线性调节零假设的p值是相等的。没有必要检验X的两个条件效应之间的差异。和W的交互作用表明模型所得到的任何两个条件效应都是有显著差异的。

2.5 中心化：变量范围及对$b_1$和$b_2$的解释

变量范围及对回归系数的可解释性的影响：正如已经讨论过的，对$b_1$和$b_2$的解释要务必小心，并且要考虑到X和W的取值范围，因为如果超出变量的范围，这些系数和它们的显著性检可能没有实质性意义。但是，通常可以在分析之前重新对X及(或)进行范围设置，以使得$b_1$,和$b_2$可以被解释。

中心化：一个方便的转化就是变量中心化(centering)，将数据中变量的每一值都减去一个常数。如果在构造X和W的乘积项之前将它们中心化，那$b_1$和$b_2$仍然表示条件作用。

常规操作：如果一个模型中包含X和W的乘积项作为前因变量，那么需要将X和W进行均值中心化。

数学上
- 传统认为错误：$Y=i_Y+b_1X+b_2W+b_3XW+e_Y$
- 传统认为正确： \[Y=i_Y+b_1(X-\bar{X})+b_2(X-\bar{W})+b_3(X-\bar{X})(W-\bar{W})+e_Y\] 也写做：\[Y=i_Y+b_1X'+b_2W'+b_3X'W'+e_Y\]其中$X'=X-\bar{X}$,$W'=W-\bar{W}$，一个有着均值中心化的前因变量和调节变量的回归模型可以被看作一个普通的调节模型，但是需要在计算X和W的乘积之前从X和W减去样本均值。
代码上：
- 无中心化估计Model的R代码是：Model1. Original Data

## 
## ****************** PART 1. Regression Model Summary ******************
## 
## PROCESS Model ID : 1
## Model Type : Simple Moderation
## -    Outcome (Y) : Y
## -  Predictor (X) : X
## -  Mediators (M) : -
## - Moderators (W) : W2
## - Covariates (C) : -
## -   HLM Clusters : -
## 
## Formula of Outcome:
## -    Y ~ X*W2
## 
## CAUTION:
##   Fixed effect (coef.) of a predictor involved in an interaction
##   denotes its "simple effect/slope" at the other predictor = 0.
##   Only when all predictors in an interaction are mean-centered
##   can the fixed effect be interpreted as "main effect"!
##   
## Model Summary
## 
## ─────────────────────────────────────
##              (1) Y        (2) Y      
## ─────────────────────────────────────
## (Intercept)    2.757 ***    4.335 ***
##               (0.099)      (0.330)   
## X              0.514 ***    0.147    
##               (0.025)      (0.085)   
## W2                         -0.031 ***
##                            (0.006)   
## X:W2                        0.007 ***
##                            (0.002)   
## ─────────────────────────────────────
## R^2            0.334        0.354    
## Adj. R^2       0.333        0.352    
## Num. obs.    815          815        
## ─────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
## 
## ************ PART 2. Mediation/Moderation Effect Estimate ************
## 
## Package Use : ‘interactions’ (v1.2.0)
## Effect Type : Simple Moderation (Model 1)
## Sample Size : 815
## Random Seed : -
## Simulations : -
## 
## Interaction Effect on "Y" (Y)
## ───────────────────────────────
##             F df1 df2     p    
## ───────────────────────────────
## X * W2  20.03   1 811 <.001 ***
## ───────────────────────────────
## 
## Simple Slopes: "X" (X) ==> "Y" (Y)
## ─────────────────────────────────────────────────────────────
##  "W2"          Effect    S.E.      t     p           [95% CI]
## ─────────────────────────────────────────────────────────────
##  33.205 (- SD)  0.384 (0.038) 10.132 <.001 *** [0.310, 0.458]
##  49.536 (Mean)  0.501 (0.025) 19.810 <.001 *** [0.451, 0.550]
##  65.867 (+ SD)  0.617 (0.035) 17.846 <.001 *** [0.549, 0.685]
## ─────────────────────────────────────────────────────────────

- 中心化估计Mode2的R代码是：Model2. X and W Mean-Centered

## 
## ****************** PART 1. Regression Model Summary ******************
## 
## PROCESS Model ID : 1
## Model Type : Simple Moderation
## -    Outcome (Y) : Y
## -  Predictor (X) : X
## -  Mediators (M) : -
## - Moderators (W) : W2
## - Covariates (C) : -
## -   HLM Clusters : -
## 
## All numeric predictors have been grand-mean centered.
## (For details, please see the help page of PROCESS.)
## 
## Formula of Outcome:
## -    Y ~ X*W2
## 
## CAUTION:
##   Fixed effect (coef.) of a predictor involved in an interaction
##   denotes its "simple effect/slope" at the other predictor = 0.
##   Only when all predictors in an interaction are mean-centered
##   can the fixed effect be interpreted as "main effect"!
##   
## Model Summary
## 
## ─────────────────────────────────────
##              (1) Y        (2) Y      
## ─────────────────────────────────────
## (Intercept)    4.587 ***    4.597 ***
##               (0.039)      (0.038)   
## X              0.514 ***    0.501 ***
##               (0.025)      (0.025)   
## W2                         -0.005 *  
##                            (0.002)   
## X:W2                        0.007 ***
##                            (0.002)   
## ─────────────────────────────────────
## R^2            0.334        0.354    
## Adj. R^2       0.333        0.352    
## Num. obs.    815          815        
## ─────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
## 
## ************ PART 2. Mediation/Moderation Effect Estimate ************
## 
## Package Use : ‘interactions’ (v1.2.0)
## Effect Type : Simple Moderation (Model 1)
## Sample Size : 815
## Random Seed : -
## Simulations : -
## 
## Interaction Effect on "Y" (Y)
## ───────────────────────────────
##             F df1 df2     p    
## ───────────────────────────────
## X * W2  20.03   1 811 <.001 ***
## ───────────────────────────────
## 
## Simple Slopes: "X" (X) ==> "Y" (Y)
## ─────────────────────────────────────────────────────────────
##  "W2"          Effect    S.E.      t     p           [95% CI]
## ─────────────────────────────────────────────────────────────
##  33.205 (- SD)  0.384 (0.038) 10.132 <.001 *** [0.310, 0.458]
##  49.536 (Mean)  0.501 (0.025) 19.810 <.001 *** [0.451, 0.550]
##  65.867 (+ SD)  0.617 (0.035) 17.846 <.001 *** [0.549, 0.685]
## ─────────────────────────────────────────────────────────────

## 
## Model Summary
## 
## ─────────────────────────────────────────────
##              M1. No center  M2. Mean-Centered
## ─────────────────────────────────────────────
## (Intercept)    4.335 ***      4.597 ***      
##               (0.330)        (0.038)         
## X              0.147          0.501 ***      
##               (0.085)        (0.025)         
## W2            -0.031 ***     -0.005 *        
##               (0.006)        (0.002)         
## X:W2           0.007 ***      0.007 ***      
##               (0.002)        (0.002)         
## ─────────────────────────────────────────────
## R^2            0.354          0.354          
## Adj. R^2       0.352          0.352          
## Num. obs.    815            815              
## ─────────────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.

2.5.0.0.1 *结果对比解读

相同点：从估计结果可以看到，模型2和模型1存在差异也有一些相似之处。它们有相同的$R^2$和$MS_{residual}$.。因此它们对数据的拟合都一样好。事 实上，它们产生的Y的估计值是完全一样的，因为它们都是数学上等价的模型。

解读结果：两个模型的区别在于是否对解释变量、调节变量进行中心化处理。实际上，两个结果的拟合优度($R^2$)、均方差($MS_{residual}$)相同。即使X、W各自系数及其标准误、t值、p值不同，但是XW交互项的系数相同。
结论：若考察对象聚焦于调节效应，那么是否进行中心化处理并不重要。

2.6 中心化变体：标准化数据

系数解读的前提：在估计形式为$\hat{Y}=i_Y+b_1X+ b_2W+b_3XW$的模型时，无论是否进行了中心化，$b_1$、$b_2$和$b_3$,都是以X、W 和Y的测量尺度解释(例如，以非标准化形式)。

两种常用的标准化的方法一对一错：标准化原始数据可以得到被解释为标准化回归系数的。但是其中一个一定不要用或解释。在本节中，我将讨论这两种变体

2.6.1 调节分析中标准化回归系数的估计和解释

在标准化的第一种变体：将X和W标准化后产生$Z_x$和$Z_w$,然后将这种标准化的X和W相乘得到$Z_xZ_w$。

$Z_Y=i_{Z_Y}+b_1Z_x+b_2Z_w+b_3Z_xZ_w+e_{Z_Y}$

谬误：和均值中心化一样，必须标准化X是一个谬论，而且该结果在软件中可直接获得

在R中（正确）：而且使用基于原始值的调节分析（i.e., Mo.raw），可以直接在R语言中获得标准化结果，其计算公式就是正确的变体1的公式

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(3, 811) = 148.07, p = 2e-76 ***
## R² = 0.35389 (Adjusted R² = 0.35150)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ────────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b]    VIF
## ────────────────────────────────────────────────────────────────────
## (Intercept)   4.335 (0.330) 13.154 <.001 *** [ 3.688,  4.981]       
## X             0.147 (0.085)  1.729  .084 .   [-0.020,  0.314] 11.473
## W2           -0.031 (0.006) -5.009 <.001 *** [-0.043, -0.019]  6.776
## X:W2          0.007 (0.002)  4.476 <.001 *** [ 0.004,  0.010] 16.357
## ────────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ─────────────────────────────────────────────────────────────────────────
##            β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ─────────────────────────────────────────────────────────────────────────
## X      0.165 (0.096)  1.729  .084 .   [-0.022,  0.353]      0.061   0.049
## W2    -0.368 (0.073) -5.009 <.001 *** [-0.512, -0.224]     -0.173  -0.141
## X:W2   0.511 (0.114)  4.476 <.001 *** [ 0.287,  0.735]      0.155   0.126
## ─────────────────────────────────────────────────────────────────────────

在SPSS中（错误）：不要SPSS的“标准化同归数”栏或类似的这种栏中寻找这些系数。它不是这些系数出现的地方，因为其计算公式就是错误的变体2的公式

例子：年龄(W)对气候变化的负面情绪反应(X)与支持政府减缓气候变化的行为(Y)之间关系的调节效应的R命令是：

Model 3. Standardized Variant 1

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(3, 811) = 148.07, p = 2e-76 ***
## R² = 0.35389 (Adjusted R² = 0.35150)
## 
## Unstandardized Coefficients:
## Outcome Variable: I(scale(Y))
## N = 815
## ────────────────────────────────────────────────────────────────────────────────
##                                b    S.E.      t     p        [95% CI of b]   VIF
## ────────────────────────────────────────────────────────────────────────────────
## (Intercept)                0.007 (0.028)  0.263  .792     [-0.048,  0.063]      
## I(scale(X))                0.562 (0.028) 19.810 <.001 *** [ 0.507,  0.618] 1.012
## I(scale(W2))              -0.063 (0.028) -2.237  .026 *   [-0.119, -0.008] 1.003
## I(scale(X)):I(scale(W2))   0.131 (0.029)  4.476 <.001 *** [ 0.074,  0.188] 1.009
## ────────────────────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: I(scale(Y))
## N = 815
## ─────────────────────────────────────────────────────────────────────────────────────────────
##                                β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ─────────────────────────────────────────────────────────────────────────────────────────────
## I(scale(X))                0.562 (0.028) 19.810 <.001 *** [ 0.507,  0.618]      0.571   0.559
## I(scale(W2))              -0.063 (0.028) -2.237  .026 *   [-0.119, -0.008]     -0.078  -0.063
## I(scale(X)):I(scale(W2))   0.127 (0.028)  4.476 <.001 *** [ 0.071,  0.183]      0.155   0.126
## ─────────────────────────────────────────────────────────────────────────────────────────────

2.6.1.0.1 *解读结果

b1：年龄（Zw=0）取均值(定义为数据中的样本均值)的情况下，两个在对气候变化的负面情绪反应（Zx）上相差1个标准差的个案，他们对政府行为的支持度（Zy）相差b1=0.562个标准差
b2：气候变化的负面情绪反应（Zx=0）取均值的情况下，两个在年龄（Zw）上相差1个标准差的个案，他们对政府行为的支持度（Zy）相差b2=-0.063个标准差(负号表示年龄越大的人表达越少的对政府行为的支持)。
b3：当年龄（Zw）增加1个标准差时，两个在负面情绪反应（Zx）上变化1个标准差的个案，他们在政府行为支持（Zy）上的变化的差值会增加0.131个标准差

2.6.1.0.2 表9.1 三种正确调节分析（原始值、均值中心化以及标准化）

	M1. No center				M2. Mean-Centered				M3. Z-Score
Predictors	Estimates	S.E.	t-value	p	Estimates	S.E.	t-value	p	Estimates	S.E.	t-value	p
(Intercept)	4.33	0.33	13.15	<0.001	4.60	0.04	119.59	<0.001	0.01	0.03	0.26	0.792
X	0.15	0.09	1.73	0.084	0.50	0.03	19.81	<0.001
W 2	-0.03	0.01	-5.01	<0.001	-0.01	0.00	-2.24	0.026
X:W2	0.01	0.00	4.48	<0.001	0.01	0.00	4.48	<0.001
I(scale(X))									0.56	0.03	19.81	<0.001
I(scale(W2))									-0.06	0.03	-2.24	0.026
I(scale(X)):I(scale(W2))									0.13	0.03	4.48	<0.001
Observations	815				815				815
R² / R² adjusted	0.354 / 0.352				0.354 / 0.352				0.354 / 0.352

2.6.1.0.3 *解读三种调节模型结果的异同

模型之间的相同点

上表中M1. No center和M2. Mean-Centered完全相同的地方是交乘项的所有值，包括：Estimate=0.01, SE=0.00, t=4.48, p=0.001
上表中M2. Mean-Centered和M3. Z-Score完全相同的地方是所有回归系数的t和p，包括
- b1：t=19.81, p=0.001
- b2：t=-2.24, p=0.026
所有三个模型都相同的
- b3：t=4.48, p=0.001。M 1、M2和M3的b3的t统计量和p值都一样。因此，标准化X和W对检验交互效应没有影响，这与检验调节假设必须进行标准化的谬论相反。
- 拟合指数：R2

模型之间的不同点

M1. No center和M2. Mean-Centered的不同点：均值中心化使得M2. Mean-Centered的针对b1和b2的解读结果比M1. No center容易
- 不中心化的情况：公式为Y=iy+b1X+b2W+b3XW的型
  - b1：当W=0时两个在X上相差一个单位的个案在Y上的差异
  - b2：估计的是当X=0时两个在W上相差一个单位的个案，在Y上的差异
  - 在管理学中b1和b2通常无意义：
    
    -原因：b1和b2取决于X和Y是如何测量的
    
    -以W=0时的b1为例：若在测量系统里没有意义（问卷研究中量表一般是从1开始，如1-5或1-7），那么b1和它的显著性检验也是没有意义的，且也没有实质性的解释。但是如果W=0是有意义的（若使用的问卷是0-4或者0-6），那么b1和它的显著性检验也是有意义的。b 2也是如此。
- 中心化的情况：均值中心化使得X和W的b1和b2更富有意义。尽管它不是在所有情况下都是真的，但是一般情况下确实是的，所以这并不是谬论。
  - b1：估计的是当W处于平均水平时（即W=0时），两个在X上相差1个单位的个案在Y上的差异
  - b2：估计了当X处于平均水平时（即X=0时），两个在W上相差一个单位的个案在Y上的差异。
  - 好处：这些都总是估计出在数据范围内的X对Y的条件影响，并且总是可以解释的
M3.Z-Score和M1和M2在系数上完全不同的原因：这是因为标准化改变了X、W和Y的度量。
- M2. Mean-Centered：b1和b2估计的是当变量X和W中的一个取均值时，另一个原始变量对原始Y的条件效应。
- M3. Z-Score：在标准化之后，X和W变化的度量从一个单位变成了一个标准差。
  - b1：当Zw=0（即，为均值），两个在Zx上相差1个标准差的个案，在Zy上相差几个标准差。
  - b2：估计的是当Zx=0（即，X取均值时），两个个案在Zw上相差1个标准差，它们在Zy上相差几个标准差。
  - 尽管b3的回归系数与使用原始数据或中心化数据的模型中的回归系数有所不同，但是与b1和b2一样，标准化改变了X和Y的差值的度量

三种正确调节分析（原始值、均值中心化以及标准化）X与W的回归系数（b1和b2）解读对比
Coefficient	M1.NoCenter	M2.MeanCentered	M3.Zscore
b1	当W=0时两个在X上相同一个单位的个案在Y上的差异	估计的是当W处于平均水平时（即W=0时），两个个案在X上相差一个单位的个案在Y上的差异	当Zw=0（即，平均值）时，两个X上相差1个标准差的个案，在Y上相差几个标准差。Zw=0是W为均值是由于b1估计的是Zw=0时Zx对Zy的效应这个事实。当W为均值时，Zw= 0
b2	仅在X=0时两个在W上相同一个单位的个案在Y上的差异	估计了当X处于平均水平时（即X=0时），两个个案在W上相差一个单位的个案在Y上的差异	估计的是Zx=0（即，Zx均值时），两个个案在W上相差1个标准差，它们在Zy上相差几个标准差。
b3	当年龄（W）增加1个单位时，两个在负面情绪反应（X）中相差1个单位的个案，他们在政府行为支持（Y）上的差值	与M1.NoCenter的b3解读完全相同	当年龄（Zw）增加1个标准差时，两个在负面情绪反应（Zx）中相差1个标准差的个案，他们在政府行为支持（Zy）上的标准差的差值

2.7 调节分析中的谬误合集

2.7.1 谬误1：均值中心化对多重共线性和$b_3$的标准误的影响

谬误来源：交乘项X*W和其构成变量X及W相关系数及p值的变化

## Pearson's r and 95% confidence intervals:
## ─────────────────────────────────────────
##             r      [95% CI]     p       N
## ─────────────────────────────────────────
## X-W2    -0.06 [-0.13, 0.01]  .105     815
## X-XW2    0.77 [ 0.74, 0.79] <.001 *** 815
## W2-XW2   0.55 [ 0.50, 0.59] <.001 *** 815
## ─────────────────────────────────────────

## Pearson's r and 95% confidence intervals:
## ───────────────────────────────────────────────────────────
##                               r      [95% CI]     p       N
## ───────────────────────────────────────────────────────────
## X_centered-W2_centered    -0.06 [-0.13, 0.01]  .105     815
## X_centered-XW2_centered    0.09 [ 0.02, 0.16]  .008 **  815
## W2_centered-XW2_centered  -0.02 [-0.08, 0.05]  .669     815
## ───────────────────────────────────────────────────────────

在估计结果变量Y的多元回归模型中，模型中前因变量j的标准误是：

\[se_{b_j}=\sqrt{\frac{MS_{residual}}{df_{residual}(s^2_j)}}\]

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(2, 812) = 207.23, p = 2e-73 ***
## R² = 0.33793 (Adjusted R² = 0.33630)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 815
## ───────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b]   VIF
## ───────────────────────────────────────────────────────────────────
## (Intercept)   3.035 (0.158) 19.250 <.001 *** [ 2.726,  3.344]      
## X             0.511 (0.025) 20.072 <.001 *** [ 0.461,  0.561] 1.003
## W2           -0.005 (0.002) -2.254  .024 *   [-0.010, -0.001] 1.003
## ───────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 815
## ───────────────────────────────────────────────────────────────────────
##          β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ───────────────────────────────────────────────────────────────────────
## X    0.574 (0.029) 20.072 <.001 *** [ 0.518,  0.630]      0.576   0.573
## W2  -0.064 (0.029) -2.254  .024 *   [-0.121, -0.008]     -0.079  -0.064
## ───────────────────────────────────────────────────────────────────────

## [1] "0.02546"

$S^2$是前因变量j的方差
$MS_{residual}$和$df_{residual}(s^2_j)$分别是模型Y的均方残差和残差自由度。
在R中SE的计算流程

## [1] "0.02545"

Hayes推荐的

\[se_{b_j}=\sqrt{\frac{1}{1-R^2_j}}\sqrt{\frac{MS_{residual}}{df_{residual}(s^2_j)}}\]

加入基于$R^2_{j}$的VIF调整项的算法：$R^2_{j}$是从模型中其他前因变量估计前因变量j时的多重相关平方

\[VIF=\sqrt{\frac{1}{1-R^2_j}}\]

在R中Hayes算法SE的计算流程

## [1] "0.02557"

方差膨胀因子（Variance Inflation Factor, VIF）

定义：VIF 测量的是一个模型中某个变量的方差增加了多少，这种增加是由于模型中的其他变量与这个变量相关所导致的。
影响：VIF 值越高，表示该变量与其他变量之间的共线性越强，其估计的不确定性（标准误）也越大。因此，这个变量的系数估计越不稳定。

标准误的计算公式

常规公式： \[ se_{b_j}=\sqrt{\frac{MS_{residual} \times VIF_j}{df_{residual} \times s^2_j}} \] 这表明标准误 $se_{b_j}$ 受到残差平均平方 $MS_{residual}$，自由度 $df_{residual}$，变量 $j$ 的样本方差 $s^2_j$，以及 $VIF_j$ 的共同影响。

均值中心化的作用：均值中心化是在分析中常用的技术，特别是在处理高共线性问题时。它指的是从每个变量的值中减去其平均值。这样做的目的通常是为了减少变量之间的多重共线性，从而减少 VIF 值，进而降低标准误。

均值中心化的直接效果：尽管均值中心化可以降低 VIF 值，但同时它也按照相同的比例减少了变量的方差 $s^2_j$。因此，标准误的计算中，这两个变化（VIF 的降低和 $s^2_j$ 的降低）相互抵消了彼此的影响。
重述的公式： \[ se_{b_j}=\sqrt{\frac{VIF_j}{s^2_j}}\sqrt{\frac{MS_{residual}}{df_{residual}}} \] 这个形式清楚地显示了即使 VIF 发生变化，均值中心化处理后变量的方差调整也会相应地调整，使得最终的标准误计算结果保持不变。

本例中：在您的例子中，均值中心化虽然显著降低了 $XW$ 的 VIF（从 16.357 降到 1.009），但 $XW$ 的方差同样按相同的比例降低（从 9489.221 降到 585.166）。因此，尽管处理了共线性，标准误实际上并未改变。

## Results based on uncentered data
## ──────────────────────────────
##    Term Variance    VIF VIF/S2
## ──────────────────────────────
## 1  X:W2 9489.221 16.357  0.002
## ──────────────────────────────

## Results based on centered data
## ──────────────────────────────────────
##             Term Variance   VIF VIF/S2
## ──────────────────────────────────────
## 1  X:W2 Centered  585.165 1.009  0.002
## ──────────────────────────────────────

这说明在包含交互项的模型中，即使进行均值中心化来处理共线性问题，它对于减少或控制标准误的计算并没有直接影响。
所有三个模型都相同的b3的t和p：t=4.48, p=0.001。M 1、M2和M3的b3的t统计量和p值都一样。因此，标准化X和W对检验交互效应没有影响，这与检验调节假设必须进行标准化的谬论相反。
结论：仅仅依赖均值中心化来改善模型的统计属性可能不够，我们可能还需要考虑其他方法来处理共线性问题。

2.7.2 谬误2：b1和b2的均值中心化的影响以及它们的标准误

模型1(原始数据)和模型2(均值中心化处理后)中$b_1$和$b_2$以及它们的标准误的差异与当X和W均值中心化后引起的共线性减小之间没有关系。

非中心化和中心化结果不同的原因：它们之所以不同是因为它们估计的是不同的效应
- 非中心化：b1是W在那些处于零的人中，X对Y的效应（若W的测量不包含0，如1-5或1-7，则b1无解读意义）；b2同理
- 中心化后：b1是W在那些变量平均水平上的人中，X对Y的效应而；b2同理
- 结论：显然，因为它们估计不同的效应，所以它们的标准误和p值是不同的。
用W均值带入非中心化公式可得中心化回归系数同样b1结果：研究者们基于未中心化的数据的模型的系数来估计当$W=\bar{W}$时X的条件效应。只需使用未中心化标准的模型中的$b$和$b$，即有： \[θ_{{X}\rightarrow{Y}}|(W=\bar{W})=b_1+b_3\bar{W}=0.147+0.007(49.536)=0.501\]
使用方程7.13可以得到中心化模型中的b1的标准误，估计出的的标准误$θ_{{X}\rightarrow{Y}}|(W=\bar{W})$是： \[\begin{equation}\begin{split} se_{θ_{{X}\rightarrow{Y}}|(W=\bar{W})} =& \sqrt{se^2_{b_1}+(2\bar{W})COV_{b1,b3}+\bar{W}^2se^2_{b_3}}\\ =& \sqrt{0.085^2}+(2)(49.536)(0.000003)+(49.536^2)(0.002^2)\\ =&0.025 \end{split}\end{equation} \]
结论：均值中心化处理后的标准误，并没有比使用原始数据中未标准化的X和W所估计出的模型产生的结果更为准确或更不准确。总而言之，$b_1$、$b_2$可能是没有必要的。

2.7.3 谬误3：中心化的变体2（错误）

变体2首先将XW相乘产生乘积项，然后再进行标准化产生Zxw。

\[ Z_Y = i_{Z_Y} + b_1 Z_x + b_2 Z_w + b_3 Z_{xw} + e_{Z_Y} \]

Model 4. Standardized Variant 2

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(3, 811) = 148.07, p = 2e-76 ***
## R² = 0.35389 (Adjusted R² = 0.35150)
## 
## Unstandardized Coefficients:
## Outcome Variable: I(scale(Y))
## N = 815
## ──────────────────────────────────────────────────────────────────────
##                     b    S.E.      t     p        [95% CI of b]    VIF
## ──────────────────────────────────────────────────────────────────────
## (Intercept)     0.000 (0.028)  0.000 1.000     [-0.055,  0.055]       
## I(scale(X))     0.165 (0.096)  1.729  .084 .   [-0.022,  0.353] 11.473
## I(scale(W2))   -0.368 (0.073) -5.009 <.001 *** [-0.512, -0.224]  6.776
## I(scale(XW2))   0.511 (0.114)  4.476 <.001 *** [ 0.287,  0.735] 16.357
## ──────────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: I(scale(Y))
## N = 815
## ──────────────────────────────────────────────────────────────────────────────────
##                     β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ──────────────────────────────────────────────────────────────────────────────────
## I(scale(X))     0.165 (0.096)  1.729  .084 .   [-0.022,  0.353]      0.061   0.049
## I(scale(W2))   -0.368 (0.073) -5.009 <.001 *** [-0.512, -0.224]     -0.173  -0.141
## I(scale(XW2))   0.511 (0.114)  4.476 <.001 *** [ 0.287,  0.735]      0.155   0.126
## ──────────────────────────────────────────────────────────────────────────────────

用原始值在SPSS运行后的标准化结果也是错的：因为方程9.6中的回归系数和使用OLS程序估计$Y=i_Y+b_1X+b_2W+b_3XW$时自动生成的标准回归系数是相等的，这意味对于OIS回归程序所产生的标准回归系数，不应该解释，也不应该报告您也不应该用这些回归系数去探测交互效应。

原因：使用变体1的M3. Z-Score的公式可以将其写成与M1. No center及M2. Mean-Centered的等价公式，但是变体2不行

当标准化X和W,然后将它们相乘生成ZxZw,变体1的模型可以改写为： \[Z_Y=i_Y+(b_1+b_3Z_W)Z_X+b_2Z_W+e_Z\]
在这种形式中，很明显X的影响取决于W，则有： \[θ_{{Z_X}\rightarrow{Z_Y}}=b_1+b_3Z_W\]

第4种调节分析的结论

谬误：在计算X和W的乘积项之前必须将二者中心化标准化是一谬论。
针对变体2的结论：变体2是错误的
- 模型设定：最后当包含预测变量的乘积项在模型中时，不要使用变体2
- 结果回报：也不要报告和解释由SPSS的回归分析程序自动产生以标准化形式列出的回归数，因为其结果是基于变体2的公式。R 语言基于lm()的简写lm(I(scale(Y))~I(scale(X))+I(scale(W2)))是可以的。

2.7.4 谬误4. 有缺失值做分析前的中心化

有缺失值的情况下手动处理（程序自动中心化不需要，比如bruceR::PROCESS）中心化和标准化的做法

处理前：确保您使用的是那些在计程序中已经删除了在任何变量上有缺失值
做处理：用保留下来的个案去标准化或中心化
做分析：最后做分析
原因：因为大多数回归程序默认选择列表删除法(listwise deletion)来处理缺失，若不删除直接做处理，程序做分析的数据的均值和标准差不像最初标准化时一样等于0和1。

2.7.5 谬误5. 人为分类和亚组分析

常见的错误做法：使用均值或中位数拆分数据

做法：使用均值或者中位数拆分数据，连续型变量的均值或中位数以下的数据被划入”低分组”，其余的则为”高分组”。继续检验由一个二分变量W所定义的一个组中X与Y的关系是否与另一个组中的不同，通过进行2×2的因素方差分析，或是两个独立样本t检验。
拆分数据的缺点和反对意见
- 选点的任意性：在分析之前人为地将连续变量分组很难使人信服，因为分割点通常是任意决定的，在这种情况下产生的分组没有心理测量学意义(例如，为什么是均值或者中位数，而不是其他的数字?)
- 这种做法将那些近似到难以区分的人(例如，那些比较接近平均值和中位数的人)处理为好像他们在测量维度上存在很大差异，这有些混淆视听。
- 低统计效力：这种做法降低了检验的统计功效，即发现真正效应的能力，因为它忽略了连续型变量中包含的信息，并且增加了误差。
- 高一类错误：这种做法在某些情况下还可能增加第一类错误的概率，即错误地拒绝原假设的风险，因为它可能导致自变量和因变量之间的关系被高估或低估。
- 因此不要这样做，更多的反对这样做的观点可以参见以下研究：Bissomnette等(1990);Cohen(1983);Hayes(2005);Humphreya和Fleishman(1974);Hunter和Schmidt(1990);Hutchinson(2003);Irwin和McClelland (2002); MacCallum等(2002); Maxwell和Delaney (1993);Newsom等(2003);Preacher等(2005);Royston、Altman和Sauerbrei(2006);Rucker、MoShane和Preacher(2015);Sedney(1981);Streiner(2002);Vargha、Rudas和Maxwell(2011)。

不恰当的替代方案：亚组分析

程序：亚组分析是指根据连续型变量的水平将数据分为两组或多组，然后在每个亚组中检验自变量对因变量的影响，以比较不同亚组之间是否存在差异。
缺点：这种方法看似可以解决连续型变量的问题，但实际上无法检验调节效应假设，即自变量对因变量的影响是否为另一个变量的函数。
以气候变化与人道主义的例子为案例，展示这种方法的结果和问题。假设根据W分为”高分组”(high)和”低分组”(low)是合理的，因此允许我们量化$\theta_{X\rightarrow Y}\mid{W=high}$和$\theta_{X\rightarrow Y}\mid{W=low}$。对于这种模式是否显著，两个t检验可能会有四种结果：
- $\theta_{X\rightarrow Y}\mid{W=high}$显著且$\theta_{X\rightarrow Y}\mid{W=low}$不显著
- $\theta_{X\rightarrow Y}\mid{W=high}$不显著且$\theta_{X\rightarrow Y}\mid{W=low}$显著
- $\theta_{X\rightarrow Y}\mid{W=high}$显著和$\theta_{X\rightarrow Y}\mid{W=low}$都显著
- $\theta_{X\rightarrow Y}\mid{W=high}$不显著和$\theta_{X\rightarrow Y}\mid{W=low}$都不显著
亚组分析的局限性和误解
- 这些模式实际上没有一个可以提供证据证明是否$_T\theta_{X\rightarrow Y}\mid{W=high}=_T\theta_{X\rightarrow Y}\mid{W=low}$，即两组中自变量对因变量的影响是否存在差异。一组显著，而另一组不显著，这并不意味着两组有差异。而且，两组都显著或都不显著也不意味着两组没有差异(查阅Gelman & Stern,2006)。
- 无正式检验：如果你的问题是关于调节效应的，那么你需要对差值之间的差异进行一个正式的检验。亚组分析并不能做到这一点。它只能给出一个粗略的估计，而且可能会产生误导和混淆。
- 亚组分析还有其他的缺点，例如它忽略了连续型变量中包含的信息，它依赖于任意选择的分割点，它可能导致样本量不平衡和统计功效下降等。

2.8 二分调节变量的调节作用

2.8.1 二分调节变量

主效应：如果将关注点转向气候变化怀疑态度如何影响人们为受害者提供报助的意愿呢？这个问题通过一个简单回归分析就能轻易解答。

X：受访者还同答了一组问题以反映他们是否相信气候变化是一种真实现象。气候变化怀疑态度这个测量在数据中被命名为SKEPTIC,受访者得分越高，就表示他/她越怀疑气候变化的真实性.
Y：在阅读完这则报道后，受访者被询问了一组问题，用以评估他们对于拒绝向受害者提供援助的各种理由的同意与不同意程度，例如他们不值得帮助，受害著应该为他们所处的境况负责，捐赠不会奏效等。对这些问题的回答被汇总并被保存为一个名为JUSTIFY的变量，该变量表示受访者对拒绝给子援助的理由的强度。所以，JUSTIFY的分数越高，受访者越强烈地认为帮助受害者是不合理的。
估计：估计从气候变化怀疑(X)对拒绝提供援助理由(Y)的影响的最佳拟合OLS回归模型为$\hat{Y}=2.186+0.201 X$。
解读：因此，两个在对气候变化怀疑程度上相差一个单位的人，他们在拒绝为处于饥荒中的受害者提供援助的理由强度上相差0.201个单位。这个关系在统计上是显著的。

做调节的理论原因：但是这个分析忽视了有一半的受访者被告知干旱是由气候变化而引起的，而另一半没有被告知这个信息（W）。研究者指出，一个事件被视作出气候变化引起的，可能会导致气候变化怀疑论者怀疑援助受害者的价值。换句话说，与没有提供原因相比，这种归因使得人们准备好了以一种更加与自己态度一致的方式来回应受害者的需求。

2.8.1.0.1 图8.1 灾害原因对气候变化怀疑与拒绝提供援助之间关系调节作用的概念图与统计图

## Error in nodes$no: object of type 'closure' is not subsettable

图8.1的数学原理：这种推理预测了气候变化怀疑程度和拒绝提供援助理由的关系在那些知道灾害是由气候变化引起和不知道这一信息的受访者之间是不一样的。

将气候变化怀疑称为X，灾害原因表述称为W(0为自然原因条件，1为气候变化条件)，可以像第7章中一样估计一个使得X对Y的影响取于W的简单调节模型。
这个过程以概念图形式展示在图8.1的面板A。且将其转换成一个以X、W和XW为前因变量的统计模型，如图8.1的面板B所示。该模型方程式为： \[ Y=i_Y+b_1 X+b_2 W+b_3 X W+e_Y \]

2.8.1.0.2 表8.1 检验灾害原因表述调节气候变化怀疑与拒绝提供援助理由之间关系的线性回归结果

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(3, 207) = 22.54, p = 1e-12 ***
## R² = 0.24626 (Adjusted R² = 0.23533)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 211
## ───────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b]   VIF
## ───────────────────────────────────────────────────────────────────
## (Intercept)   2.452 (0.149) 16.449 <.001 *** [ 2.158,  2.745]      
## W            -0.562 (0.218) -2.581  .011 *   [-0.992, -0.133] 3.784
## X             0.105 (0.038)  2.756  .006 **  [ 0.030,  0.180] 1.909
## W:X           0.201 (0.055)  3.640 <.001 *** [ 0.092,  0.310] 4.756
## ───────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 211
## ────────────────────────────────────────────────────────────────────────
##           β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ────────────────────────────────────────────────────────────────────────
## W    -0.303 (0.117) -2.581  .011 *   [-0.534, -0.072]     -0.177  -0.156
## X     0.230 (0.083)  2.756  .006 **  [ 0.065,  0.394]      0.188   0.166
## W:X   0.479 (0.132)  3.640 <.001 *** [ 0.220,  0.738]      0.245   0.220
## ────────────────────────────────────────────────────────────────────────

与RrMp7.6唯一的区别：将实验条件(FRAME)和气候变化怀疑(SKEPTIC)的角色反过来。其中焦点预测变量是一个连续的个体差异变量(X),调节变量是一个实验操作形式的二分变量(W)。P ROCESS结果如下

2.8.1.0.3 图8.2 灾害研究表述的简单调节分析的PROCESS输出结果

## 
## ****************** PART 1. Regression Model Summary ******************
## 
## PROCESS Model ID : 1
## Model Type : Simple Moderation
## -    Outcome (Y) : Y
## -  Predictor (X) : X
## -  Mediators (M) : -
## - Moderators (W) : W
## - Covariates (C) : -
## -   HLM Clusters : -
## 
## Formula of Outcome:
## -    Y ~ X*W
## 
## CAUTION:
##   Fixed effect (coef.) of a predictor involved in an interaction
##   denotes its "simple effect/slope" at the other predictor = 0.
##   Only when all predictors in an interaction are mean-centered
##   can the fixed effect be interpreted as "main effect"!
##   
## Model Summary
## 
## ─────────────────────────────────────
##              (1) Y        (2) Y      
## ─────────────────────────────────────
## (Intercept)    2.186 ***    2.452 ***
##               (0.112)      (0.149)   
## X              0.201 ***    0.105 ** 
##               (0.028)      (0.038)   
## W                          -0.562 *  
##                            (0.218)   
## X:W                         0.201 ***
##                            (0.055)   
## ─────────────────────────────────────
## R^2            0.194        0.246    
## Adj. R^2       0.190        0.235    
## Num. obs.    211          211        
## ─────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
## 
## ************ PART 2. Mediation/Moderation Effect Estimate ************
## 
## Package Use : ‘interactions’ (v1.2.0)
## Effect Type : Simple Moderation (Model 1)
## Sample Size : 211
## Random Seed : -
## Simulations : -
## 
## Interaction Effect on "Y" (Y)
## ──────────────────────────────
##            F df1 df2     p    
## ──────────────────────────────
## X * W  13.25   1 207 <.001 ***
## ──────────────────────────────
## 
## Simple Slopes: "X" (X) ==> "Y" (Y)
## ────────────────────────────────────────────────────
##  "W"   Effect    S.E.     t     p           [95% CI]
## ────────────────────────────────────────────────────
##  0.000  0.105 (0.038) 2.756  .006 **  [0.030, 0.180]
##  1.000  0.306 (0.040) 7.655 <.001 *** [0.227, 0.385]
## ────────────────────────────────────────────────────

图8.2显示了PROCESS的输出结果，表8.1是模型的总结。最佳拟合的OLS回归模型是： \[ Y=2.452+0.105 X-0.562W+0.201X W \]

2.8.1.0.4 *解读结果：

XW的回归系数：$b_3=0.201$并显著不为零，t (207)=3.640, p < 0.001。因此，气候变化怀疑（X）对拒绝提供援助理由强度（Y）的影响取决于是将干旱灾害归因（W）。
X的回归系数b1：当调节变量是二分变景时，通过将其中一组设为W=0，X的回归系数估计了在编码为0的组中X对Y的条件效应，分析结果也提供了在那些没有得知干旱原因的受访者中，气候变化怀疑对拒绝提供援助的条件效应，也就是$b_1$，它是显著不为零。
W的回归系数b2：分析也得到了在气候变化怀疑得分为0的受访者中，干旱原因所致的条件效应，也就是$b_2$，虽然它是显著的，但是实质上它并没有意义，因为0并不在X所测量的范围内。
与第7.1节中介绍的交互作用的对称性：对比7.4和8.1这两个小节的模型的解读结果，数学上这两个小节的模型是完全一样的，但是解读方式很不一样。在以方程8.1形式呈现的回归模型中，$b_3$估计了W对X与Y关系的调节效应，也估计了X对W与Y关系的调节效应。
- 拒绝$_T b_3=0$的零假设使得这两种论断都成立，至于这个结论如何得来以及交互作用如何实质性地解释取决于哪个变量被看作焦点预测变量，哪个被看作调节变量
- 两个分析之间唯一区别是如何表述相应的问题即哪个变量被视为焦点预测变量，哪个被定义为调节变量，以及这些变如何符号性地标记为X和M。
- 在第7章的分析中，焦点预测变量是一个1灾害原因表述编码的二分变量(标记为X,但现在是W),面在这个分补中，焦点预测变量是一个连续变量，将每个人置于气候变化怀影的连续上(标记为W,但现在是X),同时，调节变量是一个编码实验条件的：

2.8.2 可视化及探测调节效应

因为这个模型与第7章中估计的模型完全相同，所以第7.3节中描述的过程可用于生成该模型的直观图形。自然地，既然模型是一样的，那么它们的图形表示也是一样的(见图8.3)。

2.8.2.0.1 图8.3 灾害原因表示调节（W）气候变化怀疑（X）与拒绝提供援助理由强度（Y）之间的关系示意图

2.8.2.0.2 *调节图解读

总体上：连接气候变化怀疑和拒绝提供援助理由的直线的斜率在两组中都是正的，意味着无论如何归因，那些对气候变化怀疑越高，拒绝为受害者提供援的理由越强。然而，被告知归因于气候变化的人的直线斜率比没有被告其体原因的人的直线斜率要更陡一些。
简单斜率：这些直线的斜率可以通过正式的探测交互作用得以量化。当调节变量是二分变量时，使用选点法，可以估计调节变量W分取两个值时，焦点预测变量X对结果变量Y的条件作用。使用与第7.1中相同的数学运算，方程8.1可以改写为：

\[ \begin{aligned} &Y=i_Y+\theta_{X \rightarrow Y} X+b_2 W+e_Y\\ 其中&\theta_{X \rightarrow Y}=b_1+b_3 W \end{aligned} \]

W=0：将表示实验条件的W的两个值代入方程8.3，得到X的两个条件效应。也就是在那些未被告知干旱发生原因的受访者中(W=0)，则有：

\[ \theta_{X \rightarrow Y} \mid(W=0)=b_1+b_3(0)=b_1=0.105 \]
- W=0的简单斜率解读：对于两个未被告知灾害发生原因的受访者，如果他们对气候变化的怀疑态度相差1个单位，那么气候变化怀疑较高的人会比气候变化疑较低的人拒绝提供援助的理由强0.105个单位。
- PROCESS输出的简单斜率分析结果中p=0.006：因为W=0对应着没有被告知引起干旱的原因的那一组，可以得出结论，在没有被告知干旱引起的原因的受访者中，气候变化怀疑态度和拒绝提供援助理由强度之间的关系是正相关的，并且这种相关显著不为零。
W=1：在被告知干早是由气候变化引起的受访者中(W=1)，则有： \[ \theta_{X \rightarrow Y} \mid(W=1)=b_1+b_3(1)=b_1+b_3=0.105+0.201=0.306 \]
- W=1的简单斜率解读：对两个被告干早是由气候变化引起的受访者，气候变化怀疑高1个单位的人拒绝提供援助的理由要强0.306个单位。这两个条件效应与图8.3中两直线的斜率相对应。
- 调节变量的反向编码：但是将气候变化原因组编码为W=1,将自然原因组编码为W=0的决定完全是随意的。通过对两个组重新编码，即将气候变化原因组编码为0,自然原因组编码为1,那么方程8.1中的b,估计在被告知干旱灾害是由气候变化引起的受访者中气候变化怀疑态度的条件效应。
- 反向编码的解读结果：b1是当W=0时X对Y的影响，但是这对应着当W=1时X对Y的影响，因为W’=0对应原始编码中的W=1。注意b1=0.306,这是当W=时，X对Y的条件效应，和之前于工计算的一样

## 
## General Linear Model (OLS Regression)
## 
## Model Fit:
## F(3, 207) = 22.54, p = 1e-12 ***
## R² = 0.24626 (Adjusted R² = 0.23533)
## 
## Unstandardized Coefficients:
## Outcome Variable: Y
## N = 211
## ───────────────────────────────────────────────────────────────────
##                   b    S.E.      t     p        [95% CI of b]   VIF
## ───────────────────────────────────────────────────────────────────
## (Intercept)   1.889 (0.159) 11.882 <.001 *** [ 1.576,  2.202]      
## X             0.306 (0.040)  7.655 <.001 *** [ 0.227,  0.385] 2.102
## I(1 - W)      0.562 (0.218)  2.581  .011 *   [ 0.133,  0.992] 3.784
## X:I(1 - W)   -0.201 (0.055) -3.640 <.001 *** [-0.310, -0.092] 4.814
## ───────────────────────────────────────────────────────────────────
## 
## Standardized Coefficients (β):
## Outcome Variable: Y
## N = 211
## ───────────────────────────────────────────────────────────────────────────────
##                  β    S.E.      t     p        [95% CI of β] r(partial) r(part)
## ───────────────────────────────────────────────────────────────────────────────
## X            0.670 (0.087)  7.655 <.001 *** [ 0.497,  0.842]      0.470   0.462
## I(1 - W)     0.303 (0.117)  2.581  .011 *   [ 0.072,  0.534]      0.177   0.156
## X:I(1 - W)  -0.482 (0.132) -3.640 <.001 *** [-0.743, -0.221]     -0.245  -0.220
## ───────────────────────────────────────────────────────────────────────────────

简单斜率差异分析的无必要性：W对X和Y的关系的调节效应检验，等同于W分别取两个值时对应的X对Y的两个条件效应的差异的检验。因此可以说这两个条件效应是有显著差异的，因为X和W交互影响。
- 可以回顾对$b_3$的解释：它表示当W变化一个单位时，X对Y的影响的变化。
- 在此例中：两个原因表述条件在W上有一个单位的不同。
  - 当 W=0时，$\theta_{X \rightarrow Y}=0.105$。当 W增加一个单位时，$\theta_{X \rightarrow Y}=0.306$
  - 当W增加一个单位时，X对Y的影响增加0.201个单位。
- 这个值等于$b_3$：即XW在回归模型中的权重。我们知道$b_3$是显著不为零的，即X的这两个条件效应之间是有显著差异的。

2.9 其他

2.9.1 调节效应的建模

正确地检验调节效应：因素方差分析或回归模型

因素方差分析：将数据按照一个或多个分类变量(因素)进行分组，然后比较各组因变量的均值是否存在差异。因素方差分析可以检验自变量的条件效应之间的差异，即交互效应。交互效应显著就意味着在已知某个因素水平条件下自变量的简单效应不同于另一个因素水平条件下自变量的简单效应。
- 适用场景：因素方差分析适用于二分变量或天然存在的分类变量，例如性别、种族、实验分组等。如果连续型变量有明确的分类标准或具有本质意义，也可以使用因素方差分析。

回归模型的原则和方法

回归模型是指使用一个或多个自变量来预测或解释因变量的变化。回归模型可以处理连续型变量和分类变量，也可以检验调节效应假设。
回归模型的原则是尊重连续型变量的本质：不要将其人为地分组或忽略其信息。回归模型的方法是使用回归模型和乘积项来检验调节效应。乘积项是指自变量和调节变量的相乘，它反映了自变量对因变量的影响随着调节变量的水平而发生变化的程度。
以气候变化与人道主义的例子为案例，展示这种方法的步骤和结果。我们可以使用线性回归模型来检验干旱原因表述(自变量)对拒绝援助理由(因变量)的影响是否为气候变化怀疑态度(调节变量)的函数。在 R中我们展示了如何使用bruceR::PROCESS()进行回归分析

2.9.2 分层进入

分层进入定义：在回归分析中检验某个调节效应时通过将X和W的乘积加到已经包含X和W的模型中来构建回归模型，这被称为分层回归或分层变量进入。

分层进入目的：该方法的目的确定是否允许X的效应取决于W产生一个比X的效应在W的无条件作用下的模型更好的拟合模型。

判定方式：果条件模型比限定X的影响独立于W的模型解释了更多Y的变异，那么W调节X的影响的条件模型就是更好的模型。

分层进入建立步骤

第一步：Y是由X、W以及除了XW之外的其他变量，如各种协变量等来估计，将得到的模型称为模型1，它的多重相关平方为$R_1^2$。
第二步：添加XW到模型1产生模型2,它的多重相关平方为$R_2^2$。
- $\Delta R^2$：如果零假设为真，那么添加乘积项提供比模型1关于Y的个体差异的更多信息。这两个模型的多重相关平方的差是$\Delta R^2=R_2^2-R_1^2$。这个差值描述的是相比较模型1来说，模型2的拟合度增加了多少。这个值有时被称为$R^2$的增量，或者简单地称为”$R^2$的变化”。
- $\Delta R^2$的判断标准：当在模型中增加一个变量时，$R^2$不可能减小，所以$\Delta R^2≥0$。因此，目前的问题不在于模型2是否会拟合得更好。而是如果零假设为真，该模型是否碰巧比我们所期待的模型拟合得更好。为了同答这个问题，需要使用p值。第 2.6节中已经详细说明了关于检验模型2是否比模型1拟合更好只不过是碰运气的机制，其中介绍了关于回归模型中一系列变量的推断。使用方程2.17可以将$R^2$的差转换为F比(F-ratio),其中$R_2^2-R_1^2=\Delta R^2$，m=1，p值可从自由度为1和$df_{residual }$的F分布中计算而来。

以灾害原因表述为例：8.1节中，我们得出结论将旱灾归因于气候变化与未指定原因(W)会调节气候变化怀疑(X)对拒绝提供援助理由(Y)的影响。b ruceR::PROCESS()包含了使用分层进入方法的结果

第一步-计算X和W估计Y的模型的拟合度：这样做得到$R_1^2=0.198$。其次，当XW加入模型后，$R_2^2=0.246$,这意味着$\Delta R^2=0.246-0.198=0.048$。
第二步-调节模型：残差自由度是207。F (1,207)=13.250，p<0.001。这表示可以拒绝零假设，即气候变化怀疑对拒绝提供援助理由强度的影响取决于是否将干旱归因于气候变化。

评价分层进入法：这个分层进入方法可以奏效，但它不是必要的。S PSS的PROCESS可以自动为简单调节模型中交互效应产生$\Delta R^2$,这个结果在 PROCESS输出部分标记为”Test of highest order unconditional interaction(s)“，只是您再去实际分层地构建该模型。从图8.2中可以看到，$\Delta R^2=0.0482$。结果与通过计算每个模型的$R^2$并手动计算它们的差异一样。

适用情形：

·情形一：谈及无条件下X的影响是比较方便的，在描述过第二步的模型估计结果之后对该结论进行量化。将 X、W和XW同时进人模型产生X的效应估计值这种效应必须以W为条件。
情形二：如果需要多个回归系数来量化X对Y的影响的调节作用，例如当W或X是k个水平的多分类变量时，分层进入是一种方便检验同时发生的零假设的方式，即检验k-1个乘积项的回归系数等于零的零假设。

2.10 调节分析小结

原理：当激发一个研究的问题是什么时候或什么情况下X对Y产生影响时，调节效应分析是个合适的分析策略。

本章介绍了使用OLS回归进行调节效应分析的原理：如果W与X对Y的影响大小有关，我们就说W调节X的影响，或者X与W交互影响Y。
关于调节效应的假设可以通过几种方法来检验：其中最常用的是将X与W的乘积项与X和W一起纳入Y的模型中。这使得X对Y的影响线性地依赖于W。一旦确立这种依赖关系，那么在谈及X对Y的影响时不把W的讨论作为条件就不再合理了。

图像化：调节效应的示意图可以帮助我们很好地理解视情况而定的X与Y之间关系的性质。通过估计W取不同值时X对Y的条件效应来探测交互效应也可以做到。

选点法：是探测交互效应最常用的实现方法
詹森-内曼技术：也在慢慢地吸引用户和追随者，它迟早会比选点法更受欢迎。

本章节涉及模型：

RrMp9.1a All continuous variables moderation without any centering
RrMp9.1b All continuous variables moderation with centered X and W
RrMp9.1c All continuous variables are standardized
RrMp8.1 Moderation model with binary W (W=0/1)

Statistical modeling