我们从简单到复杂来论述这个问题为什么LSDV增加了虚拟变量λ_t×Time就可以来控制时间的异质性。我 们先来考虑最简单的情况就是时间是唯一的群聚。然 后再考虑复杂的情况,就是面板数据的混合模型所用的情况,这种情况下数据中除了时间之外,还有其他的群聚。为 了使得我们的公式推导更加直观,我们给简单情况和复杂情况各自做了一个简单的数据模拟。
这种情况下(例如我们针对某一特定群体收集了20年的数据,但是每一年收集数据都是这个群里不同的人),因为时间是唯一的群聚,我们还是可以从多层次模型的角度来理解这种情况下的建模。公 式(A)-(C)为嵌套数据的基本数据结构。其 中公式(A)代表了低层次的数据,在本例中个人层内嵌于时间组内;公式(B)和公式(C)代表了高层次变量,在本例中即时间组组间变量。在 公式(A)中,组内的结果变量是由组内层次的解释变量和是允许在各组之间变化的截距,以及是组内层次的残差构成的;公式(B)表示了截距的变化,其中截距包括组均值截距和截距的残差;公式(C)表示了斜率;公式(D)为公式(A)-(C)的合并。在 经济学领域中,学者把基于该公式的模型称为随机效应模型(Random effect model: REM),而在行为科学领域把基于该公式的模型称为多层次随机截距模型。尽 管该模型由这两种叫法,在数学上是完全等价的只是使用了不同的符号系统。
\[ \begin{aligned} 组内:\\ Y_{i j}&=\beta_{0 \mathrm{j}}+\beta_{1 \mathrm{j}} X_{i j}+e_{i j}......(A) \\ 组间:\\ \beta_{0 j}&=\gamma_{00}+U_{0 j}......(B)\\ \beta_{1 \mathrm{j}}&=\gamma_{10}......(C)\\ 合并:\\ Y_{i j} &=\gamma_{00}+\gamma_{10} X_{i j}+U_{0 j}+e_{i j}......(D)\\ \end{aligned} \]
在该模型中,表示集群之间未观察到的变化的U0j项是随机截距,因为其有可能会和预测变量x相关,因此会产生内生性导致估计的偏误。本 质上,内生性问题源于误差项与预测因子相关,从而导致所有回归系数有偏或不一致,在多层次建模环境中,除了和单层次数据一样组内的残差eij与固定部分Xi不相关之外,组间误差项U0j也必须和Xij不相关。违 反了组间层的这一假设,在计量经济学文献中这被称为违反REA(REA),这将导致Xij的参数估计可能有偏差。然 而,群组之间的变化不需要在模型的随机部分中建模;它同样可以分配给模型的固定部分,从而产生方程(E)中的固定效应模型。
\[ \begin{aligned} Y_{i j} &=\gamma_{00}+\gamma_{10} X_{i j}+\alpha_{j}+e_{i j}......(E)\\ \end{aligned} \]
公式E与公式F的唯一区别时,我们用固定效应αj代替随机效应U0j,因此该模型也被称为固定效应模型(Fixed effect model: FEM)。这 两个方法之间的区别在于,在FEM中,估计时间组j的是特定值,而在 REM方法中,仅估计U0j的方差而不是个案值。在 任何特定模型之外,某些 2 级单位的因变量高于其他单位的现象在计量经济学中被称为”未观察到的异质性”(Wooldridge,2013),并且在组织研究中被赋予了各种其他标签例如”稳定方差”。在 具体的建模中,FEM在基于最小二乘法回归的基础上增加了一个虚拟变量,一个虚拟变量就代表了一个群组的截距。然 后为每个群组从属变量估计回归系数以产生特定群组的估计,如果添加亚变量构建FEM的这种方法也被称为基于虚拟变量最小二乘 (least squares dummy variable: LSDV)的FEM。针 对哑变量的编码,其中是参考编码既是公式E是保留模型中的一个组的截距,并将该群组作为参考群组。α j表示j群组和参考群组的
\[ Y_{i j}=\gamma_{00}+\underbrace{(\alpha_1 D_1+...+\alpha_{n-1} D_{n-1})}_{\alpha_{j}}+\gamma_{10} X_{i j}+e_{i j}......(F) \]
观察公式D和公式E唯一的区别就是U0j和αj,这两个参数的差异是理解LSDV如何处理内生性问题的关键。R EM 模型(公式D)和 LSDV-FEM 模型(公式E)中的一个关键假设是模型的随机部分与回归量不相关。R EM模型的随机部分除了eij项,Uj项也是如此。因 此,与 LSDV-FEM模型相比,REM模型有一个额外的假设: 即U0j与x0j不相关,这在计量经济学中被称为随机效应假设。不 满足这一假设会影响估计的准确性。而 如果对时间效应采用了FEM的话,在时间层面所有的不可观测异质性都会被排除。
我们通过模拟一个简单的数据库来对比使用定效应模型和不使用固定效应模型建模时间效应时的区别。
为了对比这些模型设定对于数据结果产生的影响,我们生成了一个数据库。总
的来说,这个模拟数据库是一个具有时间层次结构的数据集,其中包括时间Time,和时间层变量Xt以及每个观测点的预测变量X,并且X是一个既有组建变异也有组内变异的变量。这
个数据集适合用来分析时间效应和其他变量对因变量Y的影响。在
生成这个数据库的时候,我们进行了一系列的参数设定,详情如下:
初始化数据结构: 我们创建了一个包含25个时间段(N =
25)的数据结构,每个时间段包含100个观测值(M = 100)。其
中创建的Time变量字段代表时间段,用数字1到25表示。
生成时间层的变量Xt:
生成一个时间层次的变量Xt,它是正态分布随机数的中心化版本,加上1,然后为每个群组重复M次。他
是一个在时间层的变量,没有组内变异。
生成X的组间部分Xb:
XtX存在组间相关,Xt对X的组间部分Xb的回归系数为0.8,截距为1,还有一个残差(同样使用center(rnorm(N))生成和中心化)。
生成X:
为每个个体生成观测变量X,它是Xb的值加上个体层次的正态随机波动。通
过在每个时间段内生成一个标准化的随机数rnorm(N*M)实现的。。
生成因变量Y:
因变量Y是通过一个线性模型生成的,其中包括一个截距项(5),Xt的影响(-0.8倍),X的影响(0.3倍),以及一个每个时间段内的随机误差项eij。
在对比各类模型的建模效果时,主要采用了4种类型的模型,我们想看到的是哪些模型的建模结果和是总体参数的无偏估计,我们的总体参数见表A:
表A. 模拟数据的参数设置
| 参数 | 参数值 |
|---|---|
| 截距 | 5 |
| X的效应 | 0.3 |
| 时间层省略变量Xt的效应 | -0.8 |
| Xt对X组间(Xb)的效应:内生性来源 | 0.8 |
因为我们主要是关注组内预测变量的参数估计,所以我们主要是看这四类模型,哪几类可以无偏的估计出X在总体中的参数0.3,这四类模型有如下三个共同点:
目的:所有模型都旨在探索变量X(和Xt在两个模型中)对Y的影响。
数据结构:它们都使用相同的数据集,该数据集包含时间段(Time),响应变量Y,以及预测变量X。
方法:所有模型都是基于普通最小二乘(OLS)回归,这是线性回归分析中最常用的方法。
4个模型在预测变量是否包时间效应,是否选择固定效应模型两方面有区别,表B展示了这四个模型的区别
| 包含时间效应 | 不包含时间效应 | |
|---|---|---|
| 选择固定效应模型 | 模型(1) | 模型(4) |
| 不选择固定效应模型 | 模型(2) | 模型(3) |
注:对于非固定效应模型,我们使用了多层回归
具体说来这四个模型的区别如下,
模型(1):无固定效应,含X和Xt(ModelO_ols)
模型(2):含固定效应,含X和Xt(ModelO_fe)
模型(3):无固定效应,仅含X(Model_ols)
模型(4):含固定效应,仅含X(Model_fe)
## Descriptive Statistics:
## ─────────────────────────────────────────────────────────────────────
## N Mean SD | Median Min Max Skewness Kurtosis
## ─────────────────────────────────────────────────────────────────────
## CaseID 2500 1250.50 721.83 | 1250.50 1.00 2500.00 0.00 -1.20
## Time* 2500 13.00 7.21 | 13.00 1.00 25.00 0.00 -1.21
## Y 2500 4.71 2.13 | 4.70 -3.23 12.43 -0.00 0.05
## X 2500 1.81 1.84 | 1.78 -4.89 7.91 -0.04 0.25
## Xt 2500 1.00 1.09 | 1.21 -1.35 2.98 -0.32 -0.50
## ─────────────────────────────────────────────────────────────────────
##
## NOTE: `Time` transformed to numeric.
#HLM_ICC_rWG(data, group="Time", icc.var="Xt")
#HLM_ICC_rWG(data, group="Time", icc.var="X")
#HLM_ICC_rWG(data, group="Time", icc.var="Y")
# 多层次分析(不含固定效应)
modelO_lmer <- lmer(Y ~ X + Xt + (1|Time), data=data)
# OLS回归分析(含时间固定效应)
modelO_fe <- lm(Y ~ factor(Time) + X + Xt, data=data)
# 多层次分析(不含固定效应)
model_lmer <- lmer(Y ~ X + (1|Time), data=data)
# OLS回归分析(含时间固定效应)
model_fe <- lm(Y ~ factor(Time) + X, data=data)
# 表D:模型结果汇总
model_summary(list(modelO_lmer, modelO_fe, model_lmer, model_fe), digits = 2)#,single.row = T)##
## Model Summary
##
## ───────────────────────────────────────────────────────────────────────────
## (1) Y (2) Y (3) Y (4) Y
## ───────────────────────────────────────────────────────────────────────────
## (Intercept) 5.00 *** 2.91 *** 4.23 *** 2.91 ***
## (0.06) (0.23) (0.20) (0.23)
## X 0.31 *** 0.31 *** 0.27 *** 0.31 ***
## (0.03) (0.04) (0.04) (0.04)
## Xt -0.86 ***
## (0.05)
## factor(Time)2 2.17 *** 2.17 ***
## (0.31) (0.31)
## factor(Time)3 1.13 *** 1.13 ***
## (0.28) (0.28)
## factor(Time)4 0.78 ** 0.78 **
## (0.28) (0.28)
## factor(Time)5 2.41 *** 2.41 ***
## (0.28) (0.28)
## factor(Time)6 -0.08 -0.08
## (0.29) (0.29)
## factor(Time)7 1.09 *** 1.09 ***
## (0.28) (0.28)
## factor(Time)8 0.87 ** 0.87 **
## (0.29) (0.29)
## factor(Time)9 2.18 *** 2.18 ***
## (0.28) (0.28)
## factor(Time)10 1.47 *** 1.47 ***
## (0.29) (0.29)
## factor(Time)11 1.08 *** 1.08 ***
## (0.28) (0.28)
## factor(Time)12 2.16 *** 2.16 ***
## (0.29) (0.29)
## factor(Time)13 0.52 0.52
## (0.28) (0.28)
## factor(Time)14 2.98 *** 2.98 ***
## (0.31) (0.31)
## factor(Time)15 2.88 *** 2.88 ***
## (0.34) (0.34)
## factor(Time)16 0.15 0.15
## (0.28) (0.28)
## factor(Time)17 0.29 0.29
## (0.29) (0.29)
## factor(Time)18 0.04 0.04
## (0.29) (0.29)
## factor(Time)19 2.24 *** 2.24 ***
## (0.29) (0.29)
## factor(Time)20 0.45 0.45
## (0.29) (0.29)
## factor(Time)21 1.77 *** 1.77 ***
## (0.29) (0.29)
## factor(Time)22 1.42 *** 1.42 ***
## (0.29) (0.29)
## factor(Time)23 2.09 *** 2.09 ***
## (0.32) (0.32)
## factor(Time)24 1.22 *** 1.22 ***
## (0.29) (0.29)
## factor(Time)25 -0.28 -0.28
## (0.30) (0.30)
## ───────────────────────────────────────────────────────────────────────────
## Marginal R^2 0.13 0.05
## Conditional R^2 0.13 0.21
## AIC 10574.03 10640.02
## BIC 10603.15 10663.31
## Num. obs. 2500 2500 2500 2500
## Num. groups: Time 25 25
## Var: Time (Intercept) 0.01 0.82
## Var: Residual 3.98 3.98
## R^2 0.13 0.13
## Adj. R^2 0.13 0.13
## ───────────────────────────────────────────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
表E总结了这4种模型建模的结果,具体说来:
X的无偏估计:除了模型(3),在所有模型中,X对Y我估计都是对总体参数(Bx=0.3)的无偏估计。
无偏估计的两种方法:这样的结果说明不论就像模型(1)那样控制时间层面的效应(也就是要保证我们的实际建模和总体模型是一样的),或者像(4)是使用固定模型,都可以保证我们对x变量的效应估计是无偏的。
模型(3)的估计偏误:我们看到这里面唯一有偏误的,估计模型是模型(3),这个是因为我们在总体中,Xt对X在组间层面的影响是0.8。我 们在建模的过程中忽略了Xt的时候,被忽略的Xt就被包含进了模型的残差项U0j中,导致了X和U0j是相关的,从而产生了内生性,即便我们采用多层次回归,估计仍是有偏误的。这 也是在有时间层次的数据中,很常出现的一种情况。因 为我们在建模过程中,不可能包含所有相关的时间层次的协变量。但 是这种忽略就会带来模型参数估计的偏误。
固定效应模型的优势:我们的结果我们可知,使用固定效应模型控制时间层面的混淆效应是一种非常实用的选择,这是因为在实际的实证研究中,我们很难保证我们的建模可以像模型(1)那样完全纳入所有时间层面的教预测因子(即我们基本上不可能建立一个和总体模型一样的估计模型)。但 是纳入时间的固定效应是很容易做到的,只要有了固定效应,我们就能得到无偏的估计。
Xt的影响:在包含Xt的模型(modelO_ols和modelO_fe)中,模型(1)是可以准确估计X的效应的,这是因为我们已经准确的纳入了时间效应;模型(2)也可以对X做出一样准确的估计,但是因为我们已经在模型(2)中添加了时间的固定效应,而固定效应模型已经将所有时间层面的效应全部剔除,所以固定效应模型使用之后,模型不会针对时间层面的任何效应进行估计,这一结果也就说明如果使用了固定效应模型,就不用再针对时间层面的任何预测因子,因此进行估计。
时间效应:在包含时间固定效应的模型(2)和(4)中,不同时间段的系数显著不同,表明时间是一个重要的因素,可能会影响Y的变化。
模型拟合度:包含时间固定效应的模型(模型2和4)或包含时间效应Xt的模型(模型1)都有较高的R平方值,表明不管是否能针对时间效应层面的效应进行正确建模,只要使用了固定效应模型(模型4)就可以提升模型的拟合。
# 创建数据框
data <- data.frame(
模型 = c("(1) modelO_lmer", "(2) modelO_fe", "(3) model_lmer", "(4) model_fe"),
X的标准误 = c("0.03", "0.04", "0.04", "0.04"),
X的系数 = c("0.31(显著)", "0.31(显著)", "0.27(显著)", "0.31(显著)"),
Xt的系数 = c("-0.86(显著)", "无(被固定效应共线)", "未纳入预测变量", "未纳入预测变量"),
固定效应 = c("无", "有", "无", "有"),
R平方值 = c("0.13", "0.13", "0.05", "0.13")
)
# 使用kable打印表格
kable(data, caption = "表E. 四个模型的结果比较")| 模型 | X的标准误 | X的系数 | Xt的系数 | 固定效应 | R平方值 |
|---|---|---|---|---|---|
| (1) modelO_lmer | 0.03 | 0.31(显著) | -0.86(显著) | 无 | 0.13 |
| (2) modelO_fe | 0.04 | 0.31(显著) | 无(被固定效应共线) | 有 | 0.13 |
| (3) model_lmer | 0.04 | 0.27(显著) | 未纳入预测变量 | 无 | 0.05 |
| (4) model_fe | 0.04 | 0.31(显著) | 未纳入预测变量 | 有 | 0.13 |
在时间层次是唯一群组的简单情况下,我们已经从数学上推导了为什么使用固定效应模型可以剔除时间效应,对估计结果产生的影响。面 板数据不过就是这种简单情况下的,一种更复杂的情况,即除了时间效应之外还有其他的群组。其 公式如下:
\[ \begin{aligned} 组内:\\ Y_{i jk}&=\beta_{0 \mathrm{jk}}+\beta_{1 \mathrm{jk}} X_{i jk}+e_{i jk}......(G) \\ 组间:\\ \beta_{0 jk}&=\gamma_{00}+U_{0 j}+U_{0 k}......(H)\\ \beta_{1 \mathrm{jk}}&=\gamma_{10}......(I)\\ 合并:\\ Y_{i jk} &=\gamma_{00}+\gamma_{10} X_{i jk}+U_{0 j}+U_{0k}+e_{i jk}......(J)\\ \end{aligned} \]
在这组公式中,数据被包含3个层级:时间层级(通常为 j)和个人群组层级(通常为 k)。这 里的 \(i\) 通常代表个体层级的索引。每 个公式的含义如下:
层内模型:
层间模型:
合并:
这组模型在处理面板数据,既考虑了数据在时间上有结构时(如追踪数据),也考虑了其所嵌入的个人层次,当我们想要分析个体变化和群组变化的影响时。通 过此模型,研究人员可以更好地理解在不同层级上因变量的变异性,并评估不同层级自变量对因变量的独立影响。要 理解这组公式中由时间异质性带来的内生性,就要理解U0j。具 体说来,U0j是时间的随机效应,只要它存在,我们就必须保证它不和Xijk相关,因为一旦相关。就 会产生内生性导致γ10的估计偏误。为 达到这一目的,最简单的做法就是如同我们在简单情况下里面统计原理部分的推导就是把U0j固定为αj,将其固定了之后,上面这个合并的公式就可以简化为如下公式。
\[ \begin{aligned} Y_{i k} &=\gamma_{00}+\gamma_{10} X_{i k}+\alpha_{j}+U_{0k}+e_{i k}......(K)\\ \end{aligned} \]
我们通过公示k可以看到,因为加入了时间的固定效应,αj已经变成了一个不可能和X有任何相关的固定效应。并 且在公式中纳入该固定效应就把所有的时间的层面影响在这个公式中就都被剔除掉了,整个公式就已经变为了针对只有群组k的一个嵌套模型的公式,大大简化了模型。
我们通过模拟一个简单的面板数据库来对比使用定效应模型和不使用固定效应模型建模时间效应时的区别。和 简单情况下一样,为了对比这些模型设定对于数据结果产生的影响,我们生成了一个数据库。为 了方便与简单情况下的结果进行对比,面板数据情况的参数设定与简单情况下的参数设定完全一样。不 过我们除了时间层次之外,又添加了一个公司层次,在数据上的体现就是添加了一个公司的群组标签FirmID。
在对比各类模型的建模效果时,我们为了对比方便,设置了与简单情况下一样的参数。对 比的模型也是简单情况下使用的4种类型的模型,这四类模型的共同点和区别也与简单情况下相同。
## Descriptive Statistics:
## ─────────────────────────────────────────────────────────────────────
## N Mean SD | Median Min Max Skewness Kurtosis
## ─────────────────────────────────────────────────────────────────────
## CaseID 2500 1250.50 721.83 | 1250.50 1.00 2500.00 0.00 -1.20
## FirmID 2500 50.50 28.87 | 50.50 1.00 100.00 0.00 -1.20
## Time* 2500 13.00 7.21 | 13.00 1.00 25.00 0.00 -1.21
## Y 2500 4.71 2.13 | 4.70 -3.23 12.43 -0.00 0.05
## X 2500 1.81 1.84 | 1.78 -4.89 7.91 -0.04 0.25
## Xt 2500 1.00 1.09 | 1.21 -1.35 2.98 -0.32 -0.50
## ─────────────────────────────────────────────────────────────────────
##
## NOTE: `Time` transformed to numeric.
# 同时考虑时间效应和公司效应的多层次模型(不含固定效应)
modelO_cc <- lmer(Y ~ X + Xt + (1|Time) + (1|FirmID), data=data)
# 考虑公司效应的多层次模型(含时间固定效应)
modelO_hybrid <- lmer(Y ~ factor(Time) + X + Xt +(1|FirmID), data=data)
# 同时考虑时间效应和公司效应的多层次模型(不含固定效应)
model_cc <- lmer(Y ~ X +(1|Time) + (1|FirmID), data=data)
# 考虑公司效应的多层次模型(含时间固定效应)
model_hybrid <- lmer(Y ~ factor(Time) + X +(1|FirmID), data=data)
# 表G:模型结果汇总
model_summary(list(modelO_cc, modelO_hybrid, model_cc, model_hybrid),digits = 2)##
## Model Summary
##
## ───────────────────────────────────────────────────────────────────────────────
## (1) Y (2) Y (3) Y (4) Y
## ───────────────────────────────────────────────────────────────────────────────
## (Intercept) 5.00 *** 2.91 *** 4.23 *** 2.91 ***
## (0.06) (0.23) (0.20) (0.23)
## X 0.31 *** 0.31 *** 0.27 *** 0.31 ***
## (0.03) (0.04) (0.04) (0.04)
## Xt -0.86 ***
## (0.05)
## factor(Time)2 2.17 *** 2.17 ***
## (0.31) (0.31)
## factor(Time)3 1.13 *** 1.13 ***
## (0.28) (0.28)
## factor(Time)4 0.78 ** 0.78 **
## (0.28) (0.28)
## factor(Time)5 2.41 *** 2.41 ***
## (0.28) (0.28)
## factor(Time)6 -0.08 -0.08
## (0.29) (0.29)
## factor(Time)7 1.09 *** 1.09 ***
## (0.28) (0.28)
## factor(Time)8 0.87 ** 0.87 **
## (0.29) (0.29)
## factor(Time)9 2.18 *** 2.18 ***
## (0.28) (0.28)
## factor(Time)10 1.47 *** 1.47 ***
## (0.29) (0.29)
## factor(Time)11 1.08 *** 1.08 ***
## (0.28) (0.28)
## factor(Time)12 2.16 *** 2.16 ***
## (0.29) (0.29)
## factor(Time)13 0.52 0.52
## (0.28) (0.28)
## factor(Time)14 2.98 *** 2.98 ***
## (0.31) (0.31)
## factor(Time)15 2.88 *** 2.88 ***
## (0.34) (0.34)
## factor(Time)16 0.15 0.15
## (0.28) (0.28)
## factor(Time)17 0.29 0.29
## (0.29) (0.29)
## factor(Time)18 0.04 0.04
## (0.29) (0.29)
## factor(Time)19 2.24 *** 2.24 ***
## (0.29) (0.29)
## factor(Time)20 0.45 0.45
## (0.29) (0.29)
## factor(Time)21 1.77 *** 1.77 ***
## (0.29) (0.29)
## factor(Time)22 1.42 *** 1.42 ***
## (0.29) (0.29)
## factor(Time)23 2.09 *** 2.09 ***
## (0.32) (0.32)
## factor(Time)24 1.22 *** 1.22 ***
## (0.29) (0.29)
## factor(Time)25 -0.28 -0.28
## (0.30) (0.30)
## ───────────────────────────────────────────────────────────────────────────────
## Marginal R^2 0.13 0.13 0.05 0.13
## Conditional R^2 0.13 0.13 0.21 0.13
## AIC 10576.03 10619.29 10642.02 10619.29
## BIC 10610.97 10782.36 10671.14 10782.36
## Num. obs. 2500 2500 2500 2500
## Num. groups: FirmID 100 100 100 100
## Num. groups: Time 25 25
## Var: FirmID (Intercept) 0.00 0.00 0.00 0.00
## Var: Time (Intercept) 0.01 0.82
## Var: Residual 3.98 3.98 3.98 3.98
## ───────────────────────────────────────────────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
表D总结了这4种模型建模的结果,我们发现其结果与在简单情况下的结果是高度一致的。我 们可以看到,在面板数据分析中,除了在一个模型(即模型3)下出现偏差,X对Y的估计普遍是无偏的。尤 其是,当模型未能包含所有相关的时间层面变量时,将时间的固定效应添加入多层分析中组合成为混合模型可以显示出明显的优势,因为它有效的控制列时间混淆效应,从而提供无偏估计。这 在实证研究中尤其有用,因为很难确保模型能完整地包括所有时间层面预测因子,并且很多针对面板数据的研究时间层面的效应都不是研究的重心。此 外,固定效应模型通过排除所有时间层面效应,也就无需对这些效应进行估计,依然可以实现对X影响的无偏估计。模 型对比的结果还表明,包含时间效应的模型和固定效应模型均能提高模型拟合度,强调了在分析中考虑时间效应的重要性。总 的来说,固定效应模型是处理时间数据和避免估计偏误的一个强有力工具。
# 创建数据框
data <- data.frame(
模型 = c("(1) modelO_hybrid", "(2) modelO_hybrid", "(3) model_cc", "(4) model_fe"),
X的标准误 = c("0.03", "0.04", "0.04", "0.04"),
X的系数 = c("0.31(显著)", "0.31(显著)", "0.27(显著)", "0.31(显著)"),
Xt的系数 = c("-0.86(显著)", "无(被固定效应共线)", "未纳入预测变量", "未纳入预测变量"),
固定效应 = c("无", "有", "无", "有"),
R平方值 = c("0.13", "0.13", "0.05", "0.13")
)
# 使用kable打印表格
kable(data, caption = "表H. 四个模型的结果比较")| 模型 | X的标准误 | X的系数 | Xt的系数 | 固定效应 | R平方值 |
|---|---|---|---|---|---|
| (1) modelO_hybrid | 0.03 | 0.31(显著) | -0.86(显著) | 无 | 0.13 |
| (2) modelO_hybrid | 0.04 | 0.31(显著) | 无(被固定效应共线) | 有 | 0.13 |
| (3) model_cc | 0.04 | 0.27(显著) | 未纳入预测变量 | 无 | 0.05 |
| (4) model_fe | 0.04 | 0.31(显著) | 未纳入预测变量 | 有 | 0.13 |