为了清楚的解释为什么在处理面板数据时”LSDV增加了虚拟变量λ_t×Time就可以来控制时间的异质性”这个问题,本文首先将数据分为简单数据和复杂数据两种类型,其中简单数据主要是指仅包括时间这一组间变量。例如对十年中国国民幸福感的面板数据,就是针对中国国民收集了10年的数据,但是每一年收集数据都来源于不同的中国国民。复杂数据类型就是包括时间和不同组间变量的数据集,也就是常见的面板数据。例如,中国14家上市商业银行2008-2010年季度数据,这个数据集就包括时间和银行两个高层次变量。此外,为了使读者更加直观的了解本文所提出的面板数据的混合模型所用的情况,本文进一步利用模拟数据进行了不同情况的对比。
由于时间是唯一的组间变量,本文从多层次模型的角度来帮助读者更加清楚的了解简单数据下的模型构建。公式(A)-(C)为简单数据的基本数据结构。其中公式(A)代表了低层次的数据。在中国国民幸福感的数据集中,个人层面的幸福感数据是嵌套于时间内。公式(B)和公式(C)代表了高层次变量,在中国国民幸福感的数据集中即时间作为唯一的组间变量。在公式(A)中,组内的结果变量\(Y_{ij}\)是由组内层次的解释变量\(X_{ij}\)和允许在各组之间变化的截距\(\beta_{0j}\),以及组内层次的\(e_{ij}\)残差构成的;公式(B)表示了截距\(\beta_{0j}\)的变化,其中截距包括组均值截距\(\gamma_{00}\)和截距的残差\(U_{0j}\);公式(C)表示了斜率\(\beta_{1j}\);公式(D)为公式(A)-(C)的合并。在经济学领域中,学者把基于该公式的模型称为随机效应模型(Random effect model: REM),而在行为科学领域把基于该公式的模型称为多层次随机截距模型。尽管该模型在这两个领域存在不同的名称,但是只是使用了不同的符号系统其本质是完全等价。
\[ \begin{aligned} 组内:\\ Y_{i j}&=\beta_{0 \mathrm{j}}+\beta_{1 \mathrm{j}} X_{i j}+e_{i j}......(A) \\ 组间:\\ \beta_{0 j}&=\gamma_{00}+U_{0 j}......(B)\\ \beta_{1 \mathrm{j}}&=\gamma_{10}......(C)\\ 合并:\\ Y_{i j} &=\gamma_{00}+\gamma_{10} X_{i j}+U_{0 j}+e_{i j}......(D)\\ \end{aligned} \]
内生性问题是指在模型中误差项与预测因子相关,从而导致回归系数出现估计偏误或不一致的问题。在该模型中,表示群组之间未观察到的变化的\(U_{0j}\)是随机截距的误差项,但是由于其有可能会和预测变量\(X_{ij}\)相关,因此会产生内生性的问题进而导致估计偏误。此外,在多层次建模环境中,除了和单层次数据一样组内的残差\(e_{ij}\)与\(X_{ij}\)不相关之外,组间误差项\(U_{0j}\)也必须和\(X_{ij}\)不相关,计量经济学文献将这一假设称为随机误差假设。因此若\(U_{0j}\)和\(X_{ij}\)相关,则违背随机效应假设(REA)。学者发现群组之间的变化\(U_{0j}\)其实不一定必须在模型的随机部分中建模,它可以分配给模型的固定部分,从而产生方程(E)中的固定效应模型。
\[ \begin{aligned} Y_{i j} &=\gamma_{00}+\gamma_{10} X_{i j}+\alpha_{j}+e_{i j}......(E)\\ \end{aligned} \]
公式(D)与公式(E)的唯一区别时,我们用固定效应\(\alpha_{j}\)代替随机效应\(U_{0j}\),因此该模型也被称为固定效应模型(Fixed effect model: FEM)。这两个方法之间的区别在于,在FEM中估计时间组\(j\)的是特定值,而在 REM方法中,仅估计\(U_{0j}\)的方差而不是时间组的特定值。在具体的建模中,FEM在基于最小二乘法回归的基础上增加了一个虚拟变量,一个虚拟变量就代表了一个群组的截距,然后估计每个群组从属变量的回归系数以产生特定群组的估计。如公式(F)所示,添加哑变量构建FEM的这种方法也被称为基于虚拟变量最小二乘 (least squares dummy variable: LSDV)的FEM。
\[ Y_{i j}=\gamma_{00}+\underbrace{(\alpha_1 D_1+...+\alpha_{n-1} D_{n-1})}_{\alpha_{j}}+\gamma_{10} X_{i j}+e_{i j}......(F) \]
公式(D)和公式(E)唯一的区别就是\(U_{0j}\)和\(\alpha_{j}\),这两个参数的差异是理解LSDV如何处理内生性问题的关键。REM 模型(公式D)和 LSDV-FEM 模型(公式F)都假设模型的随机部分与预测因子不相关。REM模型的随机部分除了\(e_{ij}\),还包括\(U_{0j}\)。因此,与 LSDV-FEM模型相比,REM模型有一个额外的假设: 即\(U_{0j}\)和\(X_{ij}\)不相关,若不满足这一假设会影响估计的准确性。而如果对时间效应这一组间变量采用了FEM方法的话,组间层次所有的不可观测异质性都会被\(\alpha_{j}\)估计,就不会影响估计的准确性。
我们通过一个模拟数据库来对比简单情况下使用和不使用固定效应\(\lambda_{t}*time\),以及使用和不使用时间效应(\(X_{t}\))变量在系数估计的差别。
模拟数据库是一个具有时间层次结构的数据集,其中包括时间Time,和时间层变量Xt以及每个观测点的预测变量X,并且X是一个既有组间变异也有组内变异的变量。因此这个模拟数据集适合用来分析时间效应和固定效应\(\lambda_{t}*time\)对\(X\)和因变量\(Y\)关系估计的影响。在生成这个数据库的时候,我们进行了一系列的参数设定,详情如下:
初始化数据结构: 我们创建了一个包含25个时间段(N =
25)的数据结构,每个时间段包含100个观测值(M = 100)。其
中创建的Time变量字段代表时间段,用数字1到25表示。
生成时间层的变量Xt:
生成一个时间层次的变量Xt,它是正态分布随机数的中心化版本,加上1,然后为每个群组重复M次。他
是一个在时间层的变量,没有组内变异。
生成X的组间部分Xb:
XtX存在组间相关,Xt对X的组间部分Xb的回归系数为0.8,截距为1,还有一个残差(同样使用center(rnorm(N))生成和中心化)。
生成X:
为每个个体生成观测变量X,它是Xb的值加上个体层次的正态随机波动。通
过在每个时间段内生成一个标准化的随机数rnorm(N*M)实现的。。
生成因变量Y:
因变量Y是通过一个线性模型生成的,其中包括一个截距项(5),Xt的影响(-0.8倍),X的影响(0.3倍),以及一个每个时间段内的随机误差项eij。
鉴于我们是为了看到简单情况下使用和不使用固定效应\(\lambda_{t}*time\),以及使用和不使用时间效应(\(X_{t}\))变量在系数估计的差别,因此我们采用了4种类型的模型(如表A所示):
表A 四种模型的区别
| 包含时间效应(\(X_{t}\)) | 不包含时间效应(\(X_{t}\)) | |
|---|---|---|
| 选择固定效应模型(\(\lambda_{t}*time\)) | 模型(2) | 模型(4) |
| 不选择固定效应模型(\(\lambda_{t}*time\)) | 模型(1) | 模型(3) |
具体说来这四个模型的区别如下,
模型(1):无固定效应,含X和Xt(ModelO_ols)
模型(2):含固定效应,含X和Xt(ModelO_fe)
模型(3):无固定效应,仅含X(Model_ols)
模型(4):含固定效应,仅含X(Model_fe)
为了清楚的对比各类模型的建模效果时,我们对模型的总体参数进行了设定(如表B所示),四类模型的估计越接近总体参数,则说明该模型更接近无偏估计。在简单情况,我们主要是关注组内预测变量的参数估计,所以主要是看这四类模型,哪几类可以无偏的估计出X在总体中的参数0.3。因此,这四类模型也拥有三大共同点:第一,四种模型都旨在探索变量X(和Xt在两个模型中)对Y的影响;第二,四种模型都使用相同的数据集,该数据集包含时间段(Time),响应变量Y,以及预测变量X;第三,四种模型都是基于线性回归分析中最常用的方法普通最小二乘(OLS)回归。
表B. 模拟数据的参数设置
| 参数 | 参数值 |
|---|---|
| 截距 | 5 |
| X的效应 | 0.3 |
| 时间层省略变量Xt的效应 | -0.8 |
| Xt对X组间(Xb)的效应:内生性来源 | 0.8 |
## Descriptive Statistics:
## ─────────────────────────────────────────────────────────────────────
## N Mean SD | Median Min Max Skewness Kurtosis
## ─────────────────────────────────────────────────────────────────────
## CaseID 2500 1250.50 721.83 | 1250.50 1.00 2500.00 0.00 -1.20
## Time* 2500 13.00 7.21 | 13.00 1.00 25.00 0.00 -1.21
## Y 2500 4.71 2.13 | 4.70 -3.23 12.43 -0.00 0.05
## X 2500 1.81 1.84 | 1.78 -4.89 7.91 -0.04 0.25
## Xt 2500 1.00 1.09 | 1.21 -1.35 2.98 -0.32 -0.50
## ─────────────────────────────────────────────────────────────────────
##
## NOTE: `Time` transformed to numeric.
#HLM_ICC_rWG(data, group="Time", icc.var="Xt")
#HLM_ICC_rWG(data, group="Time", icc.var="X")
#HLM_ICC_rWG(data, group="Time", icc.var="Y")
# 多层次分析(不含固定效应)
modelO_lmer <- lmer(Y ~ X + Xt + (1|Time), data=data)
# OLS回归分析(含时间固定效应)
modelO_fe <- lm(Y ~ factor(Time) + X + Xt, data=data)
# 多层次分析(不含固定效应)
model_lmer <- lmer(Y ~ X + (1|Time), data=data)
# OLS回归分析(含时间固定效应)
model_fe <- lm(Y ~ factor(Time) + X, data=data)
# 表D:模型结果汇总
model_summary(list(modelO_lmer, modelO_fe, model_lmer, model_fe), digits = 2)#,single.row = T)##
## Model Summary
##
## ───────────────────────────────────────────────────────────────────────────
## (1) Y (2) Y (3) Y (4) Y
## ───────────────────────────────────────────────────────────────────────────
## (Intercept) 5.00 *** 2.91 *** 4.23 *** 2.91 ***
## (0.06) (0.23) (0.20) (0.23)
## X 0.31 *** 0.31 *** 0.27 *** 0.31 ***
## (0.03) (0.04) (0.04) (0.04)
## Xt -0.86 ***
## (0.05)
## factor(Time)2 2.17 *** 2.17 ***
## (0.31) (0.31)
## factor(Time)3 1.13 *** 1.13 ***
## (0.28) (0.28)
## factor(Time)4 0.78 ** 0.78 **
## (0.28) (0.28)
## factor(Time)5 2.41 *** 2.41 ***
## (0.28) (0.28)
## factor(Time)6 -0.08 -0.08
## (0.29) (0.29)
## factor(Time)7 1.09 *** 1.09 ***
## (0.28) (0.28)
## factor(Time)8 0.87 ** 0.87 **
## (0.29) (0.29)
## factor(Time)9 2.18 *** 2.18 ***
## (0.28) (0.28)
## factor(Time)10 1.47 *** 1.47 ***
## (0.29) (0.29)
## factor(Time)11 1.08 *** 1.08 ***
## (0.28) (0.28)
## factor(Time)12 2.16 *** 2.16 ***
## (0.29) (0.29)
## factor(Time)13 0.52 0.52
## (0.28) (0.28)
## factor(Time)14 2.98 *** 2.98 ***
## (0.31) (0.31)
## factor(Time)15 2.88 *** 2.88 ***
## (0.34) (0.34)
## factor(Time)16 0.15 0.15
## (0.28) (0.28)
## factor(Time)17 0.29 0.29
## (0.29) (0.29)
## factor(Time)18 0.04 0.04
## (0.29) (0.29)
## factor(Time)19 2.24 *** 2.24 ***
## (0.29) (0.29)
## factor(Time)20 0.45 0.45
## (0.29) (0.29)
## factor(Time)21 1.77 *** 1.77 ***
## (0.29) (0.29)
## factor(Time)22 1.42 *** 1.42 ***
## (0.29) (0.29)
## factor(Time)23 2.09 *** 2.09 ***
## (0.32) (0.32)
## factor(Time)24 1.22 *** 1.22 ***
## (0.29) (0.29)
## factor(Time)25 -0.28 -0.28
## (0.30) (0.30)
## ───────────────────────────────────────────────────────────────────────────
## Marginal R^2 0.13 0.05
## Conditional R^2 0.13 0.21
## AIC 10574.03 10640.02
## BIC 10603.15 10663.31
## Num. obs. 2500 2500 2500 2500
## Num. groups: Time 25 25
## Var: Time (Intercept) 0.01 0.82
## Var: Residual 3.98 3.98
## R^2 0.13 0.13
## Adj. R^2 0.13 0.13
## ───────────────────────────────────────────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
表E总结了4种模型系数估计结果,具体说来:
X的无偏估计:除了模型(3),在所有模型中,X对Y的系数都接近总体参数(Bx=0.3)
由此可见实现无偏估计有两种方法:第一,如模型(1)一样控制时间层面的所有效应(也就是要保证我们的实际建模和总体模型是一样的),但是这一点在实际的应用中很难做到;第二,如模型(4)一样使用固定效应(\(\lambda_{t}*time\)),从而可以保证对\(X\)的系数估计是无偏的。
模型(3)出现估计偏误的原因:在模型中,\(X_{t}\)对\(X\)在组间层面的影响是0.8。但是由于模型(3)忽略了\(X_{t}\)的影响,导致被忽略的\(X_{t}\)就被包含进了模型的残差项\(U_{0j}\)中,进而导致\(X\)和\(U_{0j}\)是相关的,从而产生了内生性。这说明了即便采用多层次回归,估计仍是有偏误的。这也是在有时间层次的数据中,很常出现的一种情况。因为在建模过程中,学者不可能把所有相关的时间层次的协变量包含进模型估计中。
固定效应模型(\(\lambda_{t}*time\))的优势:由结果可知,使用固定效应模型控制时间层面的影响是一种非常实用的选择。因为在实际的实证研究中,学者很难保证模型构建可以像模型(1)那样完全纳入所有时间层面的教预测因子(即基本上不可能建立一个和总体模型一样的估计模型)。但是纳入时间的固定效应可以通过\(\lambda_{t}*time\)虚拟变量的方法做到控制所有时间层面的影响,从而实现无偏估计。
\(X_{t}\)的影响:在包含\(X_{t}\)的模型中,模型(1)是可以准确估计\(X\)的效应的,这是因为我们已经准确的纳入了时间效应;模型(2)也可以对\(X\)做出一样准确的估计,这是因为固定效应模型已经在模型(2)中添加了时间的固定效应,从而将所有时间层面的效应全部剔除。所以在使用固定效应模型使用之后,模型不会针对时间层面的任何预测因子进行估计。
时间效应:在包含固定效应(\(\lambda_{t}*time\))的模型(2)和(4)中,不同时间段的系数显著不同,表明时间是一个重要的因素,可能会影响Y的变化。
模型拟合度:包含固定效应(\(\lambda_{t}*time\))的模型(模型2和4)或包含时间效应\(X_{t}\)的模型(模型1)都有较高的R平方值,表明不管是否能针对时间效应层面的效应进行正确建模,只要使用了固定效应模型就可以提升模型的拟合。
# 创建数据框
data <- data.frame(
模型 = c("(1) modelO_lmer", "(2) modelO_fe", "(3) model_lmer", "(4) model_fe"),
X的标准误 = c("0.03", "0.04", "0.04", "0.04"),
X的系数 = c("0.31(显著)", "0.31(显著)", "0.27(显著)", "0.31(显著)"),
Xt的系数 = c("-0.86(显著)", "无(被固定效应共线)", "未纳入预测变量", "未纳入预测变量"),
固定效应 = c("无", "有", "无", "有"),
R平方值 = c("0.13", "0.13", "0.05", "0.13")
)
# 使用kable打印表格
kable(data, caption = "表E. 四个模型的结果比较")| 模型 | X的标准误 | X的系数 | Xt的系数 | 固定效应 | R平方值 |
|---|---|---|---|---|---|
| (1) modelO_lmer | 0.03 | 0.31(显著) | -0.86(显著) | 无 | 0.13 |
| (2) modelO_fe | 0.04 | 0.31(显著) | 无(被固定效应共线) | 有 | 0.13 |
| (3) model_lmer | 0.04 | 0.27(显著) | 未纳入预测变量 | 无 | 0.05 |
| (4) model_fe | 0.04 | 0.31(显著) | 未纳入预测变量 | 有 | 0.13 |
在时间层次是唯一群组的简单情况下,我们已经从数学上推导了为什么使用固定效应模型可以准确的估计结果,即在LSDV的基础上增加了虚拟变量λ_t×Time可以有效的控制时间效应影响。面板数据不过是这种简单情况下一种更复杂的情况,即除了时间效应之外还有其他的群组。其公式如下:
\[ \begin{aligned} 组内:\\ Y_{i jk}&=\beta_{0 \mathrm{jk}}+\beta_{1 \mathrm{jk}} X_{i jk}+e_{i jk}......(G) \\ 组间:\\ \beta_{0 jk}&=\gamma_{00}+U_{0 j}+U_{0 k}......(H)\\ \beta_{1 \mathrm{jk}}&=\gamma_{10}......(I)\\ 合并:\\ Y_{i jk} &=\gamma_{00}+\gamma_{10} X_{i jk}+U_{0 j}+U_{0k}+e_{i jk}......(J)\\ \end{aligned} \]
在公式(G)-(I)中,数据被包含3个层级:时间层级(通常为 j)和个人群组层级(通常为 k)。这 里的 \(i\) 通常代表个体层级的索引。每 个公式的含义如下:其中公式(G)表示个体层级的模型。\(Y_{ijk}\) 是因变量,\(X_{ijk}\) 是自变量,\(\beta_{0jk}\) 是截距项,\(\beta_{1jk}\) 是斜率,它们都可能随时间和群组而变化。\(e_{ijk}\) 是个体层级的随机误差项。公式(H)展示了截距 \(\beta_{0jk}\) 如何变化,它是由一个固定部分 \(\gamma_{00}\)(总体平均截距),和两个随机效应 \(U_{0j}\)(时间效应的随机部分)和 \(U_{0k}\)(群组效应的随机部分)组成。公式(I)说明斜率 \(\beta_{1j}\) 是如何随时间变化的,这里简化为一个固定效应 \(\gamma_{10}\),意味着斜率在时间上是不变的。最后,公式(J)将前面的两个模型合并,提供了一个完整的模型视图。固定效应 \(\gamma_{00}\) 和 \(\gamma_{10}\) 代表整体平均截距和斜率,而 \(U_{0j}\) 和 \(U_{0k}\) 为时间和群组的随机效应。\(e_{ijk}\) 保持不变,是个体层级的随机误差项。
这组公式在处理面板数据,既考虑了数据存在时间的组间影响(如追踪数据),也考虑了和其他组间变量的嵌套结构。因此基于此公式,研究人员可以更好地理解在不同层级上因变量的变异性,并评估不同层级自变量对因变量的独立影响。但是如简单数据一样,面板数据也会存在内生性的问题,即\(U_{0j}\)作为时间的随机效应,一旦\(U_{0j}\)和\(X_{ijk}\) 相关,就会带来内生性的问题从而导致\(\gamma_{10}\)的估计偏误。为了控制时间造成的异质性问题,最简单的做法就是如同我们在简单情况下里面统计原理部分的推导就是把\(U_{0j}\)固定为\(\alpha_{j}\),即通过虚拟变量的方法控制时间对模型估计的影响。在公式上就可以简化为公式(K),即混合模型。
\[ \begin{aligned} Y_{i k} &=\gamma_{00}+\gamma_{10} X_{i k}+\alpha_{j}+U_{0k}+e_{i k}......(K)\\ \end{aligned} \]
如公示(K)所示,因为加入了时间的固定效应,\(\alpha_{j}\)已经变成了一个不可能和\(X_{ijk}\)有任何相关的固定效应。并且在公式(K)中纳入该固定效应把所有时间层面的影响都剔除掉了,整个公式变成只针对群组k的一个嵌套模型的公式,大大简化了模型。
我们通过模拟一个简单的面板数据库来对比使用定效应模型和不使用固定效应模型建模时间效应时的区别。和 简单情况下一样,为了对比这些模型设定对于数据结果产生的影响,我们生成了一个数据库。为 了方便与简单情况下的结果进行对比,面板数据情况的参数设定与简单情况下的参数设定完全一样。不 过我们除了时间层次之外,又添加了一个公司层次,在数据上的体现就是添加了一个公司的群组标签FirmID。
在为了对比方便,我们在复杂情况下设置了与简单情况下一样的参数。对比的模型也是简单情况下使用的4种类型的模型,这四类模型的共同点和区别也与简单情况下相同。
## Descriptive Statistics:
## ─────────────────────────────────────────────────────────────────────
## N Mean SD | Median Min Max Skewness Kurtosis
## ─────────────────────────────────────────────────────────────────────
## CaseID 2500 1250.50 721.83 | 1250.50 1.00 2500.00 0.00 -1.20
## FirmID 2500 50.50 28.87 | 50.50 1.00 100.00 0.00 -1.20
## Time* 2500 13.00 7.21 | 13.00 1.00 25.00 0.00 -1.21
## Y 2500 4.71 2.13 | 4.70 -3.23 12.43 -0.00 0.05
## X 2500 1.81 1.84 | 1.78 -4.89 7.91 -0.04 0.25
## Xt 2500 1.00 1.09 | 1.21 -1.35 2.98 -0.32 -0.50
## ─────────────────────────────────────────────────────────────────────
##
## NOTE: `Time` transformed to numeric.
# 同时考虑时间效应和公司效应的多层次模型(不含固定效应)
modelO_cc <- lmer(Y ~ X + Xt + (1|Time) + (1|FirmID), data=data)
# 考虑公司效应的多层次模型(含时间固定效应)
modelO_hybrid <- lmer(Y ~ factor(Time) + X + Xt +(1|FirmID), data=data)
# 同时考虑时间效应和公司效应的多层次模型(不含固定效应)
model_cc <- lmer(Y ~ X +(1|Time) + (1|FirmID), data=data)
# 考虑公司效应的多层次模型(含时间固定效应)
model_hybrid <- lmer(Y ~ factor(Time) + X +(1|FirmID), data=data)
# 表G:模型结果汇总
model_summary(list(modelO_cc, modelO_hybrid, model_cc, model_hybrid),digits = 2)##
## Model Summary
##
## ───────────────────────────────────────────────────────────────────────────────
## (1) Y (2) Y (3) Y (4) Y
## ───────────────────────────────────────────────────────────────────────────────
## (Intercept) 5.00 *** 2.91 *** 4.23 *** 2.91 ***
## (0.06) (0.23) (0.20) (0.23)
## X 0.31 *** 0.31 *** 0.27 *** 0.31 ***
## (0.03) (0.04) (0.04) (0.04)
## Xt -0.86 ***
## (0.05)
## factor(Time)2 2.17 *** 2.17 ***
## (0.31) (0.31)
## factor(Time)3 1.13 *** 1.13 ***
## (0.28) (0.28)
## factor(Time)4 0.78 ** 0.78 **
## (0.28) (0.28)
## factor(Time)5 2.41 *** 2.41 ***
## (0.28) (0.28)
## factor(Time)6 -0.08 -0.08
## (0.29) (0.29)
## factor(Time)7 1.09 *** 1.09 ***
## (0.28) (0.28)
## factor(Time)8 0.87 ** 0.87 **
## (0.29) (0.29)
## factor(Time)9 2.18 *** 2.18 ***
## (0.28) (0.28)
## factor(Time)10 1.47 *** 1.47 ***
## (0.29) (0.29)
## factor(Time)11 1.08 *** 1.08 ***
## (0.28) (0.28)
## factor(Time)12 2.16 *** 2.16 ***
## (0.29) (0.29)
## factor(Time)13 0.52 0.52
## (0.28) (0.28)
## factor(Time)14 2.98 *** 2.98 ***
## (0.31) (0.31)
## factor(Time)15 2.88 *** 2.88 ***
## (0.34) (0.34)
## factor(Time)16 0.15 0.15
## (0.28) (0.28)
## factor(Time)17 0.29 0.29
## (0.29) (0.29)
## factor(Time)18 0.04 0.04
## (0.29) (0.29)
## factor(Time)19 2.24 *** 2.24 ***
## (0.29) (0.29)
## factor(Time)20 0.45 0.45
## (0.29) (0.29)
## factor(Time)21 1.77 *** 1.77 ***
## (0.29) (0.29)
## factor(Time)22 1.42 *** 1.42 ***
## (0.29) (0.29)
## factor(Time)23 2.09 *** 2.09 ***
## (0.32) (0.32)
## factor(Time)24 1.22 *** 1.22 ***
## (0.29) (0.29)
## factor(Time)25 -0.28 -0.28
## (0.30) (0.30)
## ───────────────────────────────────────────────────────────────────────────────
## Marginal R^2 0.13 0.13 0.05 0.13
## Conditional R^2 0.13 0.13 0.21 0.13
## AIC 10576.03 10619.29 10642.02 10619.29
## BIC 10610.97 10782.36 10671.14 10782.36
## Num. obs. 2500 2500 2500 2500
## Num. groups: FirmID 100 100 100 100
## Num. groups: Time 25 25
## Var: FirmID (Intercept) 0.00 0.00 0.00 0.00
## Var: Time (Intercept) 0.01 0.82
## Var: Residual 3.98 3.98 3.98 3.98
## ───────────────────────────────────────────────────────────────────────────────
## Note. * p < .05, ** p < .01, *** p < .001.
表D总结了这4种模型建模的结果,我们发现其结果与在简单情况下的结果是高度一致的。我们可以看到,在面板数据分析中,除了在一个模型(即模型3)下出现偏差,X对Y的估计普遍是无偏的。尤其是,当模型未能包含所有相关的时间层面变量时,将时间的固定效应(\(\lambda_{t}*time\))添加入多层分析中组合成为混合模型可以显示出明显的优势。因为时间的固定效应(\(\lambda_{t}*time\))有效的控制列时间混淆效应,从而提供无偏估计。这在实证研究中尤其有用,由于学者很难确保模型能完整地包括所有时间层面预测因子,并且很多针对面板数据的研究时间层面的效应都不是研究的重心。混合模型通过时间的固定效应(\(\lambda_{t}*time\))排除所有时间层面效应,可以实现无偏估计。模型对比的结果还表明,包含时间效应的模型和固定效应模型均能提高模型拟合度,强调了在分析中考虑时间效应的重要性。总 的来说,固定效应模型是处理时间数据和避免估计偏误的一个强有力工具。
# 创建数据框
data <- data.frame(
模型 = c("(1) modelO_hybrid", "(2) modelO_hybrid", "(3) model_cc", "(4) model_fe"),
X的标准误 = c("0.03", "0.04", "0.04", "0.04"),
X的系数 = c("0.31(显著)", "0.31(显著)", "0.27(显著)", "0.31(显著)"),
Xt的系数 = c("-0.86(显著)", "无(被固定效应共线)", "未纳入预测变量", "未纳入预测变量"),
固定效应 = c("无", "有", "无", "有"),
R平方值 = c("0.13", "0.13", "0.05", "0.13")
)
# 使用kable打印表格
kable(data, caption = "表H. 四个模型的结果比较")| 模型 | X的标准误 | X的系数 | Xt的系数 | 固定效应 | R平方值 |
|---|---|---|---|---|---|
| (1) modelO_hybrid | 0.03 | 0.31(显著) | -0.86(显著) | 无 | 0.13 |
| (2) modelO_hybrid | 0.04 | 0.31(显著) | 无(被固定效应共线) | 有 | 0.13 |
| (3) model_cc | 0.04 | 0.27(显著) | 未纳入预测变量 | 无 | 0.05 |
| (4) model_fe | 0.04 | 0.31(显著) | 未纳入预测变量 | 有 | 0.13 |