利用计算机产生\(T=100\)个i.i.d的标准正态分布随机变量序列,记这些序列为\(e_1,\cdots, e_{100}\)

\(Y_1=e_1\)\(Y_t = Y_{t-1}+e_t\)\(t=2,3,\cdots,100\);则

y = rep(0,100)
y[1] = e[1]
for(i in 2:100){y[i]=y[i-1]+e[i]}
plot(y,type='l')

再利用计算机产生100个i.i.d的标准正态分布新序列\(a_1,\cdots,a_100\)。令 \(X_1=a_1\)\(X_t =X_{t-1}+a_t\),\(t=2,\cdots,100\)

a = rnorm(100)
x = rep(0,100)
x[1] = a[1]
for(i in 2:100){x[i] = x[i-1]+a[i]}
plot(a,type="l")

plot(x,type="l")

\(X_t\)\(Y_t\)两个序列分别由两个毫无关系的白噪声累加而成,这两变量之间也因该毫无关系才对。 但是通过分析\(X_t\)\(Y_t\)的散点图以及回归结果,所得出的结论却与我们的判断并不一致。

library(ggplot2)
library(xtable)
qplot(x,y,geom=c("point","smooth"),method="lm")

summary(lm(y~x))$coef
##               Estimate Std. Error   t value     Pr(>|t|)
## (Intercept)  2.4493372 0.24985295  9.803115 3.237845e-16
## x           -0.1374156 0.03910555 -3.513966 6.698210e-04

从回归的结果可以看出,解释变量系数对应的p值远小于0.05,按照经典回归分析的评价标准,此时\(X\)\(Y\)的影响“显著”!两个本无任何关系的变量,回归结果却认为他们存在“显著”的回归关系,这就是“伪回归”。

面板数据回归

模型的设定

面板数据模型:\(Y_{it}\) = \(X_{it}\beta +\alpha_i + u_{it}\),\(i=1,\cdots,N\), \(t = 1,\cdots,T\)\(i\)表示样本观测个体的个数,\(t\)表示样本观测期数。 \(\alpha_i\)为个体的异质性,用来反映一些不随时期变化仅在个体间有差异的影响因素。

固定效应模型

和传统的回归模型类似,面板数据模型也有一些基本假定:

1.解释变量\(X_{it}\)不存在共线性;

2.随机扰动项与解释变量无关,\(E(u_{it}|X_{it})=0\)

3.随机扰动项同方差,\(D(u_{it}|X_{it})=\sigma^2_u\)

——————————the end———————————-