一、引言

  近年来我国经济已从过去的高速增长转换到现在的中高速增长，经济发展已经进入新常态。2011年以来，中国经济增长速度持续下降。2017年经济显现企稳迹象，GDP增速略高于上年。经过长时间调整，经济稳定在中高速平台的有利因素在增多，但还面临杠杆率高、需求不振、信心不稳等困难，增长前景仍存在一定的不确定性。在此轮增速下降的过程中，经济运行的动力、结构和内外环境发生显著变化，中短期分析框架已不能给出有效解释，需要放在增长阶段转换的背景下进行分析。随着增速逐步企稳，未来我国将在较长时期内保持中高速增长的观点得到广泛认可。由于经济的稳定增长关乎经济社会的稳定，所以现在最令人关心的经济问题之一就是寻找带动我国经济增长的推动点，促进我国经济的持续稳定增长。  
  经济增长通常指得是在一个较长时间的跨度上，一个国家的产出水平持续增加。经济增长率的高低体现了一个国家或地区在一定时间内的经济总量的增长速度，也是衡量一个国家或地区总体经济实力增长的标志。  
  为研究我国的经济增长变动趋势以及其影响，并根据所作出的相关结论提出建议。本文将选取中国国内生产总值以及与其相关的经济变量相联系，选择时间序列数据进行经济建模，建立线性回归模型。依据建立的模型结果进行数据分析，得出相关的结论与建议。

二、研究方法与模型

1. 变量选取

概念阐述

  （1）国内生产总值   
  指的是一定时期，指定地区的经济活动生产的最终成果，即最终产品价值。可以直观地反应统计地区的经济发展水平。   
  （2）居民消费   
  指的是常住城乡居民在生活中使用货币进行的商品（货物）支付和非商品（服务）支付。居民消费是构成国民经济的重要组成部分，对国民经济的发展起到支撑作用。通过对消费数据变化的观察可以反映出经济的增长水平。   
  （3）全社会固定资产投资  
  全社会固定资产投资是以货币表现的一定时期内全社会建造和购置固定资产活动的工作量。由相关经济学知识可知投资对经济增长的拉动作用也是十分关键的。   
  （4）教育经费  
  指的是财政部门中实际用于教育的经费，包括事业费和基础建设费。劳动力的素质水平决定经济增长的速度，提高劳动力素质的基本途径就是教育，所以对经济增长因素的分析将教育经费的投入考虑进来。   
  （5）国家财政支出  
  财政支出是政府为履行其自身的职能，对其从私人部门集中起来的以货币形式表示的社会资源的支配和使用。国家集中的财政收入只有按照行政及社会事业计划、国民经济发展需要进行统筹安排运用，才能为国家完成各项职能提供财力的保证。

数据收集以及准备工作

  本文通过时间序列数据，选取了改革开放至今相关的经济变量，对中国国内生产总值与潜在的影响因素逐个进行一元回归模型的建立。因此本文在国家统计局以及《中国统计年鉴》中收集中国国内生产总值、居民消费支出、全社会固定资产投资、教育经费以及国家财政支出在1987-2017年的数据，同时将搜集的数据保存为excel表格并将其导入Rstudio中

#导入数据
gdp <- read_excel("C:/Users/dfo23/Desktop/RDATA/gdp.xlsx")
gdp=gdp%>%select(colnames(gdp)[3])
investment <- read_excel("C:/Users/dfo23/Desktop/RDATA/investment.xlsx")
investment=investment%>%select(colnames(investment)[2])
education=read_excel("C:/Users/dfo23/Desktop/RDATA/education.xlsx")
education=education%>%select(colnames(education)[2])
colnames(education)='edu'
finance=read_excel("C:/Users/dfo23/Desktop/RDATA/finance.xlsx")
finance=finance%>%select(colnames(finance)[3])
consume=read_excel("C:/Users/dfo23/Desktop/RDATA/consume.xlsx")

2. 实证分析

    本文利用R语言来进行相关的实证分析，首先进行相应的准备工作：加载tidyverse、readxl以及读取数据文件（数据包括GDP、investment、consume、education、fund、finance的excel形式的文件）。通过left_join函数将各数据表格整合成为一个数据框便于操作。

#合并数据框
  #为每个数据框添加键
add_key=function(x){
  x=mutate(x,key=1998:2017)
  return(x)
}
gdp=add_key(gdp)
finance=add_key(finance)
investment=add_key(investment)
consume=consume%>%mutate(key=1998:2012)
education=education%>%mutate(key=1998:2015)
  #合并
data=gdp%>%left_join(investment,'key')%>%
  left_join(consume,'key')%>%
    left_join(education,'key')%>%   
  left_join(finance,'key')

1)变量之间的相关性分析

    在进行建立被解释变量与潜在影响因素的回归模型前，本文先进行变量之间的相关性分析。假如，被解释变量与解释变量之间的相关性高，那么说明二者之间有很强的相关性，可以进一步建立变量之间的回归模型，反之则不建立。利用R软件自带的计算简单相关系数的函数cor( )得到简单相关系数表，如下所示：

#相关系数检验
data_test=data%>%filter(!is.na(.$consume))
cor(data_test)

##                      GDP       key investment      time   consume
## GDP            1.0000000 0.9554028  0.9955641 0.9554028 0.9967463
## key            0.9554028 1.0000000  0.9341730 1.0000000 0.9748983
## investment     0.9955641 0.9341730  1.0000000 0.9341730 0.9891610
## time           0.9554028 1.0000000  0.9341730 1.0000000 0.9748983
## consume        0.9967463 0.9748983  0.9891610 0.9748983 1.0000000
## edu            0.9969233 0.9455086  0.9975943 0.9455086 0.9925896
## finance expend 0.9970662 0.9408094  0.9987270 0.9408094 0.9913634
##                      edu finance expend
## GDP            0.9969233      0.9970662
## key            0.9455086      0.9408094
## investment     0.9975943      0.9987270
## time           0.9455086      0.9408094
## consume        0.9925896      0.9913634
## edu            1.0000000      0.9984908
## finance expend 0.9984908      1.0000000

由上表可得国内生产总值与全社会固定资产投资、教育经费支出、消费、财政支出之间的相关系数分别是：0.995，0.996，0.995，0.997。这说明这四个变量与GDP数据的相关性很高，由此可以对其两两结合进行回归模型的建立。

2)回归分析、模型设定

    本文选取国内生产总值最为解释变量，记为Y；另外选取全社会固定资产投资、教育经费、消费、财政支出作为解释变量分别记为X1,X2,X3,X4。 
    模型的设定如下所示：  
                  lnY=β_0+β_1 lnX_i  (i=1,2,3,4)

#模型设定、拟合
library(modelr)
colnames(data)[7]='finance_exp'
data_con=data%>%filter(!is.na(consume))
data_edu=data%>%filter(!is.na(edu))
model_inv=lm(log(GDP)~log(investment),data)
model_con=lm(log(GDP)~log(consume),data_con)
model_edu=lm(log(GDP)~log(edu),data_edu)
model_fin=lm(log(GDP)~log(finance_exp),data)

3.数据可视化及模型检验：

1)数据可视化

  根据收集的数据以GDP为因变量其他经济变量为自变量画出国内生产总值与各经济变量之间的折线图（如下）

#数据可视化
 #gdp and investment
ggplot(data,aes(investment,GDP))+
  geom_line()+
  geom_point()

  #gdp and consume
data_con=data%>%filter(!is.na(consume))
ggplot(data_con,aes(consume,GDP))+
  geom_line()+
  geom_point()

  #gdp and education
data_edu=data%>%filter(!is.na(edu))
ggplot(data,aes(edu,GDP))+
  geom_line()+
  geom_point()

## Warning: Removed 2 rows containing missing values (geom_path).

## Warning: Removed 2 rows containing missing values (geom_point).

  #gdp and finance
colnames(data)[length(data)]='finance'
ggplot(data,aes(finance,GDP))+
  geom_line()+
  geom_point()

2) 一元线性模型的建立及检验

（1）居民消费
通过R软件的拟合可以得到：

model_con

## 
## Call:
## lm(formula = log(GDP) ~ log(consume), data = data_con)
## 
## Coefficients:
##  (Intercept)  log(consume)  
##      -0.5448        1.4151

    由R的输出结果可以得到设定的模型为：  
                      lnY=-0.5448+1.4151lnX_2  
    通过R语言命令可以看到：

summary(model_con)

## 
## Call:
## lm(formula = log(GDP) ~ log(consume), data = data_con)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.063440 -0.018398  0.008429  0.020452  0.047912 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -0.54481    0.17254  -3.158  0.00756 ** 
## log(consume)  1.41510    0.01913  73.968  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03184 on 13 degrees of freedom
## Multiple R-squared:  0.9976, Adjusted R-squared:  0.9974 
## F-statistic:  5471 on 1 and 13 DF,  p-value: < 2.2e-16

    由可视化残差可以看出：残差序列没有表现出特定的模式，在零的上下均匀的波动，残差序列不存在相关性，这说明残差应该是随机的噪声，表明此模型非常好的捕获了数据集中的模式。模型的拟合结果可信。

 #consume残差散点图
data_con=data%>%select(GDP,consume)
data_con=data_con%>%add_residuals(model_con)
ggplot(data_con,aes(log(consume),resid))+
  geom_ref_line(h=0)+
  geom_point()

    通过上面的输出结果可以得知，此模型的可决系数为0.9976，说明二者具有良好的拟合优度，并且可以看出模型拟合的P值为2.2e-16，其值接近为零，说明解释变量对被解释变量具有显著的影响。有结果可以看出来：居民消费每增加1%，那么国内生产总值就会增加1.4151%，可以看出消费的提升会极大的带动GDP的增加，具有较大的影响。  
    同时，对拟合的模型进行可视化处理可以看得出来（下图所示），数据的拟合回归效果较好，数据散点在拟合的回归线附近，说明选择的模型比较合理。

#设定添加预测值函数
grid=function(y,z,x=data){
  x%>%data_grid(y)%>%
    add_predictions(z)
}
    #生成各变量的预测值
grid_2=grid(consume,model_con)
ggplot(data,aes(log(consume)))+
  geom_point(aes(y=log(GDP)))+
  geom_line(aes(y=pred),data=grid_2,color='red')

## Warning: Removed 5 rows containing missing values (geom_point).

（2）全社会固定资产投资
通过R软件的拟合可以得到：

model_inv

## 
## Call:
## lm(formula = log(GDP) ~ log(investment), data = data)
## 
## Coefficients:
##     (Intercept)  log(investment)  
##           4.205            0.700

    由R的输出结果可以得知模型为：  
                    lnY=4.205+0.7lnX_1  
    通过对模型进行查看summary可以得到：

summary(model_inv)

## 
## Call:
## lm(formula = log(GDP) ~ log(investment), data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.066466 -0.028712 -0.004399  0.028561  0.061869 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     4.204654   0.086407   48.66   <2e-16 ***
## log(investment) 0.699953   0.007247   96.58   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03504 on 18 degrees of freedom
## Multiple R-squared:  0.9981, Adjusted R-squared:  0.998 
## F-statistic:  9328 on 1 and 18 DF,  p-value: < 2.2e-16

    由可视化残差可以看出：残差序列没有特征可循，在零的上下均匀波动，表现出纯随机过程不存在相关性。这表明拟合的模型较好的捕获了数据集中的模式，从数据中提取了较多的信息，表明回归后的残差项的信息完全提取，模型拟合的结果比较有可信力。

 #investment残差散点图
data_inv=data%>%select(GDP,investment)
data_inv=data_inv%>%add_residuals(model_inv)
ggplot(data_inv,aes(log(investment),resid))+
  geom_ref_line(h=0)+
  geom_point()

    对拟合的模型进行可视化处理可以看得出来，数据的拟合回归效果较好，数据散点在拟合的回归线附近，说明选择的模型比较合理。  
    同时，从直观的理解上来看，由模型拟合的可视化图形（下图）来看，散点图在拟合的回归线周围变动，说明所设定的回归模型比较合理。模型的设定有所依据。

#模型可视化
grid_1=grid(investment,model_inv)
ggplot(data,aes(log(investment)))+
  geom_point(aes(y=log(GDP)))+
  geom_line(aes(y=pred),data=grid_1,color='red')

（3）教育经费
通过R软件的拟合可以得到：

model_edu

## 
## Call:
## lm(formula = log(GDP) ~ log(edu), data = data_edu)
## 
## Coefficients:
## (Intercept)     log(edu)  
##     -3.7196       0.8707

    由输出结果可以得到模型为：  
                    lnY=-3.7196+0.8707lnX_3  
    通过summary可以得到：

summary(model_edu)

## 
## Call:
## lm(formula = log(GDP) ~ log(edu), data = data_edu)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.086732 -0.033479  0.008329  0.026147  0.096042 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -3.71958    0.24753  -15.03 7.44e-11 ***
## log(edu)     0.87073    0.01336   65.18  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.0459 on 16 degrees of freedom
## Multiple R-squared:  0.9962, Adjusted R-squared:  0.996 
## F-statistic:  4248 on 1 and 16 DF,  p-value: < 2.2e-16

    由图可知此模型的残差序列在零的上下均匀的波动，残差序列不存在相关性，这说明残差应该是随机的噪声，表明此模型非常好的捕获了数据集中的模式。模型的拟合结果可信。

#education残差散点图
data_edu=data%>%select(GDP,edu)
data_edu=data_edu%>%add_residuals(model_edu)
ggplot(data_edu,aes(log(edu),resid))+
  geom_ref_line(h=0)+
  geom_point()

## Warning: Removed 2 rows containing missing values (geom_point).

  由上可知，此模型的可决系数为0.9962，说明说明模型的拟合优度较好，解释变量可以反应被解释变量的变化，此外可以看出P值为2.2e-16，几乎为零，说明教育经费的支出对国内生产总值具有显著的影响，模型的可靠性较高。通过模型拟合的结果可知：教育经费的支出每增加1%的时候，国内生产总值将增加0.8707%，说明教育经费的增加可以带动国内经济的增长且具有较大的影响。  
  对于模型的可视化图形（如下所示）可以看出，原始数据的散点都在模型回归的曲线周围，拟合的效果较好。这也再次证明了模型的设定比较合理，有一定的意义。

#模型可视化
grid_3=grid(education,model_edu)
ggplot(data,aes(log(edu)))+
  geom_point(aes(y=log(GDP)))+
  geom_line(aes(y=pred),data=grid_3,color='red')

## Warning: Removed 2 rows containing missing values (geom_point).

（4）财政支出
通过对数据的拟合可以得到：

model_fin

## 
## Call:
## lm(formula = log(GDP) ~ log(finance_exp), data = data)
## 
## Coefficients:
##      (Intercept)  log(finance_exp)  
##           3.7412            0.8058

    可以得知模型为：  
                    lnY=3.7412+0.8058lnX_4  
    R中的summary：

summary(model_fin)

## 
## Call:
## lm(formula = log(GDP) ~ log(finance_exp), data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.09054 -0.02250 -0.00243  0.02281  0.12810 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       3.74117    0.12448   30.05   <2e-16 ***
## log(finance_exp)  0.80579    0.01139   70.75   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.04779 on 18 degrees of freedom
## Multiple R-squared:  0.9964, Adjusted R-squared:  0.9962 
## F-statistic:  5006 on 1 and 18 DF,  p-value: < 2.2e-16

    此外，由添加的残差序列可以得到图，可以看出残差序列在零的上下均匀的波动，表现为纯随机过程，说明模型的拟合结果比较令人满意。

 #finance残差散点图
colnames(data)[7]='finance_exp'
data_fin=data%>%select(GDP,finance_exp)
data_fin=data_fin%>%add_residuals(model_fin)
ggplot(data_fin,aes(finance_exp,resid))+
  geom_ref_line(h=0)+
  geom_point()

    通过上面的输出结果可以得知，此模型的可决系数为0.9964，说明二者具有良好的拟合优度，并且可以看出模型拟合的P值为2.2e-16，其值接近为零，说明解释变量对被解释变量具有显著的影响。有结果可以看出来：财政支出每增加1%，那么国内生产总值就会增加0.8058%，可以看出财政支出的增加会带动国内生产总值的增长。  
    同时，对拟合的模型进行可视化处理可以看得出来（下图所示），数据的拟合回归效果较好，数据散点在拟合的回归线附近，说明选择的模型比较合理。

#模型可视化
grid_4=data%>%data_grid(finance_exp)%>%add_predictions(model_fin)
ggplot(data,aes(log(finance_exp)))+
  geom_point(aes(y=log(GDP)))+
  geom_line(aes(y=pred),data=grid_4,color='red')

三、结论及启示

    通过利用1987-2017年的有关经济数据的分析可以得出以下结论：  
1.居民消费水平的提升能极大的带动经济的增长。
    根据对数据的拟合可以得到，消费与国内生产总值之间的关系为：消费水平每增长1%就会带动国内生产总值增长1.4151%，是本文研究四个变量与经济增长之间带动国内生产总值增长幅度最大的，这也符合我国的基本经济形式。近年来我国随着人民物质生活水平的不断提高，居民人均文化娱乐支出金额也在不断提高。文化娱乐消费是在人们满足了基础性的生活需求之后，为了提高生活品质而进行的消费。人均可支配收入提高后，消费者在食物、衣服等消费不断缩小，而在教育、医疗、娱乐等方面的消费不断增加。我国居民文化娱乐消费占消费支出比重呈逐年增长态势，2016年超过5%。这些也同样带动了整个经济社会的发展，消费升级推动产业升级，为经济增长提供新的发力点。可以看得出扩大内需，增加居民的消费水平是当前促进经济发展的主要任务之一。  
2.全社会固定资产投资对经济有促进作用但贡献相对较小。  
    通过上文可知，全社会固定资产的投资与国内生产总值之间的关系是：全社会固定资产每增加1%可以带动国内生产总值增加0.7%，说明固定资产投资可以带动经济的增长，但是与其他变量对比来说带动经济增长的幅度并不是很大。究其原因，主要是因为近年来我国实体投资回报率下降导致的。资料显示，中国的实体投资回报率、劳动生产率增速与全要素生产率均出现了趋势性的下降。中国工业企业利润同比增速在1999年至2007年期间平均达到37.55%，在2008年至今则回落至12.7%，在2015年至今已下降至3.1%。可见，实体产业投资机会匮乏、投资回报低迷。实际上，新兴产业需要更多的资金，资金的流向归根到底取决于投资回报，而投资回报归根到底取决于技术进步。由此，导致投资带动国内生产总值增长相对来说幅度较小的主要原因是：投资的资金流向实体经济的以及新型产业的比例相对来说较小，应该从根本上提高实体经济的投资回报率。  
3.教育是拉动经济的重要因素  
    根据上文的分析可以得到，教育经费的投入与国内生产总值之间的关系为：教育经费的投入每增加1%就会带动国内生产总值增长0.8707%。这说明教育经费的投入能明显的拉动经济增长，这是因为，教育对经济具有制约的作用，教育能够提高劳动力的整体素质，教育可以促进科学技术的创新，对经济的运行具有直接调节作用。而且，教育经费的投入强度增大可以提高全社会整体的教育水平，能够一定程度上带动科技的发展，这样也可以为产业升级的发展提供教育基础。这样教育的投入可以为经济的增长带来多种有利的优势。  
4.财政支出对于经济的增长有着重要的推动作用  
    根据上文对数据的拟合结果可以看出，国家财政支出与国内生产总值之间的关系为：国家财政支出每增加1%就会带动国内生产总值增长0.805%。这说明国家财政支出的增加可以带动地区生产总值的提高且具有较大的影响。这是因为国家通过财政支出的手段可以有效地调节资源配置，实现宏观调控。同时财政可以完善基础设施建设可以有力地促进科学、教育、文化、卫生事业的发展，为经济的发展奠定物质基础。我国现在处于经济转型期，合理的利用财政支出可以极大的推动经济的发展和建设，例如合理利用资金高效展开科研成果建设、教育发展和社会基础设施构建等工作，不仅能够为我国经济的全面发展构建一个良好的环境，同时还有助于提升人们的生活质量，从而带动经济的向好发展。  
    结合本文得出的相关结论以及中国当前的经济形势，本文提出以下几点建议:   
1.要重视内需对经济增长驱动的作用。   
    结合上文，居民消费支出相对来说可以极大的带动国内生产总值的增长，但是我国内需不足尤其是消费不足的现状还在持续。目前我国城镇化和工业化建设仍在快速发展，农村居民消费需求还有待释放，内需对经济增长的驱动作用还有很大发展空间。随着经济不断发展，投资的拉动作用逐渐减弱，适度扩大消费才是未来经济增长的持续动力。在国内消费需求不足的同时，中国居民的境外消费却持续高速增长，这背后的主要原因是我国产品与服务的供给与消费需求不匹配，从而造成了我国消费外流的问题。应当进一步提高产品品质和企业创新能力，尤其是加大对科学研究和技术服务，信息传输、软件和信息技术服务等高新技术产业的投资力度，对战略性新兴产业的发展政府应当积极扶持。  
2.加大教育经费的投入，提升社会劳动力整体的产出水平。   
    根据上文的分析可知，教育经费的投入可以很好的带动经济的增长，教育经费的投入对国内生产总值的带动作用在所选取的经济变量中仅次于居民消费支出，说明教育对于经济发展的重要作用。我国应加大对教育方面的投入，增加可支配教育经费，加强基础教育建设。教育部门应该培养优秀教师，提高教育水平，培养优秀的创新型人才，以适应市场的需要。除此之外，提高个人劳动力素质，提升社会劳动生产效率，可以促使社会必要劳动时间的降低，提高经济效率，促进经济增长。
3.合理分配好国家财政支出在资本市场上的配置。   
    社会投资会在一定程度上推动我国经济的增长。另一方面，同国内就业规模相比，劳动力现状存在不合理现象，就会导致负增长现象产生于经济发展中。这也是全社会固定资产投资相带动经济增长相对来说较小的原因之一。因此，对于国家来说应采取有效措施调整财政政策，并将财政支出防治基础设施建设方法，努力推动经济的增长，同时针对部分拥有较大弹性范围的领域，应引导其降低失业率，避免各种经济增长的负面影响至关重要。另外，在资本市场上，国家财政支出应该有进有退，充分激活社会资金对于资本的投资，避免挤出效应对经济造成负面的影响。在新兴产业、扶持产业上政府应该采取积极的财政政策给予补贴，这样才会对经济的发展起到推动作用，促进经济的增长。

中国经济增长影响因素分析

赵龙 2180209023

2019年01月10日

一、引言

二、研究方法与模型

1. 变量选取

概念阐述

数据收集以及准备工作

2. 实证分析

1)变量之间的相关性分析

2)回归分析、模型设定

3.数据可视化及模型检验：

1)数据可视化

2) 一元线性模型的建立及检验

三、结论及启示