Introduction

该网站主要服务于公司视频录制前的准备工作,即将原始的编码和相关的分析放到网站中,然后整合后的内容放到视频录制中去。因为公司主要内容为金价分析,所以整个网站是围绕着对黄金价格走势和相关的特征进行建模分析的。这个网站的主要内容是借助R语言来进行金融数据的分析。这里的金融分析,主要指‘时间序列’和‘线性回归’分析,当然也包括‘风险确定和测量’分析。本网站可以作为芝加哥大学教授Ruey Tsay课程的一个翻译版本,详细内容可以参考此链接

1 Financial Data and their Properties

金融数据主要指各类资产的价格走势,和其相关的延伸数据(如财务报表等)。常见的金融数据为股票或债券,以及其它资产的价格走势。因为资产价格的走势关系到回报率的多少,所以我们首先定义回报率,从而来分析我们的盈利空间。

1.1 回报率定义

将不同时段的资产价格收集为一个序列,表示为\({P_t, t = 1, 2, ... T}\)。那么一个时段的回报率则可以表示为: \[R_t = \frac{P_t - P_{t-1}}{P_{t-1}}\] 为了方便计算,我们将在后面的分析中使用对数收益率(log return)。一个时段的对数收益率定义为: \[r_t = log(\frac{P_t}{P_{t-1}}) = p_t - p_{t-1}\] 其中,\(p_t = log(P_t)\)。对数收益率因为在计算一个时段收益率时较为简单,即只需要将价格对数化后进行加减,便可以计算收益率。而且,对数收益率与回报率之间存在以下关系: \[r_t = log(1+R_t)\] 所以对价格进行对数化后,并不影响我们分析收益率或回报率。一旦获得对数收益率后,将其进行指数化,然后减去一,便可以得到我们通常理解的回报率: \[R_t = e^{r_t} - 1\] 接下来,我们将会通过分析苹果公司的数据来看下其股票的表现。

## [1] "AAPL"

可以发现,虽然价格一直在上涨,但是每日的对数收益率却变化不大

接下来,我们将会分析黄金价格的走势,和其回报率的走势。在进入数据分析之前,我们需要介绍一个非常有名的理论 - 有效市场假说。有效市场假说指的是,如果一个市场是信息透明而且运行有效,那么该市场对于任何一个参与者来说是公平的。公平意味着过去得已经成为公开得讯息(比如美联储加息等)已经充分反映到目前的价格中。因此,仅仅通过分析过去的市场价格走势,并不能带来投资利润。

要验证市场是否有效,只需要检测过去的市场价格,与现在的市场价格,或者相差一定时段的两个价格之间是否存在一定的相关性,如果存在相关性,那么市场运行并不有效,反之则可以成为有效市场。

上面这两个图一个是黄金价格的简单呈现,一个是其对数收益率的走势图。对比可以发现:

  1. 价格走势涨跌不一,没有明显规律;
  2. 对数收益率却有很明显的规律,即均值为0,而且其起伏波动不大;
  3. 对数收益率高低起伏有明显的聚集效应,这样有利于我们预测走势。

1.2 黄金回报率的统计分析

下面是对黄金回报率的绘图和统计测试,目的是检测黄金回报率是否呈正态分布,并呈现其回报率的范围。

##                     lrn
## nobs        2776.000000
## NAs           41.000000
## Minimum       -0.095962
## Maximum        0.068414
## 1. Quartile   -0.005547
## 3. Quartile    0.006373
## Mean           0.000163
## Median         0.000325
## Sum            0.445971
## SE Mean        0.000226
## LCL Mean      -0.000281
## UCL Mean       0.000607
## Variance       0.000140
## Stdev          0.011841
## Skewness      -0.361236
## Kurtosis       5.293757
## 
##  One Sample t-test
## 
## data:  ddd
## t = 0.72019, df = 2734, p-value = 0.4715
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -0.0002808995  0.0006070211
## sample estimates:
##    mean of x 
## 0.0001630608 
## 
## 
##  Shapiro-Wilk normality test
## 
## data:  ddd
## W = 0.94425, p-value < 2.2e-16

统计检测和概率分布图均显示了,黄金价格按日计算收益率均值为0,但是并不呈正态分布,这意味着在毫无消息面和经济分析时,投资黄金的回报率均值为零,但是长尾效应意味着存在一定的几率获得较高收益,只是概率较低。另外,acf检测显示价格相关性为零,因此可以说黄金市场是有效市场。其中acf计算的是autocorrelation: \[\rho_h = \frac{Cov(y_t, y_{t-h})}{V(y_t)}\]


虽然黄金价格日线收益率呈正态分布,而且其价格之间并不存在任何相关性,但是其方差却具有一定的相关性。一旦,方差具有一定相关性,我们便可以通过AR模型来进行描述且帮助我们预测风险走势。以下,就是黄金日线收益率方差的分析。

## 
##  Augmented Dickey-Fuller Test
## 
## data:  vvv
## Dickey-Fuller = -9.2649, Lag order = 13, p-value = 0.01
## alternative hypothesis: stationary
## 
## Series: vvv 
## ARIMA(1,1,3)                    
## 
## Coefficients:
##           ar1      ma1      ma2     ma3
##       -0.7922  -0.1914  -0.7843  0.0548
## s.e.   0.0875   0.0887   0.0796  0.0194
## 
## sigma^2 estimated as 1.319e-07:  log likelihood=17775.99
## AIC=-35541.99   AICc=-35541.96   BIC=-35512.42

在测试完日线回报收益率后,我们将会来分析下周线走势。

## 
##  Shapiro-Wilk normality test
## 
## data:  coredata(gdlrn_wk)
## W = 0.96612, p-value = 2.289e-11

周线收益率均值同样为零,也同样具有长尾效应,而且其长尾效应触及至15%,即较为回报率存在于市场中,但是相应的概率也较低。令人失望的是,有效市场假说在周线图中仍然能够验证,即acf给出的市场价格相关性几乎为零。

不过如果对比周线回报率分布与日线回报率分布,可以发现以下几个特点:

  1. 周线长尾效应给出的回报率较高,约15%;而日线长尾效应只有5%左右。
  2. 周线回报率分布更加接近正态分布,这意味着周线投资机会相对较少。
  3. 另外周线回报率对应的方差也有所下降。

1.3 日线建模和风险预测

在下面的建模分析中,我们将会主要分析过去两年来的走势,即对2016年1月1日后的金价进行分析。这里建模的目的,主要是反应黄金价格风险(或价格方差)的聚集影响,从而帮助投资者预测未来走势。

下面,我们将对数收益率通过动态图形进行展示,以方面投资者可以对图表进行放大跟踪。

下图是对风险走势进行互动图表的表现,投资者可以将图片放大来跟踪风险走势。

下图是将趋势走势,价格与方差放在3D图中的演示。

图形建设中。。。

2 Vector Autogression (VAR) 向量自回归模型

向量自回归模型是目前宏观经济用来预测市场走势时较为常用的模型,其具有以下几个特点:

向量自回归模型的公式: \[ \begin{pmatrix} y_{1t} \\ y_{2t} \end{pmatrix} = \begin{bmatrix} a_{11} & a_{12} \\ b_{11} & b_{12} \end{bmatrix} \begin{pmatrix} y_{1t-1} & y_{1t-2} \\ y_{2t-1} & y_{1t-2} \end{pmatrix} + \begin{pmatrix} \epsilon_{1t-1} \\ \epsilon_{2t-1} \end{pmatrix} \]

根据以上模型,还可以对其进行扩展,选择\(t-3, \ t-4\)等不同时段的数据进行建模。

2.1 Granger Causality 格兰杰因果检测

因为宏观经济数据和金融数据,经常出现同步涨跌的行情。而且很多市场价格的走势往往表现很强的同步性,那么在短线交易中,如何捕捉一定的时间差,从而利用相关性进行提前预测并盈利,成为了投行的核心课题。

接下来我们首先会对黄金价格、美元指数,以及美国10年政府债券收益率进行向量自回顾模型的分析,随后将会对这些因素之间进行格兰杰因果检测,从而帮助我们来分析影响的先后关系,及具体的时间差和程度。

3 Realized Volatility and VIX 波动率指数

波动率指数(VIX)是一种衡量未来30天市场隐含振幅大小的指数,该指数因为其指向性强,而且预测准确度高,别广泛应用。波动率指数(VIX)的理论依据是实际波动率(realized volatiltiy)。假设一天内频繁交易所产生的回报率可以表示为序列\(\{r_{i, t}\}_{i=1}^m\), m 为样本数量,那么实际波动率的计算公式为: \[RV_t^m = \sum_{i=1}^m r_{i,t}^2\] 当数据频率较高时,比如5分钟或1分钟走势图下的价格序列,我们可以将其视为连续序列,那么实际波动率计算公式则变为:\[RV_t \longrightarrow \int_t^{t+1} \sigma_s^2 ds; \ \ as \ m \rightarrow \infty \]

目前黄金价格的波动率指数(GVZ)是由芝加哥期货交易所计算的。其具有以下几个特点:

  1. 具有明显的自回归性
  2. 涨跌走势与价格涨跌同步
  3. 数值大小代表着市场隐含波动率
  4. 预测周期最长可达30天

因此,黄金波动率指数(GVZ)对于预测市场走势,有非常大的帮助。

对黄金波动率指数(GVZ)进行差异自回归建模(HAR)可以到以下公式,该公式的有效度在95%左右: \[GVZ_t = 0.286 + 0.875 \cdot GVZ_{t-1} + 0.041 \cdot GVZ_{t-5} + 0.065 \cdot GVZ_{t-22}\] 投资者可以到芝加哥期货交易所获取相应的数据,然后分别找到当天前4天,以及前21天的GVZ数据后,代入以上公式便可以预测明天GVZ的数值。