7/30/2023

移动平均法,指数平滑法和季节系数法

1.1一次移动平均法 设观测序列\(y_{1},...,y_{T}\),取移动平均的项数\(N<T\).一次移动平均值计算公式如下: \[M^{(1)}_{t}(N)=\frac{y_{t}+y_{t-1}+...+y_{t-N+1}}{N}\] 上式等价于 \[M^{(1)}_{t}(N)=\frac{y_{t-1}+...+y_{t-N}}{N}+\frac{y_{t}-y_{t-N}}{N} =M^{(1)}_{t-1}(N)+\frac{y_{t}-y_{t-N}}{N}\] \(t+1\)期的预测值为\(\hat{y}_{t+1}=M^{(1)}_{t}(N)\),其预测标准误差为 \[S=\sqrt{\frac{\sum_{t=N+1}^{T}(\hat{y}_{t}-y_{t})^2}{T-N}}\]

1.1一次移动平均法

如果将\(\hat{y}_{t+1}\)作为\(t+1\)期的实际值,那么就可以用\(\hat{y}_{t+1}=M^{(1)}_{t}(N)\) 计算第\(t+2\)期预测值\(\hat{y}_{t+2}\).

一次移动平均一般仅应用于一个时期后的预测值,即预测第t+1期。

1.2 指数平滑法

一般来说,历史数据对未来值的影响是随着时间间隔的增长而递减的。比较实际的方法是对各期 观测值依照时间顺序进行加权平均作为预测值。指数平滑法就比较适用于简单的时间序列分析和中短期预测,并满足上述要求。 
1、一次指数平滑法 设时间序列为\(y_{1},y_{2},...,y_{t},...,\alpha\)为加权系数,\(0<\alpha<1\),一次指数平滑的预测公式为 \[\hat{y}_{t+1}=S_{t}^{(1)}=\alpha y_{t}+(1-\alpha)S_{t-1}^{(1)} =S_{t-1}^{(1)}+\alpha(y_{t}-S_{t-1}^{(1)})\] \(\hat{y}_{t+1}\)表示第\(t+1\)期预测值;\(S_{t}^{(1)},S_{t-1}^{(1)}\)分别表示第\(t,t-1\) 期一次指数平滑值。 \[S_{t}^{(1)}=\alpha y_{t}+(1-\alpha)S_{t-1}^{(1)} =\alpha y_{t}+(1-\alpha)[\alpha y_{t-1}+(1-\alpha)S_{t-2}^{(1)}]\] \[~~~~~~~=\alpha\sum_{j=0}^{\infty}(1-\alpha)^{j}y_{t-j}\]

1.2 指数平滑法

\[\hat{y}_{t+1}=S_{t-1}^{(1)}+\alpha(y_{t}-S_{t-1}^{(1)})=\hat{y}_{t}+\alpha(y_{t}-\hat{y}_{t})\] 上式表明新预测值是根据预测误差对原预测值进行修正而得。\(\alpha\)值越大,修正幅度越大;\(\alpha\)值越小,修正幅度越小,\(\alpha\in [0,1]\)。

\(\alpha\)的选择原则: (1)如果时间序列波动不大,则\(\alpha\)应取小一些从而减少修正幅度,可取\(\alpha\in [0.1,0.5]\);

(2)如果时间序列具有迅速且明显的变动倾向,则\(\alpha\)应取大一些从而增加模型的灵敏度,可取\(\alpha\in [0.6,0.8]\);

特别说明:实际应用中可以取多个\(\alpha\),通过比较预测误差的大小,择优选择合适的\(\alpha\)。

初始值的确定:一般取最初几期的平均值作为初始值。

1.2 指数平滑法

2、二次指数平滑法 当时间序列的变动具有直线趋势时,用一次指数平滑法预测,可能存在明显的滞后偏差。因此 需要进行再次修正。于是我们可以做二次指数平滑,利用滞后偏差的规律建立直线趋势模型,即 二次指数平滑法,其计算公式如下:

\[ \begin{cases} S_{t}^{(1)}=\alpha y_{t}+(1-\alpha)S_{t-1}^{(1)} \\ S_{t}^{(2)}=\alpha S_{t}^{(1)}+(1-\alpha)S_{t-1}^{(2)} \end{cases} \] \(S_{t}^{(1)}\)和\(S_{t}^{(2)}\)分别为一次指数平滑值和二次指数平滑值。当时间序列\(\{y_{t}\}\)从某个时刻开始具有直线趋势,我们可用直线趋势模型 \[\hat{y}_{t+m}=a_{t}+b_{t}m,~~~m=1,2,...(*)\]

\[ \begin{cases} a_{t}=2S_{t}^{(1)}-S_{t}^{(2)}\\ b_{t}=\frac{\alpha}{1-\alpha}(S_{t}^{(1)}-S_{t}^{(2)}) \end{cases} (**) \]

1.2 指数平滑法

将\((**)\)式代入\((*)\),令\(m=1\)可得第\(t+1\)期的预测公式如下: \[\hat{y}_{t+1}=2S_{t}^{(1)}-S_{t}^{(2)}+\frac{\alpha}{1-\alpha}(S_{t}^{(1)}-S_{t}^{(2)})\]

1.3具有季节性时间序列的预测

问题:下表中是某商店按照季度统计的三年(12个季度)冰箱的销售数据(单位:万元)。求2004年4季度的销售额。

## # A tibble: 3 × 5
##    年份 一季度 二季度 三季度 四季度
##   <dbl>  <int>  <int>  <int>  <int>
## 1  2001    265    373    333    266
## 2  2002    251    379    374    309
## 3  2003    272    437    396    348

1.3具有季节性时间序列的预测

下面介绍一种可以预测季节性时间序列的预测方法:季节系数法

季节系数法的具体计算步骤:

  1. 收集数据,并用\(a_{ij}\)表示第\(i\)年第\(j\)季度(或月度)时间序列样本值; (2)计算每年所有季度或所有月份的算术平均值\(\bar{a}\),即 \[\bar{a}=\frac{\sum_{i=1}^{m}\sum_{j=1}^{n}a_{ij}}{k},~~~~k=mn\] (3)计算同季度或同月份数据的算术平均值\(\bar{a}_{.j}=\frac{\sum_{i=1}^{m}a_{ij}}{m}\)

(4)计算季度系数或月度系数\(b_{j}=\frac{\bar{a}_{.j}}{\bar{a}}\)

1.3具有季节性时间序列的预测

季节系数法的具体计算步骤(续):

(5)预测计算:

先求行和\(y_{i}=\sum_{j=1}^{n}a_{ij}\);

再求预测年份(下一年)的年加权平均值: \[y_{m+1}=\frac{\sum_{i=1}^{m}\omega_{i}y_{i}}{\sum_{i}^{m}\omega_{i}},~~\mbox{其中}\omega_{i}=i\] 再计算预测年份的季度平均值\(\bar{y}_{m+1}=\frac{y_{m+1}}{n}\);

最后计算预测年度第\(j\)季度的预测值\[y_{m+1,j}=b_{j}\bar{y}_{m+1}.\]

二、平稳时间序列

2.1 时间序列平稳性及相关性度量

严平稳序列定义:时间序列\(X_{1},X_{2},...X_{n},...\)称为严平稳序列,如果它满足如下条件:对于任何\(t_{1},t_{2},...,t_{k}\),滞后期\(\tau\)和任意\(k\),\((X_{t_{1}},X_{t_{2}},...,X_{t_{k}})\)与\((X_{t_{1}+\tau},X_{t_{2}+\tau},...,X_{t_{k}+\tau})\)同分布。

宽(弱)平稳序列定义:时间序列\(X_{1},X_{2},...X_{n},...\)称为宽平稳序列,如果它满足如下两个条件:

-(1)对任何\(t\),\(E(X_{t})=\mu\),此处\(\mu\)为常数;

-(2)对任何\(t\)和滞后期\(\tau\),\(X_{t}\)和\(X_{t+\tau}\)的协方差函数\(Cov(X_{t},X_{t+\tau})=\gamma_{\tau}\)仅仅依赖于时间间隔\(\tau\),而与时刻\(t\)无关。

(总体)自协方差函数和自相关函数

记\(\mu_{t}=E(X_{t}),\mu_{s}=E(X_{s})\),\(X_{t}\)和\(X_{s}\)的自协方差函数定义: \[\gamma_{t,s}=Cov(X_{t},X_{s})=E[(X_{t}-\mu_{t})(X_{s}-\mu_{s})]\] 对于平稳时间序列,若\(\tau=s-t,\mu=E(X_{s})=E(X_{t})\),则其自协方差函数为: \[\gamma_{\tau}=Cov(X_{t},X_{t+\tau})=E[(X_{t}-\mu)(X_{t+\tau}-\mu)]\] 平稳时间序列的自相关函数定义: \[\rho_{\tau}=\frac{\gamma_{\tau}}{\gamma_{0}}=\frac{E[(X_{t}-\mu)(X_{t+\tau}-\mu)]}{Var(X_{t})}\]

(宽)平稳时间序列统计量

样本均值: \[\hat{\mu}=\bar{x}=\frac{\sum_{i=1}^{n}{x_{i}}}{n}.\] 延迟k期样本自协方差: \[\hat{\gamma}_{k}=\frac{\sum_{t=k+1}^{n}(x_{t}-\bar{x})(x_{t-k}-\bar{x})}{n},~~~0<k<n.\]

(宽)平稳时间序列统计量

样本方差: \[\hat{\gamma_{0}}=\frac{\sum_{t=1}^{n}(x_{t}-\bar{x})^2}{n-1},~~~0<k<n.\]

延迟k期样本自相关系数: \[\hat{\rho_{k}}=\frac{\hat{\gamma}(k)}{\hat{\gamma}(0)},~~~0<k<n.\]

2.2 平稳时间序列:ARMA模型

  • AR(p)
  • MA(q)
  • ARMA(p,q)

AR(p)模型

\(AR(p)模型定义\):假设存在时间序列\(X_{1},X_{2},...,X_{n},...\),则定义p阶自回归模型(简称\(AR(p)\)),如下:

\[X_{t}=\phi_{0}+\phi_{1}X_{t-1}+\phi_{2}X_{t-2}+...+\phi_{p}X_{t-p}+\varepsilon_{t}~~~(1)\] 其中\(\phi_{p}\neq 0\)可以保证最高阶数为\(p\),\(\phi_{0},\phi_{1},\phi_{2},...,\phi_{p}\) 称为自回归系数。

随机干扰项\(\varepsilon_{t}\) \(满足\):

1.\(E(\varepsilon_{t})=0,Var(\varepsilon_{t})=\sigma_{\varepsilon}^2\).

2.对任意的\(s\neq t,E(\varepsilon_{s}\varepsilon_{t})=0.\)

即序列\(\varepsilon_{t}\)为\(白噪声序列\).

中心化的AR(p)模型

当\(\phi_{0}=0\),模型\((1)\)称为中心化的\(AR(p)模型\).

当\(\phi_{0}\neq0\),模型\((1)\)可以进行如下的\(中心化转换\): \[X_{t}-\mu=\phi_{1}(X_{t-1}-\mu)+\phi_{2}(X_{t-2}-\mu)+...+\phi_{p}(X_{t-p}-\mu)+\varepsilon_{t}(*)\] 由\((*)\)可得 \[X_{t}=\phi_{1}X_{t-1}+\phi_{2}X_{t-2}+...+\phi_{p}X_{t-p}+ \mu(1-\phi_{1}-\phi_{2}-...-\phi_{p}) \]

比较\((1)\)和上式的系数可得 \[\mu=\frac{\phi_{0}}{1-\phi_{1}-\phi_{2}-...-\phi_{p}}\] 则\(\{x_{t}-\mu\}\)为中心化序列.

中心化AR(p)模型:延迟算子

引入延迟算子,中心化\(AR(p)\)模型又可以简记为 \[\Phi(B)X_{t}=\varepsilon_{t}.\] 其中\(\Phi(B)\)定义如下: \[\Phi(B)=1-\phi_{1}B-\phi_{2}B^2-...-\phi_{p}B^{p},\] 上式称为\(p\)阶自回归系数多项式.

中心化AR(p)模型的平稳性判定:特征根

中心化AR(p)模型可以看成一个非齐次线性差分方程: \[X_{t}-\phi_{1}X_{t-1}-\phi_{2}X_{t-2}-...-\phi_{p}X_{t-p}=\varepsilon_{t}~~~(2)\] 相应的齐次线性差分方程如下: \[X_{t}-\phi_{1}X_{t-1}-\phi_{2}X_{t-2}-...-\phi_{p}X_{t-p}=0~~~(3)\] 设\((3)\)式的形式解为\(X_{t}=\lambda^t\),代入方程\((3)\)可得特征方程如下: \[\lambda^p-\phi_{1}\lambda^{p-1}-\phi_{2}\lambda^{p-2}-...-\phi_{p}=0~~~~(4)\]

中心化AR(p)模型的平稳性判定:特征根

\[\lambda^p-\phi_{1}\lambda^{p-1}-\phi_{2}\lambda^{p-2}-...-\phi_{p}=0~~~~(4)\] 设\(\lambda_{1},\lambda_{2},...,\lambda_{p}\)为\((4)\)的\(p\)个特征根,设这\(p\)个特征根取值为:

  • \(\lambda_{1}=\lambda_{2}=...=\lambda_{d}\)为\(d\)个相等实根;

  • \(\lambda_{d+1}=\lambda_{d+2}=...=\lambda_{p-2m}\)为\(p-2m-d\)个不相等实根;

  • \(\lambda_{j1}=r_{j}\exp^{iw_{j}},\lambda_{j2}=r_{j}\exp^{-iw_{j}}\)为\(j=1,2,...,m\)为\(m\)对共轭复根。 则齐次线性差分方程(3)的通解可表示为: \[x_{t}^{'}=\sum_{j=1}^{d}c_{j}t^{j-1}\lambda_{1}^{t}+\sum_{j=d+1}^{p-2m}c_{j}\lambda_{j}^{t}+\sum_{j=1}^{m}r_{j}^{t}(c_{1j}cos(tw_{j})+c_{2j}sin(tw_{j}))\]

中心化AR(p)模型的平稳性判定:特征根

\[x_{t}-\phi_{1}x_{t-1}-\phi_{2}x_{t-2}-...-\phi_{p}x_{t-p}=\varepsilon_{t}~~~(2)\]

\[\Phi(B)=1-\phi_{1}B-\phi_{2}B^2-...-\phi_{p}B^{p}\] \[\lambda^p-\phi_{1}\lambda^{p-1}-\phi_{2}\lambda^{p-2}-...-\phi_{p}=0~~~~(4)\]

设非齐次线性差分方程(2)存在一个特解\(x_{t}^{''}\),比较\(\Phi(B)\)与方程(4)可知,当 \(\mu_{i}=\frac{1}{\lambda_{i}},i=1,2,...,p\)时,有 \[\Phi(\mu_{i})=1-\phi_{1}\frac{1}{\lambda_{i}}-\phi_{2}(\frac{1}{\lambda_{i}})^2-...-\phi_{p}(\frac{1}{\lambda_{i}})^{p}\] \[=\frac{1}{\lambda_{i}^{p}}(\lambda_{i}^p-\phi_{1}\lambda_{i}^{p-1}-\phi_{2}\lambda_{i}^{p-2}-...-\phi_{p})=0\]

中心化AR(p)模型的平稳性判定:特征根

于是\(\frac{1}{\lambda_{i}}\)为自回归多项式\(\Phi(\mu)=0\)的特征根,于是\(\Phi(B)\)可分解为 \[\Phi(B)=\prod_{i=1}^{p}(1-\lambda_{i}B)\] 进一步由\(\Phi(B)x_{t}=\varepsilon_{t}\)得到特解\(x_{t}^{''}\)可表示为: \[x_{t}^{''}=\frac{\varepsilon_{t}}{\Phi(B)}=\frac{\varepsilon_{t}}{\prod_{i=1}^{p}(1-\lambda_{i}B)}\]

中心化AR(p)模型的平稳性判定:特征根

\[x_{t}-\phi_{1}x_{t-1}-\phi_{2}x_{t-2}-...-\phi_{p}x_{t-p}=\varepsilon_{t}~~~(2)\] 于是,非齐次差分方程(2)的解为 \[x_{t}=x_{t}^{'}+x_{t}^{''}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~\] \[=\sum_{j=1}^{d}c_{j}t^{j-1}\lambda_{1}^{t}+\sum_{j=d+1}^{p-2m}c_{j}\lambda_{j}^{t}+\sum_{j=1}^{m}r_{j}^{t}(c_{1j}cos(tw_{j})+c_{2j}sin(tw_{j}))\] \[+\frac{\varepsilon_{t}}{\prod_{i=1}^{p}(1-\lambda_{i}B)}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~\]

中心化AR(p)模型的平稳性判定:特征根

要使得中心化\(AR(p)\)模型平稳,即要求对任意实数\(c_{1},...,c_{p-2m},c_{1j},c_{2j}(j=1,2,...,m)\),有 \[\lim_{t\to\infty}x_{t}=0\] 其成立的充要条件是: \[|\lambda_{i}|<1,i=1,2,...,p-2m\] \[|r_{i}|<1,i=1,2,...,m\] 即\(AR(p)\)模型的\(p\)个特征根都在单位圆内.根据特征根和自回归系数多项式的根成倒数的关系,\(AR(p)\)模型平稳的等价条件是\(AR(p)\)模型的自回归系数多项式的根即\(\Phi(\mu)=0\)的根都在单位圆外。

AR(p)过程的acf满足Yule-Walker方程组

AR(p)过程的acf满足Yule-Walker方程组: \[\rho_{0}=1\] \[X_{t}-\phi_{1}X_{t-1}-\phi_{2}X_{t-2}-...-\phi_{p}X_{t-p}=\varepsilon_{t}~~~(2)\] 由中心化AR(P)方程(2)可知 \[E[X_{t}X_{t-k}]=\phi_{1}E[X_{t-1}X_{t-k}]+...+\phi_{p}E[X_{t-p}X_{t-k}]+E[X_{t-k}\varepsilon_{t}]\] 于是得到Yule-Walker方程: \[\rho_{k}=\phi_{1}\rho_{k-1}+\phi_{2}\rho_{k-2}+...+\phi_{p}\rho_{k-p}~~~~(5)\]

AR(p)过程的acf满足Yule-Walker方程组

\[\rho_{k}=\phi_{1}\rho_{k-1}+\phi_{2}\rho_{k-2}+...+\phi_{p}\rho_{k-p}~~~~(5)\] 由(5)可获得如下的Yule-Walker方程组(Yule,1927;Walker,1931):

\[ \begin{cases} \rho_{1}=\phi_{1}\rho_{0}+\phi_{2}\rho_{1}+\phi_{3}\rho_{2}+...+\phi_{p}\rho_{p-1} \\ \rho_{2}=\phi_{1}\rho_{1}+\phi_{2}\rho_{0}+\phi_{3}\rho_{1}...+\phi_{p}\rho_{p-2}\\ ....................................\\ \rho_{p-1}=\phi_{1}\rho_{p-2}+\phi_{2}\rho_{p-3}+\phi_{3}\rho_{p-4}...-\phi_{p}\rho_{1}\\ \rho_{p}=\phi_{1}\rho_{p-1}+\phi_{2}\rho_{p-2}+\phi_{2}\rho_{p-3}+...+\phi_{p}\rho_{0} \end{cases} \]

AR(p)过程的acf满足Yule-Walker方程组的矩阵形式

记\(\mathbf{\rho}_{p}=(\rho_{1},\rho_{2},...,\rho_{p})^{T},\mathbf{\phi}_{p}=(\phi_{1},\phi_{2},...,\phi_{p})^{T}\) (下面矩阵对角线元素\(\rho_{0}=1)\) \[\mathbf{P}_{p}=\left [ \begin{matrix} \rho_{0}&\rho_{1}&...& \rho_{p-1}\\ \rho_{1}& \rho_{0}&...& \rho_{p-2}\\ ...& ...&...& ...\\ \rho_{p-1}& \rho_{p-2}&...&\rho_{0} \\ \end{matrix} \right ] \]

于是Yule-Walker方程组的矩阵形式如下:

\[\mathbf{\rho}_{p}=P_{p}\mathbf{\phi}_{p} \mbox{或者得到参数}\mathbf{\phi}_{p}\mbox{的自相关解}可表示为: \mathbf{\phi}_{p}=\mathbf{P}_{p}^{-1}\mathbf{\rho}_{p}\]

AR(p)过程的偏自相关函数pacf

偏相关系数定义:设\(\{X_{t},t=0,\pm1,\pm2,...\}\)为零均值平稳序列,如果已 知\(\{X_{t-1},X_{t-2},...,X_{t-k}\}\)的值,要求对\(X_{t}\)做预报。可以考虑\(\{X_{t-1},X_{t-2},...,X_{t-k}\}\)对\(X_{t}\)的线性最小均方估计,即寻找系数\(\phi_{k,1},\phi_{k,2},...,\phi_{k,k}\)使得 \[min{\delta}=E[(X_{t}-\sum_{j=1}^{k}\phi_{k,j}X_{t-j})^{2}]\] 上式右边展开可得 \[\delta=\gamma_{0}-2\sum_{j=1}^{k}\phi_{k,j}\gamma_{j}+\sum_{j=1}^{k}\sum_{i=1}^{k}\phi_{k,i}\phi_{k,j}\gamma_{j-i}\]

AR(p)过程的偏自相关函数pacf

\[\delta=\gamma_{0}-2\sum_{j=1}^{k}\phi_{k,j}\gamma_{j}+\sum_{j=1}^{k}\sum_{i=1}^{k}\phi_{k,i}\phi_{k,j}\gamma_{j-i}\] 令\(\frac{\partial\delta}{\partial\phi_{k,j}}=0,j=1,2,...,k\)可得 \[-\gamma_{j}+\sum_{i=1}^{k}\phi_{k,i}\gamma_{j-i}=0\]

AR(p)过程的偏自相关函数pacf

两端同除\(\gamma_{0}\),并写成矩阵形式可得:

记\(\mathbf{\rho}_{k}=(\rho_{1},\rho_{2},...,\rho_{k})^{T},\mathbf{\phi}_{k}=(\phi_{k,1},\phi_{k,2},...,\phi_{k,k})^{T}\) \(\rho_{0}=1\) \[\mathbf{P}_{k}=\left [ \begin{matrix} \rho_{0}&\rho_{1}&...& \rho_{k-1}\\ \rho_{1}& \rho_{0}&...& \rho_{k-2}\\ ...& ...&...& ...\\ \rho_{k-1}& \rho_{k-2}&...&\rho_{0} \\ \end{matrix} \right ] \] 易知 \[\mathbf{P}_{k}\mathbf{\phi}_{k}=\mathbf{\rho}_{k}\] 上式称为便相关系数的Yule-Walker方程,称\(\{\phi_{k,k},k=1,2,...\}\)为\(X_{t}\) 的偏相关系数。

2.2.3 MA(q)模型

设\(\{X_{t},t=0,\pm1,\pm2,...\}\)是零均值平稳序列,满足: \[X_{t}=\varepsilon_{t}-\theta_{1}\varepsilon_{t-1}-\theta_{2}\varepsilon_{t-2}-...-\theta_{q}\varepsilon_{t-q}.\]

其中\(\varepsilon_{t}\)为均值为0,方差为\(\sigma_{\varepsilon}^{2}\)的平稳白噪声,则称\(X_{t}\)为阶数为\(q\)的移动平均序列,简记为\(MA(q)\)序列,\(\theta_{i},i=1,2,...,q\)为移动平均系数

对于线性后移算子\(B\),有 \(B\varepsilon_{t}=\varepsilon_{t-1},B^{k}\varepsilon_{t}=\varepsilon_{t-k},\) 再引进算子多项式\[\theta(B)=1-\theta_{1}B-\theta_{2}B^{2}-...-\theta_{q}B^{q}\], 则有MA(q)模型可以表示为\[X_{t}=\theta(B)\varepsilon_{t}.\]

2.2.4 ARMA(p,q)模型

设\(\{X_{t},t=0,\pm1,\pm2,...\}\)是零均值平稳序列,满足下列模型 \[X_{t}-\phi_{1}X_{t-1}-...-\phi_{p}X_{t-p}=\varepsilon_{t}-\theta_{1}\varepsilon_{t-1}-\theta_{2}\varepsilon_{t-2}-...-\theta_{q}\varepsilon_{t-q}.\] 其中\(\varepsilon_{t}\)为均值为0,方差为\(\sigma_{\varepsilon}^{2}\)的平稳白噪声,则称\(X_{t}\)为阶数为\(p,q\)的自回归移动平均序列,简记为\(ARMA(p,q)\)序列. 当\(q=0\),它是\(AR(p)\)序列;当\(p=0\),它是\(MA(q)\)序列.

应用算子多项式\(\phi(B)\)和\(\theta(B)\),\(ARMA(p,q)\)模型定义式可以写为\[\phi(B)X_{t}=\theta_{B}\varepsilon_{t}.\] 当\(ARMA(p,q)\)为非中心化序列时,\(ARMA(p,q)\)为\[\phi(B)(X_{t}-\mu)=\theta_{B}\varepsilon_{t}.\]

2.2.4 ARMA(p,q)模型:构建及预测

-绘制观测值序列的样本自相关系数ACF和样本偏自相关系数PACF图

-ARMA模型的定阶

-ARMA模型的参数估计

-ARMA模型的残差检验:\(\chi^{2}\)检验

-ARMA模型的应用:ARMA(p,q)序列的预测

2.2.4 ARMA(p,q)模型:ARMA模型的定阶

\(ARMA(p,q)\)的AIC定阶准则:选合适的\(p,q\)使得AIC达到最小值,即满足: \[min AIC=n\ln\hat{\sigma}_{\varepsilon}^{2}+2(p+q+1)\]

当\(ARMA(p,q)\)序列含有未知均值参数\(\mu\)时,模型为\[\phi(B)(X_{t}-\mu)=\theta_{B}\varepsilon_{t}.\]此时模型未知参数个数为\(p+q+1\),AIC准则为 \[min AIC=n\ln\hat{\sigma}_{\varepsilon}^{2}+2(p+q+2).\]

2.2.4 ARMA(p,q)模型:ARMA模型参数估计

ARMA模型参数估计方法有很多,包括矩估计、最小二乘估计、极大似然估计等。 此处忽略其数学原理,直接用R或者python软件求解。

2.2.4 ARMA(p,q)模型:ARMA模型残差检验

ARMA(p,q)模型的残差序列应该为白噪声序列,这样的模型才能称之为显著有效的模型。 ARMA(p,q)模型的显著性检验称为残差序列的白噪声检验

原假设\(H_{0}:\rho_{1}=\rho_{2}=...=\rho_{m}=0\),当\(m\leq L\)时; 备择假设\(H_{1}:\rho_{1}\neq0\),当\(m\leq L\)时. 检验统计量\(LB(Ljung-Box)\)检验统计量: \[LB=n(n+2)\sum_{k=1}^{L}(\frac{\hat{\rho_{k}}^{2}}{n-k})\sim\chi^{2}(L-r),~m>0\] \(r\)是带估参数的个数。 \(\chi^{2}\)检验法:给定显著性水平\(\alpha\),记\(\alpha\)分位数\(\chi^{2}(L-r)\),当 \(\chi^{2}\leq\chi^{2}_{\alpha}(L-r)\)时,接受\(H_{0}\)认为\(\varepsilon_{t}\)为白噪声,检验通过。

非平稳时间序列:ARIMA模型

自然界中绝大部分时间序列都是非平稳的。

1、差分运算:差分运算的本质是利用自回归的方式提取确定性信息。对原序列\(\{X_{t},t=0,\pm1,\pm2,...\}\)进行差分运算公式如下: \[\Delta^{d}X_{t}=(1-B)^{d}X_{t}=\sum_{i=0}^{d}(-1)^{i}C_{d}^{i}X_{t-i},~~\mbox{其中}C_{d}^{i}=\frac{d!}{i!(d-i)!}\]

非平稳时间序列:ARIMA模型

下面介绍实际操作中常见的三种差分方式:

(1)序列蕴含明显的线性趋势,一阶差分可以实现平稳;

(2)序列蕴含曲线趋势,通常二阶或三阶差分即可;

  1. 序列蕴含固定周期,通常可进行步长等于周期长度的差分运算,可以较好提取周期信息。

理论上任何非平稳序列只要通过适当阶数的差分后平稳,然后就可以针对差分序列进行ARMA模型拟合了。因此ARIMA模型事实上就是差分运算和ARMA模型的组合。

非平稳时间序列:ARIMA模型

2、ARIMA模型的结构:

\[ \begin{cases} \phi(B)\Delta^{d}X_{t}=\theta(B)\varepsilon_{t}\\ E(\varepsilon_{t})=0,Var(\varepsilon_{t})=\sigma_{\varepsilon}^{2},E(\varepsilon_{s}\varepsilon_{t})=0,s\neq t\\ E(X_{t}\varepsilon_{t})=0,s<t. \end{cases} (**) \]