Este material tem como objetivo contribuir para o entendimento sobre Modelos de Heterocedasticidade Condicional. Para tanto, vamos mostrar como modelar o segundo momento condicional de uma série temporal e as diferenças entre dois dos principais modelos econométricos de séries temporais univariadas para este caso: Modelo de Heterocedasticidade Condicional Autorregressiva (ARCH) e Modelo de Heterocedasticidade Condicional Autorregressiva Generalizado (GARCH).
INTRODUÇÃO
Anteriormente, estudamos modelos econométricos de séries temporais univariadas que se preocupavam apenas com o primeiro momento condicional da série. Para o caso da série temporal dos retornos de um ativo financeiro, nosso objetivo era modelar a média condicional, ou seja, o valor esperado do retorno. Contudo, sabemos que a série temporal dos retornos apresenta fatos estilizados o que implica que a variância dos retornos tendem a mudar ao longo do tempo, fazendo com que fatores tais como risco e incerteza também oscilem.
Estes fatores têm grande importância para a tomada de decisão de compra e venda de ativos e na montagem de uma carteira de investimentos como mostrado pela teoria moderna do portfólio. Neste sentido, técnicas econométricas de séries temporais foram desenvolvidas fundamentando-se na estimação da variância condicional ao invés de considerá-la constante ao longo do tempo como fizemos anteriormente para os modelos \(AR(p)\), \(MA(q)\), \(ARMA(p,q)\), \(ARIMA(p,d,q)\) e \(SARIMA(p,d,q)(P,D,Q)_s\).
Ao longo do texto, vamos mostrar uma breve descrição do conceito de volatilidade de ativos financeiros bem como suas características. Além disso, vamos estudar o Modelo de Heterocedasticidade Condicional Autorregressiva (ARCH) proposto por Engle (1982) e o Modelo Heterocedasticidade Condicional Autorregressiva Generalizado de Bollerslev (1986).
VOLATILIDADE E SUAS CARACTERÍSTICAS
Uma característica importante da volatilidade de um ativo financeiro é que ela não é observada diretamente. Por exemplo, considere o logaritmo dos retornos diários de uma ação qualquer. A volatilidade diária desta ação não é diretamente observável dado que temos apenas uma observação do retorno da ação durante o dia.
Você poderia pensar em usar dados intradiários para estimar a volatilidade diária, mas mesmo assim teria uma estimativa da volatilidade e não a observação da real volatilidade. Embora a volatilidade não seja observável, ela tem algumas características que são comumente vistas em retornos de ativos financeiros:
- Existem clusters de volatilidade: ela pode ser maior em certos períodos e baixa em outros;
- A volatilidade se densenvolve continuamente ao longo do tempo: saltos de volatilidade são raros
- A volatilidade não diverge para o infinito: ela oscila em torno de um intervalo fixo (estatisticamente falando, isso significa que a volatilidade é estacionária)
- A volatilidade reage de forma diferente a um grande aumento nos preços do que uma grande queda nos preços.
Abaixo, alguns gráficos do índice IBOVESPA que podem ajudar no entendimento das características da volatilidade. Para o caso de clusters, observe que há períodos de grande volatilidade na série (entre \(2008\) e \(2009\)) enquanto nos demais períodos a volatilidade se manteve.
Outra característica importante é que existe uma tendência de mudanças nos preços de um ativo financeiros serem negativamente correlacionadas com mudanças na volatilidade do ativo. Isso também fica evidente ao observarmos os gráficos do índice IBOVESPA e seus retornos (o período de maior volatilidade está associado com o período de menor cotação do índice, por volta de 2009).
Além disso, observe a relação entre os três gráficos acima. O período de maior volatilidade está associado com menor cotação do índice (como já comentado) e também com maior retorno ao quadrado. Isso nos confirma que usar os retornos ao quadrado como uma proxy para verificar a existência de heterocedasticidade condicional é justificável dada a relação entre esta variável e a volatilidade de um ativo financeiro.
Por fim, mostramos abaixo os gráficos da densidade dos retornos do IBOVESPA comparando com a distribuição Normal bem como a função de autocorrelação (FAC) para os retornos normais e retornos elevado ao quadrado.
É possível confirmar, conforme esperado, que a autocorrelação entre os retornos é praticamente nula, mas para os retornos ao quadrado ela fica evidente o que nos mostra certa dependência entre os retornos. Além disso, ao compararmos a densidade dos retornos com a densidade de uma distribuição Normal percebemos a diferença entre elas. Isso é ocasionado principalmente pelos fatos estilizados já documentamos anteriormente.

ESTRUTURA DE UM MODELO DE HETEROCEDASTICIDADE CONDICIONAL
Como mostramos anteriormente, uma das principais características de séries temporais financeiras, em particular o retorno de ativos, é a existência de clusters de volatilidade. Isto significa que retornos não muito longe um do outro no tempo tendem a ter níveis de volatilidade semelhantes. Portanto, “bons” modelos deveriam incorporar esta característica em sua estrutura, pois informações valiosas poderiam ser desperdiçadas e os modelos seriam incapazes de detectar satisfatoriamente as mudanças de volatilidade ao longo do tempo.
Para colocar um modelo que se preocupe com a volatilidade em uma perspectiva adequada, suponha que \(r_{t}\) é o logaritmo do retorno de um ativo financeiro em \(t\). A idéia básica por trás destes modelos é que a série \(\left\{ r_{t}\right\}_{t=1}^{t}\) é não autocorrelacionada ou com correlação em ordens menores, mas ela é dependente. Suponha que a média condicional e variância condicional de \(r_{t}\) são dadas por:
\[
\begin{aligned}
&&& \mu_{t} = E\left(r_{t}|F_{t-1}\right) \\
&&& \sigma_{t}^{2} = Var\left(r_{t}|F_{t-1}\right)=E[\left(r_{t}-\mu_{t}\right)^2 |F_{t-1}]
\end{aligned}
\]
onde \(F_{t-1}\) representa as informações disponíveis até \(t-1\).
Para a equação da média condicional acima, poderíamos assumir que \(r_{t}\) segue um modelo \(ARMA(p,q)\), como segue:
\[
\begin{aligned}
&&& r_{t} = \mu_{t} + a_{t} \\
&&& \mu_{t} = \phi_{0} + \sum_{i=1}^{p}{\phi_{i}r_{t-i}} + \sum_{j=1}^{q}{\theta_{j}a_{t-j}}
\end{aligned}
\] onde \(p\) e \(q\) são as ordens da parte autorregressiva e de médias móveis, respectivamente. Além da parte ARMA de \(\mu_{t}\), poderíamos adicionar variáveis explicativas na equação da média condicional e usar um modelo de regressão linear com erros se comportando como uma série temporal para capturar o comportamento de \(\mu_{t}\). Neste caso, \(\mu_{t}\) seria:
\[
\begin{aligned}
&&& \mu_{t} = \phi_{0} + \sum_{i=1}^{k}{\beta_{i}x_{it}} + \sum_{i=1}^{p}{\phi_{i}r_{t-i}} + \sum_{j=1}^{q}{\theta_{j}a_{t-j}}
\end{aligned}
\] Por exemplo, poderíamos usar uma variável dummy para as segundas-feiras e estudar o efeito do final de semana sobre retornos diários de um ativo qualquer. Combinando a equação da média condicional com a variância condicional, temos:
\[
\begin{aligned}
&&& \sigma_{t}^{2} = Var\left(r_{t}|F_{t-1}\right) = Var\left(a_{t}|F_{t-1}\right)
\end{aligned}
\]
Os modelos de heterocedasticidade condicional estudados aqui estão preocupados com a evolução de \(\sigma_{t}^{2}\). A maneira pela qual \(\sigma_{t}^{2}\) evolui ao longo do tempo distingue um modelo do outro.
TESTE PARA VERIFICAR HETEROCEDASTICIDADE CONDICIONAL AUTORREGRESSIVA (EFEITO ARCH)
Suponha que \(a_t=r_t - \mu_t\) seja os resíduos da equação da média condicional. A série ao quadrado, \(a_t^2\), é então usada para verificar a presença de heterocedasticidade condicional, que chamamos de efeito ARCH. Temos dois testes possíveis. O primeiro deles é o usual teste \(Q\left(m\right)\) da série \(\left\{a_t^2\right\}_{t=1}^{t}\). A hipótese nula deste teste é que as primeiras \(m\) defasagens da FAC da série são zero. A forma mais fácil de verificar isto é criando o gráfico da FAC desta série. Se qualquer defasagem a partir de \(1\) for estatisticamente significante (acima da linha pontilhada), há heterocedasticidade condicional em \(a_t^2\).
Outro teste possível é o teste de multiplicador de Lagrange (LM) de Engle (1982). Este teste é equivalente ao usual teste \(F\) para testar se \(\alpha_{i}=0\), para \(i=1,...,m\) na seguinte regressão linear:
\[
a_{t}^{2} = \alpha_{0} + \alpha_{1}a_{t-1}^{2}+...+\alpha_{m}a_{t-m}^{2} + e_t~\text{;}~~t=m+1,...,T
\] onde \(e_t\) denota o termo de erro, \(m\) é um número inteiro e positivo e \(T\) o tamanho da amostra. Especificamente, temos as seguintes hipóteses:
\[
\begin{aligned}
&&& H_{0}: \alpha_1=...=\alpha_m=0\\
&&& H_{1}: \alpha_i \neq 0 ~\text{para algum}~i~\text{entre}~1~\text{e}~m\\
\end{aligned}
\] Assim, se o p-valor do teste para alguma defasagem qualquer (\(i\)) for menor que \(0.05\), dizemos que ao nível de significância de \(5\%\) podemos rejeitar a hipótese nula. Tal resultado confirma a existência de heterocedasticidade condicional em \(a_t^2\).
MODELO DE HETEROCEDASTICIDADE CONDICIONAL AUTORREGRESSIVA (ARCH)
O primeiro modelo a fornecer uma abordagem sistemática para modelar a volatilidade é o modelo ARCH de Engle (1982). A ideia básica do modelo ARCH é que o termo de erro \(a_t\) dos retornos de um ativo financeiro não é autocorrelacionado, mas dependente do tempo e esta dependência de \(a_t\) pode ser descrita como uma função quadrática de seus valores passados. Especificamente, um modelo \(ARCH(m)\) assume que:
\[
\begin{aligned}
&&& a_{t}=\sigma_t\epsilon_t \\
&&& \sigma_{t}^{2} = \alpha_{0} + \alpha_{1}a_{t-1}^{2}+...+\alpha_{m}a_{t-m}^{2}
\end{aligned}
\]
onde \(\left\{\epsilon_t \right\}_{t=1}^{t}\) é uma sequência de variáveis aleatórias independente e identicamente distribuídas (iid) com média \(0\) e variância \(1\), \(\alpha_{0}>0\) e \(\alpha_{i}\geq 0\) para \(i>0\). Os coeficientes \(\alpha_i\) devem satisfazer algumas condições para garantir que a variância incondicional de \(a_{t}\) seja finita. Na prática, podemos assumir que \(\epsilon_t\) segue uma distribuição Normal ou t-Student. Em algumas aplicações, podemos usar também distribuições assimétricas para \(\epsilon_t\).
A partir da estrutura do modelo podemos perceber que um grande choque ao quadrado (\(\left\{a_{t-i}^2 \right\}_{i=1}^{m}\)) leva a uma grande variância condicional (\(\sigma_{t}^{2}\)) para o termo de erro \(a_{t}\). Consequentemente, \(a_t\) tende a assumir um valor grande em módulo. Isto significa que, sob a abordagem ARCH, grandes choques tendem a ser seguidos por outro grande choque. Esta característica é similar aos clusters de volatilidade apresentados anteriormente para os retornos de ativos.
- PROPRIEDADES DO MODELO ARCH
Para entender o modelo ARCH vale a pena estudar cuidadosamente o modelo \(ARCH(1)\) que é:
\[
\begin{aligned}
&&& a_t = \sigma_{t}\epsilon_{t} \\
&&& \sigma_{t}^2 = \alpha_{0} + \alpha_{1}a_{t-1}^2
\end{aligned}
\] onde \(\alpha_0 >0\), \(\alpha_{1} \geq 0\), \(E\left(a_t\right)=0\), \(Var\left(a_t\right)=Var\left(a_{t-1}\right)=E\left[a_{t-1}^{2}\right]\), \(E\left(\epsilon_t\right)=0\) e \(Var\left(\epsilon_t\right)=E\left[\epsilon_{t}^{2}\right]=1\). Primeiro, a média incondicional de \(a_t\) permanece \(0\) porque:
\[
E\left(a_t\right) = \sigma_tE(\epsilon_t) = 0
\] Segundo, a variância incondicional de \(a_t\) pode ser obtida como:
\[
\begin{split}
Var\left(a_t\right) & = E\left(a_{t}^{2}\right) = E\left(\sigma_{t}^{2}\epsilon_t^{2}\right) \\
& = E\left(\sigma_{t}^{2}\right)\times E\left(\epsilon_{t}^{2}\right)~\text{pois são duas variáveis iid} \\
& = E\left(\sigma_{t}^{2}\right) ~\text{pois}~Var\left(\epsilon_t\right)=1 \\
& = E\left(\alpha_{0} + \alpha_{1}a_{t-1}^2\right) \\
& = \alpha_{0} + \alpha_{1}E\left(a_{t-1}^2\right) \\
& = \alpha_{0} + \alpha_{1}Var\left(a_t\right) \\
& = \frac{\alpha_{0}}{1-\alpha_{1}} \\
\end{split}
\] Sabemos que a variância não pode ser negativa. Assim, precisamos que \(0\leq \alpha_{1} < 1\).
Dependendo da aplicação dos modelos ARCH, é preciso que os momentos de maior ordem de \(a_t\) existam. Assim, \(\alpha_{1}\) deve satisfazer algumas restrições adicionais. Por exemplo, para estudar seu comportamento nas caudas, precisamos que o quarto momento incondicional de \(a_t\) seja finito. Sob a hipóte de que \(\epsilon_{t}\) segue uma distribuição Normal, temos que o quarto momento incondicional é igual a 3, ou seja:
\[
\begin{split}
\frac{m_4}{m_2^{2}} & = \frac{E\left(a_t- \bar{a_t}\right)^4}{\left[E\left(a_t- \bar{a_t}\right)^2\right]^2} = 3 \\
& \\
E\left(a_{t}^{4}\right) & = 3E\left(a_t^2\right)^2 ~\text{pois}~\bar{a_t}=0 \\
& \\
& = 3E\left(\alpha_{0} + \alpha_{1}a_{t-1}^2\right)^2 \\
& \\
& = 3E\left(\alpha_{0}^2 + 2\alpha_{0}\alpha_{1}a_{t-1}^2+\alpha_{1}^{2}a_{t-1}^{4}\right) \\
\end{split}
\]
Se \(a_t\) é estacionário no quarto momento com \(m_4 = E\left(a_{t}^4\right)=E\left(a_{t-1}^4\right)\) e sabendo que \(E\left(a_t^2\right)=Var\left(a_t\right)\) então temos:
\[
\begin{split}
m_4 & = 3\left(\alpha_{0}^2 + 2\alpha_{0}\alpha_{1}Var(a_t)+\alpha_{1}^{2}m_4\right) \\
& \\
& = 3\alpha_{0}^2+6\alpha_0\alpha_1\left(\frac{\alpha_0}{1-\alpha_1}\right) + 3\alpha_{1}^{2}m_4\\
& \\
& = 3\alpha_{0}^{2}\left(1+\frac{2\alpha_1}{1-\alpha_1}\right) + 3\alpha_{1}^{2}m_4 \\
& \\
m_4 - 3\alpha_{1}^{2}m_4 & = 3\alpha_{0}^{2}+\frac{3\alpha_{0}^{2}\left(2\alpha_1\right)}{{1-\alpha_1}} \\
& \\
\left(1-3\alpha_{1}^{2}\right)m_4 & = \frac{\left(1-\alpha_1\right)3\alpha_{0}^{2}+3\alpha_{0}^{2}\left(2\alpha_1\right)}{1-\alpha_1} \\
& \\
m_4 & = \frac{3\alpha_0^2-3\alpha_0^2\alpha_1+6\alpha_0^2\alpha_1}{\left(1-\alpha_1\right)\left(1-3\alpha_1^{2}\right)}\\
& \\
m_4 & = \frac{3\alpha_{0}^{2}\left(1+\alpha_1\right)}{\left(1-\alpha_1\right)\left(1-3\alpha_1^{2}\right)}
\end{split}
\]
Como o quarto momento de \(a_t\) é positivo, \(\alpha_1\) deve satisfazer a condição \(1-3\alpha_{1}^{2}>0\), pois da variância incondicional já temos que \(\left(1-\alpha_1\right)\). Isso implica que \(\alpha_{1}^{2} < \frac{1}{3}\) e juntando as duas condições, \(0\leq \alpha_{1}^{2} < \frac{1}{3}\). Com tais condições podemos encontrar a curtose incondicional de \(a_t\):
\[
\frac{E\left[a_t^4\right]}{\left[Var(a_t)\right]^2} = \frac{3\alpha_{0}^{2}\left(1+\alpha_1\right)}{\left(1-\alpha_1\right)\left(1-3\alpha_1^{2}\right)} \times \frac{\left(1-\alpha_1\right)^2}{\alpha_{0}^{2}} = \frac{3\left(1-\alpha_1^2\right)}{1-3\alpha_1^{2}} > 3
\]
Assim, o excesso de curtose de \(a_t\) é positivo e cauda de sua distribuição é mais pesada que a da distribuição da Normal que tem assimetria igual a \(0\) e curtose \(3\). Isso está de acordo com os resultados empíricos que nos mostram que outliers ocorrem com maior frequência na série temporal de retornos do que em uma série que segue uma distribuição Normal. Tais propriedades são mantidas para modelos ARCH de ordem superior, mas as fórmulas se tornam mais complicadas.
- VANTAGENS E FRAQUEZAS DE UM MODELO ARCH
Como discutido nas seções anteriores, modelos ARCH tem muitas vantagens na análise de retornos de ativos financeiros. As principais vantagens são:
- O modelo pode produzir clusters de volatilidade
- Os choques do modelo, representados por \(a_t\), tem caudas pesadas
Porém, temos também algumas fraquezas, que são:
- O modelo assume que choques positivos e negativos tem o mesmo efeito sobre a volatilidade porque ele depende apenas dos quadrados de choques passados. Na prática, sabemos que os preços de ativos financeiros respondem diferentemente a choques positivos ou negativos.
- O modelo ARCH é bastante restritivo. Por exemplo, \(\alpha_{1}^{2}\) de um modelo \(ARCH(1)\) deve estar no intervalo \(\left[0,\frac{1}{3}\right]\) se a série tem o quarto momento finito. Na prática, tal restrição limita a habilidade do modelo ARCH com erros se distribuindo Normalmente em capturar o excesso de curtose comumente encontrado na distribuição dos retornos de ativos financeiros.
- O modelo ARCH não fornece qualquer insight para entender a fonte de variação de uma série temporal financeira. Ele apenas proporciona uma maneira de descrever o comportamento da variância condicional.
Se encontrarmos que os efeitos ARCH são significantes, pode-se usar a função de autocorrelação parcial (FACP) de \(a_{t}^{2}\) para determinar a ordem \(m\) do modelo \(ARCH(m)\). A justificativa para o uso da FACP pode ser delineada, como segue. Suponha o modelo ARCH(m):
\[
\sigma_{t}^{2} = \alpha_{0} + \alpha_{1}a_{t-1}^{2} + ... + \alpha_{m}a_{t-m}^{2}
\] Para uma dada amostra, \(a_{t}^{2}\) é uma estimativa não enviesada de \(\sigma_{t}^{2}\). Portanto, esperamos que \(a_{t}^{2}\) seja linearmente relacionado a \(a_{t-1}^{2},...,a_{t-m}^{2}\) em uma maneira similar a de um modelo autorregressivo de ordem \(m\). Assim, como estudamos para os modelos autorregressivos, \(AR(p)\), podemos usar a FACP para determinar a ordem \(m\) do modelo \(ARCH(m)\) como você pode observar neste Link.
Já a estimação de tal modelo pode ser realizada por meio do princípio da máxima verossimilhança. Como estudamos neste link, a verossimilhança geral de uma série temporal de retornos pode ser escrita da seguinte forma:
\[
\begin{aligned}
f(r_{t},r_{t-1},...,r_{2},r_{1}) = \left[\prod_{t=2}^{T}{f(r_{t}|r_{t-1},...r_{1})}\right]f(r_{1})
\end{aligned}
\] Se \(r_{t}|r_{t-1},...r_{1}\) segue uma distribuição normal com média \(\mu\) e variância \(\sigma^{2}\) a função de verossimilhança condicional se torna, para \(R = \left\{r_{t}\right\}_{t=1}^{T}\):
\[
L(R|\boldsymbol{\theta}) = f(r_{t},r_{t-1},...,r_{1} | \boldsymbol{\theta}) = f(r_{1}|\boldsymbol{\theta}) \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\sigma^{2}}}exp\left\{-\frac{(r_{t}-\mu)^2}{2\sigma^{2}} \right\}}
\]
Se ignoramos \(f(r_{1})\), a função de verossimilhança condicional dos retornos sob hipótese de normalidade será:
\[
L(R|\boldsymbol{\theta}) = f(r_{t},r_{t-1},...,r_{1}|\boldsymbol{\theta}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\sigma^{2}}}exp\left\{-\frac{(r_{t}-\mu)^2}{2\sigma^{2}} \right\}}
\]
Para o caso específico do modelo \(ARCH(m)\), o ponto crucial é que a função de verossimilhança passa agora a ter \(\sigma_{t}^{2}\) e não assumi-lo constante como anteriormente. Isso implica em:
\[
L(R|\boldsymbol{\theta}) = f(r_{t},r_{t-1},...,r_{1}|\boldsymbol{\theta}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\sigma_{t}^{2}}}exp\left\{-\frac{(r_{t}-\mu)^2}{2\sigma_{t}^{2}} \right\}}
\]
No momento que observamos a amostra de dados da nossa série temporal de retornos, o objetivo no processo de otimização da função de verossimilhança é encontrar o vetor de parâmetros \(\boldsymbol{\theta}\) que maximiza tal função. Como exemplo, suponha que temos o modelo \(ARMA(1,1)-ARCH(1)\) abaixo:
\[
\begin{aligned}
&&& r_{t} = \mu_{t} + a_{t} \\
&&& \mu_{t} = \phi_{0} + \phi_{1}r_{t-1} + \theta_{1}a_{t-1} \\
&&& a_t = \sigma_{t}\epsilon_{t} \\
&&& \sigma_{t}^2 = \alpha_{0} + \alpha_{1}a_{t-1}^2
\end{aligned}
\] Com tais informações, a função de verossimilhança após observar a amostra de retornos será:
\[
\begin{aligned}
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\sigma_{t}^{2}}}exp\left\{-\frac{(r_{t}-\mu)^2}{2\sigma_{t}^{2}} \right\}} \\
&&& \\
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\sigma_{t}^{2}}}exp\left\{-\frac{a_{t}^2}{2\sigma_{t}^{2}} \right\}} \\
&&& \\
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\left(\alpha_{0} + \alpha_{1}a_{t-1}^2\right)}}exp\left\{-\frac{(r_t-\phi_{0} - \phi_{1}r_{t-1} - \theta_{1}a_{t-1})^2}{2\left(\alpha_{0} + \alpha_{1}a_{t-1}^2\right)} \right\}} \\
&&& \\
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}|) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\left(\alpha_{0} + \alpha_{1}\left[r_{t-1}-\phi_{0} - \phi_{1}r_{t-2} - \theta_{1}a_{t-2}\right]^2\right)}}exp\left\{-\frac{(r_t-\phi_{0} - \phi_{1}r_{t-1} - \theta_{1}a_{t-1})^2}{2\left(\alpha_{0} + \alpha_{1}\left[r_{t-1}-\phi_{0} - \phi_{1}r_{t-2} - \theta_{1}a_{t-2}\right]^2\right)} \right\}} \\
\end{aligned}
\]
Isso permitirá encontrar o vetor de parâmetros \(\boldsymbol{\theta} = \left(\phi_0, \phi_1, \theta_1, \alpha_0, \alpha_1\right)\) por meio da otimização da função de verossimilhança.
Uma vez estimado o modelo, precisamos verificar a sua adequação. Para tanto, podemos avaliar a série \(\left\{\hat{a}_t\right\}\), ou seja, os resíduos do modelo \(ARCH(m)\) estimado. Em particular, estatísticas de \(\hat{a}_t\) podem ser usadas para verificar a adequação da equação da média e \(\hat{a}_t^{2}\) pode ser usado para testar a validade da equação da volatilidade.
MODELO DE HETEROCEDASTICIDADE CONDICIONAL AUTORREGRESSIVA GENERALIZADO (GARCH)
Embora o modelo \(ARCH(m)\) seja simples, ele frequentemente requer muitos parâmetros para descrever adequadamente a volatilidade condicional dos retornos de um ativo financeiro. Em função disso, Bollerslev (1986) propôs uma extensão do modelo \(ARCH(m)\) conhecida como modelo de heterocedasticidade condicional autorregressiva generalizado (GARCH).
Como distcutimos na seção estrutura de um modelo de heterocedasticidade condicional, temos duas equações que precisam ser estimadas nestes modelos: média condicional e variância condicional. Para a equação da média condicional, assim como nos modelos \(ARCH(m)\), podemos assumir um modelo \(ARMA(p,q)\), neste formato:
\[
\begin{aligned}
&&& r_{t} = \mu_{t} + a_{t} \\
&&& \mu_{t} = \phi_{0} + \sum_{i=1}^{p}{\phi_{i}r_{t-i}} + \sum_{j=1}^{q}{\theta_{j}a_{t-j}}
\end{aligned}
\]
Já para a variância condicional, Bollerslev (1986) definiu tal equação como segue:
\[
\begin{aligned}
&&& a_{t}=\sigma_t\epsilon_t \\
&&& \sigma_{t}^{2} = \alpha_{0} + \sum_{i=1}^{m}{}\alpha_{i}a_{t-i}^{2}+\sum_{j=1}^{n}{\beta_j\sigma^{2}_{t-j}}
\end{aligned}
\] onde, novamente \(\left\{\epsilon_t \right\}_{t=1}^{t}\) é uma sequência de variáveis aleatórias independente e identicamente distribuídas (iid) com média \(0\) e variância \(1\), \(\alpha_{0}>0\), \(\alpha_{i}\geq 0\), \(\beta_{j}\geq 0\) para \(i>0\) e \(j>0\). Além disso, \(\sum_{i=1}^{max(m,n)}{(\alpha_i+\beta_i)<1}\) que garante que a variância incondicional de \(a_t\) é finita. Como antes, podemos assumir que \(\epsilon_t\) segue uma distribuição Normal ou t-Student. Em algumas aplicações, podemos usar também distribuições assimétricas para \(\epsilon_t\).
Observe que se \(n=0\) a equação da variância condicional se comporta como um modelo \(ARCH(m)\). Por outro lado, para \(n>0\) o modelo é escrito como \(GARCH(m,n)\) também conhecido como modelo de heterocedasticidade condicional autorregressiva generalizado.
- PROPRIEDADES DO MODELO GARCH
Para entender o modelo \(GARCH(m,n)\) vale a pena estudar cuidadosamente o modelo \(GARCH(1,1)\) que é:
\[
\begin{aligned}
&&& a_t = \sigma_{t}\epsilon_{t} \\
&&& \sigma_{t}^2 = \alpha_{0} + \alpha_{1}a_{t-1}^2 + \beta_1\sigma_{t-1}^{2}
\end{aligned}
\] onde \(\alpha_0 >0\), \(\alpha_{1} \geq 0\), \(\beta_{1} \geq 0\), \(\alpha_1+\beta_1 <1\), \(E\left(a_t\right)=0\), \(Var\left(a_t\right)=Var\left(a_{t-1}\right)=E\left[a_{t-1}^{2}\right]\), \(E\left(\epsilon_t\right)=0\) e \(Var\left(\epsilon_t\right)=E\left[\epsilon_{t}^{2}\right]=1\). Primeiro, a média incondicional de \(a_t\) permanece \(0\) porque:
\[
E\left(a_t\right) = \sigma_tE(\epsilon_t) = 0
\] Segundo, para entender a variância incondicional de \(a_t\), deixe \(\eta_t = a_t^2 - \sigma_t^2\) de modo que \(\sigma_t^2 = a_t^2 - \eta_t\) e \(\sigma_{t-i}^2 = a_{t-i}^2 - \eta_{t-i}\) para \(i=0,1,...,n\). Com tais definições podemos fazer:
\[
\begin{aligned}
&&& \sigma_{t}^{2} = \alpha_{0} + \alpha_{1}a_{t-1}^{2}+\beta_1\sigma^{2}_{t-1} \\
&&& \\
&&& a_t^2-\eta_t=\alpha_{0} + \alpha_{1}a_{t-1}^{2}+\beta_1\left(a_{t-1}^2-\eta_{t-1}\right) \\
&&& \\
&&& a_t^2=\alpha_{0}+\alpha_{1}a_{t-1}^{2}+\beta_1a_{t-1}^2+\eta_t-\beta_1\eta_{t-1} \\
&&& \\
&&& a_t^2=\alpha_{0}+\left(\alpha_{1}+\beta_1\right)a_{t-1}^{2}+\eta_t-\beta_1\eta_{t-1} \\
\end{aligned}
\] Observe que a equação acima está no formato de um modelo \(ARMA(1,1)\), mas para \(a_t^2\). Assim, o modelo \(GARCH(1,1)\) pode ser visto como uma aplicação da ideia do \(ARMA(1,1)\) à série de \(a_t^2\). A média incondicional do modelo \(ARMA(1,1)\) encontrada neste link é:
\[
E\left[r_t\right]=\frac{\phi_0}{1-\phi_1}
\]
Assim, a média do modelo \(GARCH(1,1)\) escrito como \(ARMA(1,1)\) para \(a_{t}^{2}\) será:
\[
E\left[a_t^2\right]=\frac{\alpha_0}{1-\left(\alpha_1+\beta_1\right)}
\] que fornece a variância incondicional de \(a_t\) e a restrição já apresentada de que \(\alpha_1+\beta_1<1\) para que ela seja positiva. Já a curtose incondicional de \(a_t\), sob a hipóte de que \(\epsilon_{t}\) segue uma distribuição Normal, temos que o quarto momento incondicional é igual a 3, ou seja:
\[
\begin{split}
\frac{m_4}{m_2^{2}} & = \frac{E\left(a_t- \bar{a_t}\right)^4}{\left[E\left(a_t- \bar{a_t}\right)^2\right]^2} = 3 \\
& \\
E\left(a_{t}^{4}\right) & = 3E\left(a_t^2\right)^2 ~\text{pois}~\bar{a_t}=0 \\
& \\
& = 3E\left(\alpha_{0} + \alpha_{1}a_{t-1}^2+\beta_1\sigma^{2}_{t} \right)^2
\end{split}
\]
que se derivarmos semelhante ao que fizemos para o modelo \(ARCH(m)\), será:
\[
\frac{E\left[a_t^4\right]}{\left[E(a_t^2)\right]^2} = 3\left(\frac{1-\left(\alpha_1+\beta_1\right)^2}{1-\left(\alpha_1+\beta_1\right)^2-2\alpha_1^2}\right) > 3
\]
Consequentemente, similar ao modelo \(ARCH(m)\), a cauda da distribuição de um processo \(GARCH(1,1)\) é mais pesada do que a cauda da distribuição Normal cuja curtose é igual a \(3\).
- VANTAGENS DO MODELO GARCH
Para facilitar o entendimento, suponha que continuamos com um modelo \(GARCH(1,1)\), conforme abaixo.
\[
\begin{aligned}
&&& a_t = \sigma_{t}\epsilon_{t} \\
&&& \sigma_{t}^2 = \alpha_{0} + \alpha_{1}a_{t-1}^2 + \beta_1\sigma_{t-1}^{2}
\end{aligned}
\] Assim, as principais vantagens são:
- Um grande \(a_{t}^2\) ou \(\sigma_{t-1}^2\) gerará um grande \(\sigma_{t}^2\), o que significa que um grande \(a_{t-1}^2\) tende a ser seguido por outro grande \(a_{t}^2\). Isso gera o comportamento de cluster de volatilidade já estudado.
- Os choques do modelo, representados por \(a_t\), tem caudas pesadas
- O modelo fornece uma função paramétrica simples que pode ser usada para descrever a evolução da volatilidade
- ESTIMANDO UM MODELO GARCH
O mesmo procedimento (máxima verossimilhança) para estimar o modelo \(ARCH(m)\) pode ser usado para estimar um modelo \(GARCH(m,n)\), mas a especificação se torna mais complicada. Lembre-se que escrevemos o modelo \(GARCH(m,n)\) como um modelo ARMA e que para este a definição da especificação (ordens do modelo) é feita por meio de critérios de informação.
Assim, utilizaremos a mesma abordagem para os modelos \(GARCH(m,n)\), ou seja, estimamos diversas combinações de \(m\) e \(n\) usando as funções de autocorrelação (FAC) e autocorrelação parcial (FACP). Após isso, escolheremos o modelo com menor AIC e/ou BIC.
No momento que observamos a amostra de dados da nossa série temporal de retornos, o objetivo no processo de otimização da função de verossimilhança é encontrar o vetor de parâmetros \(\boldsymbol{\theta}\) que maximiza tal função. Como exemplo, suponha que temos o modelo \(AR(1)-GARCH(1,1)\) abaixo:
\[
\begin{aligned}
&&& r_{t} = \mu_{t} + a_{t} \\
&&& \mu_{t} = \phi_{0} + \phi_{1}r_{t-1} \\
&&& a_t = \sigma_{t}\epsilon_{t} \\
&&& \sigma_{t}^2 = \alpha_{0} + \alpha_{1}a_{t-1}^2 + \beta_{1}\sigma_{t-1}^{2}
\end{aligned}
\] Com tais informações, a função de verossimilhança após observar a amostra de retornos será:
\[
\begin{aligned}
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}|) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\sigma_{t}^{2}}}exp\left\{-\frac{(r_{t}-\mu)^2}{2\sigma_{t}^{2}} \right\}} \\
&&& \\
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\sigma_{t}^{2}}}exp\left\{-\frac{a_{t}^2}{2\sigma_{t}^{2}} \right\}} \\
&&& \\
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\left(\alpha_{0} + \alpha_{1}a_{t-1}^2 + \beta_{1}\sigma_{t-1}^{2}\right)}}exp\left\{-\frac{(r_t-\phi_{0} - \phi_{1}r_{t-1})^2}{2\left(\alpha_{0} + \alpha_{1}a_{t-1}^2+ \beta_{1}\sigma_{t-1}^{2}\right)} \right\}} \\
&&& \\
&&& L(\boldsymbol{\theta}|R) = f(\boldsymbol{\theta}| r_{t},r_{t-1},...,r_{1}) = \prod_{t=2}^{T}{ \frac{1}{\sqrt{2\pi\left(\alpha_{0} + \alpha_{1}\left[r_{t-1}-\phi_{0} - \phi_{1}r_{t-2} \right]^2+\beta_{1}\sigma_{t-1}^{2}\right)}}exp\left\{-\frac{(r_t-\phi_{0} - \phi_{1}r_{t-1})^2}{2\left(\alpha_{0} + \alpha_{1}\left[r_{t-1}-\phi_{0} - \phi_{1}r_{t-2} \right]^2 +\beta_{1}\sigma_{t-1}^{2}\right)} \right\}} \\
\end{aligned}
\]
e \(\sigma_{t}^{2}\) pode ser calculado recursivamente dado que assumimos os valores iniciais \(r_0\), \(a_0\) e \(\sigma_0\). Isso permitirá encontrar o vetor de parâmetros \(\boldsymbol{\theta} = \left(\phi_0, \phi_1, \alpha_0, \alpha_1, \beta_1\right)\).
CONSTRUÇÃO DO MODELO DE HETEROCEDASTICIDADE CONDICIONAL
Construir um modelo de volatilidade para o retorno de uma série temporal financeira consiste de 4 passos:
- Especificar a equação para a média condicional (\(\mu_{t}\)):
- Visualizar os dados e identificar observações fora do padrão (outliers ou dados faltantes) e eliminá-las.
- Se necessário, transformar os dados para estabilizar a variância (logaritmo dos dados, variação ou retorno, por exemplo)
- Testar se os dados são estacionários. Caso tenha raiz unitária é preciso diferenciar os dados até se tornarem estacionários. Para isso, testa-se novamente se a série diferenciada se tornou estacionária.
- Examinar as funções de autocorrelação (FAC) e autocorrelação parcial (FACP) para determinar as ordens máximas \(P\) e \(Q\) para os componentes AR e MA da série estacionária (diferenciada, se necessário).
- Estimar todas as combinações para \(p\), \(d\) e \(q\). Aqui, \(d\) será fixo e igual ao número de vezes necessárias para tornar a série original estacionáira. Se não foi preciso diferenciar a série, \(d=0\).
- Escolher dentre todos os modelos estimados no passo anterior, o modelo com menor AIC e/ou BIC.
- Caso a especificação escolhida seja \(ARMA(0,0)\) teremos apenas um parâmetro do tipo \(\phi_{0}\) para a média condicional
- Examinar se os resíduos se comportam como um ruído branco:
- Testar autocorrelação nos resíduos: visualizar a função de autocorrelação (FAC) dos resíduos. Se existem defasagens estatisticamente significante (acima da linha pontilhada), há autocorrelação serial.
- Testar heterocedasticidade condicional: visualizar a função de autocorrelação (FAC) dos resíduos ao quadrado. Se existem defasagens estatisticamente significante (acima da linha pontilhada), há heterocedasticidade condicional. Outra alternativa é o teste LM de Engle (1982).
- Verificar a distribuição de probabilidade assumida no processo de estimação: realizar teste que verifique se os resíduos se comportam de acordo com a distribuição de probabilidade adotada.
- Se os resíduos são bem comportados (ruído branco), obter as previsões apenas com a estimação da média condicional. Caso contrário, revisar os passos anteriores para certificar que foram realizados corretamente. Se mesmo assim existir heterocedasticidade condicional e a distribuição de probabilidade não condiz com a hipótese assumida (geralmente uma distribuição Normal), avançar para o próximo passo e estimar a variância condicional também.
- Especificar um modelo de volatilidade e estimar conjuntamente as equações da média e variância condicional:
- Examinar as funções de autocorrelação (FAC) e autocorrelação parcial (FACP) dos resíduos ao quadrado (obtidos da estimação da média condicional) para determinar as ordens máximas \(M\) e \(N\) para os componentes ARCH e GARCH, respectivamente.
- Examinar o histograma dos resíduos juntamente com a densidade das distribuições Normal e t-Student para determinar qual a melhor distribuição se ajusta aos dados. Outras distribuições de probabilidade também podem ser usadas, tal como a Cauchy. Além disso, você pode usar a versão assimétrica destas distribuições caso perceba assimetria no histograma dos resíduos.
- Estimar todas as combinações para \(m=1,..,M\) e \(n=0,...,N\) para a variância condicional juntamente com a especificação ARMA(p,q) escolhida no passo 1
- Escolher o modelo com menor AIC e/ou BIC
- Verificar o modelo estimado
- Avaliar o gráfico da função de autocorrelação do quadrado dos resíduos padronizados estimados no passo 2. O ideal é que as defasagens não ultrapassem a linha pontilhada.
- Avaliar se as restrições impostas sobre os parâmetros são atendidas
- Testar se os resíduos padronizados se comportam conforme a hipóte de distribuição de probabilidade assumida no passo 2 no momento de estimar conjuntamente a média condicional e a variância condicional.
- Visualizar os resultados
- Gráfico da volatilidade condicional
- Obter as previsões
REFERÊNCIAS
Bollerslev, Tim. 1986. “Generalized Autoregressive Conditional Heteroskedasticity.” Journal of econometrics.
Campbell, John Y, Andrew Wen-Chuan Lo, and Archie Craig MacKinlay. 1997. The Econometrics of Financial Markets. Princeton (NJ) Princeton University Press.
Engle, Robert F. 1982. “Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation.” Econometrica Journal of the Econometric Society.
Morettin, Pedro Alberto. 2008. Econometria Financeira Um Curso Em Séries Temporais Financeiras. Edgard Blucher.
Tsay, Ruey S. 2010. Analysis of Financial Time Series. John Wiley & Sons.
———. 2014. An Introduction to Analysis of Financial Data with R. John Wiley & Sons.
