A série temporal dos retornos de um ativo denotada por \(\left\{r_{t}\right\}_{t=1}^{T}\) é uma coleção de variáveis aleatórias coletadas ao longo do tempo (definição de processo estocástico). A modelagem econométrica de séries temporais univariadas tem como objetivo capturar a relação linear entre \(r_{t}\) e informações disponíveis antes de \(t\).
Desta forma, os valores históricos de \(r_{t}\) podem ser úteis para modelar o seu comportamento ao longo do tempo. Neste caso, a correlação entre os retornos tem um papel importante. Chamamos tais correlações de autocorrelação e esta é uma ferramenta básica para estudar uma série temporal estacionária.
Neste sentido, este material tem como objetivo contribuir para o entendimento sobre correlação, autocorrelação e autocorrelação parcial.
CORRELAÇÃO
O coeficiente de correlação de Pearson que mede a dependência linear entre duas variáveis é definido como:
\[
{\rho}_{x,y}=\frac{COV\left(x,y \right)}{\sqrt{Var\left(x \right),Var\left(y \right)}} =\frac{E\left[\left(x-{\mu}_{x} \right) \left(y-{\mu}_{y} \right) \right]}{\sqrt{E{\left(x-{\mu}_{x} \right)}^{2}E{\left(y-{\mu}_{y} \right)}^{2}}}
\]
onde \({\mu}_{x}\) e \({\mu}_{y}\) são a média de \(x\) e \(y\), respectivamente. Algumas propriedades:
- \(-1\leq {\rho}_{x,y} \leq 1\)
- \({\rho}_{x,y}={\rho}_{y,x}\)
- \({\rho}_{x,y}=0\) quando as duas variáveis não são correlacionada
Existem outras alternativas para o cálculo de correlação proposto por Pearson. Dentre eles temos o \(\rho\) de Spearman e o \(\tau\) de Kendall. Maiores detalhes neste link.
Quando uma amostra \(\left\{(x_{t},y_{t})|t=1,...,T\right\}\) é coletada, a correlação pode ser obtida por seu estimador amostral:
\[
{\hat{\rho}}_{x,y}=\frac{\sum_{t=1}^{T}{ \left({x}_{t}-\overline{x} \right) \left({y}_{t}-\overline{y} \right)}}{ \sqrt{\sum_{t=1}^{T}{{\left({x}_{t}-\overline{x} \right)}^{2}\sum _{t=1}^{T}{{\left({y}_{t}-\overline{y} \right) }^{2}}}}}
\]
onde \(\overline{x}={\sum_{t=1}^{T}{{x}_{t}}}/{T}\) e \(\overline{y}={\sum_{t=1}^{T}{{y}_{t}}}/{T}\) correspondem à média amostral de \(x\) e \(y\), respectivamente. No gráfico abaixo, mostramos exemplos de variáveis correlacionadas (positiva e negativa).
FUNÇÃO DE AUTOCORRELAÇÃO
A função de autocorrelação é o gráfico da autocorrelação contra a defasagem. Considere uma série temporal de retornos de uma ação \(\left\{r_{t}\right\}_{t=1}^{T}\). O coeficiente de correlação entre \(r_{t}\) e \(r_{t-k}\) é chamado de autocorrelação de k-ésima ordem e é denotadado por:
\[
{\rho}_{k}=\frac {Cov\left({r}_{t},{r}_{t-k} \right)}{\sqrt{Var\left({r}_{t},{r}_{t-k} \right)}} =\frac{Cov\left({r}_{t},{r}_{t-k} \right)}{Var\left({r}_{t} \right)} =\frac{{\gamma}_{k}}{{\gamma}_{0}}
\]
onde \(Var\left({r}_{t-k}\right)=Var\left({r}_{t}\right)\) porque \(r_{t}\) é fracamente estacionário. Além disso, temos:
- \({\rho}_{0}=1\);
- \({\rho}_{l}={\rho}_{-l}\);
- \(-1\leq {\rho}_{l} \leq 1\)
Um conjunto de autocorrelações, \(\left\{\rho_{k}\right\}\), é chamado de função de autocorrelação de \(r_{t}\). Para uma dada amostra de retornos de uma ação, \(\left\{r_{t}\right\}_{t=1}^{T}\), suponha que \(\overline{r}\) é a média amostral. Então, a autocorrelação amostral de primeira ordem de \(r_{t}\) é:
\[
{\hat{\rho}}_{1}=\frac{\sum _{t=2}^{T}{\left({r}_{t}-\overline{r}\right) \left({r}_{t-1}-\overline{r}\right)}}{\sum_{t=1}^{T}{{\left({r}_{t}-\overline{r}\right)}^{2}}}
\]
que é um estimador consistente de \({\rho}_{1}\). Em geral, a autocorrelação amostral de k-ésima ordem de \(r_{t}\) pode ser definida como:
\[
{\hat{\rho}}_{k}=\frac{\sum_{t=k+1}^{T}{\left({r}_{t}-\overline{r}\right) \left({r}_{t-k}-\overline{r} \right)}}{\sum_{t=1}^{T}{{\left({r}_{t}-\overline{r}\right)}^{2}}}
\] para \(0\leq k \leq T-1\).
Por exemplo, suponha que você está avaliando uma série temporal qualquer e quer visualizar como as defasagens da série podem impactar seu valor atual (ou seja, se \(r_{t}\) é relacionado com \(r_{t-k}\) para \(k\ge1\)). A função de autocorrelação pode ser usada para obter tal informação.
Num primeiro momento, visualize os dados da série para 10 defasagens. Observe que as defasagens se tornam novas colunas e na medida que elas aumentam, incrementa-se as linhas sem observações.
Agora, observe a matriz de correlações entre a série temporal e suas defasagens (aqui, apenas 10). O comportamento da correlação é evidenciado pela mudança de cor de azul para vermelho, sendo que a cor azul representa correlação positiva e vermelha negativa. Observamos que há correlação positiva para as primeiras defasagens da série temporal.
Apesar da simples correlação entre os dados nos ajudar a identificar defasagens que poderíam contribuir para o comportamento da série em \(t\), precisamos fazer uso de testes estatísticos que verifiquem a significância da relação entre o valor atual e suas defasagens. Neste sentido, a função de autocorrelação tem grande importância.
Abaixo, um exemplo de função de autocorrelação. Observe que há duas linhas horizontais que representam os limites do teste de significância sendo que valores acima ou abaixo da linha são estatisticamente significantes. Neste documento, apresentaremos o teste que é realizado.

AUTOCORRELAÇÃO PARCIAL
Em um modelo AR(1), existe uma correlação implícita entre \(y_{t}\) e \(y_{t-2}\). Isso está presente na FAC, por meio do decaimento exponencial.
Suponha que você quer modelar o retorno no instante \(t\), \(r_{t}\), como função do retorno imediatamente anterior, \(R_{t-1}\). Porém, pode existir também uma correlação implícita entre os retornos em \(t\) e \(t-2\), mas seu interesse continua sendo verificar se apenas o retorno em \(t-1\) é importante para o comportamento do retorno em \(t\).
Uma alternativa para filtrar correlações e manter-se apenas a correlação pura entre duas observações é fazer uso da correlação parcial. Formalmente, fazemos uso das seguintes regressões para cada defasagem \(j\) de interesse:
\[
{r}_{t}={\phi}_{j,1}{r}_{t-1}+{\phi}_{j,2}{r}_{t-2}+\cdot \cdot \cdot +{\phi}_{j,j}{r}_{t-j}+{\epsilon}_{t}
\]
onde \({\epsilon}_{t}\) é um erro e \(j=1,2,...\). Em outras palavras, o procedimento faz:
- Para \(j=1\): regredir \(r_{t}\) contra \(r_{t-1}\) e obter \(\hat{{\phi}}_{1,1}\)
- Para \(j=2\): regredir \(r_{t}\) contra \(r_{t-1}\) e \(r_{t-2}\) e obter \(\hat{{\phi}}_{2,1}\) e \(\hat{{\phi}}_{2,2}\), mas só interessa \(\hat{{\phi}}_{2,2}\)
- Assim por diante
No caso de uma série temporal, geramos uma função de autocorrelação parcial que será o gráfico da autocorrelação parcial contra possíveis defasagens da própria série temporal, ou seja, o gráfico de \(\hat{{\phi}}_{j,j}\) para cada \(j\) possível.
Abaixo, gráfico da FACP para a mesma série temporal que usamos para exemplificar a matriz de correlações e a FAC. Observe a diferença entre a função de autocorrelação e função de autocorrelação parcial. Enquanto a primeira mostra que há autocorrelação significante até a defasagem 12, o gráfico da função de autocorrelação parcial define que apenas 3 defasagens da série temporal realmente são importantes para modelar seu valor esperado em \(t\).

Essa avaliação das duas funções é de suma importância para a modelagem de séries temporais lineares dado que contribui para identificar a especificação correta de qual formulação econométrica usar. Neste caso específico, um modelo AR(3), \({r}_{t}={\phi}_{0}+{\phi}_{1}{r}_{t-1}+{\phi}_{2}{r}_{t-2}+{\phi}_{3}{r}_{t-3}+{a}_{t}\), deve ser uma boa especifição. Veremos maiores detalhes sobre esses modelos em próximas aulas.
TESTE SIGNIFICÂNCIA ESTATÍSTICA AUTOCORRELAÇÃO
Para um dado \(k\), os resultados da Função de Autocorrelação podem ser testados usando um teste que verifique se:
\[
\begin{aligned}
&& H_{0}: \rho_{k}=0 \\
&& H_{1}: \rho_{k}\neq 0
\end{aligned}
\] A estatística do teste será:
\[
t-ratio=\hat{\rho}_{k}\sqrt{T}
\]
A decisão do teste será rejeitar \(H_{0}\) se \(\left| t-ratio \right|>{{Z}_{\alpha}}/{{2}}\), onde \({Z}_{{\alpha}/{2}}\) é o \(100(1-{\alpha}/{2})\) percentil de uma distribuição normal.
Exemplo: tenho uma série temporal com \(516\) observações e quero testar a signifiância de \(\hat{\rho}_{12}=0.13\). Para tanto, basta fazer: \(t-ratio=\sqrt{516}*0.13=2.96\) que é maior em módulo do que o valor crítico de \(5\%\) que é \(1.96\). Conclusão: rejeitamos \(H_{0}\).
TESTAR CONJUNTAMENTE VÁRIAS AUTOCORRELAÇÕES
As estatísticas \(\hat{\rho}_{1}\), \(\hat{\rho}_{2}\), … são chamadas de FAC amostral de uma série temporal. Elas têm um papel importante na análise de séries temporais lineares. Em muitas aplicações estamos interessados em testar se várias defasagens da função de autocorrelação são iguais a 0. Box and Pierce (1970) propuseram um teste, conhecido como Ljung-Box, que foi modificado por Ljung and Box (1978) para melhorar o poder do teste em amostras finitas e é definido como:
\[
Q=T(T+2)\sum_{j=1}^{n}{\frac{{\hat{\rho}}_{j}^{2}}{T-j}}
\] que segue uma distribuição \({\chi}_{n}^{2}\) que indica \(n\) graus de liberdade. Sejam as hipóteses nulda, dada por \(H_{0}:\sum_{j=1}^{n}{\rho_{j}=0}\), e alternativa, dada por \(H_{0}:\sum_{j=1}^{n}{\rho_{j}\neq0}\), então podemos testar conjuntamente se \(j\) defasagens da função de autocorrelação são iguais a \(0\).
REFERÊNCIAS
Box, George EP, and David Pierce. 1970. “Distribution of Residual Autocorrelations in Autoregressive-Integrated Moving Average Time Series Models” 65 (332). Journal of the American statistical Association: 1509–26.
Campbell, John Y, Andrew Wen-Chuan Lo, and Archie Craig MacKinlay. 1997. The Econometrics of Financial Markets. Princeton (NJ) Princeton University Press.
Ljung, Greta M, and George EP Box. 1978. “On a Measure of Lack of Fit in Time Series Models” 65 (2). Biometrika - Oxford University Press: 297–303.
Morettin, Pedro Alberto. 2008. Econometria Financeira Um Curso Em Séries Temporais Financeiras. Edgard Blucher.
Tsay, Ruey S. 2010. Analysis of Financial Time Series. John Wiley & Sons.
———. 2014. An Introduction to Analysis of Financial Data with R. John Wiley & Sons.
