# BiBliotecas
library(readxl)
library(astsa)
library(tidyverse)
library(forecast)
library(tidyquant)
library(tscount)
library(gridExtra)

1 Objetivos

O objetivo desse relatório, é de mostrar os resultados encontrados utilizando o modelo Logit Multinomial. Foi feito diversas abordagens, em relação a escolha dos parâmetros da minha função Logit_ts(). A cadeia de RNA utilizada nos testes foi a do Virus Epstein–Barr (BNRF1), selecionando as 1000 observações iniciais.

No qual a cadeia de RNA é interpretada dessa forma:

\[ A = 1 \\ C = 2 \\ G = 3 \\ T = 4 \]

A função Logit_ts(), apresenta alguns parâmetros que precisam ser explicados afim de melhorar o entendimento dos resultados posteriores. São eles:

2 Parte De Médias Móveis

Um modelo de médias móveis, em particular de um MA(1) é dado por:

\[ \mathbf{g(W_{t})} = \alpha_{0} + \theta_{1}\left[ \mathbf{g(Y_{t-1})} - \mathbf{g(W_{t-1})} \right], \qquad \qquad (1), \]

no qual, \(\mathbf{W_t} = \mathbf{\pi_t}\)

O modelo utilizando a função de ligação logit é dado por:

\[ \pi_{tj}(\mathbf{\beta}) = \dfrac{\mathrm{exp(\mathbf{\beta^{'}_{j} z_{t-1}})}} {1 + \sum_{l=1}^q \mathrm{exp(\mathbf{\beta^{'}_{l} z_{t-1}})} }, \qquad j = 1,\dots, q, \qquad \qquad (2) \]

Então, os passos seguintes para construir um MA(q), são:

\[\mathbf{z_{t−1}} = \left(\mathbf{1}, \mathbf{Y_{t−1}} - \mathbf{W_{t−1}} \right)\].

3 Modelo 1

Este é o modelo inicial com AR(3) e MA(3). Sem iterações entre essas variáveis.

## [1] "35.406 %"

Quantitativo de acertos:

## [1] 353

4 Modelo 2

Ao contrário do modelo anterior, foi adicionado dois termos novos, \(\cos(2\pi t/12)\) e \(\sin(2\pi t/12)\) e sem interação entre os termos AR e MA.

## [1] "35.507 %"

Quantitativo de acertos:

## [1] 354

5 Modelo 3

A única mudança feita, foi adicionado uma interação entre os termos AR e MA.

## [1] "39.017 %"

Quantitativo de acertos:

## [1] 389

6 Modelo 4

De agora em diante, vamos testar uma extrapolação nos parâmetros AR e MA. Mantendo a mesma estrutura do Modelo 3.

## [1] "45.409 %"

Quantitativo de acertos:

## [1] 450

7 Modelo 5

## [1] "49.899 %"

Quantitativo de acertos:

## [1] 493

8 Conclusões

Percebi que o adicionamento de termos \(\cos(2\pi t/12)\) e \(\sin(2\pi t/12)\) não influencia na quantitade de acertos. Em relação a interação, houve um aumento na taxa de acertos após ser adicionado na modelagem. Esse comportamento se repete quando também aumentamos o número de parâmetros da parte AR e MA. Porém, o maior problema disso é no aumento significativo na quantidade de parâmetros pertencentes ao modelo. Ou seja, dado que adicionarmos por exemplo um termo autoregressivo, o número de parâmetros a serem estimados cresce em 3 vezes, isso é entendido pela expressão: \(\mathbf{Y_{t−1}} = \left(Y_{(t-1)1}, Y_{(t-1)2}, Y_{(t-1)3} \right)\). Esse comportamento é análogo para a parte de médias móveis.

9 Outras abordagens

Pensar em outros elementos que podem entrar na modelagem, afim de melhorar o entendimento do comportamento dos dados.