1 Introdução

Série Temporal é um conjunto de observações sobre uma variável, ordenado no tempo, sendo assim para a nossa análise de séries temporais, usaremos dados de Covid-19 para a cidade de Campina Grande nos dias 27 de março de 2020 à 11 de Outubro de 2022. O banco de dados é composto por 930 observações referentes à data, ao número de Casos Acumulados, número de casos novos, óbitos acumulados, óbitos novos e recuperados por dia. E desejamos analisar o número de casos acumulados por dia na cidade de Campina Grande.

2 Metodologia

2.1 Material

  • O banco da dados utilizado para a análise foi retirado do site CORONAVÍRUS/BRASIL;

  • Para fazer a análise foi utilizado o programa Rstudio que é uma linguagem de programação para gráficos e cálculos estatísticos.

2.2 Métodos

Foi realizado os testes de tendência, estacionariedade e o de sazonalidade. Também utilizou-se as técnicas de suavização exponencial simples e para prever o comportamento da série utilizamos o ajuste de médias móveis que consiste em utilizar os recentes casos para prever o comportamento da demanda em períodos seguintes.

2.3 Teste de tendência

A tendência de uma série temporal é definida como um padrão de crescimento/descrecimento da variável em um certo período de tempo. Existem testes específicos para identificar se a série tem tendência, neste trabalho iremos com o teste de Wald-Wolfowitz. Esse teste não-paramétrico serve para verificar a aleatoriedade de uma sequência de dados. No caso de séries temporais pode servir para testar se uma série possui ou não tendência.

O teste de Wald-Wolfowitz testa as seguintes hipóteses:

H0: Não possui tendência;

H1: Possui tendência.

2.4 Teste de Sazonalidade

A sazonalidade pode ser definida como padrões de comportamento que se repetem em específicas épocas do ano, neste trabalho iremos com o teste de Kruskal-Wallis. O teste de Kruskal-Wallis supõe uma amostra de uma população, subdividida em K > 4 conjuntos de amostras com tamanho n não necessariamente iguais entre si. Onde K é o número de anos e n observações da série.

O teste de Kruskal-Wallis testa as seguintes hipóteses:

H0: Não possui sazonalidade;

H1: Possui sazonalidade.

2.5 Suavização Exponencial Simples

A Suavização Exponencial Simples é o caso particular mais simples de suavização exponencial. Esse tipo de modelo serve para quando não existe nenhum padrão claro de sazonalidade ou tendência na série.

A Suavização Exponencial Simples (SES) pode ser descrita como:

\[\overline{X}=\alpha Z_t + (1-\alpha)\overline{Z}_t-1 , t= 1, ...,N. \]

Onde:

\(\overline{Z}_t\)= Valor Exponencialmente Suavizado

\(\alpha\) = É a constante de suavização, \(0 \le\alpha \le 1\)

2.6 Previsão utilizando a Suavização Exponencial Simples (SES)

A previsão é dada pelo último valor exponencialmente suavizado.

\(\widehat{Z}_t(h)=\overline{Z}_t\), para todo h maior que 0.

\[\widehat{Z}_t(h)=\alpha Z_t+(1- \alpha) \widehat{Z}_{t-1}(h+1)\]

A SES é um método muito utilizado devido devido ao fácil entendimento e o valor de \(\alpha=2/r-1\) fornece previsões semelhantes ao método médias móveis com parâmetro r.

3 Aplicação

3.1 Carregando pacotes necessários

pacotes <- c("TTR", "readxl", "tidyverse","dygraphs","forecast", "fpp", "fGarch", "randtests")
if(sum(as.numeric(!pacotes %in% installed.packages())) != 0){
  instalador <- pacotes[!pacotes %in% installed.packages()]
  for(i in 1:length(instalador)) {
    install.packages(instalador, dependencies = T)
    break()}
  sapply(pacotes, require, character = T) 
} else {
  sapply(pacotes, require, character = T) 
}

3.2 Visualizando o banco de dados

library(rmarkdown)
 paged_table(covid)

3.3 Análise Exploratória

3.3.1 Para dados faltantes

any(is.na(casos))
## [1] FALSE

3.4 Análise Descritiva

summary(covid)
##     estado           municipio              data            casosAcumulado 
##  Length:929         Length:929         Min.   :2020-03-27   Min.   :    0  
##  Class :character   Class :character   1st Qu.:2020-11-14   1st Qu.:13977  
##  Mode  :character   Mode  :character   Median :2021-07-04   Median :37796  
##                                        Mean   :2021-07-04   Mean   :34309  
##                                        3rd Qu.:2022-02-21   3rd Qu.:54982  
##                                        Max.   :2022-10-11   Max.   :65031  
##    cum_sales       
##  Min.   :       0  
##  1st Qu.: 1767205  
##  Median : 6938780  
##  Mean   :10265777  
##  3rd Qu.:17569822  
##  Max.   :31873497

3.5 Transformando os dados em uma serie temporal:

casos <- ts(tscovid, start = c(2020,4), frequency = 365)

3.6 Gráfico da série

plot(casos, main="Casos Acumulados em Campina Grande",
     lwd= 1,
     col='red',
      xlab="Meses",
     ylab="Casos Acumulados")

3.7 Teste para tendência

O teste para verificar se existe tendência testa as seguintes hipóteses:

H0: não possui tendência;

H1: possui tendência.

## 
##  Runs Test
## 
## data:  casos
## statistic = -30.414, runs = 2, n1 = 464, n2 = 464, n = 928, p-value <
## 2.2e-16
## alternative hypothesis: nonrandomness

Como o p valor foi menor que 0.05, concluimos ao nível de 5% de significância que a série possui tendência.

3.8 Teste de aleatoriadade e estacionaridade

H0: não possui estacionariedade;

H1: possui estacionariedade.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  casos
## Dickey-Fuller = -1.3195, Lag order = 9, p-value = 0.8663
## alternative hypothesis: stationary

Como o p valor foi maior que 0,05. Logo, ao nível de 5% de significância temos evidências estatísticas para afirmar que a série não possui estacionariedade.

3.9 Teste para sazonalidade

H0: não possui sazonalidade;

H1: possui sazonalidade.

tempo<- covid$data
kruskal.test(covid$casosAcumulado~tempo)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  covid$casosAcumulado by tempo
## Kruskal-Wallis chi-squared = 928, df = 928, p-value = 0.4938

Como o p valor foi maior que 0,05.Logo ao nível de 5% de significância temos evidências estatísticas de que a série não possui sazonalidade.

4 Suavização Exponencial Simples

ses_ex1 <- HoltWinters(casos, 
                       beta = F,gamma = F)
plot(casos, main= "Casos Acumulados em Campina Grande")
lines(ses_ex1$fitted[,1],
      pch = 18, col = "pink", 
      type = "b", 
      lty = 2, lwd = 5)
legend("topleft", legend = c("Dados Originais", "SES"),
       col = c("red", "pink"), lty = 1:2, cex = 0.8)

5 Previsão

O termo previsão se refere à ação e ao efeito de prever, ou seja, prever o que vai acontecer através da interpretação de indícios ou de sinais. Para conseguirmos uma melhor previsão, realizamos a técnica de soma cumulativa, que consiste em somar a nova observação com a anterior e como podemos verificar a previsão mostra um aumento na série, isso se dá por conta do aumento de novos casos e consequentemento um aumento no número de casos acumulados.

O gráfico a seguir se refere a previsão:

6 Conclusão

Podemos concluir em nossa análise que nossos dados, a partir do teste feito, que a série possui tendência e não tem sazonalidade, além do mais, como a nossa análise é feita a partir do número de casos, a medida que o número de casos aumentam, o número de casos acumulados também aumentam e consequentemente a série também aumenta.

7 Referências

RAPOSO, Rennata. Séries Temporais. Disponível em:https://rstudio-pubs-static.s3.amazonaws.com/133842_3f1f6c0abf8942098fb90c322d9dd18b.html. Acesso em: 24 de nov. 2022.

Daniel. Suavização exponencial simples com R. Disponível em:https://blog.curso-r.com/posts/2019-02-10-ses/. Acesso em: 02 de dez. 2022.