Série Temporal é um conjunto de observações sobre uma variável, ordenado no tempo, sendo assim para a nossa análise de séries temporais, usaremos dados de Covid-19 para a cidade de Campina Grande nos dias 27 de março de 2020 à 11 de Outubro de 2022. O banco de dados é composto por 930 observações referentes à data, ao número de Casos Acumulados, número de casos novos, óbitos acumulados, óbitos novos e recuperados por dia. E desejamos analisar o número de casos acumulados por dia na cidade de Campina Grande.
O banco da dados utilizado para a análise foi retirado do site CORONAVÍRUS/BRASIL;
Para fazer a análise foi utilizado o programa Rstudio que é uma linguagem de programação para gráficos e cálculos estatísticos.
Foi realizado os testes de tendência, estacionariedade e o de sazonalidade. Também utilizou-se as técnicas de suavização exponencial simples e para prever o comportamento da série utilizamos o ajuste de médias móveis que consiste em utilizar os recentes casos para prever o comportamento da demanda em períodos seguintes.
A tendência de uma série temporal é definida como um padrão de crescimento/descrecimento da variável em um certo período de tempo. Existem testes específicos para identificar se a série tem tendência, neste trabalho iremos com o teste de Wald-Wolfowitz. Esse teste não-paramétrico serve para verificar a aleatoriedade de uma sequência de dados. No caso de séries temporais pode servir para testar se uma série possui ou não tendência.
O teste de Wald-Wolfowitz testa as seguintes hipóteses:
H0: Não possui tendência;
H1: Possui tendência.
A sazonalidade pode ser definida como padrões de comportamento que se repetem em específicas épocas do ano, neste trabalho iremos com o teste de Kruskal-Wallis. O teste de Kruskal-Wallis supõe uma amostra de uma população, subdividida em K > 4 conjuntos de amostras com tamanho n não necessariamente iguais entre si. Onde K é o número de anos e n observações da série.
O teste de Kruskal-Wallis testa as seguintes hipóteses:
H0: Não possui sazonalidade;
H1: Possui sazonalidade.
A Suavização Exponencial Simples é o caso particular mais simples de suavização exponencial. Esse tipo de modelo serve para quando não existe nenhum padrão claro de sazonalidade ou tendência na série.
A Suavização Exponencial Simples (SES) pode ser descrita como:
\[\overline{X}=\alpha Z_t + (1-\alpha)\overline{Z}_t-1 , t= 1, ...,N. \]
Onde:
\(\overline{Z}_t\)= Valor Exponencialmente Suavizado
\(\alpha\) = É a constante de suavização, \(0 \le\alpha \le 1\)
A previsão é dada pelo último valor exponencialmente suavizado.
\(\widehat{Z}_t(h)=\overline{Z}_t\), para todo h maior que 0.
\[\widehat{Z}_t(h)=\alpha Z_t+(1- \alpha) \widehat{Z}_{t-1}(h+1)\]
A SES é um método muito utilizado devido devido ao fácil entendimento e o valor de \(\alpha=2/r-1\) fornece previsões semelhantes ao método médias móveis com parâmetro r.
pacotes <- c("TTR", "readxl", "tidyverse","dygraphs","forecast", "fpp", "fGarch", "randtests")
if(sum(as.numeric(!pacotes %in% installed.packages())) != 0){
instalador <- pacotes[!pacotes %in% installed.packages()]
for(i in 1:length(instalador)) {
install.packages(instalador, dependencies = T)
break()}
sapply(pacotes, require, character = T)
} else {
sapply(pacotes, require, character = T)
}
library(rmarkdown)
paged_table(covid)
any(is.na(casos))
## [1] FALSE
summary(covid)
## estado municipio data casosAcumulado
## Length:929 Length:929 Min. :2020-03-27 Min. : 0
## Class :character Class :character 1st Qu.:2020-11-14 1st Qu.:13977
## Mode :character Mode :character Median :2021-07-04 Median :37796
## Mean :2021-07-04 Mean :34309
## 3rd Qu.:2022-02-21 3rd Qu.:54982
## Max. :2022-10-11 Max. :65031
## cum_sales
## Min. : 0
## 1st Qu.: 1767205
## Median : 6938780
## Mean :10265777
## 3rd Qu.:17569822
## Max. :31873497
casos <- ts(tscovid, start = c(2020,4), frequency = 365)
plot(casos, main="Casos Acumulados em Campina Grande",
lwd= 1,
col='red',
xlab="Meses",
ylab="Casos Acumulados")
O teste para verificar se existe tendência testa as seguintes hipóteses:
H0: não possui tendência;
H1: possui tendência.
##
## Runs Test
##
## data: casos
## statistic = -30.414, runs = 2, n1 = 464, n2 = 464, n = 928, p-value <
## 2.2e-16
## alternative hypothesis: nonrandomness
Como o p valor foi menor que 0.05, concluimos ao nível de 5% de significância que a série possui tendência.
H0: não possui estacionariedade;
H1: possui estacionariedade.
##
## Augmented Dickey-Fuller Test
##
## data: casos
## Dickey-Fuller = -1.3195, Lag order = 9, p-value = 0.8663
## alternative hypothesis: stationary
Como o p valor foi maior que 0,05. Logo, ao nível de 5% de significância temos evidências estatísticas para afirmar que a série não possui estacionariedade.
H0: não possui sazonalidade;
H1: possui sazonalidade.
tempo<- covid$data
kruskal.test(covid$casosAcumulado~tempo)
##
## Kruskal-Wallis rank sum test
##
## data: covid$casosAcumulado by tempo
## Kruskal-Wallis chi-squared = 928, df = 928, p-value = 0.4938
Como o p valor foi maior que 0,05.Logo ao nível de 5% de significância temos evidências estatísticas de que a série não possui sazonalidade.
ses_ex1 <- HoltWinters(casos,
beta = F,gamma = F)
plot(casos, main= "Casos Acumulados em Campina Grande")
lines(ses_ex1$fitted[,1],
pch = 18, col = "pink",
type = "b",
lty = 2, lwd = 5)
legend("topleft", legend = c("Dados Originais", "SES"),
col = c("red", "pink"), lty = 1:2, cex = 0.8)
O termo previsão se refere à ação e ao efeito de prever, ou seja, prever o que vai acontecer através da interpretação de indícios ou de sinais. Para conseguirmos uma melhor previsão, realizamos a técnica de soma cumulativa, que consiste em somar a nova observação com a anterior e como podemos verificar a previsão mostra um aumento na série, isso se dá por conta do aumento de novos casos e consequentemento um aumento no número de casos acumulados.
O gráfico a seguir se refere a previsão:
Podemos concluir em nossa análise que nossos dados, a partir do teste feito, que a série possui tendência e não tem sazonalidade, além do mais, como a nossa análise é feita a partir do número de casos, a medida que o número de casos aumentam, o número de casos acumulados também aumentam e consequentemente a série também aumenta.
RAPOSO, Rennata. Séries Temporais. Disponível em:https://rstudio-pubs-static.s3.amazonaws.com/133842_3f1f6c0abf8942098fb90c322d9dd18b.html. Acesso em: 24 de nov. 2022.
Daniel. Suavização exponencial simples com R. Disponível em:https://blog.curso-r.com/posts/2019-02-10-ses/. Acesso em: 02 de dez. 2022.