1.INTRODUÇÃO E CONTEXTUALIZAÇÃO

O presente relatório visa ao compartilhamento dos dados referentes à pandemia ocasionada pela Covid-19 no Brasil. Os dados com os quais as análises foram realizadas podem ser encontrados no site do Ministério da Saúde. Os dados são públicos e podem ser exportados em formato csv e manipulados de acordo com a análise empregada.

A partir dos dados disponibilizados pelo governo, que são atualizados diariamente, a quantidade de casos novos confirmados e a quantidade de óbitos pode ser obtida e analisadas. Atualmente, no dia 10 de maio de 2019, o Brasil conta com poucos menos de 11 mil óbitos, e é considerado o segundo país do continente americano com a maior quantidade de casos (aproximadamente 155 mil casos confirmados), estando atrás apenas dos Estados Unidos, que já passou de 1 milhão.

2.ANÁLISES DE CASOS NOVOS E ÓBITOS

Em seguida à importação dos dados, decidiu-se identificar a presença ou não de tendências nos casos novos de contaminação por estado. Para isso, inicialmente, os dados de novos casos foram separados por região e plotados para que uma melhor visualizaçao fosse possível; em seguida, realizou-se o método de Mann-Kendall, cujo objetivo é o de testar a hipótese nula (H0) de ausência de tendência monotônica.

Figura 1- Gráfico regionalizado dos casos novos de Covid-19

A visualização das séries históricas, apesar de importante, não permite a quantificação estatística e, por isso, a taxa de incremento tendencial deve ser calculada. Os resultados, por estado, foram os seguintes:

##    Estado   Valor de p Valor de Slope
## 1      RO 1.418573e-12      1.7500000
## 2      AC 5.093138e-12      1.4580420
## 3      AM 2.841016e-17     11.0000000
## 4      RR 2.509724e-09      1.8666667
## 5      PA 1.116647e-16      7.7960526
## 6      AP 5.530641e-11      2.9756098
## 7      TO 2.250870e-10      1.0208333
## 8      MA 1.256829e-16      7.3750000
## 9      PI 2.155603e-14      1.7272727
## 10     CE 1.427330e-15      9.3500000
## 11     RN 5.779062e-08      1.4594156
## 12     PB 2.504213e-15      2.3750000
## 13     PE 7.695696e-18     13.0678161
## 14     AL 3.620263e-13      3.0161290
## 15     SE 4.955213e-11      1.9000000
## 16     BA 1.353713e-18      4.8000000
## 17     MG 8.331118e-14      2.0000000
## 18     ES 7.198269e-16      3.6720430
## 19     RJ 5.634985e-21     10.8275862
## 20     SP 5.324675e-19     21.4478610
## 21     PR 1.101750e-05      0.6976744
## 22     SC 1.236968e-10      1.6733333
## 23     RS 4.362921e-11      1.3055556
## 24     MS 8.169643e-04      0.1081081
## 25     MT 1.807802e-05      0.2777778
## 26     GO 3.497093e-09      0.5517241
## 27     DF 4.794503e-11      1.4482759

A primeira coluna faz referência aos estados brasileiros; a segunda coluna, referente ao valor de p, indica a presença ou não de tendência (valores de p < 0.05: há tendência); a terceira coluna, referente ao valor de slope. indica se o sentido tendencial é positivo ou negativo.

A partir dos valores de slope, é notável a diferença entre os estados de São Paulo, Pernambuco, Amazonas e Rio Janeiro, cujos incrementos diários são maiores do que 10. Os valores são coerentes, uma vez que os locais nos quais a situação é mais drástica são os mesmos com as maiores taxas monotônicas (sen slope). Os mapas 2 e 3 foram elaborados com valores semanais (período de 14/mar - 09/mai) a fim de auxiliar o entendimento.

Mapa 1- Mapa interativo com a quantidade de casos confirmados de COVID-19 no Brasil

A partir da figura 1, é possível se observar que, ao longo de poucas semanas, a quantidade de casos confirmados de Covid no país cresceu e se alastrou de forma exponencial. Tendo início no município de São Paulo, em meados de fevereiro/março, o avanço do coronavírus logo alcançou todo o país e causou o colapso do sistema de saúde em muitas localidades, o que fez com que as autoridades estaduais e municipais fossem obrigadas a tomar decisões duras e a adotar práticas intensas no combate ao rápido contágio do coronavírus.

Mapa 2- Mapa interativo com a quantidade de óbitos confirmados em decorrência do surto de Coronavírus no Brasil

3.O CASO DE SÃO PAULO: AJUSTE DE MODELO PARA PREVISÃO DE NOVOS CASOS

Para que a quantidade de novos casos de contaminação por Covid-19 pudesse ser avaliada, um modelo matemático de previsão de séries temporais foi ajustado. Uma vez que o primeiro caso identificado no estado se deu no dia 25 de fevereiro, o intervalo de dados utilizado foi de 25/fev - 09/maio, e a previsão, para as próximas duas semanas (10/maio - 23-maio).

Figura 2- Dados de novos casos de Covid-19 no estado de São Paulo (25/fev - 09/maio)

A partir da distribuição de novos casos presentes na figura 2, pode-se perceber que há um padrão recorrente: claramente, a tendência é de aumento e de crescimento, no entanto, após alguns dias de incremento, há alguns dias de decréscimo seguido por um novo crescimento. Em seguida à análise da figura 2, realizou-se o ajuste do modelo Arima.

Figura 3- Comparação de ajuste

Determinando a acurácia do modelo:

##                ME     RMSE      MAE      MPE     MAPE        ACF1 Theil's U
## Test set 5.932851 432.9333 291.2501 28.58599 60.90659 -0.03015569  1.089646

Pela visualização da figura 3, pode-se ter uma ideia do quão correlacionado aos dados o modelo ajustado se encontra. Cabe ressaltar que o critério utilizado para a escolha dos modelos Arimas disponíveis foi o AIC.

Como o simples ajuste do modelo não é suficiente, a segunda etapa foi a realização de previsões utilizando-o. Como os dados são diários, decidiu-se prever o aparecimento de novos casos nas próximas duas semanas (14 dias; 10/05 - 23-05).

Figura 4- Previsão

Por fim, foi um dado um zoom no trecho previsto. Os intervalos em tonalidades indicam o intervalo de confiança: o mais externo, de 95%; o mais interno, de 80%.

Figura 5- Zoom no trecho previsto

Por fim, para as próximas duas semanas, os valores médios de novos casos de pessoas contaminadas por Covid-19 são os seguintes:

##          Data Novos casos previstos
## 1  2020-05-10              1290.810
## 2  2020-05-11              1576.211
## 3  2020-05-12              2219.609
## 4  2020-05-13              1939.653
## 5  2020-05-14              2309.224
## 6  2020-05-15              2439.278
## 7  2020-05-16              2086.238
## 8  2020-05-17              2151.051
## 9  2020-05-18              2162.652
## 10 2020-05-19              2106.804
## 11 2020-05-20              2295.505
## 12 2020-05-21              2372.184
## 13 2020-05-22              2363.625
## 14 2020-05-23              2415.793

Portanto, segundo o modelo ajustado, em duas semanas, o número de novos casos de pessoas contaminadas por Covid-19 será de 29728, aproximadamente.