O presente relatório visa ao compartilhamento dos dados referentes à pandemia ocasionada pela Covid-19 no Brasil. Os dados com os quais as análises foram realizadas podem ser encontrados no site do Ministério da Saúde. Os dados são públicos e podem ser exportados em formato csv e manipulados de acordo com a análise empregada.
A partir dos dados disponibilizados pelo governo, que são atualizados diariamente, a quantidade de casos novos confirmados e a quantidade de óbitos pode ser obtida e analisadas. Atualmente, no dia 10 de maio de 2019, o Brasil conta com poucos menos de 11 mil óbitos, e é considerado o segundo país do continente americano com a maior quantidade de casos (aproximadamente 155 mil casos confirmados), estando atrás apenas dos Estados Unidos, que já passou de 1 milhão.
Em seguida à importação dos dados, decidiu-se identificar a presença ou não de tendências nos casos novos de contaminação por estado. Para isso, inicialmente, os dados de novos casos foram separados por região e plotados para que uma melhor visualizaçao fosse possível; em seguida, realizou-se o método de Mann-Kendall, cujo objetivo é o de testar a hipótese nula (H0) de ausência de tendência monotônica.
Figura 1- Gráfico regionalizado dos casos novos de Covid-19
A visualização das séries históricas, apesar de importante, não permite a quantificação estatística e, por isso, a taxa de incremento tendencial deve ser calculada. Os resultados, por estado, foram os seguintes:
## Estado Valor de p Valor de Slope
## 1 RO 1.418573e-12 1.7500000
## 2 AC 5.093138e-12 1.4580420
## 3 AM 2.841016e-17 11.0000000
## 4 RR 2.509724e-09 1.8666667
## 5 PA 1.116647e-16 7.7960526
## 6 AP 5.530641e-11 2.9756098
## 7 TO 2.250870e-10 1.0208333
## 8 MA 1.256829e-16 7.3750000
## 9 PI 2.155603e-14 1.7272727
## 10 CE 1.427330e-15 9.3500000
## 11 RN 5.779062e-08 1.4594156
## 12 PB 2.504213e-15 2.3750000
## 13 PE 7.695696e-18 13.0678161
## 14 AL 3.620263e-13 3.0161290
## 15 SE 4.955213e-11 1.9000000
## 16 BA 1.353713e-18 4.8000000
## 17 MG 8.331118e-14 2.0000000
## 18 ES 7.198269e-16 3.6720430
## 19 RJ 5.634985e-21 10.8275862
## 20 SP 5.324675e-19 21.4478610
## 21 PR 1.101750e-05 0.6976744
## 22 SC 1.236968e-10 1.6733333
## 23 RS 4.362921e-11 1.3055556
## 24 MS 8.169643e-04 0.1081081
## 25 MT 1.807802e-05 0.2777778
## 26 GO 3.497093e-09 0.5517241
## 27 DF 4.794503e-11 1.4482759
A primeira coluna faz referência aos estados brasileiros; a segunda coluna, referente ao valor de p, indica a presença ou não de tendência (valores de p < 0.05: há tendência); a terceira coluna, referente ao valor de slope. indica se o sentido tendencial é positivo ou negativo.
A partir dos valores de slope, é notável a diferença entre os estados de São Paulo, Pernambuco, Amazonas e Rio Janeiro, cujos incrementos diários são maiores do que 10. Os valores são coerentes, uma vez que os locais nos quais a situação é mais drástica são os mesmos com as maiores taxas monotônicas (sen slope). Os mapas 2 e 3 foram elaborados com valores semanais (período de 14/mar - 09/mai) a fim de auxiliar o entendimento.
Mapa 1- Mapa interativo com a quantidade de casos confirmados de COVID-19 no Brasil
A partir da figura 1, é possível se observar que, ao longo de poucas semanas, a quantidade de casos confirmados de Covid no país cresceu e se alastrou de forma exponencial. Tendo início no município de São Paulo, em meados de fevereiro/março, o avanço do coronavírus logo alcançou todo o país e causou o colapso do sistema de saúde em muitas localidades, o que fez com que as autoridades estaduais e municipais fossem obrigadas a tomar decisões duras e a adotar práticas intensas no combate ao rápido contágio do coronavírus.
Mapa 2- Mapa interativo com a quantidade de óbitos confirmados em decorrência do surto de Coronavírus no Brasil
Para que a quantidade de novos casos de contaminação por Covid-19 pudesse ser avaliada, um modelo matemático de previsão de séries temporais foi ajustado. Uma vez que o primeiro caso identificado no estado se deu no dia 25 de fevereiro, o intervalo de dados utilizado foi de 25/fev - 09/maio, e a previsão, para as próximas duas semanas (10/maio - 23-maio).
Figura 2- Dados de novos casos de Covid-19 no estado de São Paulo (25/fev - 09/maio)
A partir da distribuição de novos casos presentes na figura 2, pode-se perceber que há um padrão recorrente: claramente, a tendência é de aumento e de crescimento, no entanto, após alguns dias de incremento, há alguns dias de decréscimo seguido por um novo crescimento. Em seguida à análise da figura 2, realizou-se o ajuste do modelo Arima.
Figura 3- Comparação de ajuste
Determinando a acurácia do modelo:
## ME RMSE MAE MPE MAPE ACF1 Theil's U
## Test set 5.932851 432.9333 291.2501 28.58599 60.90659 -0.03015569 1.089646
Pela visualização da figura 3, pode-se ter uma ideia do quão correlacionado aos dados o modelo ajustado se encontra. Cabe ressaltar que o critério utilizado para a escolha dos modelos Arimas disponíveis foi o AIC.
Como o simples ajuste do modelo não é suficiente, a segunda etapa foi a realização de previsões utilizando-o. Como os dados são diários, decidiu-se prever o aparecimento de novos casos nas próximas duas semanas (14 dias; 10/05 - 23-05).
Figura 4- Previsão
Por fim, foi um dado um zoom no trecho previsto. Os intervalos em tonalidades indicam o intervalo de confiança: o mais externo, de 95%; o mais interno, de 80%.
Figura 5- Zoom no trecho previsto
Por fim, para as próximas duas semanas, os valores médios de novos casos de pessoas contaminadas por Covid-19 são os seguintes:
## Data Novos casos previstos
## 1 2020-05-10 1290.810
## 2 2020-05-11 1576.211
## 3 2020-05-12 2219.609
## 4 2020-05-13 1939.653
## 5 2020-05-14 2309.224
## 6 2020-05-15 2439.278
## 7 2020-05-16 2086.238
## 8 2020-05-17 2151.051
## 9 2020-05-18 2162.652
## 10 2020-05-19 2106.804
## 11 2020-05-20 2295.505
## 12 2020-05-21 2372.184
## 13 2020-05-22 2363.625
## 14 2020-05-23 2415.793
Portanto, segundo o modelo ajustado, em duas semanas, o número de novos casos de pessoas contaminadas por Covid-19 será de 29728, aproximadamente.