Esse relatório tem como objetivo realizar uma análise exploratória da base de dados com informações da COVID-19 no estado do Espírito Santo nos últimos meses.
Para isso, foram utilizados dados fornecidos pelo governo estadual do Espírito Santo, disponibilizados pelo https://coronavirus.es.gov.br/painel-covid-19-es, a partir do dia primeiro de julho (01/07/2020) até o dia vinte e três de novembro (23/11/2020).
A lista abaixo nos permite visualizar as variáveis disponíveis para análise:
## [1] "DataNotificacao" "DataCadastro"
## [3] "DataDiagnostico" "DataColeta_RT_PCR"
## [5] "DataColetaTesteRapido" "DataColetaSorologia"
## [7] "DataColetaSorologiaIGG" "DataEncerramento"
## [9] "DataObito" "Classificacao"
## [11] "Evolucao" "CriterioConfirmacao"
## [13] "StatusNotificacao" "Municipio"
## [15] "Bairro" "FaixaEtaria"
## [17] "IdadeNaDataNotificacao" "Sexo"
## [19] "RacaCor" "Escolaridade"
## [21] "Febre" "DificuldadeRespiratoria"
## [23] "Tosse" "Coriza"
## [25] "DorGarganta" "Diarreia"
## [27] "Cefaleia" "ComorbidadePulmao"
## [29] "ComorbidadeCardio" "ComorbidadeRenal"
## [31] "ComorbidadeDiabetes" "ComorbidadeTabagismo"
## [33] "ComorbidadeObesidade" "FicouInternado"
## [35] "ViagemBrasil" "ViagemInternacional"
## [37] "ProfissionalSaude" "PossuiDeficiencia"
## [39] "MoradorDeRua" "ResultadoRT_PCR"
## [41] "ResultadoTesteRapido" "ResultadoSorologia"
## [43] "ResultadoSorologia_IGG"
Aqui, podemos ver as classes das variáveis listadas acima:
str(dados[c(1, 10:20)])
## tibble [616,500 x 12] (S3: tbl_df/tbl/data.frame)
## $ DataNotificacao : Date[1:616500], format: "2020-11-18" "2020-11-18" ...
## $ Classificacao : chr [1:616500] "Suspeito" "Suspeito" "Suspeito" "Suspeito" ...
## $ Evolucao : chr [1:616500] "Ignorado" "-" "-" "-" ...
## $ CriterioConfirmacao : chr [1:616500] "Laboratorial" "-" "-" "-" ...
## $ StatusNotificacao : chr [1:616500] "Em Aberto" "Em Aberto" "Em Aberto" "Em Aberto" ...
## $ Municipio : chr [1:616500] "MARATAIZES" "VILA VALERIO" "SERRA" "JOAO NEIVA" ...
## $ Bairro : chr [1:616500] "SANTA TEREZA" "CENTRO" "COLINA DE LARANJEIRAS" "CENTRO" ...
## $ FaixaEtaria : chr [1:616500] "40 a 49 anos" "20 a 29 anos" "10 a 19 anos" "50 a 59 anos" ...
## $ IdadeNaDataNotificacao: chr [1:616500] "45 anos, 9 meses, 29 dias" "22 anos, 10 meses, 26 dias" "15 anos, 6 meses, 8 dias" "54 anos, 5 meses, 27 dias" ...
## $ Sexo : chr [1:616500] "M" "M" "F" "F" ...
## $ RacaCor : chr [1:616500] "Parda" "Branca" "Parda" "Branca" ...
## $ Escolaridade : chr [1:616500] "Educação superior completa" "Ensino médio completo (antigo colegial ou 2º grau )" "Ensino médio incompleto (antigo colegial ou 2º grau )" "Ensino médio completo (antigo colegial ou 2º grau )" ...
## - attr(*, "problems")= tibble [5,539 x 5] (S3: tbl_df/tbl/data.frame)
## ..$ row : int [1:5539] 2009 3727 6076 6344 8490 8634 12096 12488 13233 13705 ...
## ..$ col : chr [1:5539] "DataObito" "DataObito" "DataObito" "DataObito" ...
## ..$ expected: chr [1:5539] "1/0/T/F/TRUE/FALSE" "1/0/T/F/TRUE/FALSE" "1/0/T/F/TRUE/FALSE" "1/0/T/F/TRUE/FALSE" ...
## ..$ actual : chr [1:5539] "2020-11-05" "2020-11-17" "2020-11-15" "2020-11-16" ...
## ..$ file : chr [1:5539] "'MICRODADOS.csv'" "'MICRODADOS.csv'" "'MICRODADOS.csv'" "'MICRODADOS.csv'" ...
Gráifco 1: Quantidade de testes realizados nesse período de tempo (01/07/2020 até 23/11/2020):
Gráfico 2: Quantidade de testes realizados, no mesmo período de tempo, que obtiveram resultados positivos:
Gráfico 3:
## `summarise()` ungrouping output (override with `.groups` argument)
## `summarise()` ungrouping output (override with `.groups` argument)
Nota-se que no mês de julho a quantidade de resultados positivos era bem significativa em relação a quantidade de testes feitos. Já em agosto até meados de outubro a quantidade de resultados positivos era proporcional a quantidade de testes realizados. No final de outubro e começo de novembro ocorreu um pico de casos confirmados, em relação a quantia de testes realizada. Mas já por volta do dia 10 de novembro o número de testes que obtiveram resultado positivo caiu significativamente se comparado ao mês anterior nessa mesma data.
Gráfico 4: Quantidade de óbitos pelo COVID-19 de acordo com a faixa etária:
É notável na relação de óbitos por faixa etária que a maior quantidade de notificações estão em pessoas com idades mais avançadas, mais de 89% dos óbitos analisados estão concentrados em casos onde as vítimas possuíam mais de 50 anos, enquanto a faixa entre 0 e 39 anos concentra menos de 5% dos óbitos estudados no período.
Gráfico 5: Municípios em que pessoas do Espírito Santo testaram positivo para COVID-19 e a frequência (maior que 300) de casos confirmados em cada um deles:
Como se pode observar, as maiores quantidades de casos de Covid-19 ocorre nos municípios da região metropolitana do estado (Vila Velha, Serra, Vitória e Cariacica). Somente esses quatro municípios corresponde a quase 45% (44.98%) dos casos do ES. Dos 59 municípios mostrados no gráfico, 18 deles tiveram entre mais de 1000 casos entre julho e novembro, enquanto o restante tiveram entre 300 e 999 casos durante o mesmo período.
Gráfico 6: Frequência de internação, ou não, dentre os casos confirmados por Covid-19 no estado do Espírito Santo, separados por faixa-etária:
Aqui percebe-se que a grande maioria dos casos confirmados de Covid-19, não ouve a necessidade de internação. 51.62% dos casos não ficou internado, apenas 1.70% das pessoas tiveram que ser internadas, mas por outro lado, 46.68% dos casos em que os indivíduos testaram positivo para COVID-19, foram ignorados ou não foi informado. Como se pode perceber, em todas as faixas etárias possui uma grande quantidade de casos ignorados ou não informados, e a maioria das pessoas que ficaram internadas, possuem entre 50 e 89 anos. O que segue o esperado, pois, como vimos no Gráfico 4 as faixas-etárias com maior quantidade de óbitos são justamente as com maior quantidade de internações no Gráfico 6.
Gráfico 7: Frequência diária de novos casos confirmados de Covid-19 para os municípios com maiores chances de sediar o prêmio juniores:
## `summarise()` regrouping output by 'DataNotificacao' (override with `.groups` argument)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 12.00 38.50 62.09 98.00 390.00
Pode-se observar que nas semanas iniciais de novembro, o número de novos casos diminuíram gradativamente em relação ao mês anterior, que foi o mês cujo ocorreram mais altas gerais em relação a novos casos, juntamente com o inicio de julho obtendo uma queda verificada entre esses dois períodos com menor média localizada entre a ultima semana de agosto e primeira semana de setembro em todas as cidades analisadas.
Gráfico 8: Frequência diária de óbitos nesses mesmos municípios:
## `summarise()` regrouping output by 'DataNotificacao' (override with `.groups` argument)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 1.000 1.477 2.000 11.000
Com o gráfico acima é possível perceber que no mês de julho, ocorreu picos de óbitos em todos os municípios listados, com enfoque principal nos municípios de Vila Velha e Serra. A partir do mês de agosto os municípios se comportaram de maneira bem similar, variando de 1 a 5 o número de óbitos diários. Por fim, tem-se que a média de óbitos diários nos municípios em questão é de 1,47.
Gráfico 9: Taxa de letalidade por nível de escolaridade:
## The following objects are masked from escolaridade_confirmados:
##
## Freq, Var1
O gráfico apresentado exibe uma aparente relação entre a taxa de letalidade e a escolaridade. É interessante ressaltar a relação inversa que existe entre o nível de escolaridade e a taxa de letalidade do COVID-19. Percebe-se, pelo Gráfico 9, que quanto maior o nível de escolaridade a taxa de letalidade do vírus tende a diminuir.