Instituição: Centro Universitário de Brasília - UniCEUB

Disciplina: Introdução à Linguagem Estatística R

Professor: Ricardo Barros Sampaio

Alunos:

Calebe Josué da Silva Campos RA: 52000111
Daniel Giuberti Lauria RA: 52000112
Leonardo Davi Leandro das Chagas Danquimaia RA: 52000203

A Pandemia de 2020

##O que é COVID-19

A COVID-19 é uma doença causada pelo coronavírus SARS-CoV-2, que apresenta um quadro clínico que varia de infecções assintomáticas a quadros respiratórios graves. De acordo com a Organização Mundial de Saúde (OMS), a maioria dos pacientes com COVID-19 (cerca de 80%) podem ser assintomáticos e cerca de 20% dos casos podem requerer atendimento hospitalar por apresentarem dificuldade respiratória e desses casos aproximadamente 5% podem necessitar de suporte para o tratamento de insuficiência respiratória (suporte ventilatório).

##O que é o coronavírus?

Coronavírus é uma família de vírus que causam infecções respiratórias. O novo agente do coronavírus foi descoberto em 31/12/19 após casos registrados na China. Provoca a doença chamada de coronavírus (COVID-19).

Os primeiros coronavírus humanos foram isolados pela primeira vez em 1937. No entanto, foi em 1965 que o vírus foi descrito como coronavírus, em decorrência do perfil na microscopia, parecendo uma coroa.

A maioria das pessoas se infecta com os coronavírus comuns ao longo da vida, sendo as crianças pequenas mais propensas a se infectarem com o tipo mais comum do vírus. Os coronavírus mais comuns que infectam humanos são o alpha coronavírus 229E e NL63 e beta coronavírus OC43, HKU1.

##Quais são os sintomas

Os sintomas da COVID-19 podem variar de um simples resfriado até uma pneumonia severa. Sendo os sintomas mais comuns:

Tosse Febre Coriza Dor de garganta Dificuldade para respirar

##Como é transmitido

A transmissão acontece de uma pessoa doente para outra ou por contato próximo por meio de: Toque do aperto de mão Gotículas de saliva Espirro Tosse Catarro Objetos ou superfícies contaminadas, como celulares, mesas, maçanetas, brinquedos, teclados de computador etc.

Fonte: https://coronavirus.saude.gov.br/sobre-a-doenca

library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(forcats)
library(knitr)
library(tinytex)
setwd("~/Dropbox (InteligCooperativa)/Projetos de Ensino/2 - Esp CEUB CD/Visualizing COVID-19/Script_R_-_TrabalhoFinal")
#setwd("D:/1 - CALEBE CAMPOS/Calebe Josué/CURSOS/UniCEUB/Pós-Graduação - Ciência de Dados/2 - Introdução à Linguagem Estatística R/Arquivos_R/Projeto Covid-19/Dados/")
planilhacsvBrasil <- read_csv("TotalCasosPorEstadoPorDia.csv")
## Parsed with column specification:
## cols(
##   epi_week = col_double(),
##   date = col_date(format = ""),
##   country = col_character(),
##   state = col_character(),
##   city = col_character(),
##   newDeaths = col_double(),
##   deaths = col_double(),
##   newCases = col_double(),
##   totalCases = col_double(),
##   deathsMS = col_double(),
##   totalCasesMS = col_double(),
##   deaths_per_100k_inhabitants = col_double(),
##   totalCases_per_100k_inhabitants = col_double(),
##   deaths_by_totalCases = col_double(),
##   recovered = col_double(),
##   suspects = col_double(),
##   tests = col_logical(),
##   tests_per_100k_inhabitants = col_logical()
## )
## Warning: 4172 parsing failures.
##  row                        col           expected    actual                            file
## 1247 tests                      1/0/T/F/TRUE/FALSE 2131      'TotalCasosPorEstadoPorDia.csv'
## 1247 tests_per_100k_inhabitants 1/0/T/F/TRUE/FALSE 241.62778 'TotalCasosPorEstadoPorDia.csv'
## 1248 tests                      1/0/T/F/TRUE/FALSE 2348      'TotalCasosPorEstadoPorDia.csv'
## 1248 tests_per_100k_inhabitants 1/0/T/F/TRUE/FALSE 70.35507  'TotalCasosPorEstadoPorDia.csv'
## 1250 tests                      1/0/T/F/TRUE/FALSE 3292      'TotalCasosPorEstadoPorDia.csv'
## .... .......................... .................. ......... ...............................
## See problems(...) for more details.
planilhacsvMundo <- read_csv("confirmed_cases_by_country.csv")
## Parsed with column specification:
## cols(
##   country = col_character(),
##   province = col_character(),
##   date = col_date(format = ""),
##   cases = col_double(),
##   cum_cases = col_double()
## )
tabelaCovidDFporRA <- readxl::read_xlsx(path = "DadosCovidDFporRA.xlsx")
tabelaCovidDFporRAcasosemortes <- readxl::read_xlsx(path = "DadosCovidDFporRA - Copia.xlsx")

tabelaCovidBrasil <- planilhacsvBrasil %>%
  select(
  PAIS = country,
  DATA = date,
  ESTADO = state,
  CASOS = totalCases,
  MORTES = deaths) %>% 
  filter(ESTADO != "TOTAL")

tabelaCovidMundo <- planilhacsvMundo %>%
  select(
    PAIS = country,
    DATA = date,
    CASOS = cases,
    TOTALCASOS = cum_cases)

##Covid-19 no Mundo

###Paises com maior numero de casos confirmados

A tabela abaixo apresenta o top vinte dos paises com maior numero de casos confirmados para covid-19, na data de 17/03/2020. O mesmo que é apresentado no grafico abaixo:

vintepaisescommaiornumerodecasos <- tabelaCovidMundo %>% 
  group_by(PAIS) %>%
  summarize(MAIORDATA = max(DATA), TOTALMAXIMOCASOS = max(TOTALCASOS)) %>% 
  arrange(desc(TOTALMAXIMOCASOS)) %>%
  top_n(20, TOTALMAXIMOCASOS)
## `summarise()` ungrouping output (override with `.groups` argument)
vintepaisescommaiornumerodecasos
## # A tibble: 20 x 3
##    PAIS           MAIORDATA  TOTALMAXIMOCASOS
##    <chr>          <date>                <dbl>
##  1 Italy          2020-03-17            31506
##  2 Iran           2020-03-17            16169
##  3 Spain          2020-03-17            11748
##  4 Germany        2020-03-17             9257
##  5 Korea, South   2020-03-17             8320
##  6 France         2020-03-17             7699
##  7 US             2020-03-17             6421
##  8 Switzerland    2020-03-17             2700
##  9 United Kingdom 2020-03-17             1960
## 10 Netherlands    2020-03-17             1708
## 11 Norway         2020-03-17             1463
## 12 Austria        2020-03-17             1332
## 13 Belgium        2020-03-17             1243
## 14 Sweden         2020-03-17             1190
## 15 Denmark        2020-03-17             1024
## 16 Japan          2020-03-17              878
## 17 Cruise Ship    2020-03-17              706
## 18 Malaysia       2020-03-17              673
## 19 Canada         2020-03-17              478
## 20 Australia      2020-03-17              452
ggplot(vintepaisescommaiornumerodecasos, aes(x = fct_reorder(PAIS, TOTALMAXIMOCASOS, .desc = FALSE), y = TOTALMAXIMOCASOS, fill = PAIS)) +
  geom_bar(stat = 'identity') +
  xlab("Países") +
  ylab("Numero de Casos Confirmados") +
  coord_flip()

##covid-19 no Brasil

A pandemia de COVID-19 no Brasil teve início em 26 de fevereiro de 2020, após a confirmação de que um homem de 61 anos de São Paulo que retornou da Itália testou positivo para a SARS-CoV-2, causador da COVID-19. Desde então, em 13 de julho de 2020, confirmaram-se 1.864.681 casos, a maior parte deles no estado de São Paulo, causando 72.100 mortes. Em 17 de março de 2020, na manhã, o Estado de São Paulo confirmou a primeira morte no Brasil, de um homem de 62 anos que estava internado em um hospital particular. De acordo com dados do Ministério da Saúde, a COVID-19 no Brasil até abril de 2020, matou mais do que a H1N1, dengue e sarampo em todo o ano de 2019.

Fonte: https://pt.wikipedia.org/wiki/Pandemia_de_COVID-19_no_Brasil

###Total de casos e mortes no Brasil

A tabela e os graficos abaixo apresentam o total de casos confirmados e total de mortes por covid-19 em cada estado do Brasil. Os dados foram extraidos na data 13/07/2020 do site: https://covid19br.wcota.me/

###Casos confirmados por estado do Brasil

totalcasostotalmortesporestadobrasil <- tabelaCovidBrasil %>%
  group_by(PAIS, ESTADO) %>%
  summarize(MAIORDATA = max(DATA), TOTALCASOS = max(CASOS), TOTALMORTES = max(MORTES)) %>%
  arrange(desc(TOTALCASOS))
## `summarise()` regrouping output by 'PAIS' (override with `.groups` argument)
totalcasostotalmortesporestadobrasil
## # A tibble: 27 x 5
## # Groups:   PAIS [1]
##    PAIS   ESTADO MAIORDATA  TOTALCASOS TOTALMORTES
##    <chr>  <chr>  <date>          <dbl>       <dbl>
##  1 Brazil SP     2020-07-12     371997       17848
##  2 Brazil CE     2020-07-12     136790        6869
##  3 Brazil RJ     2020-07-12     129684       11415
##  4 Brazil PA     2020-07-12     126509        5293
##  5 Brazil BA     2020-07-12     105763        2483
##  6 Brazil MA     2020-07-12      98952        2463
##  7 Brazil AM     2020-07-12      83526        3039
##  8 Brazil MG     2020-07-12      75851        1576
##  9 Brazil PE     2020-07-12      72470        5595
## 10 Brazil DF     2020-07-12      70712         902
## # … with 17 more rows
ggplot(totalcasostotalmortesporestadobrasil, aes(x = fct_reorder(ESTADO, TOTALCASOS, .desc = TRUE), y = TOTALCASOS, fill = ESTADO)) +
  geom_bar(stat = 'identity') +
  ylab("Numero de Casos Confirmados") +
  xlab("Estados do Brasil") 

###Mortes por covid-19 por estado do Brasil

ggplot(totalcasostotalmortesporestadobrasil, aes(x = fct_reorder(ESTADO, TOTALMORTES, .desc = FALSE), y = TOTALMORTES, fill = ESTADO)) +
  geom_bar(stat = 'identity') +
  ylab("Numero de mortes") +
  xlab("Estados do Brasil")

  coord_flip()
## <ggproto object: Class CoordFlip, CoordCartesian, Coord, gg>
##     aspect: function
##     backtransform_range: function
##     clip: on
##     default: FALSE
##     distance: function
##     expand: TRUE
##     is_free: function
##     is_linear: function
##     labels: function
##     limits: list
##     modify_scales: function
##     range: function
##     render_axis_h: function
##     render_axis_v: function
##     render_bg: function
##     render_fg: function
##     setup_data: function
##     setup_layout: function
##     setup_panel_guides: function
##     setup_panel_params: function
##     setup_params: function
##     train_panel_guides: function
##     transform: function
##     super:  <ggproto object: Class CoordFlip, CoordCartesian, Coord, gg>

###Porcentagem de mortes por estado em relacao ao número de casos confirmados e as respectivas mortes

totalcasostotalmortesporestadobrasil %>%
  mutate(PORCENTAGEMDEMORTES = (TOTALMORTES * 100)/TOTALCASOS) %>%
  select(ESTADO, PORCENTAGEMDEMORTES)
## Adding missing grouping variables: `PAIS`
## # A tibble: 27 x 3
## # Groups:   PAIS [1]
##    PAIS   ESTADO PORCENTAGEMDEMORTES
##    <chr>  <chr>                <dbl>
##  1 Brazil SP                    4.80
##  2 Brazil CE                    5.02
##  3 Brazil RJ                    8.80
##  4 Brazil PA                    4.18
##  5 Brazil BA                    2.35
##  6 Brazil MA                    2.49
##  7 Brazil AM                    3.64
##  8 Brazil MG                    2.08
##  9 Brazil PE                    7.72
## 10 Brazil DF                    1.28
## # … with 17 more rows

###Porcentagem de mortes no Brasil em relacao ao número de casos confirmados e as mortes

totalcasostotalmortesporestadobrasil %>%
  group_by(PAIS) %>%
  transmute(SOMACASOS = sum(TOTALCASOS), SOMAMORTES = sum(TOTALMORTES)) %>%
  mutate(PORCENTAGEMDEMORTES = (SOMAMORTES * 100)/SOMACASOS)
## # A tibble: 27 x 4
## # Groups:   PAIS [1]
##    PAIS   SOMACASOS SOMAMORTES PORCENTAGEMDEMORTES
##    <chr>      <dbl>      <dbl>               <dbl>
##  1 Brazil   1867057      72169                3.87
##  2 Brazil   1867057      72169                3.87
##  3 Brazil   1867057      72169                3.87
##  4 Brazil   1867057      72169                3.87
##  5 Brazil   1867057      72169                3.87
##  6 Brazil   1867057      72169                3.87
##  7 Brazil   1867057      72169                3.87
##  8 Brazil   1867057      72169                3.87
##  9 Brazil   1867057      72169                3.87
## 10 Brazil   1867057      72169                3.87
## # … with 17 more rows

##Casos no Distrito Federal

O Distrito Federal (DF) registrou neste domingo (12/07/2020), 70.712 casos confirmados do novo coronavírus, incluindo pacientes recuperados e óbitos. Nas últimas 24 horas, foram registrados 2.306 novos diagnósticos, segundo dados divulgados pelo Painel Covid-19 do Governo do Distrito Federal.

O número de óbitos também subiu. Desde o boletim divulgado na noite de sabado (11/07/2020), 31 novas vítimas fatais foram registradas, totalizando 902 óbitos no DF. Deste total, 826 eram moradoras do DF e 76 de outras unidades da Federação que faziam tratamento na capital.

Fonte: https://jornaldebrasilia.com.br/cidades/df-chega-a-70-mil-casos-de-coronavirus-e-900-obitos/

###Evolução do número de casos no Distrito Federal

tabelacoviddistritofederal <- tabelaCovidBrasil %>%
  filter(ESTADO == "DF") %>%
  select(ESTADO, DATA, CASOS, MORTES)

ggplot(tabelacoviddistritofederal, aes(x = DATA, y = CASOS)) + 
  geom_point() + 
  geom_line() +
  labs(x = "Dia após dia", y = "Número de casos confirmados")

###Evolução do número de mortes por covid-19 no Distrito Federal

ggplot(tabelacoviddistritofederal, aes(x = DATA, y = MORTES)) + 
  geom_point() + 
  geom_line() +
  labs(x = "Dia após dia", y = "Número de mortes por covid-19")

###Dados das regiões administrativas do Distrito Federal

A tabela abaixo apresenta o numero de casos confirmados e numero de obtos por região administrativo do Distrito Federal.

tabelaCovidDFporRA
## # A tibble: 31 x 3
##    RA               CASOS MORTES
##    <chr>            <dbl>  <dbl>
##  1 AGUAS CLARAS      2841     22
##  2 RECANTO DAS EMAS  2151     39
##  3 SAMAMBAIA         4948     88
##  4 TAGUATINGA        5003     81
##  5 VICENTE PIRES      948     13
##  6 PLANO PILOTO      5429     57
##  7 SUDOESTE           986      9
##  8 CRUZEIRO           586      4
##  9 LAGO NORTE         574      5
## 10 LAGO SUL           929      7
## # … with 21 more rows

###Numero de caSos confirmados por RA no DF

ggplot(tabelaCovidDFporRA, aes(x = reorder(RA, CASOS), y = CASOS)) +
  geom_col(fill = "blue") +
  labs(title = "Quantidade de casos confirmados por RA",
       subtitle = "Até 13/07/2020",
       x = "Regiões Administrativas",
       y = "Quantidade de casos confirmados")+
  theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
  coord_flip()

###Numero de mortes por covid-19 por RA no DF

ggplot(tabelaCovidDFporRA, aes(x = reorder(RA, MORTES), y = MORTES)) +
  geom_col(fill = "red") +
  labs(title = "Quantidade de mortes por covid-19 por RA",
       subtitle = "Até 13/07/2020",
       x = "Regiões Administrativas",
       y = "Quantidade de mortes")+
  theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
  coord_flip()

###As tres regiões administrativas com maior numero de mortes

tresmaiorescasosdodf <- tabelaCovidDFporRAcasosemortes %>%
  filter(RA %in% c("CEILANDIA","SAMAMBAIA","TAGUATINGA"))

ggplot(tresmaiorescasosdodf, aes(x = RA, y = QT, fill = factor(TP))) +
  geom_col(position = "stack")

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.