Instituição: Centro Universitário de Brasília - UniCEUB
Disciplina: Introdução à Linguagem Estatística R
Professor: Ricardo Barros Sampaio
Alunos:
Calebe Josué da Silva Campos RA: 52000111
Daniel Giuberti Lauria RA: 52000112
Leonardo Davi Leandro das Chagas Danquimaia RA: 52000203
##O que é COVID-19
A COVID-19 é uma doença causada pelo coronavírus SARS-CoV-2, que apresenta um quadro clínico que varia de infecções assintomáticas a quadros respiratórios graves. De acordo com a Organização Mundial de Saúde (OMS), a maioria dos pacientes com COVID-19 (cerca de 80%) podem ser assintomáticos e cerca de 20% dos casos podem requerer atendimento hospitalar por apresentarem dificuldade respiratória e desses casos aproximadamente 5% podem necessitar de suporte para o tratamento de insuficiência respiratória (suporte ventilatório).
##O que é o coronavírus?
Coronavírus é uma família de vírus que causam infecções respiratórias. O novo agente do coronavírus foi descoberto em 31/12/19 após casos registrados na China. Provoca a doença chamada de coronavírus (COVID-19).
Os primeiros coronavírus humanos foram isolados pela primeira vez em 1937. No entanto, foi em 1965 que o vírus foi descrito como coronavírus, em decorrência do perfil na microscopia, parecendo uma coroa.
A maioria das pessoas se infecta com os coronavírus comuns ao longo da vida, sendo as crianças pequenas mais propensas a se infectarem com o tipo mais comum do vírus. Os coronavírus mais comuns que infectam humanos são o alpha coronavírus 229E e NL63 e beta coronavírus OC43, HKU1.
##Quais são os sintomas
Os sintomas da COVID-19 podem variar de um simples resfriado até uma pneumonia severa. Sendo os sintomas mais comuns:
Tosse Febre Coriza Dor de garganta Dificuldade para respirar
##Como é transmitido
A transmissão acontece de uma pessoa doente para outra ou por contato próximo por meio de: Toque do aperto de mão Gotículas de saliva Espirro Tosse Catarro Objetos ou superfícies contaminadas, como celulares, mesas, maçanetas, brinquedos, teclados de computador etc.
Fonte: https://coronavirus.saude.gov.br/sobre-a-doenca
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(forcats)
library(knitr)
library(tinytex)
setwd("~/Dropbox (InteligCooperativa)/Projetos de Ensino/2 - Esp CEUB CD/Visualizing COVID-19/Script_R_-_TrabalhoFinal")
#setwd("D:/1 - CALEBE CAMPOS/Calebe Josué/CURSOS/UniCEUB/Pós-Graduação - Ciência de Dados/2 - Introdução à Linguagem Estatística R/Arquivos_R/Projeto Covid-19/Dados/")
planilhacsvBrasil <- read_csv("TotalCasosPorEstadoPorDia.csv")
## Parsed with column specification:
## cols(
## epi_week = col_double(),
## date = col_date(format = ""),
## country = col_character(),
## state = col_character(),
## city = col_character(),
## newDeaths = col_double(),
## deaths = col_double(),
## newCases = col_double(),
## totalCases = col_double(),
## deathsMS = col_double(),
## totalCasesMS = col_double(),
## deaths_per_100k_inhabitants = col_double(),
## totalCases_per_100k_inhabitants = col_double(),
## deaths_by_totalCases = col_double(),
## recovered = col_double(),
## suspects = col_double(),
## tests = col_logical(),
## tests_per_100k_inhabitants = col_logical()
## )
## Warning: 4172 parsing failures.
## row col expected actual file
## 1247 tests 1/0/T/F/TRUE/FALSE 2131 'TotalCasosPorEstadoPorDia.csv'
## 1247 tests_per_100k_inhabitants 1/0/T/F/TRUE/FALSE 241.62778 'TotalCasosPorEstadoPorDia.csv'
## 1248 tests 1/0/T/F/TRUE/FALSE 2348 'TotalCasosPorEstadoPorDia.csv'
## 1248 tests_per_100k_inhabitants 1/0/T/F/TRUE/FALSE 70.35507 'TotalCasosPorEstadoPorDia.csv'
## 1250 tests 1/0/T/F/TRUE/FALSE 3292 'TotalCasosPorEstadoPorDia.csv'
## .... .......................... .................. ......... ...............................
## See problems(...) for more details.
planilhacsvMundo <- read_csv("confirmed_cases_by_country.csv")
## Parsed with column specification:
## cols(
## country = col_character(),
## province = col_character(),
## date = col_date(format = ""),
## cases = col_double(),
## cum_cases = col_double()
## )
tabelaCovidDFporRA <- readxl::read_xlsx(path = "DadosCovidDFporRA.xlsx")
tabelaCovidDFporRAcasosemortes <- readxl::read_xlsx(path = "DadosCovidDFporRA - Copia.xlsx")
tabelaCovidBrasil <- planilhacsvBrasil %>%
select(
PAIS = country,
DATA = date,
ESTADO = state,
CASOS = totalCases,
MORTES = deaths) %>%
filter(ESTADO != "TOTAL")
tabelaCovidMundo <- planilhacsvMundo %>%
select(
PAIS = country,
DATA = date,
CASOS = cases,
TOTALCASOS = cum_cases)
##Covid-19 no Mundo
###Paises com maior numero de casos confirmados
A tabela abaixo apresenta o top vinte dos paises com maior numero de casos confirmados para covid-19, na data de 17/03/2020. O mesmo que é apresentado no grafico abaixo:
vintepaisescommaiornumerodecasos <- tabelaCovidMundo %>%
group_by(PAIS) %>%
summarize(MAIORDATA = max(DATA), TOTALMAXIMOCASOS = max(TOTALCASOS)) %>%
arrange(desc(TOTALMAXIMOCASOS)) %>%
top_n(20, TOTALMAXIMOCASOS)
## `summarise()` ungrouping output (override with `.groups` argument)
vintepaisescommaiornumerodecasos
## # A tibble: 20 x 3
## PAIS MAIORDATA TOTALMAXIMOCASOS
## <chr> <date> <dbl>
## 1 Italy 2020-03-17 31506
## 2 Iran 2020-03-17 16169
## 3 Spain 2020-03-17 11748
## 4 Germany 2020-03-17 9257
## 5 Korea, South 2020-03-17 8320
## 6 France 2020-03-17 7699
## 7 US 2020-03-17 6421
## 8 Switzerland 2020-03-17 2700
## 9 United Kingdom 2020-03-17 1960
## 10 Netherlands 2020-03-17 1708
## 11 Norway 2020-03-17 1463
## 12 Austria 2020-03-17 1332
## 13 Belgium 2020-03-17 1243
## 14 Sweden 2020-03-17 1190
## 15 Denmark 2020-03-17 1024
## 16 Japan 2020-03-17 878
## 17 Cruise Ship 2020-03-17 706
## 18 Malaysia 2020-03-17 673
## 19 Canada 2020-03-17 478
## 20 Australia 2020-03-17 452
ggplot(vintepaisescommaiornumerodecasos, aes(x = fct_reorder(PAIS, TOTALMAXIMOCASOS, .desc = FALSE), y = TOTALMAXIMOCASOS, fill = PAIS)) +
geom_bar(stat = 'identity') +
xlab("Países") +
ylab("Numero de Casos Confirmados") +
coord_flip()
##covid-19 no Brasil
A pandemia de COVID-19 no Brasil teve início em 26 de fevereiro de 2020, após a confirmação de que um homem de 61 anos de São Paulo que retornou da Itália testou positivo para a SARS-CoV-2, causador da COVID-19. Desde então, em 13 de julho de 2020, confirmaram-se 1.864.681 casos, a maior parte deles no estado de São Paulo, causando 72.100 mortes. Em 17 de março de 2020, na manhã, o Estado de São Paulo confirmou a primeira morte no Brasil, de um homem de 62 anos que estava internado em um hospital particular. De acordo com dados do Ministério da Saúde, a COVID-19 no Brasil até abril de 2020, matou mais do que a H1N1, dengue e sarampo em todo o ano de 2019.
Fonte: https://pt.wikipedia.org/wiki/Pandemia_de_COVID-19_no_Brasil
###Total de casos e mortes no Brasil
A tabela e os graficos abaixo apresentam o total de casos confirmados e total de mortes por covid-19 em cada estado do Brasil. Os dados foram extraidos na data 13/07/2020 do site: https://covid19br.wcota.me/
###Casos confirmados por estado do Brasil
totalcasostotalmortesporestadobrasil <- tabelaCovidBrasil %>%
group_by(PAIS, ESTADO) %>%
summarize(MAIORDATA = max(DATA), TOTALCASOS = max(CASOS), TOTALMORTES = max(MORTES)) %>%
arrange(desc(TOTALCASOS))
## `summarise()` regrouping output by 'PAIS' (override with `.groups` argument)
totalcasostotalmortesporestadobrasil
## # A tibble: 27 x 5
## # Groups: PAIS [1]
## PAIS ESTADO MAIORDATA TOTALCASOS TOTALMORTES
## <chr> <chr> <date> <dbl> <dbl>
## 1 Brazil SP 2020-07-12 371997 17848
## 2 Brazil CE 2020-07-12 136790 6869
## 3 Brazil RJ 2020-07-12 129684 11415
## 4 Brazil PA 2020-07-12 126509 5293
## 5 Brazil BA 2020-07-12 105763 2483
## 6 Brazil MA 2020-07-12 98952 2463
## 7 Brazil AM 2020-07-12 83526 3039
## 8 Brazil MG 2020-07-12 75851 1576
## 9 Brazil PE 2020-07-12 72470 5595
## 10 Brazil DF 2020-07-12 70712 902
## # … with 17 more rows
ggplot(totalcasostotalmortesporestadobrasil, aes(x = fct_reorder(ESTADO, TOTALCASOS, .desc = TRUE), y = TOTALCASOS, fill = ESTADO)) +
geom_bar(stat = 'identity') +
ylab("Numero de Casos Confirmados") +
xlab("Estados do Brasil")
###Mortes por covid-19 por estado do Brasil
ggplot(totalcasostotalmortesporestadobrasil, aes(x = fct_reorder(ESTADO, TOTALMORTES, .desc = FALSE), y = TOTALMORTES, fill = ESTADO)) +
geom_bar(stat = 'identity') +
ylab("Numero de mortes") +
xlab("Estados do Brasil")
coord_flip()
## <ggproto object: Class CoordFlip, CoordCartesian, Coord, gg>
## aspect: function
## backtransform_range: function
## clip: on
## default: FALSE
## distance: function
## expand: TRUE
## is_free: function
## is_linear: function
## labels: function
## limits: list
## modify_scales: function
## range: function
## render_axis_h: function
## render_axis_v: function
## render_bg: function
## render_fg: function
## setup_data: function
## setup_layout: function
## setup_panel_guides: function
## setup_panel_params: function
## setup_params: function
## train_panel_guides: function
## transform: function
## super: <ggproto object: Class CoordFlip, CoordCartesian, Coord, gg>
###Porcentagem de mortes por estado em relacao ao número de casos confirmados e as respectivas mortes
totalcasostotalmortesporestadobrasil %>%
mutate(PORCENTAGEMDEMORTES = (TOTALMORTES * 100)/TOTALCASOS) %>%
select(ESTADO, PORCENTAGEMDEMORTES)
## Adding missing grouping variables: `PAIS`
## # A tibble: 27 x 3
## # Groups: PAIS [1]
## PAIS ESTADO PORCENTAGEMDEMORTES
## <chr> <chr> <dbl>
## 1 Brazil SP 4.80
## 2 Brazil CE 5.02
## 3 Brazil RJ 8.80
## 4 Brazil PA 4.18
## 5 Brazil BA 2.35
## 6 Brazil MA 2.49
## 7 Brazil AM 3.64
## 8 Brazil MG 2.08
## 9 Brazil PE 7.72
## 10 Brazil DF 1.28
## # … with 17 more rows
###Porcentagem de mortes no Brasil em relacao ao número de casos confirmados e as mortes
totalcasostotalmortesporestadobrasil %>%
group_by(PAIS) %>%
transmute(SOMACASOS = sum(TOTALCASOS), SOMAMORTES = sum(TOTALMORTES)) %>%
mutate(PORCENTAGEMDEMORTES = (SOMAMORTES * 100)/SOMACASOS)
## # A tibble: 27 x 4
## # Groups: PAIS [1]
## PAIS SOMACASOS SOMAMORTES PORCENTAGEMDEMORTES
## <chr> <dbl> <dbl> <dbl>
## 1 Brazil 1867057 72169 3.87
## 2 Brazil 1867057 72169 3.87
## 3 Brazil 1867057 72169 3.87
## 4 Brazil 1867057 72169 3.87
## 5 Brazil 1867057 72169 3.87
## 6 Brazil 1867057 72169 3.87
## 7 Brazil 1867057 72169 3.87
## 8 Brazil 1867057 72169 3.87
## 9 Brazil 1867057 72169 3.87
## 10 Brazil 1867057 72169 3.87
## # … with 17 more rows
##Casos no Distrito Federal
O Distrito Federal (DF) registrou neste domingo (12/07/2020), 70.712 casos confirmados do novo coronavírus, incluindo pacientes recuperados e óbitos. Nas últimas 24 horas, foram registrados 2.306 novos diagnósticos, segundo dados divulgados pelo Painel Covid-19 do Governo do Distrito Federal.
O número de óbitos também subiu. Desde o boletim divulgado na noite de sabado (11/07/2020), 31 novas vítimas fatais foram registradas, totalizando 902 óbitos no DF. Deste total, 826 eram moradoras do DF e 76 de outras unidades da Federação que faziam tratamento na capital.
Fonte: https://jornaldebrasilia.com.br/cidades/df-chega-a-70-mil-casos-de-coronavirus-e-900-obitos/
###Evolução do número de casos no Distrito Federal
tabelacoviddistritofederal <- tabelaCovidBrasil %>%
filter(ESTADO == "DF") %>%
select(ESTADO, DATA, CASOS, MORTES)
ggplot(tabelacoviddistritofederal, aes(x = DATA, y = CASOS)) +
geom_point() +
geom_line() +
labs(x = "Dia após dia", y = "Número de casos confirmados")
###Evolução do número de mortes por covid-19 no Distrito Federal
ggplot(tabelacoviddistritofederal, aes(x = DATA, y = MORTES)) +
geom_point() +
geom_line() +
labs(x = "Dia após dia", y = "Número de mortes por covid-19")
###Dados das regiões administrativas do Distrito Federal
A tabela abaixo apresenta o numero de casos confirmados e numero de obtos por região administrativo do Distrito Federal.
tabelaCovidDFporRA
## # A tibble: 31 x 3
## RA CASOS MORTES
## <chr> <dbl> <dbl>
## 1 AGUAS CLARAS 2841 22
## 2 RECANTO DAS EMAS 2151 39
## 3 SAMAMBAIA 4948 88
## 4 TAGUATINGA 5003 81
## 5 VICENTE PIRES 948 13
## 6 PLANO PILOTO 5429 57
## 7 SUDOESTE 986 9
## 8 CRUZEIRO 586 4
## 9 LAGO NORTE 574 5
## 10 LAGO SUL 929 7
## # … with 21 more rows
###Numero de caSos confirmados por RA no DF
ggplot(tabelaCovidDFporRA, aes(x = reorder(RA, CASOS), y = CASOS)) +
geom_col(fill = "blue") +
labs(title = "Quantidade de casos confirmados por RA",
subtitle = "Até 13/07/2020",
x = "Regiões Administrativas",
y = "Quantidade de casos confirmados")+
theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
coord_flip()
###Numero de mortes por covid-19 por RA no DF
ggplot(tabelaCovidDFporRA, aes(x = reorder(RA, MORTES), y = MORTES)) +
geom_col(fill = "red") +
labs(title = "Quantidade de mortes por covid-19 por RA",
subtitle = "Até 13/07/2020",
x = "Regiões Administrativas",
y = "Quantidade de mortes")+
theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
coord_flip()
###As tres regiões administrativas com maior numero de mortes
tresmaiorescasosdodf <- tabelaCovidDFporRAcasosemortes %>%
filter(RA %in% c("CEILANDIA","SAMAMBAIA","TAGUATINGA"))
ggplot(tresmaiorescasosdodf, aes(x = RA, y = QT, fill = factor(TP))) +
geom_col(position = "stack")
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.