No final do ano de 2019, o mundo foi supreendido com o surgimento de uma nova doença que, inicialmente, foi detectada na cidade de Wuhan,China, a COVID-19. O primeiro caso da doença foi relatado no dia 1/12/2019.
Após esta data houve uma rápida contaminação pelo mundo. Em pouco mais de 1 mês a COVID-19 já havia sido registrada na Austrália, na França, na Coreia do Sul, no Japão, no Canadá e nos Estados Unidos.
Aqui no Brasil o primeiro caso da doença foi registrado em Fevereiro. Este caso seria referente a um homem que teria viajado para a Itália. Após esta data vários outros casos começaram a ser registrados e identificados pelo país.
Sendo assim, este trabalho visa trazer informações sobre a evolução da Covid no Brasil, fazendo análises dos dados de casos da doença no Brasil, bem como apresentar também o úmero de óbitos que ocorreram e também o número de pessoas que se recuperou da doença.
A Covid-19 é uma doença causada pelo vírus Sars-Cov-2, a estrutura do vírus é apresentada na figura abaixo. Acredita-se que este vírus possua como hospedeiros algumas espécies de mamíferos, como morcegos e pangolins. Como estes animais são consumidos em algumas regiões da China, então é provável que a origem da doença nos humanos tenha se dado por este hábito alimentar.
Dentre os sistomas mais comuns dos pacientes disgnosticados com Covid, estão sintomas relacionados ao sistema respiratório. Este sintoma foi o maior causador das mortes por Covid. Outro problema dos sintomas da Covid é que se assemelham muito aos sintomas de gripes e resfriados comuns, oque foi e continua sendo um grande obstáculo para um correto diagnóstico. A figura abaixo mostra o estado o estado muito comprometido dos pulmões que morreu por complicações causadas pela Covid.
A metodologia adotada será iniciando a análise dos dados do Brasil, sem fazer distinção de estados e regiões. Em seguida veremos como os casos de Covid se desenvolveram nas regiões do país. Em seguida será feito um estudo dos casos confirmados e dos óbitos ocorridos nos estados brasileiros. Por último será feita uma análise da situação do estado de Pernambuco, avaliando a evolução da doença na região metropolitana e no interior, bem como em nossa capital, Recife.
Todas análises feitas geraram gráficos de acompanhamento dos números que serão tomados como base para as inferências realizadas acerca da situação de nossa nação. Ajudando assim todos os brasileiros a entederem melhor como se deu o desenvolvimento da Covid em solo nacional, bem como ter um restrospecto de seu estado e sua região.
A tabela abaixo trás um resumo dos pacotes que foram usados no projeto, bem como a descrição deles.
| Pacotes | Descrição |
|---|---|
| dplyr | Utilizado para realizar a manipulação de DataFrames |
| ggplot2 | Utilizado para criação de gráficos |
| plotly | Utilizado para criação de gráficos interativos |
| formattable | Utilizado para geração e formatação de tabelas |
| DT | Utilizado para inserir tabelas dinâmicas no R Markdown |
Para que se possa usar de todas as funcionalidades do pacote, se faz necessário a instalação e depois importação dos pacotes.
install.packages("dplyr")
install.packages("ggplot2")
install.packages("plotly")
install.packages("formattable")
install.packages("DT")
library(dplyr)
library(ggplot2)
library(plotly)
library(formattable)
library(DT)
Os dados utilizados nas análises foram obtidos no site Kaggle, que é um repositório de DataSets. Para acessar diretamente a página dos dados basta clicar aqui. Estes dados foram importados originalmente do portal CoronaVírus Brasil no dia 12 de março de 2021.
Os dados orginalmente foram adiquiridos no formato .csv e importados para o R. Foi necessário informar que o separador usado era “;”.
covid<-read.csv("https://www.dropbox.com/s/09x7u589ga3znve/COVID19_20210312.csv?dl=1",
header = T,sep = ";")
Originalmente os dados tinham 1973139 registros e 17 colunas e compreendem dados da Covid-19 no Brasil nos períodos de 2020-02-25 a 2021-03-12. Contudo, nem todas as colunas foram usadas nas análises. Sendo assim, após a importação dos dados se sucedeu um procedimento de limpeza e organização dos dados para retirar as colunas que não foram usadas.
Inicialmente foi identificado que existia um problema de enconding, onde o nome dos municípios que continham acento em sua escrita foram importados com caractéres especiais. Sendo assim foi usada a função iconv para sanar este problema.
#Resolução de problemas de enconding
covid$municipio<-iconv(covid$municipio,from="UTF-8",to="latin1//TRANSLIT")
Em seguida, foi observado que existiam algumas informações faltantes em algumas linhas, então estas foram retiradas dos dados. Vale salientar que só foram retirados os NA’s da coluna populacaoTCU2019, pois as demais colunas continham dados faltantes também ou em duplicidade. Os demais NA’s foram tratados em situações particulares, pois se retirados no início iam ocasionar perda de informações.
#Eliminação dos dados que contém informações faltantes
covid<-covid[which(is.na(covid$populacaoTCU2019)==F),]
Os NA’s presentes na coluna Recuperadosnovos e interior.metropolitana foram substituídos por 0.
#Substituição dos NA's por 0
covid$Recuperadosnovos[
which(
is.na(
covid$Recuperadosnovos)==T)]<-rep(
0,length(
covid$Recuperadosnovos[
which(is.na(covid$Recuperadosnovos)==T)]))
covid$interior.metropolitana[
which(
is.na(
covid$interior.metropolitana)==T)]<-rep(
0,length(
covid$interior.metropolitana[
which(is.na(covid$interior.metropolitana)==T)]))
Após a eliminação dos dados faltantes e criação de nova coluna, foram selecionadas as colunas que seriam usadas nas análises
#Eliminação de colunas que não serão usadas
covid<-covid[,c("regiao","estado","municipio","data","casosAcumulado",
"casosNovos","obitosAcumulado","obitosNovos",
"Recuperadosnovos","interior.metropolitana")]
Assim finalizamos a limpeza e organização dos dados, culminando num conjunto de dados nomeado covid que contém 1965768 registros e 10 colunas. Uma parte dos dados é mostrado abaixo, bem como é apresentada uma Tabela com os nomes das culunas e a descrição dos dados que contém em cada uma.
#Tabela interativa do Data Frame covid
DT::datatable(covid[1:20, c( 1:length(colnames(covid)))], rownames = FALSE)
#Criação da tabela de descrição das colunas do data frame
Descrição<-c("Coluna que contém as regiões do Brasil.Quando ela contém dados
do Brasil ela é preenchida com o nome Brasil",
"Contém o nome dos Estados do Brasil",
"Contém o nome dos munícipios",
"Contém o registro das datas nas quais os dados foram obtidos",
"Contém a quantidade de casos acumulados desde o início da
pandemia",
"Contém a quantidade de casos novos registrados naquela data",
"Contém a quantidade de óbitdos acumulados desde o início da
pandemia",
"Contém a quantidade de novos óbitos registrados naquela data",
"Contém a quantidade acumulada de pessoas recupedas desde o
início da pandemia",
"Contém dados binários referentes se o município está ou não na
região metropolitana:1 - município da Regição Metropolitana;
0 - municipio do interior. Essa informações são válidas só para
as linhas que contém municípios")
nomes_colunas<-data.frame(colnames(covid),Descrição)
colnames(nomes_colunas)[1]<-"Nomes das Colunas"
formattable(nomes_colunas, align = c("l", "l"))
| Nomes das Colunas | Descrição |
|---|---|
| regiao | Coluna que contém as regiões do Brasil.Quando ela contém dados do Brasil ela é preenchida com o nome Brasil |
| estado | Contém o nome dos Estados do Brasil |
| municipio | Contém o nome dos munícipios |
| data | Contém o registro das datas nas quais os dados foram obtidos |
| casosAcumulado | Contém a quantidade de casos acumulados desde o início da pandemia |
| casosNovos | Contém a quantidade de casos novos registrados naquela data |
| obitosAcumulado | Contém a quantidade de óbitdos acumulados desde o início da pandemia |
| obitosNovos | Contém a quantidade de novos óbitos registrados naquela data |
| Recuperadosnovos | Contém a quantidade acumulada de pessoas recupedas desde o início da pandemia |
| interior.metropolitana | Contém dados binários referentes se o município está ou não na região metropolitana:1 - município da Regição Metropolitana; 0 - municipio do interior. Essa informações são válidas só para as linhas que contém municípios |
Inicialmente o data frame covid foi dividido para melhor se trabalhar. Como foi mencionado, as análises começaram pelo estudo da evolução dos casos de Covid no Brasil, bem como hou também o estudo da evolução dos casos de morte e de recuperação em todo o território nacional.
#Criação do data frame covid_br
covid_br<-covid[which(covid$regiao=="Brasil"),
c("regiao","data","casosAcumulado","casosNovos",
"obitosAcumulado","obitosNovos","Recuperadosnovos")]
Como só há registro de recuperados para o Brasil todo, foi criada a coluna Recuperados_dia, pois a coluna que contém os dados das pessoas recuperadas, contém dados cumulativos. Então para melhor análise dos dados foi feita a criação da coluna com dados de casos diários. Esta manipulação foi feita nesta segunda etapa pois os demais estudos não necessitam dela e para diminuir o tempo de trabalho da máquina.
#Ciração da coluna Recuperados_por_dia
for (i in 1:length(covid_br$Recuperadosnovos)) {
if (i==1) {
covid_br$Recuperados_por_dia[i]<-0
}else if (i>1) {
covid_br$Recuperados_por_dia[i]<-
covid_br$Recuperadosnovos[i]-covid_br$Recuperadosnovos[i-1]
}
}
De posse do data frame covid_br, foi feita a análise da evolução dos casos, óbitos e recuperados num período de quinzenas. Foi escolhido esse período para melhor observação dos dados nos gráficos. Para automatizar as análises foi criada a função grafico_quinzena que já gera um gráfico interativos com os dados que são desejados. A tabela abaixo mostra as variáveis de entrada da função e a descrição delas.
#Evolução da covid no Brasil
desc_grafico_quinzena<-data.frame(
Variáveis = c("df","coluna","nome_serie","titulo_grafico","eixoX","eixoY"),
Descrição = c("Conjunto de dados a ser utilizado - data frame",
"Coluna do data frame que será usada como fonte dos dados para plotagem do gráfico",
"Nome da série de dados que será usada para nomear a legenda do gráfico",
"Título que será dado ao gráfico",
"Label do eixo X",
"Label do eixo Y")
)
formattable(desc_grafico_quinzena, align = c("l", "l"))
| Variáveis | Descrição |
|---|---|
| df | Conjunto de dados a ser utilizado - data frame |
| coluna | Coluna do data frame que será usada como fonte dos dados para plotagem do gráfico |
| nome_serie | Nome da série de dados que será usada para nomear a legenda do gráfico |
| titulo_grafico | Título que será dado ao gráfico |
| eixoX | Label do eixo X |
| eixoY | Label do eixo Y |
grafico_quinzena<-function(df,coluna,nome_serie,titulo_grafico,eixoX,eixoY){
intervalo_datas<-c()
casos_quinzena<-c()
x<-1
for (i in seq(1,length(df$data),15)) {
if ((i+14)<=length(df$data)) {
intervalo_datas[x]<-paste(df$data[i],
df$data[i+14],
sep="/")
casos_quinzena[x]<-sum(df[which(df$data>=df$data[i] &
df$data<=df$data[i+14]),coluna])
}else if ((i+14)>length(df$data)) {
intervalo_datas[x]<-paste(df$data[i],
df$data[length(df$data)],
sep="/")
casos_quinzena[x]<-sum(df[which(df$data>=df$data[i] &
df$data<=df$data[length(df$data)]),
coluna])
}
x<-x+1
}
y<-data.frame(intervalo_datas,casos_quinzena)
fig<-plot_ly(data=y,type="scatter",mode="lines",
x=~intervalo_datas,y=~casos_quinzena,name=nome_serie
) %>% layout(
showlegend=TRUE,
title=titulo_grafico,
yaxis=list(title=eixoY),
xaxis=list(title=eixoX)
)
return(fig)
}
Utilizando a função acima descrita foram plotados os gráficos de acompanhamento quinzenal da Covid no Brasil. Primeiramente foi feito o acompanhamento dos casos confitmados, em seguida foi feito o gráfico com dados dos óbitos e por foi feito o gráfico da evolução dos casos de recuperação. Neste último gráfico ainda foi feita uma manipulação antes da plotagem, pois foi identificado que alguns dados do número de recuperados novos eram negativos, logo estes dados foram eliminados. Esta eliminação não foi feita antes para evitar perda de dados de outras variáveis.
No gráfico do acompanhamento do número de casos é possível observar que no início o número de casos subiu com um taxa menor, contudo a partir do final de Abril de 2020 houve um forte aumento da ocorrência de casos, culminando no primeiro pico em meados de Agosto de 2020. Após este primeiro pico houve uma rápida queda no número de casos atingindo o menor número de ocorrências de casos em meados de Novembro de 2020. Contudo, com o relaxamento das medidas restritivas o Brasil enfrentou uma segunda, ainda mais forte que a primeira, culminando em sucessivos aumentos do número de casos registrados, atingindo seu pico máximo em meados de Março do ano atual.
Em relação a evolução do número de mortes, esta acompanha o perfil do gráfico do número de casos mostrando que mais mortes ocorreram nas e´pocas que haviam mais casos sendo diagnosticados. Por outro lado o número de recuperados também apresentou o mesmo perfil, mostrando que embroa o número de casos e de óbitos esteja apresentando um crescimento, o número de pessoas que estão se recuperando da covid também estão aumento.
#Casos Novos por quinzena
grafico_quinzena(df=covid_br,coluna="casosNovos",nome_serie="Casos Novos",
titulo_grafico="Quantidade de Casos Novos/Quinzena",
eixoX="Quinzena",eixoY="Quantidade de Casos")
#Óbitos novos por quinzena
grafico_quinzena(df=covid_br,coluna="obitosNovos",nome_serie = "Novos Óbitos",
titulo_grafico = "Número de Óbitos/Quinzena",
eixoX = "Quinzena",eixoY = "Óbitos")
#Recuperados por quinzena
covid_br<-covid_br[which(covid_br$Recuperados_por_dia>
min(covid_br$Recuperados_por_dia) &
covid_br$Recuperados_por_dia<
max(covid_br$Recuperados_por_dia)),]
grafico_quinzena(df=covid_br,coluna="Recuperados_por_dia",
nome_serie="Recuperados",
titulo_grafico = "Número de Pessoas Recuperadas/Quinzena",
eixoX = "Quinzena",eixoY = "Nº de Recuperados")
Assim como no caso do Brasil, para se estudar a evolução dos casos confirmados e de óbitos foi dividido o conjunto de dados para cada região com o auxílio de uma função. Então foi feito um gráfico comparativo entre as regiões com o objetivo de melhor vizualizar qyais foram as regiões mais afetadas pela pandemia e consequentemente aquelas que apresentaram maior número de mortos. A figura abaixo mostra as variáveis e a descrição da de cada uma delas.
#Criação dos data frames de cada região
desc_covid_regiao<-data.frame(
Variáveis=c("data","regiao"),
Descrição=c("Conjunto de dados a ser utilizado - data frame",
"Região que será separdo os dados")
)
formattable(desc_covid_regiao, align = c("l", "l"))
| Variáveis | Descrição |
|---|---|
| data | Conjunto de dados a ser utilizado - data frame |
| regiao | Região que será separdo os dados |
covid_regiao<-function(data,regiao) {
x<-data[which(data$regiao==regiao & data$municipio==""),
c("regiao","estado","data","casosAcumulado","casosNovos",
"obitosAcumulado","obitosNovos")]
return(x)
}
covid_N<-covid_regiao(data = covid,regiao = "Norte")
covid_NE<-covid_regiao(data = covid,regiao = "Nordeste")
covid_SE<-covid_regiao(data = covid,regiao = "Sudeste")
covid_S<-covid_regiao(data = covid,regiao = "Sul")
covid_CO<-covid_regiao(data = covid,regiao = "Centro-Oeste")
Em seguida foi feita uma função para separar o período de tempo em quinzenas e uma função para montar o vetor com os casos quinzenais. De posse desses vetores foi feito então a construção e plotagem dos gráficos de multilas linhas, onde cada linha representa a evolução da doença em uma região. A função de cálculo dos casos quinzenais serve para calcular tanto o número de casos confirmados quanto de óbitos para cada uma região.
#Determinação dos intervalos de tempo (quinzenas) que serão analizadas
desc_quinzenas<-data.frame(
Variáveis=c("df"),
Descrição=c("Conjunto de dados a ser utilizado - data frame")
)
formattable(desc_quinzenas, align = c("l", "l"))
| Variáveis | Descrição |
|---|---|
| df | Conjunto de dados a ser utilizado - data frame |
quinzenas<-function(df){
intervalo_datas<-c()
x<-1
for (i in seq(1,length(unique(df$data)),15)) {
if ((i+14)<=length(unique(df$data))) {
intervalo_datas[x]<-paste(unique(df$data)[i],
unique(df$data)[i+14],
sep="/")
}else if ((i+14)>length(unique(df$data))) {
intervalo_datas[x]<-paste(unique(df$data)[i],
unique(df$data)[length(unique(df$data))],
sep="/")
}
x<-x+1
}
return(intervalo_datas)
}
quinzena<-quinzenas(covid_NE)
#Determinação dos casos em quinzenas
desc_casos_quinzenais<-data.frame(
Variáveis=c("df","coluna"),
Descrição=c("Conjunto de dados a ser utilizado - data frame",
"Coluna do data frame que será usada como fonte dos dados para plotagem do gráfico")
)
formattable(desc_casos_quinzenais, align = c("l", "l"))
| Variáveis | Descrição |
|---|---|
| df | Conjunto de dados a ser utilizado - data frame |
| coluna | Coluna do data frame que será usada como fonte dos dados para plotagem do gráfico |
casos_quinzenais<-function(df,coluna){
casos_quinzena<-c()
x<-1
for (i in seq(1,length(unique(df$data)),15)) {
if ((i+14)<=length(unique(df$data))) {
casos_quinzena[x]<-sum(df[which(df$data>=unique(df$data)[i] &
df$data<=unique(df$data)[i+14]),coluna])
}else if ((i+14)>length(unique(df$data))) {
casos_quinzena[x]<-sum(df[which(df$data>=unique(df$data)[i] &
df$data<=unique(df$data)[
length(unique(df$data))]),coluna])
}
x<-x+1
}
return(casos_quinzena)
}
casos_novos_NE<-casos_quinzenais(df = covid_NE,coluna = "casosNovos")
casos_novos_N<-casos_quinzenais(df=covid_N,coluna = "casosNovos")
casos_novos_CO<-casos_quinzenais(df=covid_CO,coluna = "casosNovos")
casos_novos_S<-casos_quinzenais(df=covid_S,coluna = "casosNovos")
casos_novos_SE<-casos_quinzenais(df=covid_SE,coluna = "casosNovos")
casos_novos_regioes<-data.frame(quinzena,casos_novos_CO,casos_novos_N,
casos_novos_NE,casos_novos_S,casos_novos_SE)
fig_cn_reg<-plot_ly(data=casos_novos_regioes,type="scatter",mode="lines",
x=~quinzena,y=~casos_novos_CO,name="Centro-Oeste(CO)"
) %>% add_trace(
y=~casos_novos_N,name="Norte(N)"
) %>% add_trace(
y=~casos_novos_NE,name="Nordeste(NE)"
) %>% add_trace(
y=~casos_novos_S,name="Sul(S)"
) %>% add_trace(
y=~casos_novos_SE,name="Sudeste(SE)"
) %>% layout(
showlegend=TRUE,
title="Casos Novos por Região",
yaxis=list(title="Quantidade de Casos"),
xaxis=list(title="Quinzena")
)
obitos_NE<-casos_quinzenais(df = covid_NE,coluna = "obitosNovos")
obitos_N<-casos_quinzenais(df = covid_N,coluna = "obitosNovos")
obitos_CO<-casos_quinzenais(df = covid_CO,coluna = "obitosNovos")
obitos_SE<-casos_quinzenais(df = covid_SE,coluna = "obitosNovos")
obitos_S<-casos_quinzenais(df = covid_S,coluna = "obitosNovos")
obitos_regioes<-data.frame(quinzena,obitos_CO,obitos_N,obitos_NE,obitos_S,
obitos_SE)
fig_ob_reg<-plot_ly(data=obitos_regioes,type="scatter",mode="lines",
x=~quinzena,y=~obitos_CO,name="Centro-Oeste(CO)"
) %>% add_trace(
y=~obitos_N,name="Norte(N)"
) %>% add_trace(
y=~obitos_NE,name="Nordeste(NE)"
) %>% add_trace(
y=~obitos_S,name="Sul(S)"
) %>% add_trace(
y=~obitos_SE,name="Sudeste(SE)"
) %>% layout(
showlegend=TRUE,
title="Óbitos por Região",
yaxis=list(title="Quantidade de Óbitos"),
xaxis=list(title="Quinzena")
)
Os graficos de acompanhamento de casos e óbitos de cada região a princípio mostram um perfil semelhante ao observado pela evolução dos casos no Brasil. No gráfico da evolução dos casos novos é possível obarevar que a região que tem o maior registro de casos é a região Sudeste, Ela só não teve sempre o maior número de casos, porque logo no início da pandemia a região Nordeste ainda teve uma maior quantidade de registros da doença durante 45 dias, aproximadamente. Após um forte crescimento no início da pandemia a Região Nordeste apresentou uma forte chegando níveis mais baixos que a região Sul a partir de 2020-10-22/2020-11-05. Após esses dias a região Sul teve um aumento no número de casos e cehou a níveis próximos aos da Região Sudeste. Contudo com um aumento nos casos a região NE voltou a ter uma quantidade de casos novos maior que a região S e então estas duas bem se alternando como segunda região mais afetada. As regiões Norte e Centro-Oeste ficaram todo o período da pandemia se alternando como as regiões de menor incidência da doença.
Em relação ao gráfico de acompanhamento do número de mortos durante o período estudado, foi visto que se comporta se forma similar ao gráfico do número de casos. Contudo tem um evento bem peculiar que aconteceu na região Norte. Como é possível ver no período de 2021-01-20/2021-02-03 é observado um pico muito elevado e repentino para o número de óbitos que a região Norte estava apresentando. Isto ocorreu devido a cris do abastecimento de oxigêncio que ocorreu no estado do Amazonas, fazendo com que tivesse um aumento rápido e repentino no número de de mortes. E mais uma vez a região SE se apresentou como a pior região em termos de número de óbitos.
fig_cn_reg
fig_ob_reg
Após analizar o desenvolvimento da Covid-19 entre as regiões, foi feito o estudo dos casos totais e da quantidade total de óbitos entre os estados e o Distrito Federal, afim de identificar os estados com maior incidência da doença e maior índice de morte devido a Covid.
Para tal estudo incialmente, assim como nos casos anteriores, o data frame covid foi dividido entre os estados para melhor controle e manuseio dos dados.
#Criação dos data frames dos Estados
desc_covid_estados<-data.frame(
Variáveis=c("data","sigla_estado"),
Descrição=c("Conjunto de dados a ser utilizado - data frame",
"Sigla do estado que vai ser feita a separação de dados")
)
formattable(desc_covid_estados, align = c("l", "l"))
| Variáveis | Descrição |
|---|---|
| data | Conjunto de dados a ser utilizado - data frame |
| sigla_estado | Sigla do estado que vai ser feita a separação de dados |
covid_estados<-function(data,sigla_estado) {
x<-data[which(data$estado==sigla_estado & data$municipio==""),
c("estado","data","casosAcumulado","casosNovos","obitosAcumulado",
"obitosNovos")]
return(x)
}
covid_pe<-covid_estados(data=covid,sigla_estado="PE")
covid_ac<-covid_estados(data=covid,sigla_estado="AC")
covid_al<-covid_estados(data=covid,sigla_estado="AL")
covid_ap<-covid_estados(data=covid,sigla_estado="AP")
covid_am<-covid_estados(data=covid,sigla_estado="AM")
covid_ba<-covid_estados(data=covid,sigla_estado="BA")
covid_ce<-covid_estados(data=covid,sigla_estado="CE")
covid_df<-covid_estados(data=covid,sigla_estado="DF")
covid_es<-covid_estados(data=covid,sigla_estado="ES")
covid_go<-covid_estados(data=covid,sigla_estado="GO")
covid_ma<-covid_estados(data=covid,sigla_estado="MA")
covid_mt<-covid_estados(data=covid,sigla_estado="MT")
covid_ms<-covid_estados(data=covid,sigla_estado="MS")
covid_mg<-covid_estados(data=covid,sigla_estado="MG")
covid_pa<-covid_estados(data=covid,sigla_estado="PA")
covid_pb<-covid_estados(data=covid,sigla_estado="PB")
covid_pr<-covid_estados(data=covid,sigla_estado="PR")
covid_pi<-covid_estados(data=covid,sigla_estado="PI")
covid_rj<-covid_estados(data=covid,sigla_estado="RJ")
covid_rn<-covid_estados(data=covid,sigla_estado="RN")
covid_rs<-covid_estados(data=covid,sigla_estado="RS")
covid_ro<-covid_estados(data=covid,sigla_estado="RO")
covid_rr<-covid_estados(data=covid,sigla_estado="RR")
covid_sc<-covid_estados(data=covid,sigla_estado="SC")
covid_sp<-covid_estados(data=covid,sigla_estado="SP")
covid_se<-covid_estados(data=covid,sigla_estado="SE")
covid_to<-covid_estados(data=covid,sigla_estado="TO")
De posse dos dados dos estados, foram feitos dois gráficos de barra para estudar o total de casos confirmados e de óbitos em cada estado brasileiro.
#Gráfico comparativo do total de casos entre os estados
casos_totais_estados<-data.frame()
z<-1
for (i in unique(covid$estado)[-1]) {
casos_totais_estados[z,1]<-covid[
which(covid$estado==i &
covid$municipio==""),
"regiao"][1]
casos_totais_estados[z,2]<-i
casos_totais_estados[z,3]<-max(covid[
which(covid$estado==i &
covid$municipio==""),
"casosAcumulado"])
casos_totais_estados[z,4]<-max(covid[
which(covid$estado==i &
covid$municipio==""),
"obitosAcumulado"])
z<-z+1
}
colnames(casos_totais_estados)<-c("regiao","estados",
"casos_totais","obitos_totais")
fig_casos_estados<-plot_ly(data = casos_totais_estados,x=~estados,
y=~casos_totais,type = 'bar',
name = 'Casos Totais',
color=rainbow(length(casos_totais_estados$estados)),
colors = "Dark2"
)%>% layout(
showlegend=FALSE,
title="Casos Totais de Covid por Estado",
xaxis=list(title="Estados"),
yaxis=list(title="Quantidade")
)
fig_obitos_estados<-plot_ly(data = casos_totais_estados,x=~estados,
y=~obitos_totais,type = 'bar',
name = 'Ótbitos Totais',
color=rainbow(length(casos_totais_estados$estados)),
colors = "Dark2"
)%>% layout(
showlegend=FALSE,
title="Óbitos por Estado",
xaxis=list(title="Estados"),
yaxis=list(title="Quantidade")
)
Para completar os estudos que foram feitos nas regiões, o estudo entre os estados vem confirmar o esperado. Como a regição SE apresentou, em sua maioria, sempre os maiores níveis de casos confirmados e de óbitos, era esperado que seus estados configurassem entre os estados de maior número de casos e de morte, com o grande destaque a São Paulo que é o estado que mais teve casos confirmados e mais óbitos registrados devido a Covid-19. Um dado bastante curioso é o caso dos estados da região Sul (PR, SC, RS), estes estados apresentaram alevados níveis de casos novos e óbitos, contudo foi visto que era um estado que ficava com os níveis um pouco baixos, isto devido a pequena quantidade de estados que a região tem, apenas 3, fazendo com que seu somatório fique menor que os de outras regiões com mais estados, como é o caso do NE. Por isso se fez necessário observar a quantidade de casos e óbitos com os estados separados.
Continuando com a análise agora foi feito o estudo do estado de Pernambuco onde foi verificado a relação entre a quantidade de casos e óbitos entre a região metropolitana (RMT) e o interior do estado. Para este estudo foi criada mais uma função que separa os dados dos estados, agora levando em consideração os municípios, no nosso caso a função foi usada apenas para estudar o estado de PE, contudo ela pode ser usada para fazer o mesmo estudo nos demais estados. Esta função covid_estados_municipios tem as mesmas variáveis de entrada da função usada na separação dos dados dos estados.
#Criação do data frame do estado de PE levando em consideração os municípios
covid_estados_municipios<-function(data,sigla_estado) {
x<-data[which(data$estado==sigla_estado & data$municipio!=""),
c("estado","municipio","data","casosAcumulado","casosNovos",
"obitosAcumulado","obitosNovos","interior.metropolitana")]
return(x)
}
covid_pe_mun<-covid_estados_municipios(data=covid,sigla_estado="PE")
#Data frame da RMT de Recife
covid_pe_rmt<-covid_pe_mun[which(covid_pe_mun$interior.metropolitana==1),]
#Data frame do interior do estado de PE
covid_pe_int<-covid_pe_mun[which(covid_pe_mun$interior.metropolitana==0),]
#Gráfico comparativo RMT e Interior do Estado de PE
zona<-c("RMT","Interior")
casos_pe<-c(0,0)
obi_pe<-c(0,0)
for (i in unique(covid_pe_mun$municipio)) {
if (unique(covid_pe_mun[which(covid_pe_mun$municipio==i),
"interior.metropolitana"])==1) {
casos_pe[1]<-casos_pe[1]+max(covid_pe_mun[which(covid_pe_mun$municipio==i),
"casosAcumulado"])
obi_pe[1]<-obi_pe[1]+max(covid_pe_mun[which(covid_pe_mun$municipio==i),
"obitosAcumulado"])
}else if (unique(covid_pe_mun[which(covid_pe_mun$municipio==i),
"interior.metropolitana"])==0) {
casos_pe[2]<-casos_pe[2]+max(covid_pe_mun[which(covid_pe_mun$municipio==i),
"casosAcumulado"])
obi_pe[2]<-obi_pe[2]+max(covid_pe_mun[which(covid_pe_mun$municipio==i),
"obitosAcumulado"])
}
}
pe_rmt_int<-data.frame(zona,casos_pe,obi_pe)
Então foram feitos dois gráficos de pizza para se estudar a relação entre a quantidade de casos na RMT e no inteior. Nos gráficos apresentados é possível ver algo interessente. Normalmente, podemos pensar que a RMT teria uma maior quantidade de casos confirmados, contudo não é oque o gráfico da esquerda nos mostra, isto pode ocorrer devido a diferença da quantidade de municípios que cada zona tem: 15 na RMT e 170 no interior do estado. Sendo assim podemos calcular a média de contágio em cada zona do estado: 9180 infectados/município, aproximadamente, na RMT enquanto que no interior temos, aproximadamente, 1042 infectados/municipio. Mostrando que de fato a taxa de infecção na RMT é 8.81x maior que no interior. Quando observamos o gráfico dos óbitos, direita, épossível já identificar que aquantidade de óbitos na RMT é maior que no interior, ostrando a gravidade da situação para os habitante da RMT da apital pernambucana.
layout(matrix(c(1,2),nrow=1,byrow=T),widths=c(20,20),heights=c(60))
pct<-round(pe_rmt_int$casos_pe/sum(pe_rmt_int$casos_pe)*100)
lbls<-paste(pct,"%",sep="")
pie(x=pe_rmt_int$casos_pe,labels = lbls,col = c("#002171","#c79a00"),
main = "Casos em PE: RMT x Interior")
legend("topright",legend = pe_rmt_int$zona,fill=c("#002171","#c79a00"))
pct<-round(pe_rmt_int$obi_pe/sum(pe_rmt_int$obi_pe)*100)
lbls<-paste(pct,"%",sep="")
pie(x=pe_rmt_int$obi_pe,labels = lbls,col = c("#002171","#c79a00"),
main = "Óbitos em PE: RMT x Interior")
legend("topright",legend = pe_rmt_int$zona,fill=c("#002171","#c79a00"))
Por fim, foi feito o estudo do desenvolvimento dos casos e óbitos na capital pernambucana, Recife. Para tal estudo, foi separdo os dados de Recife em um data frame chamado covid_recife.
#Criação dos data frames capitais
desc_covid_estados<-data.frame(
Variáveis=c("data","municipio","sigla_estado"),
Descrição=c("Conjunto de dados a ser utilizado - data frame",
"Municipio que será feita a separação dos dados",
"Sigla do estado onde está o município")
)
formattable(desc_covid_estados, align = c("l", "l"))
| Variáveis | Descrição |
|---|---|
| data | Conjunto de dados a ser utilizado - data frame |
| municipio | Municipio que será feita a separação dos dados |
| sigla_estado | Sigla do estado onde está o município |
covid_municipios<-function(data,municipio,sigla_estado) {
x<-data[which(data$municipio==municipio & data$estado==sigla_estado),
c("regiao","estado","municipio","data","casosAcumulado",
"casosNovos","obitosAcumulado","obitosNovos")]
return(x)
}
covid_recife<-covid_municipios(data=covid,
municipio="Recife",
sigla_estado="PE")
recife_casos<-covid_recife[which(covid_recife$casosNovos>=0),
c("data","casosNovos")]
recife_obitos<-covid_recife[which(covid_recife$obitosNovos>=0),
c("data","obitosNovos")]
Foram então feitos dois gráficos para acompanhar a evolução dos casos e óbitos em Recife. Inicialmente é possível observar que a cidade do Recife apresentou um primeiro grande pico logo nas primeiras semanas de pandemia (2020-05-16). Após essa data houve uma fase de queda no registro de casos, contudo a partir do final do ano de 2020 foi identificado um novo aumento no número de casos oque culminou em uma sequência de dois picos de casos sendo o maior deles no dia (2021-02-18). Prém, após esse terceiro pico de casos o número de casos novos voltou a cair.
Em relação ao número de óbitos, este apresentou uma evolução bem satisfatória. Logo no início da pandemia houve um aumento bem acentuado no número de óbitos registrado na cidade alcançando seu maior pico no dia 2020-05-27. Contudo após essa data apresentou forte queda chegando a níveis bem baixos no mês de Outubro de 2020. Após isto houve um pequeno aumento seguida de outra redução do número de óbitos.
#Evolução dos casos de Covid em Recife
recife_casos<-covid_recife[which(covid_recife$casosNovos>=0),
c("data","casosNovos")]
grafico_quinzena(df = recife_casos,coluna = "casosNovos",nome_serie = "Recife",
titulo_grafico = "Casos Novos por Quinzena em Recife",
eixoX = "Quinzena",eixoY = "Quantidade de Casos")
#Acompanhamento dos Casos de Óbito em Recife
recife_obitos<-covid_recife[which(covid_recife$obitosNovos>=0),
c("data","obitosNovos")]
grafico_quinzena(df = covid_recife,coluna = "obitosNovos",nome_serie = "Recife",
titulo_grafico = "Número de Óbitos por Quinzena em Recife",
eixoX = "Quinzena",eixoY = "Quantidade de Óbitos")
Assim como a maioria dos imprevistos, a Covid-19 surgiu no mundo como uma grande praga que afetou e ainda afeta vários países. Em relaçao ao nosso país ficou evidenciado pelas análises dos dados que o início da pandemia foi muito difícil para o Brasil, uma vez que apresentou uma crescente bem acentuada no número de casos e óbitos, tendo no início de 2021 o pior momento registrado desde o início da pandemia. O fato positivo é que juntamente com o número de casos e óbitos, também aumentou o número de pessoas que se recuperaram da doença.
Foi observado também que alguns acontecimentos que se deram no Brasil favoreceram o aumento dos números de casos e mortes. No Brasil, ano passado, houveram as eleições municipais, onde após a corrida elitoral o Brasil apresentou seu segundo pico de casos registrados. No Amazonas houve a crise de abastecimento de oxigênio, favorecendo com o número de mortes no início de 2021 aumentasse num rítimo bem acelerado.
É evidente que no período analisando a pandemia ainda estava fora de controle, com momentos de baixa e de alta, contudo é possível observar que os últimos dados analisados demonstram uma tendência de queda nos casos, mas ainda assim estámos vivendo período de instabilidade onde a prevenção é o melhor método dese evitar contágio.
Por se tratar de um projeto onde analisa dados da pandemia que ainda está acontecendo os dados não estão totalmente atualizados, pois datam até o mês de março desse ano. Oque pode ser feito é pegar dados mais recentes da pandemia e realizar as análises para o ano atual.
CDL FLORIANÓPOLIS. Linha do tempo: primeiro caso de Covid-19 no mundo completa um ano. Disponível em: https://www.cdlflorianopolis.org.br/COVID-19-noticia/linha-do-tempo-primeiro-caso-de-covid-19-no-mundo-completa-um-ano-7205. Acessado em: 08 jul. 2021.
CORONAVÍRUS BRASIL. COVID-19 Painel Coronavírus. Disponível em: https://covid.saude.gov.br/. Acessado em: 09 jul 2021.
ISTO É DINHEIRO. Um ano do primeiro caso de covid-19: veja a evolução da doença. Disponível em: https://www.istoedinheiro.com.br/um-ano-do-primeiro-caso-de-covid-19-veja-a-evolucao-da-doenca/. Acessado em: 08 jul. 2021.
KAGGLE. CORONA VIRUS DATA IN BRAZIL (SINCE 2020/02/26). Disponível em: https://www.kaggle.com/gomes555/covid19br?select=COVID19_20210312.csv. Acessado em: 11 mai. 2021.
TUA SAÚDE. Como surgiu o novo coronavírus (COVID-19). Disponível em: https://www.tuasaude.com/misterioso-virus-da-china/. Acessado em: 08 jul. 2021.