Objetivo

O objetivo é construir uma tabela com os casos de notificação para malária entre os anos de 2015-2020 e saber em que estado brasileiro houve a maior variação percentual ao longo destes anos, considerando apenas a região Sudeste. Com essa estrutura, nós podemos levantar esses dados utilizando o próprio site do ministério da saúde, por meio do Tabnet.

\[ \cdot\cdot\cdot \]

Carregando os dados

#base::library(tidyverse)
load_data <- function(file, year){
    
    data <- readr::read_delim(file = file, delim = ";", 
                      escape_double = FALSE, trim_ws = TRUE,
                      show_col_types = FALSE,
                      locale = readr::locale(encoding = "UTF-8"))
    data <- data |> 
        dplyr::mutate(
            `UF de notificação` = str_replace(`UF de notificação`,
                                              "^\\d+\\s+",
                                              "")
        ) |> 
        dplyr::mutate(Ano = year)
    
    return(data)
    
}

data_2015 <- load_data("2015.csv", 2015)
data_2016 <- load_data("2016.csv", 2016)
data_2017 <- load_data("2017.csv", 2017)
data_2018 <- load_data("2018.csv", 2018)
data_2019 <- load_data("2019.csv", 2019)
data_2020 <- load_data("2020.csv", 2020)
base::rm(load_data)

\[ \cdot\cdot\cdot \]

Tabelas de dados

# casos de notificacao malaria
stacked_data <- bind_rows(data_2015, data_2016,
                          data_2017, data_2018,
                          data_2019, data_2020)
# variacao percentual
stacked_data <- stacked_data |> 
    dplyr::group_by(`UF de notificação`) |> 
    dplyr::mutate(
        var_perc = ((`Casos confirmados` - lag(`Casos confirmados`)) / lag(`Casos confirmados`))*100
    ) |> 
    dplyr::mutate(var_perc = if_else(is.na(var_perc), 0, var_perc))


#library(kableExtra)
kableExtra::kable(stacked_data) |> 
    kableExtra::kable_styling(full_width = FALSE,
                  bootstrap_options = c("striped","hover","condensed","responsive"))
UF de notificação Casos confirmados Ano var_perc
Minas Gerais 37 2015 0.000000
Espírito Santo 58 2015 0.000000
Rio de Janeiro 73 2015 0.000000
São Paulo 132 2015 0.000000
Minas Gerais 56 2016 51.351351
Espírito Santo 48 2016 -17.241379
Rio de Janeiro 50 2016 -31.506849
São Paulo 136 2016 3.030303
Minas Gerais 69 2017 23.214286
Espírito Santo 49 2017 2.083333
Rio de Janeiro 60 2017 20.000000
São Paulo 127 2017 -6.617647
Minas Gerais 46 2018 -33.333333
Espírito Santo 156 2018 218.367347
Rio de Janeiro 59 2018 -1.666667
São Paulo 140 2018 10.236220
Minas Gerais 49 2019 6.521739
Espírito Santo 26 2019 -83.333333
Rio de Janeiro 48 2019 -18.644068
São Paulo 119 2019 -15.000000
Minas Gerais 29 2020 -40.816327
Espírito Santo 1 2020 -96.153846
Rio de Janeiro 28 2020 -41.666667
São Paulo 74 2020 -37.815126
grouped_data <- stacked_data |>
    dplyr::select(-c(var_perc)) |> 
    tidyr::pivot_wider(names_from = Ano, values_from = `Casos confirmados`)


#library(kableExtra)
kableExtra::kable(grouped_data) |> 
    kableExtra::kable_styling(full_width = FALSE,
                  bootstrap_options = c("striped","hover","condensed","responsive"))
UF de notificação 2015 2016 2017 2018 2019 2020
Minas Gerais 37 56 69 46 49 29
Espírito Santo 58 48 49 156 26 1
Rio de Janeiro 73 50 60 59 48 28
São Paulo 132 136 127 140 119 74
grouped_data2 <- stacked_data |>
    dplyr::select(-c(`Casos confirmados`)) |> 
    tidyr::pivot_wider(names_from = Ano, values_from = var_perc)


#library(kableExtra)
kableExtra::kable(grouped_data2) |> 
    kableExtra::kable_styling(full_width = FALSE,
                  bootstrap_options = c("striped","hover","condensed","responsive"))
UF de notificação 2015 2016 2017 2018 2019 2020
Minas Gerais 0 51.351351 23.214286 -33.333333 6.521739 -40.81633
Espírito Santo 0 -17.241379 2.083333 218.367347 -83.333333 -96.15385
Rio de Janeiro 0 -31.506849 20.000000 -1.666667 -18.644068 -41.66667
São Paulo 0 3.030303 -6.617647 10.236220 -15.000000 -37.81513

\[ \cdot\cdot\cdot \]

Visualização dos dados

ggplot2::theme_set(theme_classic())
ggplot2::ggplot(data = stacked_data,
                aes(group = `UF de notificação`,
                    y = var_perc,
                    x = Ano)) +
    
    scale_color_manual(values = c("#008744",
                                  "#d62d20",
                                  "#E69F00",
                                  "#56B4E9")) +

    geom_path(size = 1.35, aes(color = `UF de notificação`)) +
    
    labs(title = "MALÁRIA - CASOS CONFIRMADOS NO SUDESTE",
         subtitle = "Variação percentual de Notificados no SINAN",
         caption = "Fonte: Ministério da Saúde/SVS - Sistema de Informação de Agravos de Notificação - Sinan Net",
         x = "",
         y = "Percentual",
         col = "Estados") +
    
    theme(axis.text.x = element_text(angle = 45, hjust = 1))

ggplot2::theme_set(theme_classic())
ggplot2::ggplot(data = stacked_data,
                aes(group = `UF de notificação`,
                    y = `Casos confirmados`,
                    x = Ano)) +
    
    scale_color_manual(values = c("#008744",
                                  "#d62d20",
                                  "#E69F00",
                                  "#56B4E9")) +

    geom_path(size = 1.35, aes(color = `UF de notificação`)) +
    
    labs(title = "MALÁRIA - CASOS CONFIRMADOS NO SUDESTE",
         subtitle = "Total de Notificados no SINAN",
         caption = "Fonte: Ministério da Saúde/SVS - Sistema de Informação de Agravos de Notificação - Sinan Net",
         x = "",
         y = "Quantidade notificados",
         col = "Estados") +
    
    theme(axis.text.x = element_text(angle = 45, hjust = 1))

Conclusão

Ao analisarmos as tabelas e gráficos, percebemos que a variação do estado do Espírito Santo durante o ano de 2018 é bastante significativa. Ao pesquisar sobre o que aconteceu neste período, foi constatado um surto de doença na região.

\[ \cdot\cdot\cdot \]