Plano de Aula: Introdução ao R com Microdados do Datasus
Dia 1: Introdução e Manipulação de Dados
Objetivos da Aula
- Compreender como instalar e utilizar o pacote
microdatasus
.
- Baixar e processar dados do Sistema de Informação sobre Mortalidade (SIM).
- Aprender a manipular dados com
dplyr
.
Materiais Necessários
- Computadores com R e RStudio instalados.
- Pacotes:
microdatasus
, dplyr
.
Conteúdo da Aula
1. Introdução ao R e ao Pacote microdatasus
- Breve introdução ao R e suas aplicações em saúde pública.
- Apresentação do pacote
microdatasus
e sua utilidade para acessar dados do Datasus.
2. Instalação e Carregamento do Pacote
# Instalação do pacote
install.packages("remotes")
remotes::install_github("rfsaldanha/microdatasus")
# Carregar o pacote
library(microdatasus)
3. Baixando Dados do Datasus
- Explicação sobre as funções
fetch_datasus
e process_sim
.
# Baixando dados do SIM
dados <- fetch_datasus(year_start = 2013, year_end = 2014, uf = "RJ", information_system = "SIM-DO")
dados <- process_sim(dados)
4. Manipulação de Dados com dplyr
- Uso das funções
select()
, filter()
, mutate()
, group_by()
e summarize()
.
Comando select()
- Utilizado para escolher colunas específicas de um data frame.
# Selecionando colunas
dados_selecionados <- dados %>% select(id, sexo, idade, causa_morte)
Comando filter()
- Usado para filtrar linhas com base em uma condição específica.
# Filtrando dados
dados_filtrados <- dados_selecionados %>% filter(idade > 60)
Comando mutate()
- Serve para criar novas colunas ou modificar colunas existentes.
# Criando uma nova coluna
dados_mutados <- dados_filtrados %>% mutate(causa_morte = ifelse(causa_morte == "A", "Causa A", "Outras Causas"))
Comando group_by()
e summarize()
group_by()
: Agrupa os dados com base em uma ou mais colunas.
summarize()
: Resume os dados agrupados, permitindo cálculos agregados.
# Agrupando e resumindo dados
resumo_dados <- dados_mutados %>%
group_by(causa_morte) %>%
summarize(total = n(), media_idade = mean(idade, na.rm = TRUE))
5. Atividade Prática
- Exercício: Os alunos devem baixar dados de um ano específico e realizar as seguintes tarefas:
- Selecionar colunas de interesse.
- Filtrar os dados para pessoas com idade superior a 50 anos.
- Criar uma nova coluna que categorize a causa da morte.
6. Conclusão do Dia 1
- Revisão dos conceitos abordados e perguntas.
Dia 2: Visualização e Análise dos Dados
Objetivos da Aula
- Aprender a visualizar dados utilizando o
esquisse
.
- Gerar relatórios resumidos com o
gtsummary
.
Materiais Necessários
- Computadores com R e RStudio instalados.
- Pacotes:
esquisse
, gtsummary
.
Conteúdo da Aula
1. Visualização de Dados com esquisse
- Introdução ao
esquisse
para criar gráficos interativos.
# Carregar o pacote
library(esquisse)
# Iniciar a interface do esquisse
esquisse::esquisse()
- Criar um gráfico a partir do
dados_mutados
.
- Os alunos podem usar a interface do
esquisse
para escolher variáveis e tipos de gráficos.
2. Gerando Tabelas Resumidas com gtsummary
- Uso da função
tbl_summary()
para criar tabelas resumidas.
# Carregar o pacote
library(gtsummary)
# Criar tabela resumida
tabela_resumo <- tbl_summary(dados_mutados, by = sexo)
tabela_resumo
3. Atividade Prática
- Exercício: Os alunos devem criar:
- Um gráfico que mostre a distribuição das causas de morte por sexo utilizando
esquisse
.
- Uma tabela que resuma os dados por faixa etária utilizando
gtsummary
.
4. Conclusão e Perguntas
- Revisão dos conceitos abordados e discussão sobre aplicações práticas.
- Sessão de perguntas e respostas.