A análise de combinação é simples por definição e elegante em sua aplicação. O raciocínio epidemiológico da análise de combinação está presente em todo diagnóstico médico que envolve a presença de diferentes sintomas concomitantemente.
Vamos aplicar a análise de combinações em uma base de dados do Sistema de Informação de Agravos de Notificação (SINAN) utilizando dados públicos disponibilizados pelo DataSUS referentes a casos de dengue no Brasil ocorridos no ano de 2020.
Primeiro, precisamos compreender o contexto da informação. O documento Dengue: diagnóstico e manejo clínico1 informa que um caso suspeito de dengue envolve a presença de febre e pelo menos dois dos seguintes sintomas:
Agora precisamos saber se estas variáveis estão presentes no instrumento utilizado para coleta dos dados, a Ficha de Investigação2, pois dele vem as informações da base de dados que iremos utilizar. O campo 33 denominado Sinais Clínicos permite o preenchimento com a seguinte identificação:
O Ministério da Saúde também disponibiliza o Dicionário de Dados3 desta base e assim podemos descobrir como as variáveis foram codificadas. Aliás, este é um documento essencial para análise de dados do DataSUS. Observe que as nossas variáveis de interesse estarão no banco de dados assim representadas:
Sintoma | Codificação |
---|---|
Febre | FEBRE |
Cefaleia | CEFALEIA |
Dor retro-orbital | DOR_RETRO |
Exantema | EXANTEMA |
Prostração | não consta |
Mialgia | MIALGIA |
Artralgia | ARTRALGIA |
library(tidyverse, warn.conflicts = FALSE)
Agora faremos o download dos dados de dengue diretamente do FTP do DataSUS. O arquivo possui dados de todas as unidades da federação do Brasil e, por isso, possui um tamanho de 72.193 Kb e dependendo da velocidade da sua internet esta próxima etapa pode demorar alguns minutos.
<- tempfile()
temp download.file("ftp://ftp.datasus.gov.br/dissemin/publicos/SINAN/DADOS/FINAIS/DENGBR20.dbc", temp, mode = "wb")
<- read.dbc::read.dbc(temp)
dengue rm(temp)
O que o código acima está dizendo? Criamos um arquivo temporário que
posteriormente recebeu os dados de dengue em um arquivo de extensão DBC
baixado do DataSUS, depois criamos um vetor chamado dengue
para receber e armazenar os dados provenientes do arquivo DBC utilizando
o pacote read.dbc
4.
A base original contém 1.484.133 casos notificados e 119 variáveis.
::paged_table(dengue) rmarkdown