Análises de dados em saúde.

Atualização e ferramentas.

2023-11-21

Agenda!

  • Conceitos importantes

  • Jornada do analista de dados

  • Principais ferramentas de análise de dados

  • Experiência do CIEVS-SC na automatização de análise de dados

O que é análise de dados?

  • A análise de dados é um conjunto de técnicas estatísticas que permitem explorar os dados para uma aproximação à realidade, na busca de algum padrão ou comportamento relevante que esteja presente no conjunto de dados.

  • Identificar tendências, detectar surtos e criar visualizações informativas.

Estatística


Coleta de dados

Amostra, população, variável e tipo de variável.


Estatítisca Descritiva

Frequências e contagens, medidas centrais, medidas de dispersão.


Estatística Inferencial

Testa hipóteses, buscar os determinantes, as explicações e entender os fatores associados a eventos de saúde.

Porque analisar os dados?

Transformar números em informações em insights!

Figura1: Taxas de incidência de coqueluche e de internação em crianças de menores de 1 ano, 2008-2018.

Jornada do analista de dados

Jornada do analista de dados

1. Extração dos dados
Extrair dados dos sistemas de informação(SIM, SIVEP, SINAN, GAL)

2. Exploração de dados
Identificar padrões preliminares e identificar as transformações necessárias.

Jornada da análise de dados

  1. Etapa de tranformação
  • Limpeza dos dados: eliminar quaisquer erros e imprecisões que possam afetar os resultados (datas erradas, duplicidades).

  • Transformam os dados (datas, faixa etária, labels, unir bases de dados, etc.)

Jornada da análise de dados

  1. Etapa de tranformação

Jornada da análise de dados

  1. Modelagem
  • aplicar técnicas estatísticas
  • modelos descritivos, modelos de previsão e inferências
  • distribuição do evento, calcular taxas, contagens, série temporal, correlação.

Jornada da análise de dados

  1. Representação, interpretação e comunicação
  • Tabelas

Jornada da análise de dados

Representação, interpretação e comunicação

{fig-align=“left” width= 100}

Jornada da análise de dados

Representação, interpretação e comunicação

Jornada da análise de dados

Representação, interpretação e comunicação

  • Dashboard ou painéis interativos.

Jornada da análise de dados

Representação, interpretação e comunicação

  • Relatório, informe, boletim, artigo, apresentação.

Visualização dos dados (dataviz)


“A visualização de dados é a linguagem da tomada de decisão. Bons gráficos transmitem informações de maneira eficaz. Ótimos gráficos permitem, informam e melhoram a tomada de decisões.” - Dante Vitagliano.

Visualização dos dados (dataviz)

  • Princípios da percepção visual e cognição - psicologia das cores
  • Identidade visual
  • Técnicas de storytelling (contar uma história com dados)
  • Elementos ícones, fontes, títulos, rótulos.

Visualização dos dados (dataviz)

Diretrizes para ajudá-lo a selecionar o melhor gráfico para seus dados.

https://datavizcatalogue.com/

Sempre da pra melhorar ;)

Sempre da pra melhorar ;)

Erros comuns

Cores com muito contraste

  • Difícil saber qual valor é mais significativo.

Erros comuns

Escolher o método de visualização errado

  • As partes do gráfico parecem semelhantes entre si e os valores não somam 100%.

Erros comuns

Gráficos com muitos dados

  • sobrecarrega o leitor e confunde onde focar a atenção.

Erros comuns

Linha de base não começa em zero.

Erros comuns

Correlações sem causa

Erros comuns

Zoom em dados

  • Esse tipo de visualização oculta dados importantes, dando aos usuários apenas uma parte.

Erros comuns

Seleção de cores:

  • Algumas cores se destacam mais que outras, dando peso desnecessário aos dados.
  • Alternativa: Use uma única cor com tonalidade variável.

Erros comuns

  • Distribuição dos dados e múltiplas categorias.

Erros comuns

  • Categorias desordenadas

Erros comuns

  • Variáveis categóricas em gráfico de rosca.

Erros comuns

  • Menos é mais: considerem a cor cinza na visualização
  • Acalmar a impressão visual geral de seus gráficos

Erros comuns

  • Use cores intuitivas
  • Cores aprendidas: vermelho (atenção/parar/ruim) e o verde(bom/seguir).

Erros comuns

  • Considere as pessoas daltônicas.

Erros comuns

  • Os tipos de letra sans-serif (“sem serifas”) geralmente são a melhor escolha. Elas parecem mais limpas.

Dica

Tip

  • Para saber se um gráfico está de fácil compreensão escreva sobre seus achados.

Alfabetização de dados



Vídeo - Alfabetização de dados, TedTalk

Ferramentas de Análise de Dados

As ferramentas e softwares de análise de dados têm grande expansão nos últimos anos.

  • orientada em click e point.

  • orientada por linguagem de programação.

Principais softwares de análise de dados

Comerciais open-source vizualização de dados
Stata R Power BI
SAS Python Tableu
SPSS Google sheets Google Data Studio
Matlab
Excel

Excel e Google Sheets

  • Editores de planilhas
  • Microsoft x Google
  • Pago x gratuito
  • Úteis para manipulações de dados e análises mais básicas.
  • Vizualização de dados.

Power BI, Tableu e Google Data Studio

  • Dashboards ou painéis de monitoramento.
  • Interface gráfica amigável.

R

  • É uma linguagem de programação e software para computação estatística e gráficos.
  • É um software livre (sem taxas de licença)
  • As análises ficam salvas em scripts.
  • Automatização das análises repetitvas.
  • Volume grande e constante de dados.

Desenvolvimento análise de dados CIEVS-SC


Obrigada! ;)

  • bittenka@gmail.com
  • www.linkedin.com/in/biancabitte