✅ Explicar por que interpretabilidade importa em saúde
✅ Calcular valores SHAP em R/Python
✅ Interpretar gráficos SHAP globais e locais
✅ Identificar limitações e riscos do SHAP
✅ Apontar implicações éticas e regulatórias
🔥 Warm-up
Levante a mão:
Quem já treinou algum modelo de ML?
Quem já tentou explicar o que o modelo fez?
Quem trabalha diretamente com dados clínicos?
Quem já ouviu falar em SHAP?
PARTE I
Fundamentos de Interpretabilidade e Teoria do SHAP
IA na saúde: poder e opacidade
Modelos de ML estão por toda parte:
Detecção de retinopatia diabéticaComplicação do diabetes em que os vasos da retina são danificados, podendo causar perda progressiva da visão.
Risco de readmissão hospitalar
Alerta precoce em UTI
Diagnóstico de arritmias
O problema:
“Modelos mais complexos envolvem milhares/milhões de parâmetros — interpretá-los diretamente se torna inviável.”
Consequência: Profissionais da saúde tendem a resistir a recomendações que não entendem.
📖 Miotto et al. (2018); Rajkomar et al. (2018); Topol (2019); Bajwa et al. (2023); Hannun et al. (2019); Tonekaboni et al. (2019); Lipton (2018).
IA na saúde: poder e opacidade
Interpretabilidade vs Explicabilidade
Definições
InterpretabilidadeExemplo: “Idade elevada e pressão arterial baixa aumentaram o risco previsto”. — capacidade de entender como um modelo transforma dados de entrada em uma previsão, usando categorias compreensíveis para humanos.
Explicabilidade — conjunto de métodos empregados para tornar esse comportamento inteligível, especialmente em modelos complexos.
Ideia-chave: interpretabilidade é o objetivo; explicabilidade é o caminho metodológico para alcançá-lo.
Por que importa clinicamente?
Priorização de pacientes em emergências
Estratificação de risco em doenças crônicas
Diagnóstico assistido por imagem, sinais ou exames
Alertas precoces de deterioração em UTI
“Compreender os fatores que sustentam uma predição é tão importante quanto o desempenho do modelo.”
Como analisar explicações de modelos?
Há dois eixos fundamentais para classificar métodos de explicabilidade:
Eixo
Pergunta orientadora
Exemplos
Escopo
A explicação vale para o modelo inteiro ou para uma previsão específica?
Global Global: explica o comportamento médio do modelo. Ex: importância de variáveis. vs. local Local: explica uma previsão individual. Ex: por que este paciente foi classificado como alto risco?
Dependência
O método precisa conhecer a estrutura interna do modelo?
Específico de modelo Específico: acessa os internals do algoritmo. Ex: coeficientes da regressão. vs. agnóstico Agnóstico: trata o modelo como caixa-preta, funciona com qualquer algoritmo. Ex: SHAP, LIME.
📖 Stiglic et al. (2020); Molnar (2022); Tonekaboni et al. (2019); Hakkoum et al. (2024); Salih et al. (2023); Vimbi et al. (2024); Amann et al. (2020)
Modelos caixa-preta: o que os torna opacos?
Modelo
Por que pode ser opaco?
CNN para imagens médicas
Aprende padrões nas imagens que nem sempre correspondem a sinais clínicos fáceis de reconhecer.
Transformer para texto clínico
Usa representações matemáticas do texto que podem ser difíceis de transformar em uma explicação clínica direta.
XGBoost / Random Forest
Combina muitas árvores de decisão, o que dificulta entender rapidamente como chegou à previsão final.
Rede neural profunda
Mistura muitas variáveis em várias camadas, tornando difícil saber qual fator pesou mais na decisão.
O problema não é apenas o número de parâmetros. A opacidade surge quando o raciocínio do modelo não pode ser facilmente traduzido em uma explicação clinicamente significativa.
Métodos pós-hoc: o que já existia antes do SHAP?
Método
Uso
Cuidado principal
Permutation Importance Mede a importância de uma variável observando quanto o desempenho do modelo piora quando seus valores são embaralhados.
Visão geral do modelo
Variáveis correlacionadas podem distorcer o resultado.
Local Interpretable Model-Agnostic Explanations (LIME) Explica uma previsão específica usando um modelo simples ao redor daquela observação.
Explicação de um caso
Pode mudar conforme as simulações usadas.
Partial Dependence Plots (PDP) e Individual Conditional Expectation (ICE) PDP mostra o efeito médio de uma variável. ICE mostra esse efeito caso a caso.
Efeito de uma variável
Médias podem esconder diferenças entre indivíduos.
Gradient-weighted Class Activation Mapping (Grad-CAM) Destaca as regiões da imagem que mais influenciaram a previsão do modelo.
Explicação visual
É mais usado em redes neurais para imagens.
📖 Burrell (2016); Bodria et al. (2021); Hassija et al. (2023); Mienye & Sun (2025); Ribeiro et al. (2016) [LIME]; Greenwell (2017) [PDP]; Hooker & Mentch (2019); Rudin (2019); Obermeyer et al. (2019)
Por que SHAP?
SHAP responde a uma pergunta central: quanto cada variável contribuiu para esta previsão?
Antes do SHAP
Métodos pós-hoc podem produzir explicações úteis, mas essas explicações dependem de escolhas aproximadas feitas durante a análise.
Com SHAP
A explicação passa a ser formulada como um problema de atribuição justa de contribuição, inspirado na Teoria dos Jogos Cooperativos.
Teoria dos Jogos Cooperativos
A analogia do jogo:
Imagine variáveis clínicas como jogadores em uma equipe:
Cada “jogador” contribui para a predição final
Queremos distribuir o crédito de forma justa
Definição formal:
Um jogo cooperativo é definido por \((N, v)\) em que \(N = \{1, 2, \dots, n\}\) e:
\(N\) representa o conjunto de variáveis do modelo;
\(S \subseteq N\) representa um subconjunto de variáveis (coalizão);
\(v(S)\) representa o valor produzido pelo modelo usando apenas as variáveis em \(S\);
\(v(\emptyset)\) representa a previsão de referência, antes de observar qualquer variável.
Teoria dos Jogos Cooperativos
O problema: Como distribuir \(v(N)\) entre as variáveis?
Exemplo cardiovascular:
Jogadores:
j1 = idade_anos
j2 = imc
j3 = ap_hi (pressão sistólica)
j4 = colesterol
j5 = tabagismo
...
Coalização {j1, j3}:
v({j1, j3}) = predição esperada do modelo quando idade e pressão são conhecidas, mas as demais variáveis ainda são desconhecidas.
Objetivo:
φ_i = contribuição justa de cada variável para a predição do paciente X
📖 Shapley (1953); Nohara et al. (2021); Ghasemi et al. (2024); Vimbi et al. (2024); Ghosh et al. (2024); Hettikankanamage et al. (2025); Covert et al. (2020)
Valores de Shapley: a fórmula
\[
\underbrace{\phi_i}_{\substack{\text{contribuição}\\\text{da variável } i}}
=
\underbrace{
\sum_{S \subseteq N \setminus \{i\}}
}_{\substack{\text{todas as coalizões}\\\text{sem a variável } i}}
\underbrace{
\dfrac{|S|!\,(|N|-|S|-1)!}{|N|!}
}_{\substack{\text{peso de cada}\\\text{coalizão}}}
\underbrace{
\left[v(S \cup \{i\}) - v(S)\right]
}_{\substack{\text{ganho ao adicionar}\\\text{a variável } i}}
\]
O valor de Shapley calcula a contribuição marginal média da variável \(i\), considerando todos os contextos possíveis em que ela poderia aparecer.
Lloyd Shapley Nascido em Cambridge, MA (1923). Graduado em Harvard, doutor em Princeton sob orientação de Albert Tucker. Pesquisador na RAND Corporation e professor na UCLA. Prêmio Nobel de Economia em 2012 junto com Alvin Roth, pelo trabalho em teoria de jogos cooperativos e mecanismos de alocação estável.
(1923 – 2016)
Teoria dos jogos · UCLA
🏆 Nobel de Economia (2012)
Nesta etapa, foque em \(\frac{|S|!\,(|N|-|S|-1)!}{|N|!}\). Esse termo vem de uma contagem combinatória das ordens possíveis de entrada das variáveis.
Esse termo é o peso combinatório da coalizão \((S)\). Ele indica a frequência relativa com que o conjunto \((S)\) apareceria antes da variável \((i)\) se considerássemos todas as ordens possíveis de entrada das variáveis.
Exemplo simples: três variáveis
Suponha que temos três variáveis (\(N = \{A, B, C\}\)) e queremos calcular a contribuição de \(i = C\).
Todas as ordens possíveis são:
Ordem de entrada
Variáveis antes de \(C\)
\(C, A, B\)
\(\emptyset\)
\(C, B, A\)
\(\emptyset\)
\(A, C, B\)
\(\{A\}\)
\(B, C, A\)
\(\{B\}\)
\(A, B, C\)
\(\{A,B\}\)
\(B, A, C\)
\(\{A,B\}\)
Assim:
Conjunto \(S\) antes de \(C\)
Quantas vezes aparece?
Peso
\(\emptyset\)
2 vezes
\(\frac{2}{6}\)
\(\{A\}\)
1 vez
\(\frac{1}{6}\)
\(\{B\}\)
1 vez
\(\frac{1}{6}\)
\(\{A,B\}\)
2 vezes
\(\frac{2}{6}\)
Ligando o exemplo à fórmula
O peso de cada conjunto \(S\) é:
\[
\frac{|S|!\,(|N|-|S|-1)!}{|N|!}
\]
No exemplo:
\[
N = \{A,B,C\}
\qquad
i = C
\qquad
|N| = 3
\]
\(S\)
Cálculo
Peso
\(\emptyset\)
\(\frac{0!\,(3-0-1)!}{3!} = \frac{0!\,2!}{3!}\)
\(\frac{2}{6}\)
\(\{A\}\)
\(\frac{1!\,(3-1-1)!}{3!} = \frac{1!\,1!}{3!}\)
\(\frac{1}{6}\)
\(\{B\}\)
\(\frac{1!\,(3-1-1)!}{3!} = \frac{1!\,1!}{3!}\)
\(\frac{1}{6}\)
\(\{A,B\}\)
\(\frac{2!\,(3-2-1)!}{3!} = \frac{2!\,0!}{3!}\)
\(\frac{2}{6}\)
O peso diz quanto cada contribuição marginal deve contar na média final.
Nesta etapa, foque em \(v(S \cup \{i\}) - v(S)\) — valor da previsão com a variável \((i)\) menos valor da previsão sem a variável \((i)\).
Esse termo mede o quanto a previsão muda quando adicionamos a variável \((i)\) ao subconjunto \((S)\).
Em linguagem direta, ele compara a previsão com e sem a variável \((i)\).
contribuição marginal = previsão com i − previsão sem i
Se a diferença for positiva, a variável aumenta a previsão.
Se for negativa, a variável reduz a previsão.
O valor de Shapley é a média ponderada das contribuições marginais da variável \((i)\), considerando todos os subconjuntos possíveis de variáveis.
Em português:
A variável recebe crédito pelo quanto ela acrescenta à previsão, em média, quando entra em diferentes combinações com as demais variáveis.
Shapley = média ponderada do impacto de uma variável em todos os contextos possíveis
Valores de Shapley: contribuição da idade
Paciente: 65 anos · Pressão sistólica: 160 mmHg · Colesterol: 240 mg/dL Predição final: 72% de risco cardiovascular Ponto de partida: 30% de risco médio no conjunto de referência
Pergunta: Quanto a variável idade contribuiu para levar a predição de 30% para 72%?
A ideia do Shapley é simples! Calculamos quanto a predição muda quando a idade entra no modelo em diferentes momentos: às vezes antes de todas as outras variáveis, às vezes depois da pressão, às vezes depois do colesterol.
Os valores de Shapley são definidos por propriedades formais que determinam como o crédito deve ser distribuído entre as variáveis.
Propriedade
Ideia central
Interpretação no SHAP
Eficiência
Todo o efeito da previsão deve ser distribuído
A soma dos SHAP explica a diferença entre a previsão do paciente e a previsão média. \(\sum_{i} \phi_i = f(x) - E[f(x)]\)
Simetria
Variáveis equivalentes recebem o mesmo crédito
Se duas variáveis contribuem da mesma forma em todos os contextos, seus valores SHAP devem ser iguais.
Nulidade
Variáveis sem efeito recebem contribuição zero
Se uma variável não altera a previsão em nenhuma coalizão, então seu SHAP value deve ser \(\phi_i = 0\).
Aditividade
Explicações de modelos combinados também se combinam
Se dois modelos são somados, as contribuições atribuídas às variáveis também devem se somar.
📖 Shapley (1953); Lundberg & Lee (2017); Lundberg et al. (2018); Bifarin et al. (2022); Belle & Papantonis (2020); Hettikankanamage et al. (2025); Auzine et al. (2024)
TreeSHAP: tornando SHAP computacionalmente viável
O problema
O SHAP exato exige avaliar todas as coalizões possíveis:
Variáveis (\(n\))
Subconjuntos (\(2^n\))
Viável?
10
1.024
✅
20
1.048.576
⚠️
50
\(\approx 10^{15}\)
❌
100
\(\approx 10^{30}\)
❌
Datasets reais de saúde facilmente têm 50–200 variáveis — o SHAP exato torna-se inviável.
A solução: explorar a estrutura da árvore
TreeSHAPLundberg et al. (2020). From local explanations to global understanding with explainable AI for trees. Nature Machine Intelligence. não enumera coalizões — ele percorre os caminhos da árvore uma única vez, propagando os pesos das coalizões ao longo dos nós.
O TreeSHAP é exato — não é uma aproximação. Ele produz os mesmos valores que o SHAP teórico, mas em tempo polinomial, explorando a estrutura interna das árvores.
📖 Lundberg, S. M. et al. (2020). From local explanations to global understanding with explainable AI for trees. Nature Machine Intelligence, 2, 56–67.
TreeSHAP: percorrendo a árvore
O que o TreeSHAP faz?
O TreeSHAP abre a árvore e lê sua estrutura diretamente — percorrendo cada caminho uma única vez de cima para baixo:
Em cada nó, registra quantas amostras de treino seguiram cada ramo — isso substitui a amostragem de coalizões
Essa proporção vira o peso exato da coalizão, sem aproximação
Ao chegar numa folha, a contribuição marginal de cada variável já está calculada — basta somar
Caminho do paciente (65 anos, pressão 160 mmHg):
Idade ≥ 60 → Sim → Pressão ≥ 140 → Sim → folha: 72%
O TreeSHAP percorre esse caminho e distribui os +42 pp acima da baseline entre as variáveis que tomaram cada decisão.
━━━ caminho do paciente (65 anos, pressão 160 mmHg)
📖 Lundberg, S. M. et al. (2020). From local explanations to global understanding with explainable AI for trees. Nature Machine Intelligence, 2, 56–67.
TreeSHAP: quando o modelo tem muitas árvores
Ideia principal
Modelos como XGBoost, LightGBM e Random Forest combinam muitas árvores.
O TreeSHAP não tenta testar todos os subconjuntos manualmente.
Ele aproveita a própria estrutura das árvores:
percorre uma árvore por vez;
usa os caminhos e divisões da árvore;
calcula contribuições locais;
soma as contribuições entre árvores.
Exemplo
Fonte
Idade
Pressão
Colesterol
Árvore 1
+2
+4
0
Árvore 2
+1
0
+3
Árvore 3
-0,5
+2
+1
…
…
…
…
SHAP final
soma
soma
soma
\[
\phi_j
=
\sum_{t=1}^{T} \phi_j^{(t)}
\]
\(T\) é o número de árvores. \(\phi_j^{(t)}\) é a contribuição da variável \(j\) na árvore \(t\).
KernelSHAP: SHAP para qualquer modelo
A ideia central
O TreeSHAP abre a árvore e lê sua estrutura. Mas e quando o modelo é uma rede neural, uma SVM, ou qualquer caixa-preta?
O KernelSHAP resolve isso sem precisar ver o interior do modelo:
Escolhe subconjuntos aleatórios de variáveis
Pergunta ao modelo: “qual seria sua predição só com essas variáveis?”
Repete isso muitas vezes, com pesos diferentes para cada subconjunto
Ajusta um modelo linear simples por cima dessas predições (regressão explicativa local)
Os coeficientes desse modelo linear são os valores SHAP
Analogia
Imagine que você quer entender por que um médico tomou uma decisão, mas ele não explica o raciocínio.
Você apresenta casos hipotéticos com diferentes combinações de sintomas e anota as respostas. Com casos suficientes, consegue inferir quanto cada sintoma pesou na decisão — sem nunca saber o que passa na cabeça do médico.
É exatamente isso que o KernelSHAP faz com o modelo.
📖 Lundberg & Lee (2017). A unified approach to interpreting model predictions. NeurIPS.
KernelSHAP: o problema das variáveis ausentes
O problema fundamental
O modelo foi treinado com todas as variáveis — ele não sabe funcionar com apenas algumas. Mas para calcular o SHAP, precisamos perguntar:
“Quanto a Idade contribui, ignorando Pressão e Colesterol?”
Não podemos simplesmente apagar essas colunas — o modelo quebraria.
A solução: fingir que não sabemos
Substituímos as variáveis ausentes por valores sorteados do dataset de treino — como se aquele paciente tivesse os valores “típicos” da população.
Queremos avaliar\(S = \{\)Idade\(\}\) — só a Idade importa
Sorteamos valores de Pressão e Colesterol do treino:
Rodada
Idade
Pressão
Colesterol
Predição
1
65
118
195
52%
2
65
142
210
58%
3
65
130
225
55%
4
65
125
180
49%
…
…
…
…
…
Média das predições → \(v(\{\)Idade\(\}) \approx 53\%\)
📖 Lundberg & Lee (2017). A unified approach to interpreting model predictions. NeurIPS.
KernelSHAP: por que sortear do treino?
A intuição
Queremos simular um paciente com Idade=65 mas sem informação sobre Pressão e Colesterol — e a melhor forma de representar “sem informação” é usar a distribuição real dos dados.
É como dizer:
“Se eu só soubesse que este paciente tem 65 anos, qual seria minha melhor estimativa de risco, considerando todas as combinações possíveis de pressão e colesterol que ele poderia ter?”
O que pode dar errado?
Instâncias irreais: se Pressão e Colesterol são correlacionados entre si, sortear cada um de forma independente pode criar combinações que nunca existem na prática — ex: Pressão=180 com Colesterol=120.
Isso não quebra o método, mas pode distorcer os valores SHAP em datasets com muitas correlações.
Quantas rodadas? O KernelSHAP usa entre 100 e 1.000 amostras por subconjunto por padrão. Mais amostras = mais preciso, mas mais lento. O TreeSHAP não precisa de nenhuma — calcula exato.
📖 Lundberg & Lee (2017). A unified approach to interpreting model predictions. NeurIPS.
KernelSHAP: onde entra a regressão?
Paciente real: idade = 65 · pressão = 160 · colesterol = 240 Objetivo: explicar a predição individual do modelo
1. Criamos versões incompletas
Idade
Pressão
Colesterol
Predição média \(v(S)\)
0
0
0
30%
1
0
0
58%
0
1
0
52%
0
0
1
45%
1
1
0
70%
1
0
1
68%
0
1
1
65%
1
1
1
72%
1 = variável real do paciente é mantida 0 = variável é substituída por valores de referência
\(v(\{\text{idade}\}) = 58\%\) significa: predição média quando apenas a idade real do paciente é conhecida. \(\phi_{\text{idade}}\) significa: contribuição final da idade considerando todos os contextos possíveis.
KernelSHAP vs TreeSHAP: quando usar cada um?
Use TreeSHAP quando…
O modelo é baseado em árvores: Random Forest, XGBoost, LightGBM, CatBoost
Você precisa de valores SHAP exatos
O dataset é grande e velocidade importa
Quer explicar muitas predições (ex: dataset inteiro)
Use KernelSHAP quando…
O modelo é uma caixa-preta: rede neural, SVM, regressão logística
Você aceita uma aproximação em troca de universalidade
Está explicando poucas predições (ex: casos individuais)
Quer um método independente de implementação
📖 Lundberg & Lee (2017). A unified approach to interpreting model predictions. NeurIPS.
Use global para validação clínica e comunicação com gestores.
Use local para decisões individuais e discussão caso a caso.
Bar Plot — Importância Global
# Importância média (bar)sv_importance(sv, kind ="bar", fill ="#0a2342") +labs(title ="Importância global (|SHAP| médio)",x ="Impacto médio na predição (log-odds)")
Beeswarm — Importância Global
# Beeswarm — direção + distribuiçãosv_importance(sv, kind ="beeswarm") +labs(title ="Distribuição dos valores SHAP",subtitle ="Amarelo = valor alto da variável")
Dependence Plot — Efeitos Não-Lineares
# Efeito da pressão sistólicasv_dependence(sv, v ="ap_hi", color_var ="cholesterol") +labs(title ="SHAP(pressão sistólica) × valores", subtitle ="Cor = nível de colesterol", x ="Pressão sistólica (mmHg)", y ="Contribuição SHAP (log-odds)")
# Force plot — versão compactasv_force(sv, row_id = idx_alto) +labs(title =paste("Paciente #", idx_alto, "— Alto risco cardiovascular"))
Aplicação clínica real
Em rondas hospitalares:
“O sistema indica alto risco. Vejamos por quê:”
Pressão de 165 mmHg: +0.82
67 anos de idade: +0.54
Colesterol alto: +0.41
Ativo fisicamente: -0.28
Isso conecta a IA ao raciocínio clínico.
Lembrete crucial
A explicação descreve o modelo, não a fisiologia.
Não inferir causalidade — o SHAP mostra associações preditivas, não relações de causa e efeito.
Boa prática: apresente apenas os 3–5 fatores mais relevantes para evitar sobrecarga cognitiva em ambientes de alta pressão como UTI.
Limitações do SHAP: o que ele não garante
O SHAP ajuda a entender como o modelo chegou a uma predição. Mas ele não prova que a predição está correta, nem que a relação é causal.
Limitação
Interpretação simples
Variáveis correlacionadas
Quando duas variáveis carregam informação parecida, o SHAP pode dividir a contribuição de forma instável.
Dependência da implementação
Diferentes formas de calcular SHAP podem gerar valores diferentes.
Explica o modelo, não a doença
Um valor SHAP alto mostra importância para o modelo, não necessariamente importância clínica real.
Não indica causalidade
A variável influenciou a predição, mas isso não significa que causou o desfecho.
Explicação não garante acerto
O modelo pode errar e ainda produzir uma explicação coerente.
Risco de excesso de confiança
Explicações convincentes podem fazer o usuário confiar demais no modelo.
Boas práticas no uso do SHAP
Etapa
Boa prática
Por que importa?
Antes da explicação
Validar desempenho e calibração do modelo
SHAP não corrige modelo ruim; apenas explica suas decisões.
Interpretação global
Usar gráficos de importância, beeswarm e dependência
Permite identificar padrões gerais e variáveis dominantes.
Interpretação local
Analisar casos individuais com waterfall ou force plot
Mostra quais variáveis contribuíram para uma predição específica.
Validação clínica
Confrontar explicações com conhecimento especializado
Associações estatísticas podem ser espúrias ou clinicamente implausíveis.
Comunicação
Evitar linguagem causal
SHAP descreve contribuição preditiva, não causa do desfecho.
Produção
Monitorar drift e armazenar explicações
Explicações podem mudar quando dados, população ou modelo mudam.
Ética, Regulação e Governança
Marcos regulatórios relevantes
Regulação
Origem
Exigência principal
O que isso significa na prática?
GDPR
União Europeia
Direito à explicação de decisões automatizadas
Pacientes têm direito de saber por que um sistema automatizado tomou uma decisão sobre eles — e de contestá-la.
LGPD
Brasil
Transparência no uso de dados pessoais
Organizações devem informar como dados pessoais são usados em decisões automatizadas e garantir revisão humana quando solicitado.
EU AI Act
União Europeia
Sistemas de alto risco: explicabilidade obrigatória
Sistemas de IA usados em saúde são classificados como alto risco — exigem documentação técnica, testes de robustez e explicações auditáveis antes de serem implantados.
FDA / ANVISA
EUA / Brasil
SaMD: documentação de propósito clínico e explicação
Software as a Medical Device — modelos de ML usados em diagnóstico ou tratamento precisam de documentação do propósito clínico, evidência de desempenho e explicabilidade das decisões.
Princípio fundamental
🩺 Quem decide, afinal?
“A responsabilidade final permanece com o profissional de saúde, que deve interpretar as informações fornecidas pelo modelo à luz do contexto clínico.”
O modelo é uma ferramenta de apoio — como um exame laboratorial ou uma imagem de raio-X. Ele fornece informação; o profissional interpreta e decide.
A IA não assina a prescrição.
Se o modelo sugerir alto risco e o médico discordar com base no quadro clínico, o médico prevalece — e é responsável pela decisão.
🏛️ Governança mínima para uso seguro
1
Equipe multidisciplinarMédicos, enfermeiros, estatísticos, cientistas de dados e especialistas em ética devem participar juntos das decisões sobre o modelo — nenhuma área sozinha tem todas as respostas.
2
Validação pré-implantaçãoAntes de usar o modelo em pacientes reais, ele deve ser testado com dados externos e avaliado por profissionais de saúde para confirmar que funciona como esperado.
3
Monitoramento contínuoApós a implantação, o desempenho do modelo deve ser acompanhado regularmente — o perfil dos pacientes muda com o tempo e o modelo pode degradar sem que ninguém perceba.
4
Documentação auditávelTodas as versões do modelo, dados usados e decisões de design devem ser registradas. Regulações como LGPD e EU AI Act podem exigir que você explique decisões passadas.
5
Revisão após atualizaçõesQualquer mudança no modelo, nos dados ou no contexto clínico exige nova validação — uma atualização pode melhorar o desempenho geral e piorar para subgrupos específicos.
Perspectivas e fronteiras abertas
🔍 Limitações que motivam pesquisa
Dados longitudinaisEm séries temporais clínicas (ex: monitoramento de UTI ao longo de dias), o SHAP foi projetado para dados tabulares estáticos. Explicar como a contribuição de uma variável muda ao longo do tempo ainda é um problema em aberto.
Séries temporais clínicas: SHAP ainda tem limitações metodológicas
️ Dados multimodaisModelos modernos combinam imagem (raio-X), texto (prontuário) e dados tabulares (exames). Integrar explicações SHAP nesses diferentes tipos de dado de forma coerente é um desafio metodológico ativo.
Imagem + texto + tabular: integração complexa
Causalidade vs. associaçãoUm modelo pode ter valores SHAP tecnicamente corretos e ainda ser clinicamente enganoso — se a variável importante for um proxy espúrio, não uma causa real. Ex: o número de medicamentos pode predizer mortalidade sem causá-la.
Lacuna fundamental — um modelo pode ter SHAP correto e ser clinicamente enganoso
Avaliação de impactoPoucas pesquisas medem se usar explicações SHAP realmente melhora decisões clínicas ou desfechos para pacientes. Saber que o modelo é explicável não garante que as explicações sejam úteis na prática.
Poucos estudos medem o efeito real das explicações em desfechos clínicos
🚀 Métodos em desenvolvimento
Método
O que resolve
CausalSHAPIncorpora um grafo causal ao cálculo dos valores SHAP — permitindo distinguir contribuições de causas reais de variáveis que são apenas correlacionadas com o desfecho.
Incorpora estrutura causal
FastSHAPTreina uma rede neural para estimar valores SHAP diretamente, sem precisar recalcular para cada novo paciente. Muito mais rápido em produção, com pequena perda de precisão.
Estimativas por aprendizado — muito mais rápido
DeepSHAPExtensão do SHAP para redes neurais profundas — usa a estrutura interna da rede (camadas, ativações) para calcular contribuições de forma eficiente, similar ao que o TreeSHAP faz para árvores.
SHAP para redes neurais profundas
GradientSHAPCombina gradientes da rede neural com amostragem para estimar valores SHAP de forma aproximada e eficiente — útil quando a rede é muito grande para DeepSHAP.
SHAP via gradientes — redes grandes
O campo está em rápida evolução — o que aprendemos hoje é a base para acompanhar os desenvolvimentos futuros com senso crítico.
Mensagem central
“O SHAP é poderoso para transparência e auditabilidade. Seu valor depende de como é usado — com análise crítica, validação clínica e atenção às suas limitações”.
Referências citadas
AMANN, J. et al. Explainability for artificial intelligence in healthcare: a multidisciplinary perspective. BMC Medical Informatics and Decision Making, v. 20, n. 1, p. 310, 2020.
BAJWA, A. et al. A prospective study on diabetic retinopathy detection based on modify convolutional neural network using fundus images. Diagnostics, v. 13, 2023. DOI: 10.3390/diagnostics13030393.
BELLE, V.; PAPANTONIS, I. Principles and practice of explainable machine learning. Frontiers in Big Data, v. 4, 2020. DOI: 10.3389/fdata.2021.688969.
BIFARIN, O. O. Interpretable machine learning with tree-based Shapley additive explanations. PLOS ONE, v. 18, 2022.
BODRIA, F. et al. Benchmarking and survey of explanation methods for black box models. Data Mining and Knowledge Discovery, v. 37, p. 1719-1778, 2021.
BURRELL, J. How the machine “thinks”: understanding opacity in machine learning algorithms. Big Data & Society, v. 3, 2016.
COVERT, I.; LUNDBERG, S. M.; LEE, S.-I. Understanding global feature contributions with additive importance measures. NeurIPS, v. 33, p. 17212-17223, 2020.
GHASEMI, A. et al. Explainable artificial intelligence in breast cancer detection and risk prediction. Cancer Innovation, v. 3, 2024.
GREENWELL, B. M. pdp: an R package for constructing partial dependence plots. The R Journal, v. 9, p. 421, 2017.
HANNUN, A. Y. et al. Cardiologist-level arrhythmia detection and classification in ambulatory electrocardiograms. Nature Medicine, v. 25, n. 1, p. 65-69, 2019.
HASSIJA, V. et al. Interpreting black-box models: a review on explainable artificial intelligence. Cognitive Computation, v. 16, p. 45-74, 2023.
HOOKER, G.; MENTCH, L.; ZHOU, S. Unrestricted permutation forces extrapolation. Statistics and Computing, v. 31, 2019.
LIPTON, Z. C. The mythos of model interpretability. Queue, v. 16, n. 3, p. 31-57, 2018.
LUNDBERG, S.; LEE, S.-I. A unified approach to interpreting model predictions. NeurIPS, 2017.
LUNDBERG, S. M. et al. From local explanations to global understanding with explainable AI for trees. Nature Machine Intelligence, v. 2, n. 1, p. 56-67, 2020.
MIOTTO, R. et al. Deep learning for healthcare: review, opportunities and challenges. Briefings in Bioinformatics, v. 19, n. 6, p. 1236-1246, 2018.
MOLNAR, C. Interpretable machine learning. 2020.
GHOSH, S. K.; KHANDOKER, A. Investigation on explainable machine learning models to predict chronic kidney diseases. Scientific Reports, v. 14, 2024.
HAKKOUM, H.; IDRI, A.; ABNANE, I. Global and local interpretability techniques of supervised machine learning black box models for numerical medical data. Engineering Applications of Artificial Intelligence, v. 131, 107829, 2024.
HETTIKANKANAMAGE, N. D. et al. eXplainable Artificial Intelligence: a systematic review for biomedical imaging and sensing. Sensors, v. 25, 2025.
MIENYE, I. D. et al. Deep convolutional neural networks in medical image analysis: a review. Information, v. 16, p. 195, 2025.
NOHARA, Y. et al. Explanation of machine learning models using SHAP and application for real data in hospital. Computer Methods and Programs in Biomedicine, v. 214, 106584, 2021.
OBERMEYER, Z. et al. Dissecting racial bias in an algorithm used to manage the health of populations. Science, v. 366, n. 6464, p. 447-453, 2019.
RAJKOMAR, A. et al. Scalable and accurate deep learning with electronic health records. NPJ Digital Medicine, v. 1, n. 1, p. 18, 2018.
RIBEIRO, M. T.; SINGH, S.; GUESTRIN, C. “Why should I trust you?” Explaining the predictions of any classifier. In: KDD. 2016. p. 1135-1144.
RUDIN, C. Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence, v. 1, n. 5, p. 206-215, 2019.
SALIH, A. M. A. et al. A perspective on explainable artificial intelligence methods: SHAP and LIME. Advanced Intelligent Systems, v. 7, 2023.
SHAPLEY, L. S. A value for n-person games. Contributions to the Theory of Games, v. 2, n. 28, p. 307-317, 1953.
STIGLIC, G. et al. Interpretability of machine learning-based prediction models in healthcare. WIREs Data Mining and Knowledge Discovery, v. 10, 2020.
TONEKABONI, S. et al. What clinicians want: contextualizing explainable machine learning for clinical end use. Proceedings of Machine Learning Research, v. 106, p. 359-380, 2019.
TOPOL, E. J. High-performance medicine: the convergence of human and artificial intelligence. Nature Medicine, v. 25, n. 1, p. 44-56, 2019.
VIMBI, V.; SHAFFI, N.; MAHMUD, M. Interpreting artificial intelligence models: LIME and SHAP in Alzheimer’s disease detection. Brain Informatics, v. 11, 2024.
AUZINE, M. M. et al. Development of an ensemble CNN model with explainable AI for gastrointestinal cancer classification. PLOS ONE, v. 19, 2024.