Árvores de Decisão e Matriz de Confusão

Pedro Franklin

IME-UFU

8 de dezembro de 2025

Estrutura da árvore

Termo Significado
Cada ponto de decisão ou resultado da árvore
Nó raiz O primeiro nó da árvore, onde começa a divisão
Nó interno Nós intermediários que fazem divisões com base em variáveis

Estrutura da árvore

Termo Significado
Nó folha Nó terminal, que contém a classe ou valor final previsto
Galho Caminho entre nós; representa uma condição lógica
Profundidade Número de níveis da árvore

Árvores no R

Termo/função do R Descrição
rpart() Função para ajustar uma árvore
rpart.plot() Para visualizar a árvore
minsplit, maxdepth Parâmetros para controlar o crescimento da árvore
predict() Função para prever com base no modelo ajustado

Matriz de Confusão

A matriz de confusão mostra a comparação entre as classes reais e as preditas pelo modelo.

Ela é essencial para calcular métricas como acurácia, precisão, sensibilidade e especificidade.

Matriz de Confusão

Matriz de Confusão: Classes positiva (+) e negativa (-)

  • VP (Verdadeiro Positivo): + corretamente identificado
  • VN (Verdadeiro Negativo): – corretamente identificado
  • FP (Falso Positivo): – identificado como +
  • FN (Falso Negativo): + identificado como –

Medidas de Desempenho: Acurácia

Proporção de previsões corretas

Acurácia = (VP + VN) / Total

Medidas de Desempenho: Precisão

Proporção de previsões positivas corretas

Precisão = VP / (VP + FP)

Medidas de Desempenho: Sensibilidade (Recall)

Proporção de positivos reais corretamente identificados

Sensibilidade = VP / (VP + FN)

Medidas de Desempenho: Especificidade

Proporção de negativos reais corretamente identificados

Especificidade = VN / (VN + FP)