Quando usar histograma, boxplot ou violino?

Hellen Sonaly Silva Alves
hellensilva.estat@gmail.com
http://lattes.cnpq.br/4845253626067527


Introdução

Ao analisar uma variável quantitativa, uma das primeiras perguntas é:

Qual gráfico devo usar para entender a distribuição dos dados?

Neste tutorial vamos comparar três dos principais gráficos usados em estatística descritiva:

  • 📊 Histograma
  • 📦 Boxplot
  • 🎻 Gráfico de Violino

Cada um possui objetivos, vantagens e limitações diferentes.

Se você está iniciando no R, recomendo primeiro:


1. Dataset do Tutorial

Vamos usar um conjunto de dados simulado contendo:

  • grupo (A ou B)
  • renda (variável quantitativa assimétrica)
set.seed(123)

dados <- data.frame(
  grupo = sample(c("A", "B"), 120, replace = TRUE),
  renda = round(rlnorm(120, meanlog = log(3000), sdlog = 0.6), 0)
)

head(dados)
##   grupo renda
## 1     A  3767
## 2     A  2219
## 3     A  2456
## 4     B  1628
## 5     A  1577
## 6     B  3599

Vamos utilizar o pacote ggplot2 para os gráficos:

library(ggplot2)

2. Objetivo de Cada Tipo de Gráfico

Gráfico Melhor para visualizar Mostra formato da distribuição? Mostra outliers?
Histograma Frequência Sim Não claramente
Boxplot Resumo e dispersão Não completamente Sim
Violino Densidade completa Sim Parcialmente

3. Histograma

3.1 O que ele mostra?

O histograma divide os dados em intervalos (bins) e mostra a frequência em cada faixa.

Ele é ideal para visualizar:

  • Formato da distribuição
  • Assimetria
  • Concentração de valores

3.2 Exemplo em R

ggplot(dados, aes(x = renda)) +
  geom_histogram(bins = 20) +
  labs(title = "Histograma da Renda",
       x = "Renda",
       y = "Frequência")

3.3 Vantagens

  • Mostra o formato da distribuição
  • Permite visualizar assimetria
  • Ajuda a identificar concentração de valores

3.4 Limitações

  • Depende do número de bins
  • Não destaca claramente outliers
  • Não é ideal para comparar muitos grupos

4. Boxplot

4.1 O que ele mostra?

O boxplot resume os dados usando:

  • Mediana
  • Quartis (Q1 e Q3)
  • Amplitude interquartil (IQR)
  • Outliers

4.2 Exemplo em R

ggplot(dados, aes(x = grupo, y = renda)) +
  geom_boxplot() +
  labs(title = "Boxplot da Renda por Grupo",
       x = "Grupo",
       y = "Renda")

4.3 Vantagens

  • Excelente para comparar grupos
  • Identifica outliers claramente
  • Fornece resumo visual rápido

4.4 Limitações

  • Não mostra o formato completo da distribuição
  • Pode esconder multimodalidade

5. Gráfico de Violino

5.1 O que ele mostra?

O gráfico de violino combina:

  • Resumo semelhante ao boxplot
  • Estimativa da densidade da distribuição

Ele mostra o formato completo da distribuição espelhado.

5.2 Exemplo em R

ggplot(dados, aes(x = grupo, y = renda)) +
  geom_violin(trim = FALSE) +
  labs(title = "Gráfico de Violino da Renda por Grupo",
       x = "Grupo",
       y = "Renda")

5.3 Vantagens

  • Mostra a forma da distribuição
  • Ideal para detectar assimetria
  • Ótimo para comparar grupos

5.4 Limitações

  • Pode ser menos intuitivo para iniciantes
  • Não destaca outliers individualmente

6. Comparação Visual

# Histograma
ggplot(dados, aes(x = renda)) +
  geom_histogram(bins = 20) +
  labs(title = "Histograma")

# Boxplot
ggplot(dados, aes(y = renda)) +
  geom_boxplot() +
  labs(title = "Boxplot")

# Violino por grupo
ggplot(dados, aes(x = grupo, y = renda)) +
  geom_violin(trim = FALSE) +
  labs(title = "Violino por Grupo")

Observe como cada gráfico destaca aspectos diferentes da mesma variável.


7. Quando usar cada um?

Use Histograma quando:

  • Quer entender o formato geral da distribuição
  • Está analisando uma única variável
  • Deseja avaliar assimetria

Use Boxplot quando:

  • Quer comparar grupos
  • Precisa identificar outliers
  • Deseja um resumo rápido

Use Violino quando:

  • Quer comparar grupos
  • Precisa visualizar densidade completa
  • Suspeita de distribuições multimodais

8. Interpretação Prática

Para a variável renda:

  • O histograma mostra assimetria à direita (comum em rendas).
  • O boxplot evidencia valores extremos.
  • O violino mostra onde há maior concentração de observações.

Cada gráfico responde a uma pergunta diferente.


Conclusão

Não existe um gráfico “melhor”.

Existe o gráfico mais adequado para a pergunta que você deseja responder.

  • O histograma é ideal para entender a forma geral.
  • O boxplot é excelente para resumo e comparação.
  • O violino é poderoso para analisar a densidade completa.

Em uma análise completa, é recomendável combinar mais de um tipo de visualização para obter uma compreensão mais profunda dos dados.