Quando usar histograma, boxplot ou violino?
Hellen Sonaly Silva Alves
hellensilva.estat@gmail.com
http://lattes.cnpq.br/4845253626067527
Introdução
Ao analisar uma variável quantitativa, uma das primeiras perguntas é:
Qual gráfico devo usar para entender a distribuição dos dados?
Neste tutorial vamos comparar três dos principais gráficos usados em estatística descritiva:
- 📊 Histograma
- 📦 Boxplot
- 🎻 Gráfico de Violino
Cada um possui objetivos, vantagens e limitações diferentes.
Se você está iniciando no R, recomendo primeiro:
- Tutorial para instalar o R https://www.rpubs.com/Hellen_Silva/1384633
- Tutorial básico de uso do RStudio https://www.rpubs.com/Hellen_Silva/1384634
- Tutorial básico de uso do RStudio - Parte 2 https://rpubs.com/Hellen_Silva/1386700
- Tutorial para realizar uma Estatística Descritiva do zero no R https://rpubs.com/Hellen_Silva/1399318
1. Dataset do Tutorial
Vamos usar um conjunto de dados simulado contendo:
grupo(A ou B)renda(variável quantitativa assimétrica)
set.seed(123)
dados <- data.frame(
grupo = sample(c("A", "B"), 120, replace = TRUE),
renda = round(rlnorm(120, meanlog = log(3000), sdlog = 0.6), 0)
)
head(dados)## grupo renda
## 1 A 3767
## 2 A 2219
## 3 A 2456
## 4 B 1628
## 5 A 1577
## 6 B 3599
Vamos utilizar o pacote ggplot2 para os gráficos:
2. Objetivo de Cada Tipo de Gráfico
| Gráfico | Melhor para visualizar | Mostra formato da distribuição? | Mostra outliers? |
|---|---|---|---|
| Histograma | Frequência | Sim | Não claramente |
| Boxplot | Resumo e dispersão | Não completamente | Sim |
| Violino | Densidade completa | Sim | Parcialmente |
3. Histograma
3.1 O que ele mostra?
O histograma divide os dados em intervalos (bins) e mostra a frequência em cada faixa.
Ele é ideal para visualizar:
- Formato da distribuição
- Assimetria
- Concentração de valores
3.2 Exemplo em R
ggplot(dados, aes(x = renda)) +
geom_histogram(bins = 20) +
labs(title = "Histograma da Renda",
x = "Renda",
y = "Frequência")3.3 Vantagens
- Mostra o formato da distribuição
- Permite visualizar assimetria
- Ajuda a identificar concentração de valores
3.4 Limitações
- Depende do número de bins
- Não destaca claramente outliers
- Não é ideal para comparar muitos grupos
4. Boxplot
4.1 O que ele mostra?
O boxplot resume os dados usando:
- Mediana
- Quartis (Q1 e Q3)
- Amplitude interquartil (IQR)
- Outliers
4.2 Exemplo em R
ggplot(dados, aes(x = grupo, y = renda)) +
geom_boxplot() +
labs(title = "Boxplot da Renda por Grupo",
x = "Grupo",
y = "Renda")4.3 Vantagens
- Excelente para comparar grupos
- Identifica outliers claramente
- Fornece resumo visual rápido
4.4 Limitações
- Não mostra o formato completo da distribuição
- Pode esconder multimodalidade
5. Gráfico de Violino
5.1 O que ele mostra?
O gráfico de violino combina:
- Resumo semelhante ao boxplot
- Estimativa da densidade da distribuição
Ele mostra o formato completo da distribuição espelhado.
5.2 Exemplo em R
ggplot(dados, aes(x = grupo, y = renda)) +
geom_violin(trim = FALSE) +
labs(title = "Gráfico de Violino da Renda por Grupo",
x = "Grupo",
y = "Renda")5.3 Vantagens
- Mostra a forma da distribuição
- Ideal para detectar assimetria
- Ótimo para comparar grupos
5.4 Limitações
- Pode ser menos intuitivo para iniciantes
- Não destaca outliers individualmente
6. Comparação Visual
# Violino por grupo
ggplot(dados, aes(x = grupo, y = renda)) +
geom_violin(trim = FALSE) +
labs(title = "Violino por Grupo")Observe como cada gráfico destaca aspectos diferentes da mesma variável.
7. Quando usar cada um?
Use Histograma quando:
- Quer entender o formato geral da distribuição
- Está analisando uma única variável
- Deseja avaliar assimetria
Use Boxplot quando:
- Quer comparar grupos
- Precisa identificar outliers
- Deseja um resumo rápido
Use Violino quando:
- Quer comparar grupos
- Precisa visualizar densidade completa
- Suspeita de distribuições multimodais
8. Interpretação Prática
Para a variável renda:
- O histograma mostra assimetria à direita (comum em rendas).
- O boxplot evidencia valores extremos.
- O violino mostra onde há maior concentração de observações.
Cada gráfico responde a uma pergunta diferente.
Conclusão
Não existe um gráfico “melhor”.
Existe o gráfico mais adequado para a pergunta que você deseja responder.
- O histograma é ideal para entender a forma geral.
- O boxplot é excelente para resumo e comparação.
- O violino é poderoso para analisar a densidade completa.
Em uma análise completa, é recomendável combinar mais de um tipo de visualização para obter uma compreensão mais profunda dos dados.