Este capítulo apresenta um gráfico de dispersão para analisar a a relação entre o peso e o consumo de combustível pelo veículo, utilizando o dataset mtcars
Este capítulo apresenta um gráfico de barras para analisar a
distribuição de diamantes por tipo de corte, utilizando o dataset
diamonds.
O gráfico abaixo mostra a contagem de diamantes por sua qualidade de
corte (cut), implementando as seguintes modificações: * (a)
Barras ordenadas em ordem decrescente (do mais frequente ao menos
frequente). * (b) Rótulos de valor (contagem) adicionados em cada barra.
* (c) Paleta de cores divergente (scale_fill_brewer()).
Este capítulo foca na customização avançada de um boxplot, analisando
a distribuição do preço (price) dos diamantes em relação à
qualidade de corte (cut).
O boxplot a seguir ilustra a distribuição de preços por categoria de
corte, seguindo as personalizações solicitadas: * (a) Títulos e rótulos
em português. * (b) Cores customizadas (scale_fill_manual).
* (c) Remoção da legenda. * (d) Ajuste do ângulo dos rótulos do eixo X
(45 graus).
# Exercício 1.4- Conceitos Fundamentais
Ambos os geoms são usados para criar gráficos de dispersão, mas diferem crucialmente na forma como lidam com pontos de dados que têm valores idênticos para as coordenadas X e Y.
| Característica | geom_point() |
geom_jitter() |
|---|---|---|
| Função Principal | Exibir pontos de dados em coordenadas exatas. | Adicionar um pequeno ruído aleatório (jitter) às coordenadas dos pontos. |
| Lidando com Sobreposição (Overplotting) | Ruim. Pontos idênticos se sobrepõem, parecendo ser apenas um ponto. Isso oculta a verdadeira densidade dos dados. | Bom. Dispersa os pontos levemente para que todos fiquem visíveis, revelando a densidade dos dados em valores discretos. |
| Situação Apropriada | Quando as variáveis X e Y são contínuas (Ex: Peso vs. Altura) ou quando não há sobreposição de pontos. | Quando a variável X ou Y (ou ambas) é discreta ou categórica, e muitos pontos caem exatamente no mesmo local (Ex: Idade por Categoria). |
A “Gramática dos Gráficos” é um conceito teórico que descreve como a
maioria dos gráficos estatísticos pode ser construída combinando
componentes independentes e nomeados. É o pilar fundamental do pacote
ggplot2.
O nome ggplot2 vem de Grammar of
Graphics Plot 2. O pacote implementa a
gramática ao exigir que o usuário adicione o gráfico em camadas
(layers).
Os principais componentes da gramática, conforme implementados no
ggplot2, são:
| Componente | Função no ggplot2 (Camadas) |
O que Define |
|---|---|---|
| Dados (Data) | Função \(\texttt{ggplot(data = ...)}\) | O conjunto de dados que será visualizado. |
| Mapeamentos Estéticos (Aesthetics) | Funções \(\texttt{aes(x=..., y=..., color=...)}\) | Como as variáveis dos dados são mapeadas para propriedades visuais (eixos X/Y, cor, tamanho, forma). |
| Geometrias (Geoms) | Funções \(\texttt{geom\_point()}\), \(\texttt{geom\_bar()}\) | A forma geométrica usada para representar os dados. |
| Facetas (Facets) | Funções \(\texttt{facet\_wrap()}\), \(\texttt{facet\_grid()}\) | Como dividir o gráfico em subgráficos baseados em uma ou mais variáveis categóricas. |
O relatório finalizou a análise exploratória, a customização de
visualizações com ggplot2 e abordou os conceitos teóricos
da Gramática dos Gráficos.