Exercício 1.1- Introdução ao ggplot2 - Dispersão entre as variáveis mpg (milhas por galão) e wt (peso do carro)

Este capítulo apresenta um gráfico de dispersão para analisar a a relação entre o peso e o consumo de combustível pelo veículo, utilizando o dataset mtcars

1.1.1 Gráfico de Dispersão

Logo PMMG Logo RPM Logo UA

Exercício 1.2- Gráficos de Barras - Análise de Diamantes

Este capítulo apresenta um gráfico de barras para analisar a distribuição de diamantes por tipo de corte, utilizando o dataset diamonds.

1.2.1. Gráfico de Barras: Contagem por Tipo de Corte

O gráfico abaixo mostra a contagem de diamantes por sua qualidade de corte (cut), implementando as seguintes modificações: * (a) Barras ordenadas em ordem decrescente (do mais frequente ao menos frequente). * (b) Rótulos de valor (contagem) adicionados em cada barra. * (c) Paleta de cores divergente (scale_fill_brewer()).

Exercício 1.3 - Customização Avançada

Este capítulo foca na customização avançada de um boxplot, analisando a distribuição do preço (price) dos diamantes em relação à qualidade de corte (cut).

1.3.1. Boxplot do Preço por Corte

O boxplot a seguir ilustra a distribuição de preços por categoria de corte, seguindo as personalizações solicitadas: * (a) Títulos e rótulos em português. * (b) Cores customizadas (scale_fill_manual). * (c) Remoção da legenda. * (d) Ajuste do ângulo dos rótulos do eixo X (45 graus).

# Exercício 1.4- Conceitos Fundamentais

1.4.1. Diferença entre geom_point() e geom_jitter()

Ambos os geoms são usados para criar gráficos de dispersão, mas diferem crucialmente na forma como lidam com pontos de dados que têm valores idênticos para as coordenadas X e Y.

Característica geom_point() geom_jitter()
Função Principal Exibir pontos de dados em coordenadas exatas. Adicionar um pequeno ruído aleatório (jitter) às coordenadas dos pontos.
Lidando com Sobreposição (Overplotting) Ruim. Pontos idênticos se sobrepõem, parecendo ser apenas um ponto. Isso oculta a verdadeira densidade dos dados. Bom. Dispersa os pontos levemente para que todos fiquem visíveis, revelando a densidade dos dados em valores discretos.
Situação Apropriada Quando as variáveis X e Y são contínuas (Ex: Peso vs. Altura) ou quando não há sobreposição de pontos. Quando a variável X ou Y (ou ambas) é discreta ou categórica, e muitos pontos caem exatamente no mesmo local (Ex: Idade por Categoria).

5.2. Conceito de “Gramática dos Gráficos” (Grammar of Graphics)

A “Gramática dos Gráficos” é um conceito teórico que descreve como a maioria dos gráficos estatísticos pode ser construída combinando componentes independentes e nomeados. É o pilar fundamental do pacote ggplot2.

Implementação no ggplot2

O nome ggplot2 vem de Grammar of Graphics Plot 2. O pacote implementa a gramática ao exigir que o usuário adicione o gráfico em camadas (layers).

Os principais componentes da gramática, conforme implementados no ggplot2, são:

Componente Função no ggplot2 (Camadas) O que Define
Dados (Data) Função \(\texttt{ggplot(data = ...)}\) O conjunto de dados que será visualizado.
Mapeamentos Estéticos (Aesthetics) Funções \(\texttt{aes(x=..., y=..., color=...)}\) Como as variáveis dos dados são mapeadas para propriedades visuais (eixos X/Y, cor, tamanho, forma).
Geometrias (Geoms) Funções \(\texttt{geom\_point()}\), \(\texttt{geom\_bar()}\) A forma geométrica usada para representar os dados.
Facetas (Facets) Funções \(\texttt{facet\_wrap()}\), \(\texttt{facet\_grid()}\) Como dividir o gráfico em subgráficos baseados em uma ou mais variáveis categóricas.

Conclusão do Relatório

O relatório finalizou a análise exploratória, a customização de visualizações com ggplot2 e abordou os conceitos teóricos da Gramática dos Gráficos.