mtcars$cyl <- factor(mtcars$cyl)

ggplot(data = mtcars, aes(x = wt, y = mpg, color = cyl)) +
  geom_point(size = 3) +
  labs(title = "Relação entre Peso e Consumo de Combustível",
       x = "Peso do carro (wt)",
       y = "Milhas por galão (mpg)",
       color = "Cilindros") +
  theme_minimal()

Exercício 1.2 - Gráfico de Barras

contagem_cut <- diamonds %>%
count(cut) %>%
arrange(desc(n))

contagem_cut$cut <- factor(contagem_cut$cut, levels = contagem_cut$cut)

ggplot(contagem_cut, aes(x = cut, y = n, fill = cut)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = n), vjust = -0.3, size = 4) +
  labs(title = "Quantidade de Diamantes por Tipo de Corte",
       x = "Tipo de Corte",
       y = "Quantidade") +
  scale_fill_brewer(palette = "Spectral") +
  theme_minimal()

Exercício 1.3 - Customização Avançada

ggplot(diamonds, aes(x = cut, y = price, fill = cut)) +
  geom_boxplot() + 
  labs(title = "Distribuição do Preço dos Diamantes por Tipo de Corte",
       x = "Tipo de Corte",
       y = "Preço (USD)") +
  scale_fill_manual(values = c("Fair" = "#d73027",
                               "Good" = "#fc8d59",
                               "Very Good" = "#fee08b",
                               "Premium" = "#91bfdb",
                               "Ideal" = "#4575b4")) +
  theme_minimal() +
  theme(legend.position = "none",
        axis.text.x = element_text(angle = 30, hjust = 1)
        )

Exercício 1.4 – Conceitos Fundamentais

Diferença entre geom_point() e geom_jitter()

O ‘geom_point()’ é utilizado para criar gráficos tradicionais, onde cada observação é representada na posição correspondente aos seus valores nos eixos X e Y. Ele é mais apropriado quando há pouca ou nenhuma sobreposição entre os pontos. O ‘geom_jitter()’ adiciona um pequeno ruído aleatório às posições dos pontos, deslocando-os levemente nos eixos cartesianos. Esse recurso é especialmente útil quando existe sobreposição excessiva de observações (overplotting), situação comum em variáveis discretas ou categóricas. Dessa forma espalha levemente os pontos para melhorar a visualização. —

Gramática dos Gráficos

A Gramática dos Gráficos é um conceito proposto por Leland Wilkinson que descreve a construção de gráficos como a combinação de componentes independentes e reutilizáveis. Seu principal objetivo é associar cada componente do gráfico a uma estrutura gramatical, semelhante a formação de uma frase. Possibilitando a elaboração de diversos gráficos de forma eficiente e elaborada.

No ggplot2, esse conceito é implementado por meio de camadas, como:

  • Dados (data): conjunto de informações que contém a s variáveis a serem utilizadas;

  • Mapeamentos estéticos (aes): Define como as variáveis serão mapeadas para propriedades visuais do gráfico;

  • Geometrias (geoms): Determina o que é efetivamente desenhado no gráfico enquanto objeto visual;

  • Facetas (facets): Cria uma matriz de subgráficos onde cada painel mostra um subconjunto dos dados. É útil para visualizar o comportamento da relação entre variáveis;

  • Estatísticas (Statistics): Realiza a transformação estatística dos dados antes de plota-los nos gráficos;

  • Coordenadas (‘Coordinates’): Controla o sistema de corrdenadas dos gráficos, tendo como padrão as coordenadas cartesianas;

  • Temas (themes): Controla a aparência não relacionada a dados.