Exercício 1.1 - Introdução ao ggplot2

Column

Gráfico de Dispersão: Relação entre Peso e Consumo de Combustível

Column

Descrição do Gráfico

  • Dataset: mtcars (dados sobre características de 32 carros)
  • Variáveis:
    • Eixo X: wt (peso do carro em 1000 libras)
    • Eixo Y: mpg (milhas por galão)
    • Cor: Diferenciada por número de cilindros (cyl)
  • Tema: theme_minimal() para aparência limpa

Interpretação: Observa-se uma relação inversamente proporcional entre o peso do carro e o consumo de combustível. Carros mais pesados tendem a consumir mais combustível.


Exercício 1.2 - Gráficos de Barras

Column

Gráfico de Barras: Contagem de Diamantes por Corte

Column

Características do Gráfico

Modificações Realizadas: - ✓ Barras ordenadas em ordem decrescente - ✓ Rótulos de valor adicionados em cada barra - ✓ Paleta de cores divergente (RdYlGn - Vermelho/Amarelo/Verde)

Insight: O corte “Ideal” é o mais frequente no dataset com mais de 21 mil diamantes, seguido pelos cortes “Premium” e “Muito Bom”.


Exercício 1.3 - Customização Avançada

Column

Boxplot: Distribuição de Preço por Corte

Column

Detalhes da Customização

Personalizações Aplicadas: - ✓ Títulos em português - ✓ Cores customizadas para cada categoria - ✓ Legenda com rótulos em português - ✓ Ângulo dos rótulos ajustado a 45°

Análise Estatística:
cut_pt Mediana Média Mínimo Máximo
Bom 3050.5 3928.86 327 18788
Ideal 1810.0 3457.54 326 18806
Muito Bom 2648.0 3981.76 336 18818
Premium 3185.0 4584.26 326 18823
Razoável 3282.0 4358.76 337 18574

Exercício 1.4 - Conceitos Fundamentais

Column

Diferença entre geom_point() e geom_jitter()

geom_point()

  • Plota pontos exatamente nas coordenadas x, y
  • Apropriado quando não há sobreposição de dados
  • Ideal para dados contínuos e bem distribuídos
  • Exemplo de uso: dados com valores únicos em ambos os eixos

geom_jitter()

  • Adiciona ruído aleatório aos pontos (jitter)
  • Evita sobreposição (overplotting) de pontos
  • Apropriado quando há muitos pontos coincidentes
  • Ideal para dados discretos ou com muitas repetições
  • Permite visualizar a densidade real dos dados

Quando usar cada um: - geom_point(): Dados bem espaçados, sem sobreposição - geom_jitter(): Dados discretos, muitas coincidências, análise exploratória


Comparação Visual


Column

Gramática dos Gráficos - ggplot2

O que é a “Gramática dos Gráficos”?

A Gramática dos Gráficos é um conceito fundamental que trata a visualização de dados como uma linguagem com sua própria gramática, proposta por Leland Wilkinson. Ela define componentes básicos que podem ser combinados para criar qualquer gráfico estatístico.

Componentes Principais:

  1. Dados: Os dados a serem visualizados
  2. Estética: Mapeamento de variáveis para atributos visuais (x, y, cor, tamanho, forma)
  3. Geometrias: Formas geométricas que representam os dados (pontos, linhas, barras, etc.)
  4. Transformações Estatísticas: Operações estatísticas (contagem, média, regressão)
  5. Escalas: Controle de mapeamento entre dados e valores visuais
  6. Sistema de Coordenadas: Forma de apresentação (cartesiano, polar)
  7. Facetas: Divisão em múltiplos painéis
  8. Tema: Elementos visuais não relacionados aos dados

Implementação no ggplot2:

O ggplot2 implementa essa gramática através de uma sintaxe em camadas:

ggplot(data = dados) +                    # Dados
  aes(x = var1, y = var2, color = var3) +# Estética
  geom_point() +                          # Geometria
  geom_smooth() +                         # Transformação estatística
  scale_color_brewer() +                  # Escalas
  coord_cartesian() +                     # Sistema de coordenadas
  facet_wrap(~categoria) +                # Facetas
  theme_minimal()                         # Tema

Vantagem: Essa abordagem permite criar gráficos complexos de forma lógica e modular, entendendo exatamente cada componente e sua função.


Resumo da Atividade

Column

Checklist de Conclusão

  • Exercício 1.1: Scatter plot com mtcars, cor por cilindros e tema minimalista
  • Exercício 1.2: Gráfico de barras com diamonds, ordenado e com paleta divergente
  • Exercício 1.3: Boxplot customizado com cores e rótulos em português
  • Exercício 1.4: Explicação teórica sobre geom_point vs geom_jitter e Gramática dos Gráficos

Informações do Documento

  • Aluno: Anderson Veloso dos Santos
  • Data: 2025-12-11
  • Disciplina: Ciência de Dados
  • Atividade: Questões Gerais - Dashboard (4,0 pontos)
  • Deadline: 16/12/2025
  • Formato: FlexDashboard com R Markdown