Logo do R

Visualização de Dados

Dione Aparecido Silva

8ª RPM

Exercício 1.1

Exercício 1.2

Exercício 1.3

Exercício 1.4

Diferença entre geom_point() e geom_jitter()

A diferença entre geom_point() e geom_jitter() está na forma como eles representam os pontos em um gráfico.

O geom_point() cria um gráfico de dispersão simples, em que cada observação é mostrada como um ponto nas coordenadas definidas. Esse método funciona bem quando os dados são contínuos e não há muita sobreposição, mas pode se tornar problemático quando muitas observações possuem valores iguais ou muito próximos, já que os pontos acabam se sobrepondo e dificultam a percepção da densidade.

Já o geom_jitter() é uma variação do geom_point() que adiciona um pequeno deslocamento aleatório nos pontos. Esse deslocamento evita que eles fiquem exatamente sobrepostos, permitindo visualizar melhor a concentração de observações. Ele é especialmente útil em situações com variáveis categóricas ou discretas, em que várias observações compartilham o mesmo valor.

Em resumo:

  • geom_point() é mais apropriado para dados contínuos sem grande sobreposição.
  • geom_jitter() deve ser usado quando há overplotting, ou seja, muitos pontos sobrepostos, principalmente em variáveis discretas ou categóricas.

Gramática dos Gráficos e sua implementação no ggplot2

A Gramática dos Gráficos, proposta por Leland Wilkinson, parte da ideia de que todo gráfico pode ser descrito como a combinação de elementos fundamentais. Em vez de pensar em tipos fixos de gráficos, a gramática organiza visualizações em componentes universais que podem ser recombinados para criar qualquer representação.

No ggplot2, essa filosofia é implementada de forma declarativa: você descreve os dados e como eles devem ser mapeados para atributos visuais, adiciona camadas (geom), define escalas, coordenadas e temas. Assim, gráficos complexos podem ser construídos de maneira modular e elegante.

Principais componentes:

  • Dados: conjunto de informações a serem representadas.
  • Estética (aes): mapeamento de variáveis para atributos visuais (posição, cor, tamanho).
  • Geometrias (geom): formas gráficas (pontos, linhas, barras).
  • Escalas (scale): traduzem valores em atributos visuais.
  • Coordenadas (coord): definem o sistema de posicionamento.
  • Facetas (facet): dividem os dados em subgráficos.
  • Tema (theme): controla aparência geral.

Em resumo, o ggplot2 traduz a Gramática dos Gráficos em código, permitindo criar visualizações sofisticadas apenas combinando camadas e mapeamentos.