Visualização de Dados
Andressa Duarte Amaral Isayama
Este trabalho tem como objetivo explorar conceitos fundamentais de visualização de dados, utilizando a linguagem R e o pacote ggplot2, com foco na compreensão visual de padrões, distribuições e relações entre variáveis.
##
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
que fechou o chunk dos gráficos.
``markdown ## Diferença entregeom_point()egeom_jitter()`
geom_point()Plota os pontos exatamente nas coordenadas fornecidas pelos dados. Cada observação é representada fielmente pela sua posição (x, y).
Quando usar:
Quando não há (ou há pouca) sobreposição de pontos e quando a precisão
da posição é importante, por exemplo, em dados contínuos bem
distribuídos.
geom_jitter()É uma variação de geom_point() que adiciona um pequeno
deslocamento aleatório aos pontos nos eixos x e/ou y.
Esse deslocamento não altera o valor real dos dados, apenas a posição
visual.
Quando usar:
Quando há muita sobreposição de pontos, especialmente em dados discretos
ou categóricos, facilitando a visualização da densidade e da quantidade
de observações em cada categoria.
A Gramática dos Gráficos é um conceito que descreve gráficos estatísticos como a combinação de componentes independentes e bem definidos. Em vez de pensar em tipos fixos de gráficos (como barras, linhas ou dispersão), essa abordagem define regras que permitem construir qualquer gráfico a partir de partes básicas, como dados, mapeamentos estéticos, geometrias e escalas.