Introdução

O presente relatório tem como objetivo demonstrar a aplicação de técnicas fundamentais de visualização de dados utilizando a linguagem R e o pacote ggplot2.

Os exercícios abordam a construção de gráficos estatísticos básicos e intermediários, com foco em clareza visual, correta escolha de geometrias, customização estética e aderência aos princípios da Gramática dos Gráficos.

Os datasets utilizados foram mtcars e diamonds, ambos amplamente empregados em análises exploratórias e exemplos didáticos em ciência de dados.

Exercício 1.1 – Gráfico de Dispersão (Scatter Plot)

Este exercício tem como objetivo analisar a relação entre o peso dos veículos e o consumo de combustível, utilizando o dataset mtcars.

Foi construído um gráfico de dispersão entre as variáveis wt (peso do carro) e mpg (milhas por galão), com diferenciação de cor conforme o número de cilindros (cyl), permitindo identificar padrões e possíveis agrupamentos nos dados.

Exercício 1.2 – Gráfico de Barras

Neste exercício foi elaborado um gráfico de barras a partir do dataset diamonds, com o objetivo de apresentar a contagem de diamantes por tipo de corte (cut).

O gráfico foi customizado para atender aos seguintes requisitos: - ordenação das barras em ordem decrescente de frequência; - inclusão de rótulos com os valores absolutos de cada categoria; - utilização de paleta de cores divergente, conforme recomendado pelo ColorBrewer; - aplicação de tema minimalista para melhor legibilidade.

Exercício 1.3 – Boxplot com Customização Avançada

Este exercício consistiu na criação de um boxplot da variável price em função do tipo de corte (cut), utilizando o dataset diamonds.

O gráfico foi personalizado com: - títulos e rótulos em língua portuguesa; - cores customizadas para cada categoria de corte; - remoção da legenda, por não agregar informação adicional; - ajuste do ângulo dos rótulos do eixo X, visando melhorar a legibilidade.

Exercício 1.4 – Conceitos Fundamentais

Diferença entre geom_point() e geom_jitter()

geom_point()

Plota os pontos exatamente nas coordenadas informadas, sendo adequado quando há pouca sobreposição de dados.

geom_jitter()

Adiciona um pequeno deslocamento aleatório aos pontos, sendo mais adequado quando muitos valores se sobrepõem.

Gramática dos Gráficos

A Gramática dos Gráficos é um modelo conceitual que descreve gráficos como combinação de dados, mapeamentos estéticos, geometrias, escalas, coordenadas e temas. No ggplot2, isso é implementado pela construção incremental do gráfico usando o operador +.