Introdução

logo
logo
O presente relatório técnico tem como finalidade consolidar as atividades práticas de análise estatística e visualização de dados, utilizando a linguagem de programação *R*. O foco principal desta análise reside na gestão e no desempenho de frotas, explorando a correlação entre variáveis técnicas e a distribuição de frequências em conjuntos de dados complexos.

Para a execução desta tarefa, foram empregadas as ferramentas de ponta da ciência de dados: ggplot2: Implementação da “Gramática dos Gráficos” para criar visualizações precisas e informativas. dplyr: Ferramenta essencial para a manipulação, filtragem e organização de grandes volumes de dados.

O objetivo fundamental é demonstrar como a ciência de dados pode ser aplicada para transformar dados brutos em inteligência logística, facilitando a interpretação de indicadores de desempenho e a identificação de padrões de consumo e precificação.


Gráfico de Dispersão (mtcars)

library(ggplot2)

ggplot(
  data = mtcars,
  aes(x = wt, y = mpg, color = factor(cyl))
) +
  geom_point(size = 3) +
  labs(
    title = "Relação entre Peso e Consumo de Combustível",
    x = "Peso do carro (wt)",
    y = "Milhas por galão (mpg)",
    color = "Cilindros"
  ) +
  theme_minimal()

Gráfico de Barras (diamonds)

library(ggplot2)
library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
diamonds %>%
  count(cut) %>%
  ggplot(aes(x = reorder(cut, -n), y = n, fill = cut)) +
  geom_col() + 
  geom_text(aes(label = n), vjust = -0.5) +
  scale_fill_brewer(palette = "RdYlBu") +
  labs(
    title = "Contagem por Qualidade de Corte",
    x = "Corte",
    y = "Quantidade",
    fill = "Corte"
  ) +
  theme_minimal()

Boxplot de Preços (diamonds)

Nesta análise, observamos a variação de preço para cada tipo de corte de diamante.

library(ggplot2)

# Criando o Boxplot com customizações solicitadas

ggplot(diamonds, aes(x = cut, y = price, fill = cut)) +
  geom_boxplot() +
  scale_fill_manual(
    values = c(
      "Fair" = "#d73027",
      "Good" = "#fc8d59",
      "Very Good" = "#fee08b",
      "Premium" = "#91bfdb",
      "Ideal" = "#4575b4"
    )
  ) +
  labs(
    title = "Distribuição do Preço dos Diamantes por Tipo de Corte",
    x = "Tipo de Corte",
    y = "Preço (US$)"
  ) +
  theme_minimal() +
  theme(
    legend.position = "none",
    axis.text.x = element_text(angle = 45, hjust = 1)
  )

## Teoria e Gramática dos Gráficos

Diferença entre geom_point() e geom_jitter()

O geom_point() plota os pontos exatamente nas coordenadas obseradas, sendo mais adequado quando há pouca sobreposição entre os dados.

O geom_jitter() adiciona um pequeno deslocamento aleatório aos pontos, sendo indicado em situações com muitos valores repetidos ou sobrepostos, melhorando a legibilidade do gráfico.


O conceito de “Gramática dos Gráficos”

A Gramática dos Dados define a visualização como a combinação de componentes independentes, tais como dados, mapeamentos estéticos, geometrias, escalas e temas.

No ggplot2, essa gramática é implementada através do operador +**, permitindo construir a visualização passo a passo:

  1. Data (Dados): O dataset bruto (ex: mtcars).
  2. Aesthetics (Estética - aes): O mapeamento de quais colunas vão para o eixo X, Y, cores ou tamanhos.
  3. Geoms (Geometrias): A forma física do gráfico (pontos, barras, linhas).
  4. Scales (Escalas): Controle de cores e eixos.
  5. Themes (Temas): A aparência visual (fundo, fontes, grades).

Essa abordagem modular torna o R uma ferramenta poderosa, pois você pode mudar o tipo de gráfico apenas alterando a camada de geom, mantendo todo o resto da estrutura.

  • Atividade elaborada por: Kall Muller Barbosa