O presente relatório técnico tem como finalidade consolidar as atividades práticas de análise estatística e visualização de dados, utilizando a linguagem de programação *R*. O foco principal desta análise reside na gestão e no desempenho de frotas, explorando a correlação entre variáveis técnicas e a distribuição de frequências em conjuntos de dados complexos.
Para a execução desta tarefa, foram empregadas as ferramentas de ponta da ciência de dados: ggplot2: Implementação da “Gramática dos Gráficos” para criar visualizações precisas e informativas. dplyr: Ferramenta essencial para a manipulação, filtragem e organização de grandes volumes de dados.
O objetivo fundamental é demonstrar como a ciência de dados pode ser aplicada para transformar dados brutos em inteligência logística, facilitando a interpretação de indicadores de desempenho e a identificação de padrões de consumo e precificação.
library(ggplot2)
ggplot(
data = mtcars,
aes(x = wt, y = mpg, color = factor(cyl))
) +
geom_point(size = 3) +
labs(
title = "Relação entre Peso e Consumo de Combustível",
x = "Peso do carro (wt)",
y = "Milhas por galão (mpg)",
color = "Cilindros"
) +
theme_minimal()
library(ggplot2)
library(dplyr)
##
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
diamonds %>%
count(cut) %>%
ggplot(aes(x = reorder(cut, -n), y = n, fill = cut)) +
geom_col() +
geom_text(aes(label = n), vjust = -0.5) +
scale_fill_brewer(palette = "RdYlBu") +
labs(
title = "Contagem por Qualidade de Corte",
x = "Corte",
y = "Quantidade",
fill = "Corte"
) +
theme_minimal()
Nesta análise, observamos a variação de preço para cada tipo de corte de diamante.
library(ggplot2)
# Criando o Boxplot com customizações solicitadas
ggplot(diamonds, aes(x = cut, y = price, fill = cut)) +
geom_boxplot() +
scale_fill_manual(
values = c(
"Fair" = "#d73027",
"Good" = "#fc8d59",
"Very Good" = "#fee08b",
"Premium" = "#91bfdb",
"Ideal" = "#4575b4"
)
) +
labs(
title = "Distribuição do Preço dos Diamantes por Tipo de Corte",
x = "Tipo de Corte",
y = "Preço (US$)"
) +
theme_minimal() +
theme(
legend.position = "none",
axis.text.x = element_text(angle = 45, hjust = 1)
)
## Teoria e Gramática dos Gráficos
O geom_point() plota os pontos exatamente nas coordenadas obseradas, sendo mais adequado quando há pouca sobreposição entre os dados.
O geom_jitter() adiciona um pequeno deslocamento aleatório aos pontos, sendo indicado em situações com muitos valores repetidos ou sobrepostos, melhorando a legibilidade do gráfico.
A Gramática dos Dados define a visualização como a combinação de componentes independentes, tais como dados, mapeamentos estéticos, geometrias, escalas e temas.
No ggplot2, essa gramática é implementada através do operador +**, permitindo construir a visualização passo a passo:
Essa abordagem modular torna o R uma ferramenta poderosa, pois você pode mudar o tipo de gráfico apenas alterando a camada de geom, mantendo todo o resto da estrutura.