En esta práctica se resuelven ejercicios de visualización de datos utilizando el dataset diamonds del paquete ggplot2. Se emplean diferentes tipos de gráficos para explorar la relación entre el precio, los quilates, la claridad y la calidad del corte de los diamantes.
knitr::opts_chunk$set(echo = TRUE)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data(diamonds)
Gráfico de dispersión entre carat y price, con puntos azules.
ggplot(data = diamonds, aes(x = carat, y = price)) +
geom_point(color = "blue") +
ggtitle("Relación entre precio y quilates (muestra de 1000)")
Gráfico de dispersión anterior, pero coloreado por cut, con tamaño 1.5
ggplot(data = diamonds, aes(x = carat, y = price, color = cut)) +
geom_point(size = 1.5) +
ggtitle("Precio vs Quilates según Calidad del Corte (muestra de 1000)")
Boxplot de price por clarity, con color naranja y etiquetas giradas.
ggplot(data = diamonds, aes(x = clarity, y = price)) +
geom_boxplot(fill = "orange") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
ggtitle("Boxplot del Precio por Claridad")
Histograma de precios con 30 bins de color verde con bordes negros
ggplot(data = diamonds, aes(x = price)) +
geom_histogram(bins = 30, fill = "green", color = "black") +
ggtitle("Histograma de Precios de Diamantes")
Promedio de precio por quilate agrupado y graficado con líneas.
carat_avg_price <- diamonds %>%
group_by(carat) %>%
summarise(avg_price = mean(price))
ggplot(data = carat_avg_price, aes(x = carat, y = avg_price)) +
geom_line() +
ggtitle("Precio Promedio por Quilate")