Este proyecto tiene como objetivo explorar visualmente el dataset
diamonds disponible en R.
Usaremos la librería ggplot2 para analizar cómo el
precio de los diamantes se relaciona con otras características como los
quilates, el corte y la claridad.
# Instalar dplyr si no está presente
if (!require(dplyr)) install.packages("dplyr")
library(ggplot2)
library(dplyr)
# Cargar dataset incorporado
data("diamonds")ggplot(diamonds, aes(x = carat, y = price)) +
geom_point(color = "blue", alpha = 0.3) +
labs(title = "Relación entre Quilates y Precio",
x = "Quilates (carat)", y = "Precio (USD)")ggplot(diamonds, aes(x = carat, y = price, color = cut)) +
geom_point(size = 1.2, alpha = 0.4) +
labs(title = "Precio vs Quilates según Calidad del Corte",
x = "Quilates (carat)", y = "Precio (USD)", color = "Corte")ggplot(diamonds, aes(x = clarity, y = price)) +
geom_boxplot(fill = "orange") +
labs(title = "Distribución del Precio por Claridad",
x = "Claridad", y = "Precio (USD)") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))ggplot(diamonds, aes(x = price)) +
geom_histogram(bins = 30, fill = "green", color = "black") +
labs(title = "Histograma de Precios de Diamantes",
x = "Precio (USD)", y = "Frecuencia") +
theme_minimal()diamonds_avg <- diamonds %>%
group_by(carat) %>%
summarise(mean_price = mean(price), .groups = "drop")
ggplot(diamonds_avg, aes(x = carat, y = mean_price)) +
geom_line(color = "blue") +
labs(title = "Precio Promedio por Quilate",
x = "Quilates (carat)", y = "Precio Promedio (USD)") +
theme_minimal()En este análisis visual pudimos:
Este tipo de exploración es útil como paso previo para aplicar modelos predictivos o clasificaciones más complejas.