Introducción

Este proyecto tiene como objetivo explorar visualmente el dataset diamonds disponible en R.
Usaremos la librería ggplot2 para analizar cómo el precio de los diamantes se relaciona con otras características como los quilates, el corte y la claridad.


Paso 1: Cargar librerías y datos

# Instalar dplyr si no está presente
if (!require(dplyr)) install.packages("dplyr")

library(ggplot2)
library(dplyr)

# Cargar dataset incorporado
data("diamonds")

Paso 2: Dispersión entre precio y quilates

ggplot(diamonds, aes(x = carat, y = price)) +
  geom_point(color = "blue", alpha = 0.3) +
  labs(title = "Relación entre Quilates y Precio",
       x = "Quilates (carat)", y = "Precio (USD)")


Paso 3: Precio vs Quilates por calidad del corte

ggplot(diamonds, aes(x = carat, y = price, color = cut)) +
  geom_point(size = 1.2, alpha = 0.4) +
  labs(title = "Precio vs Quilates según Calidad del Corte",
       x = "Quilates (carat)", y = "Precio (USD)", color = "Corte")


Paso 4: Distribución del precio por claridad

ggplot(diamonds, aes(x = clarity, y = price)) +
  geom_boxplot(fill = "orange") +
  labs(title = "Distribución del Precio por Claridad",
       x = "Claridad", y = "Precio (USD)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))


Paso 5: Histograma de precios

ggplot(diamonds, aes(x = price)) +
  geom_histogram(bins = 30, fill = "green", color = "black") +
  labs(title = "Histograma de Precios de Diamantes",
       x = "Precio (USD)", y = "Frecuencia") +
  theme_minimal()


Paso 6: Precio promedio por quilate

diamonds_avg <- diamonds %>%
  group_by(carat) %>%
  summarise(mean_price = mean(price), .groups = "drop")

ggplot(diamonds_avg, aes(x = carat, y = mean_price)) +
  geom_line(color = "blue") +
  labs(title = "Precio Promedio por Quilate",
       x = "Quilates (carat)", y = "Precio Promedio (USD)") +
  theme_minimal()


Conclusión

En este análisis visual pudimos:

  • Explorar la relación entre precio y quilates, la variable más influyente.
  • Comparar precios por corte y claridad, observando diferencias relevantes.
  • Analizar la distribución de precios.
  • Observar cómo varía el precio promedio a lo largo del peso en quilates.

Este tipo de exploración es útil como paso previo para aplicar modelos predictivos o clasificaciones más complejas.