Introducción

Este documento presenta cinco visualizaciones del dataset diamonds utilizando ggplot2 es para crear graficos y dplyr libreria es para manipular y analizar datos de manera eficiente en R.

Cada gráfico explora diferentes aspectos de los datos, como la relación entre precio y quilates, la influencia del corte, la distribución de precios por claridad y más. A continuación, se muestra cada gráfico junto con una breve explicación.

Ejercicio 1: Dispersión entre precio y quilates

ggplot(data = diamonds, aes(x = carat, y = price)) +
  geom_point(color = "orange")

Explicación: Este gráfico de dispersión muestra la relación entre el peso de los diamantes (carat) y su precio (price). Los puntos azules indican que, en general, a mayor peso en quilates, el precio tiende a aumentar, aunque hay variabilidad en los precios para un mismo peso.

Ejercicio 2: Colorear por calidad del corte

ggplot(data = diamonds, aes(x = carat, y = price, color = cut)) +
  geom_point(size = 1.5) +
  ggtitle("Relación entre precio y quilates según el corte")

Explicación: Este gráfico extiende el anterior al colorear los puntos según la calidad del corte (cut). Los colores diferenciados revelan que los diamantes con cortes de mayor calidad (como “Ideal”) tienden a tener precios más altos para un mismo peso en quilates, aunque la relación no es estrictamente lineal.

Ejercicio 3: Boxplot del precio por claridad

ggplot(data = diamonds, aes(x = clarity, y = price)) +
  geom_boxplot(fill = "brown") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Explicación: Este boxplot muestra la distribución de los precios para cada nivel de claridad (clarity). Las cajas naranjas indican que los diamantes con mayor claridad (como IF o VVS1) no siempre tienen los precios más altos, ya que otros factores, como el peso, influyen significativamente. La rotación de las etiquetas mejora la legibilidad.

Ejercicio 4: Histograma de precios

ggplot(data = diamonds, aes(x = price)) +
  geom_histogram(bins = 30, fill = "blue", color = "black")

Explicación: Este histograma representa la distribución de los precios de los diamantes. Las barras verdes con bordes negros muestran que la mayoría de los diamantes tienen precios bajos (menores a $5,000), con una cola larga hacia precios más altos, lo que indica una distribución sesgada a la derecha.

Ejercicio 5: Gráfico de líneas de precio promedio por quilate

avg_price_by_carat <- diamonds %>%
  group_by(carat) %>%
  summarise(mean_price = mean(price))

ggplot(data = avg_price_by_carat, aes(x = carat, y = mean_price)) +
  geom_line() +
  labs(x = "Quilate", y = "Precio Promedio")

Explicación: Este gráfico de líneas muestra el precio promedio de los diamantes para cada valor de carat. La línea indica una tendencia general de aumento en el precio promedio a medida que aumenta el peso en quilates, aunque hay fluctuaciones debido a la variabilidad en otros factores como el corte o la claridad.