Introducción

Este documento demuestra cómo crear diferentes tipos de gráficos en R utilizando el paquete ggplot2 con el conjunto de datos diamonds. También se incluye manipulación de datos con dplyr.


Gráfico de Dispersión

El siguiente gráfico de dispersión muestra la relación entre el peso en quilates (carat) y el precio (price) de los diamantes.

ggplot(diamonds, aes(x = carat, y = price)) + 
  geom_point() +
  labs(title = "Consumo vs Precio", x = "Quilates", y = "Precio")

Conclusión: A mayor cantidad de quilates, el precio del diamante tiende a ser más alto, aunque hay una gran dispersión en los precios para un mismo valor de quilates.


Gráfico de Dispersión con Color por Calidad de Corte

Aquí se visualiza la misma relación, pero diferenciando los puntos por la calidad del corte (cut), lo que permite observar patrones según dicha categoría.

ggplot(diamonds, aes(x = carat, y = price, color = as.factor(cut))) +
  geom_point(size = 1.5) +
  labs(title = "Calidad de Corte según Precio",
       x = "Quilates", y = "Precio", color = "Calidad de Corte")

Conclusión: Los diamantes con cortes de mejor calidad tienden a tener precios más altos. La calidad del corte influye directamente en el precio.


Boxplot de Precio por Claridad

Este boxplot muestra cómo varía el precio de los diamantes según su claridad (clarity).

ggplot(diamonds, aes(x = as.factor(clarity), y = price)) +
  geom_boxplot(fill = "orange") +
  labs(title = "Precio por Claridad",
       x = "Claridad", y = "Precio") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Conclusión: Los diamantes con mejor claridad no siempre tienen el precio más alto, pero hay una tendencia de mayor precio en los valores intermedios de claridad.


Histograma de Precios

A continuación se presenta un histograma de la variable price, que muestra cómo se distribuyen los precios de los diamantes.

ggplot(diamonds, aes(x = price)) +
  geom_histogram(bins = 30, fill = "green", color = "black") +
  labs(title = "Histograma de Precios",
       x = "Precio", y = "Cantidad")

Conclusión: La mayoría de los diamantes tienen precios en el rango bajo a medio, con pocos diamantes de precios extremadamente altos.


Gráfico de Líneas del Precio Promedio por Quilate

Finalmente, agrupamos los datos por carat y calculamos el precio promedio. Luego, se representa esta relación mediante un gráfico de líneas.

precio_promedio <- diamonds %>%
  group_by(carat) %>%
  summarise(promedio_precio = mean(price))

ggplot(precio_promedio, aes(x = carat, y = promedio_precio)) +
  geom_line(color = "red") +
  labs(title = "Precio Promedio por Quilate",
       x = "Quilate", y = "Precio Promedio")

Conclusión: Existe una relación creciente entre los quilates y el precio promedio, mostrando que a medida que aumenta el peso del diamante, también lo hace su valor medio.