Este documento presenta cinco visualizaciones del dataset
diamonds utilizando ggplot2 es para crear
graficos y dplyr libreria es para manipular y analizar
datos de manera eficiente en R.
ggplot2dplyrdiamondsCada gráfico explora diferentes aspectos de los datos, como la relación entre precio y quilates, la influencia del corte, la distribución de precios por claridad y más. A continuación, se muestra cada gráfico junto con una breve explicación.
ggplot(data = diamonds, aes(x = carat, y = price)) +
geom_point(color = "orange")
Explicación: Este gráfico de dispersión muestra la
relación entre el peso de los diamantes (carat) y su precio
(price). Los puntos azules indican que, en general, a mayor
peso en quilates, el precio tiende a aumentar, aunque hay variabilidad
en los precios para un mismo peso.
ggplot(data = diamonds, aes(x = carat, y = price, color = cut)) +
geom_point(size = 1.5) +
ggtitle("Relación entre precio y quilates según el corte")
Explicación: Este gráfico extiende el anterior al
colorear los puntos según la calidad del corte (cut). Los
colores diferenciados revelan que los diamantes con cortes de mayor
calidad (como “Ideal”) tienden a tener precios más altos para un mismo
peso en quilates, aunque la relación no es estrictamente lineal.
ggplot(data = diamonds, aes(x = clarity, y = price)) +
geom_boxplot(fill = "brown") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Explicación: Este boxplot muestra la distribución de
los precios para cada nivel de claridad (clarity). Las
cajas naranjas indican que los diamantes con mayor claridad (como IF o
VVS1) no siempre tienen los precios más altos, ya que otros factores,
como el peso, influyen significativamente. La rotación de las etiquetas
mejora la legibilidad.
ggplot(data = diamonds, aes(x = price)) +
geom_histogram(bins = 30, fill = "blue", color = "black")
Explicación: Este histograma representa la distribución de los precios de los diamantes. Las barras verdes con bordes negros muestran que la mayoría de los diamantes tienen precios bajos (menores a $5,000), con una cola larga hacia precios más altos, lo que indica una distribución sesgada a la derecha.
avg_price_by_carat <- diamonds %>%
group_by(carat) %>%
summarise(mean_price = mean(price))
ggplot(data = avg_price_by_carat, aes(x = carat, y = mean_price)) +
geom_line() +
labs(x = "Quilate", y = "Precio Promedio")
Explicación: Este gráfico de líneas muestra el
precio promedio de los diamantes para cada valor de carat.
La línea indica una tendencia general de aumento en el precio promedio a
medida que aumenta el peso en quilates, aunque hay fluctuaciones debido
a la variabilidad en otros factores como el corte o la claridad.