Este documento demuestra cómo crear diferentes tipos de gráficos en R
utilizando el paquete ggplot2
con el conjunto de datos
diamonds
. También se incluye manipulación de datos con
dplyr
.
El siguiente gráfico de dispersión muestra la relación entre el peso
en quilates (carat
) y el precio (price
) de los
diamantes.
ggplot(diamonds, aes(x = carat, y = price)) +
geom_point() +
labs(title = "Consumo vs Precio", x = "Quilates", y = "Precio")
Conclusión: A mayor cantidad de quilates, el precio del diamante tiende a ser más alto, aunque hay una gran dispersión en los precios para un mismo valor de quilates.
Aquí se visualiza la misma relación, pero diferenciando los puntos
por la calidad del corte (cut
), lo que permite observar
patrones según dicha categoría.
ggplot(diamonds, aes(x = carat, y = price, color = as.factor(cut))) +
geom_point(size = 1.5) +
labs(title = "Calidad de Corte según Precio",
x = "Quilates", y = "Precio", color = "Calidad de Corte")
Conclusión: Los diamantes con cortes de mejor calidad tienden a tener precios más altos. La calidad del corte influye directamente en el precio.
Este boxplot muestra cómo varía el precio de los diamantes según su
claridad (clarity
).
ggplot(diamonds, aes(x = as.factor(clarity), y = price)) +
geom_boxplot(fill = "orange") +
labs(title = "Precio por Claridad",
x = "Claridad", y = "Precio") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Conclusión: Los diamantes con mejor claridad no siempre tienen el precio más alto, pero hay una tendencia de mayor precio en los valores intermedios de claridad.
A continuación se presenta un histograma de la variable
price
, que muestra cómo se distribuyen los precios de los
diamantes.
ggplot(diamonds, aes(x = price)) +
geom_histogram(bins = 30, fill = "green", color = "black") +
labs(title = "Histograma de Precios",
x = "Precio", y = "Cantidad")
Conclusión: La mayoría de los diamantes tienen precios en el rango bajo a medio, con pocos diamantes de precios extremadamente altos.
Finalmente, agrupamos los datos por carat
y calculamos
el precio promedio. Luego, se representa esta relación mediante un
gráfico de líneas.
precio_promedio <- diamonds %>%
group_by(carat) %>%
summarise(promedio_precio = mean(price))
ggplot(precio_promedio, aes(x = carat, y = promedio_precio)) +
geom_line(color = "red") +
labs(title = "Precio Promedio por Quilate",
x = "Quilate", y = "Precio Promedio")
Conclusión: Existe una relación creciente entre los quilates y el precio promedio, mostrando que a medida que aumenta el peso del diamante, también lo hace su valor medio.