DESCRIPCION ACERCA DE LA PRACTICA

En esta práctica se resuelven ejercicios de visualización de datos utilizando el dataset diamonds del paquete ggplot2. Se emplean diferentes tipos de gráficos para explorar la relación entre el precio, los quilates, la claridad y la calidad del corte de los diamantes.

Librerias a utilizar

knitr::opts_chunk$set(echo = TRUE)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
data(diamonds)

Paso 1: Dispersión entre precio y quilates

Gráfico de dispersión entre carat y price, con puntos azules.

  ggplot(data = diamonds, aes(x = carat, y = price)) +
  geom_point(color = "blue") +
  ggtitle("Relación entre precio y quilates (muestra de 1000)")

Paso 2: Colorear por calidad del corte

Gráfico de dispersión anterior, pero coloreado por cut, con tamaño 1.5

  ggplot(data = diamonds, aes(x = carat, y = price, color = cut)) +
  geom_point(size = 1.5) +
  ggtitle("Precio vs Quilates según Calidad del Corte (muestra de 1000)")

Paso 3: Boxplot del precio por claridad

Boxplot de price por clarity, con color naranja y etiquetas giradas.

  ggplot(data = diamonds, aes(x = clarity, y = price)) +
  geom_boxplot(fill = "orange") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  ggtitle("Boxplot del Precio por Claridad")

Paso 4: Histograma de precios

Histograma de precios con 30 bins de color verde con bordes negros

  ggplot(data = diamonds, aes(x = price)) +
  geom_histogram(bins = 30, fill = "green", color = "black") +
  ggtitle("Histograma de Precios de Diamantes")

Paso 5: Gráfico de líneas de precio promedio por quilate

Promedio de precio por quilate agrupado y graficado con líneas.

  carat_avg_price <- diamonds %>%
  group_by(carat) %>%
  summarise(avg_price = mean(price))

ggplot(data = carat_avg_price, aes(x = carat, y = avg_price)) +
  geom_line() +
  ggtitle("Precio Promedio por Quilate")