Introducción

Este documento muestra cómo visualizar los datos del dataset de pingüinos usando diversos tipos de gráficos. Utilizaremos el paquete ggplot2 para la visualización.

Paso 1: Cargar los Paquetes y Datos

  • Primero, cargamos los paquetes necesarios y el dataset de pingüinos.
# Instalar y cargar los paquetes necesarios

library(palmerpenguins)
library(ggplot2)
library(GGally)
library(dplyr)
library(tidyr)
library(palmerpenguins)


# Cargar el dataset de pingüinos
data("penguins")

# Limpiar los datos eliminando los valores faltantes
penguins_clean <- penguins %>%
  drop_na()

Gráfico 1: Histograma

  • Un histograma muestra la distribución de una variable continua. Vamos a visualizar la distribución de la masa corporal de los pingüinos.
# Histograma de la masa corporal
ggplot(penguins_clean, aes(x = body_mass_g, fill = species)) +
  geom_histogram(binwidth = 200, color = "black", alpha = 0.7) +
  labs(title = "Histograma de la Masa Corporal", x = "Masa Corporal (g)", y = "Frecuencia") +
  theme_minimal()

Gráfico 2: Gráfico de Barras

  • Los gráficos de barras se utilizan para mostrar la frecuencia de categorías. Aquí visualizamos cuántos pingüinos hay en cada especie.
# Gráfico de barras de las especies
ggplot(penguins_clean, aes(x = species, fill = species)) +
  geom_bar() +
  labs(title = "Número de Pingüinos por Especie", x = "Especie", y = "Conteo") +
  theme_minimal()

Gráfico 3: Gráfico de Dispersión

  • Un gráfico de dispersión muestra la relación entre dos variables continuas. Aquí visualizamos la relación entre la longitud del pico y la profundidad del pico.
# Gráfico de dispersión entre longitud y profundidad del pico
ggplot(penguins_clean, aes(x = bill_length_mm, y = bill_depth_mm, color = species)) +
  geom_point() +
  labs(title = "Gráfico de Dispersión de Longitud vs. Profundidad del Pico", x = "Longitud del Pico (mm)", y = "Profundidad del Pico (mm)") +
  theme_minimal()

Gráfico 4: Gráfico de Cajas (Boxplot)

  • Un gráfico de cajas es útil para visualizar la distribución y los posibles valores atípicos en diferentes grupos. Aquí comparamos la masa corporal entre las especies de pingüinos.
# Boxplot de la masa corporal por especie
ggplot(penguins_clean, aes(x = species, y = body_mass_g, fill = species)) +
  geom_boxplot() +
  labs(title = "Boxplot de la Masa Corporal por Especie", x = "Especie", y = "Masa Corporal (g)") +
  theme_minimal()

Gráfico 5: Gráfico de Violín

  • El gráfico de violín combina aspectos de un gráfico de caja y un gráfico de densidad, lo que permite ver la distribución de los datos de manera más detallada.
# Gráfico de violín de la masa corporal por especie
ggplot(penguins_clean, aes(x = species, y = body_mass_g, fill = species)) +
  geom_violin(trim = FALSE) +
  labs(title = "Gráfico de Violín de la Masa Corporal por Especie", x = "Especie", y = "Masa Corporal (g)") +
  theme_minimal()

Gráfico 6: Gráfico de Pares

  • Un gráfico de pares es útil para visualizar las relaciones entre varias variables numéricas. Aquí comparamos varias medidas físicas entre las especies de pingüinos.
# Gráfico de pares para las variables numéricas
ggpairs(penguins_clean, columns = 3:6, aes(color = species)) +
  labs(title = "Gráfico de Pares de las Variables Físicas")

Gráfico 7: Gráfico de Densidad

  • Un gráfico de densidad es similar a un histograma, pero suaviza la distribución de los datos. Aquí visualizamos la densidad de la masa corporal.
# Gráfico de densidad de la masa corporal por especie
ggplot(penguins_clean, aes(x = body_mass_g, fill = species)) +
  geom_density(alpha = 0.7) +
  labs(title = "Gráfico de Densidad de la Masa Corporal", x = "Masa Corporal (g)", y = "Densidad") +
  theme_minimal()