Introducción

Este documento presenta los principales tipos de gráficos en R utilizando tanto las funciones base como el paquete ggplot2. Se incluye una breve definición, explicación de cuándo se utiliza cada gráfico y ejemplos con variables.

Gráficos en R Base

1. Gráfico de Dispersión (Scatter Plot)

Definición: Representa la relación entre dos variables numéricas.
Uso: Para observar correlaciones o patrones entre dos conjuntos de datos.

altura <- c(160, 165, 170, 175, 180)
peso <- c(55, 60, 65, 72, 80)
plot(altura, peso,
     main = "Altura vs Peso",
     xlab = "Altura (cm)",
     ylab = "Peso (kg)",
     col = "blue",
     pch = 19)

2. Gráfico de Líneas

Definición: Conecta puntos de datos con líneas.
Uso: Ideal para representar datos secuenciales, como series de tiempo.

dias <- 1:7
ventas <- c(200, 250, 300, 280, 310, 400, 380)
plot(dias, ventas, type = "o",
     main = "Ventas durante la semana",
     xlab = "Día",
     ylab = "Ventas ($)",
     col = "green")

3. Gráfico de Barras

Definición: Representa cantidades mediante barras.
Uso: Comparar frecuencias o cantidades entre distintas categorías.

frutas <- c("Manzana", "Banana", "Pera", "Uva")
ventas <- c(30, 45, 25, 50)
barplot(ventas, names.arg = frutas,
        main = "Ventas por tipo de fruta",
        col = "orange",
        ylab = "Cantidad")

4. Histograma

Definición: Muestra la distribución de una variable numérica dividiéndola en intervalos.
Uso: Analizar la frecuencia de valores dentro de rangos específicos.

edades <- c(18, 22, 21, 25, 20, 22, 24, 26, 28, 22, 23)
hist(edades,
     main = "Distribución de edades",
     xlab = "Edad",
     col = "skyblue",
     border = "black")

5. Diagrama de Caja (Boxplot)

Definición: Visualiza los cuartiles, la mediana y los valores atípicos.
Uso: Comparar distribuciones y detectar outliers.

edades <- c(18, 22, 21, 25, 20, 22, 24, 26, 28, 22, 23, 40)
boxplot(edades,
        main = "Boxplot de edades",
        ylab = "Edad",
        col = "pink")

6. Gráfico de Pastel (Pie Chart)

Definición: Representa proporciones de un total en sectores circulares.
Uso: Visualizar porcentajes o proporciones.

categorias <- c("Aprobados", "Reprobados", "Retirados")
valores <- c(50, 30, 20)
pie(valores, labels = categorias,
    main = "Resultados de los estudiantes",
    col = c("green", "red", "yellow"))

7. Barras Apiladas

Definición: Muestra partes de un todo por categoría.
Uso: Comparar composición dentro de cada grupo.

ventas <- matrix(c(10, 15, 20, 8, 12, 18), nrow = 2, byrow = TRUE)
colnames(ventas) <- c("Ene", "Feb", "Mar")
rownames(ventas) <- c("Producto A", "Producto B")
barplot(ventas,
        beside = FALSE,
        main = "Ventas mensuales por producto",
        col = c("blue", "red"),
        legend = rownames(ventas))

8. Barras Lado a Lado (agrupadas)

Definición: Muestra categorías agrupadas por subcategorías.
Uso: Comparar varias variables entre grupos.

barplot(ventas,
        beside = TRUE,
        main = "Ventas mensuales por producto",
        col = c("blue", "red"),
        legend = rownames(ventas))

Gráficos con ggplot2

ggplot2 es un sistema de gráficos más avanzado y personalizable en R.
Primero, carga el paquete:

# install.packages("ggplot2")  # Descomenta si es la primera vez
library(ggplot2)

Ejemplo: Gráfico de Dispersión

datos <- data.frame(
  altura = c(160, 165, 170, 175, 180),
  peso = c(55, 60, 65, 72, 80)
)

ggplot(datos, aes(x = altura, y = peso)) +
  geom_point(color = "blue") +
  ggtitle("Altura vs Peso") +
  xlab("Altura (cm)") +
  ylab("Peso (kg)")

Ejemplo: Gráfico de Barras

datos_fruta <- data.frame(
  fruta = c("Manzana", "Banana", "Pera", "Uva"),
  ventas = c(30, 45, 25, 50)
)

ggplot(datos_fruta, aes(x = fruta, y = ventas, fill = fruta)) +
  geom_bar(stat = "identity") +
  ggtitle("Ventas por tipo de fruta")