Guía Rápida: El Gráfico Ideal Según tus Datos en R

Elegir el gráfico correcto define el éxito de tu análisis. R permite crear visualizaciones potentes con pocas líneas de código. Descubre qué gráfico usar según tus datos y cómo programarlo con el paquete base de R.

1. Una Variable Numérica

Usa estos gráficos para ver cómo se distribuyen tus datos cuantitativos de forma individual.

Histograma

  • Cuándo usarlo: Ver la forma, el centro y la dispersión de un grupo de datos continuo.

  • Ejemplo: Distribución de salarios en una empresa.

# Datos de ejemplo
valores <- rnorm(100, mean = 50, sd = 10)

# Código en R
hist(valores, 
     main = "Distribución de Valores", 
     xlab = "Rango de Valores", 
     ylab = "Frecuencia", 
     col = "lightblue")

Diagrama de Caja (Boxplot)

  • Cuándo usarlo: Identificar valores atípicos (outliers) y ver la simetría de los datos.

  • Ejemplo: Edades de los usuarios de una aplicación.

# Código en R
boxplot(valores, 
        main = "Detección de Atípicos", 
        ylab = "Valores", 
        col = "tomato")

2. Una Variable Categórica

Ideal para mostrar frecuencias de texto, etiquetas, meses o clasificaciones.

Gráfico de Barras

  • Cuándo usarlo: Comparar cantidades entre diferentes categorías separadas.

  • Ejemplo nº 1: Cantidad de ventas por tipo de producto.

    # Datos de ejemplo
    categorias <- table(c("A", "B", "A", "C", "B", "A", "A"))
    
    # Código en R
    barplot(categorias, 
            main = "Ventas por Categoría", 
            xlab = "Categorías", 
            ylab = "Total", 
            col = "lightgreen")

3. Dos Variables Numéricas

Utiliza estos métodos si buscas entender la relación entre dos métricas distintas.

Gráfico de Dispersión (Scatter Plot)

  • Cuándo usarlo: Buscar correlaciones, tendencias o patrones entre dos variables numéricas.

  • Ejemplo: Relación entre horas de estudio y nota del examen.

# Datos de ejemplo
horas <- c(2, 4, 6, 8, 10)
notas <- c(5, 6, 7, 9, 10)

# Código en R
plot(horas, notas, 
     main = "Horas vs Notas", 
     xlab = "Horas de Estudio", 
     ylab = "Calificación", 
     pch = 19, 
     col = "purple")

Gráfico de Líneas

  • Cuándo usarlo: Mostrar la evolución de una variable a lo largo del tiempo.

  • Ejemplo: Evolución del precio de una acción durante una semana.

# Datos de ejemplo
dias <- 1:5
precio <- c(100, 105, 102, 110, 115)

# Código en R
plot(dias, precio, 
     type = "b", 
     main = "Evolución de Precio", 
     xlab = "Días", 
     ylab = "Precio ($)", 
     col = "blue", 
     lwd = 2)

4. Variable Numérica por Categoría

Boxplot Comparativo

  • Cuándo usarlo: Comparar el comportamiento de una métrica entre diferentes grupos.

  • Ejemplo: Rendimiento de combustible por tipo de automóvil.

# Datos de ejemplo
rendimiento <- c(15, 18, 12, 25, 28, 22)
motor <- c("V6", "V6", "V6", "I4", "I4", "I4")

# Código en R
boxplot(rendimiento ~ motor, 
        main = "Rendimiento por Tipo de Motor", 
        xlab = "Motor", 
        ylab = "Km por Litro", 
        col = c("gold", "cyan"))

Conclusión

El paquete básico de R ofrece herramientas rápidas para explorar datos sin instalar librerías extra. El truco está en mirar tu hoja de datos, contar las variables y elegir la función adecuada.