_________________________________________________________________________________________________________________________

1 Visualizar los datos

La etapa de visualización de datos en el flujo de trabajo de un proyecto en R es fundamental para la interpretación y comunicación efectiva de los resultados del anÔlisis. En esta fase, se utilizan herramientas como ggplot2 para crear grÔficos y visualizaciones que permiten explorar y resaltar patrones, tendencias y relaciones en los datos.

La visualización no solo facilita la identificación de hallazgos importantes, sino que también ayuda a comunicar estos resultados a audiencias diversas. AdemÔs, enriquece el anÔlisis y asegura que los resultados sean accesibles y comprensibles, lo que es esencial para la toma de decisiones informadas y basadas en evidencia en cualquier proyecto.



2 Cargamos paquetes

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## āœ” dplyr     1.1.4     āœ” readr     2.1.5
## āœ” forcats   1.0.0     āœ” stringr   1.5.1
## āœ” ggplot2   3.5.1     āœ” tibble    3.2.1
## āœ” lubridate 1.9.3     āœ” tidyr     1.3.1
## āœ” purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## āœ– dplyr::filter() masks stats::filter()
## āœ– dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

3 Cargamos la base de datos

iris.es <- iris %>% 
  rename(LONG.SEPALOS = Sepal.Length , 
         ANCHO.SEPALOS = Sepal.Width ,
         LONG.PETALOS = Petal.Length,
         ANCHO.PETALOS = Petal.Width,
         ESPECIES = Species)

4 El paquete ggplot2

logo

ggplot2 es un paquete de R ampliamente utilizado para la creación de grÔficos estadísticos, basado en la gramÔtica de grÔficos propuesta por Leland Wilkinson. Su enfoque modular permite a los usuarios construir grÔficos a partir de capas. Esta estructura hace que ggplot2 sea altamente flexible y capaz de generar desde grÔficos simples hasta visualizaciones complejas y personalizadas.

El aprendizaje de este paquete del tidyverse, proporciona una herramienta poderosa para comunicar resultados de manera visual, lo que facilita la comprensión y exploración de patrones, tendencias y relaciones dentro de los datos. AdemÔs, su capacidad de crear grÔficos reproducibles y estéticamente agradables es fundamental para la presentación científica, la elaboración de informes y la enseñanza de conceptos estadísticos.


5 Capas

Los grÔficos elaborados con ggplot2 se construyen de manera modular a través de capas, lo que permite una flexibilidad y personalización excepcionales en la visualización de datos. El proceso comienza con la capa de datos y estética, donde se definen las variables que se mapearÔn a los ejes y otras propiedades visuales, como el color o el tamaño. Luego, se añaden capas de geometría (geoms), que determinan el tipo de grÔfico, como puntos (geom_point), líneas (geom_line) o barras (geom_bar).

Adicionalmente, se pueden incluir capas para modificar escalas, ejes, facetas y temas, lo que permite ajustar detalles como la leyenda, los rótulos o el estilo grÔfico general.



Las principales capas son:

  1. La base de datos (data): el conjunto de datos que contiene las variables de interƩs.
  2. Las estƩticas (aes)
  3. Las capas o geomas (geoms)
  4. Las facetas (facet)
  5. Los temas (themes)

A continuación veremos como crear grÔficos en R con ggplot2:


5.1 El lienzo

ggplot()

5.1.1 La estƩtica (aesthetics)

Son los atributos estƩticos. La estƩtica incluye el tamaƱo, la forma o el color de los puntos.

Los argumentos de aes() mƔs importantes son:

  • x: posición x (eje x), es la distancia horizontal.

  • y: posición y (Eje y).

  • colour: color.

  • size: tamaƱo.

  • alpha: controla la transparecia de los puntos. Valores acercanos a ā€œ1ā€ indican mayor opacidad mientras que los valores cercanos a ā€œ0ā€ mayor transparencia.

  • shape: estĆ©tica que controla la forma de los puntos.

  • fill: para el color de relleno de las formas sólidas como barras, etc.

ggplot(iris.es, aes(x = LONG.PETALOS, y = ANCHO.PETALOS))


5.2 La geometrĆ­a (geometries)

Indican el tipo de grĆ”fico a elaborar con los datos y las estĆ©ticas elegidas. Existen varias opciones de ā€œgeomsā€ y dependeran del tipo y cantidad de variables con el que se esta trabajando.

  • histograma: (geom_histogram)

  • point: (geom_point)

  • lines: geom_line()

  • bar: (geom_bar)

  • boxplot: (geom_boxplot)

ggplot(data = iris.es, aes(x = LONG.PETALOS, y = ANCHO.PETALOS)) +
  geom_point() 


5.3 El facetado (facets)

El facetado permite dividir un grÔfico en múltiples grÔficos basado en un factor incluido en el conjunto de datos.

# La variable ESPECIES estĆ” ubicada antes del sĆ­mbolo "~." 
# Indica que los paneles se organizan en filas. 
# Cada fila representarƔ una especie diferente, mientras que las columnas permanecerƔn invariables.
ggplot(data = iris.es, aes(x = LONG.PETALOS, y = ANCHO.PETALOS)) +
  geom_point() +
  facet_grid(ESPECIES ~.)

# La variable ESPECIES estƔ despuƩs del sƭmbolo ".~" 
# Indica que los paneles se organizarƔn en columnas. 
# Cada columna representarƔ una especie diferente, mientras que las filas permanecerƔn constantes.
ggplot(data = iris.es, aes(x = LONG.PETALOS, y = ANCHO.PETALOS)) +
  geom_point() +
  facet_grid(.~ ESPECIES)


5.4 El tema (themes)

Un tema es una colección de elementos que indican aspectos estéticos del grÔfico.

  • Con los temas podemos agregar ejes, etiquetas, colores de fondo, tamaƱo de mĆ”rgenes, entre otros.

  • Los temas no afectan la forma en que los ā€œgeomsā€ presentan los datos o como se transforman mediante las escalas.

  • El tema por defecto que usa ggplot2 es theme_gray()

# GrƔfico de puntos con theme_dark
ggplot(iris.es,aes(LONG.PETALOS, ANCHO.PETALOS)) +
  geom_point() + 
  theme_dark() 

# GrƔfico de puntos con theme_classic
ggplot(iris.es, aes(LONG.PETALOS, ANCHO.PETALOS)) +
  geom_point() + 
  theme_classic()


6 Combinación de capas

ggplot(iris.es, aes(LONG.PETALOS, ANCHO.PETALOS, colour = ESPECIES)) +
  geom_point() +
  facet_grid(.~ ESPECIES) +
  theme_gray()


7 Bibliografƭa y Sitios de interƩs