_________________________________________________________________________________________________________________________
La etapa de visualización de datos en el flujo de trabajo de un proyecto en R es fundamental para la interpretación y comunicación efectiva de los resultados del anÔlisis. En esta fase, se utilizan herramientas como ggplot2 para crear grÔficos y visualizaciones que permiten explorar y resaltar patrones, tendencias y relaciones en los datos.
La visualización no solo facilita la identificación de hallazgos importantes, sino que también ayuda a comunicar estos resultados a audiencias diversas. AdemÔs, enriquece el anÔlisis y asegura que los resultados sean accesibles y comprensibles, lo que es esencial para la toma de decisiones informadas y basadas en evidencia en cualquier proyecto.
## āā Attaching core tidyverse packages āāāāāāāāāāāāāāāāāāāāāāāā tidyverse 2.0.0 āā
## ā dplyr 1.1.4 ā readr 2.1.5
## ā forcats 1.0.0 ā stringr 1.5.1
## ā ggplot2 3.5.1 ā tibble 3.2.1
## ā lubridate 1.9.3 ā tidyr 1.3.1
## ā purrr 1.0.2
## āā Conflicts āāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāā tidyverse_conflicts() āā
## ā dplyr::filter() masks stats::filter()
## ā dplyr::lag() masks stats::lag()
## ā¹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
ggplot2 es un paquete de R ampliamente utilizado para la creación de grĆ”ficos estadĆsticos, basado en la gramĆ”tica de grĆ”ficos propuesta por Leland Wilkinson. Su enfoque modular permite a los usuarios construir grĆ”ficos a partir de capas. Esta estructura hace que ggplot2 sea altamente flexible y capaz de generar desde grĆ”ficos simples hasta visualizaciones complejas y personalizadas.
El aprendizaje de este paquete del tidyverse, proporciona una herramienta poderosa para comunicar resultados de manera visual, lo que facilita la comprensión y exploración de patrones, tendencias y relaciones dentro de los datos. AdemĆ”s, su capacidad de crear grĆ”ficos reproducibles y estĆ©ticamente agradables es fundamental para la presentación cientĆfica, la elaboración de informes y la enseƱanza de conceptos estadĆsticos.
Los grĆ”ficos elaborados con ggplot2 se construyen de manera modular a travĆ©s de capas, lo que permite una flexibilidad y personalización excepcionales en la visualización de datos. El proceso comienza con la capa de datos y estĆ©tica, donde se definen las variables que se mapearĆ”n a los ejes y otras propiedades visuales, como el color o el tamaƱo. Luego, se aƱaden capas de geometrĆa (geoms), que determinan el tipo de grĆ”fico, como puntos (geom_point), lĆneas (geom_line) o barras (geom_bar).
Adicionalmente, se pueden incluir capas para modificar escalas, ejes, facetas y temas, lo que permite ajustar detalles como la leyenda, los rótulos o el estilo grÔfico general.
Las principales capas son:
A continuación veremos como crear grÔficos en R con
ggplot2:
Son los atributos estƩticos. La estƩtica incluye el tamaƱo, la forma o el color de los puntos.
Los argumentos de aes() mƔs importantes son:
x: posición x (eje x), es la distancia horizontal.
y: posición y (Eje y).
colour: color.
size: tamaƱo.
alpha: controla la transparecia de los puntos. Valores acercanos a ā1ā indican mayor opacidad mientras que los valores cercanos a ā0ā mayor transparencia.
shape: estƩtica que controla la forma de los puntos.
fill: para el color de relleno de las formas sólidas como barras, etc.
Indican el tipo de grĆ”fico a elaborar con los datos y las estĆ©ticas elegidas. Existen varias opciones de āgeomsā y dependeran del tipo y cantidad de variables con el que se esta trabajando.
histograma: (geom_histogram)
point: (geom_point)
lines: geom_line()
bar: (geom_bar)
boxplot: (geom_boxplot)
El facetado permite dividir un grÔfico en múltiples grÔficos basado en un factor incluido en el conjunto de datos.
# La variable ESPECIES estĆ” ubicada antes del sĆmbolo "~."
# Indica que los paneles se organizan en filas.
# Cada fila representarƔ una especie diferente, mientras que las columnas permanecerƔn invariables.
ggplot(data = iris.es, aes(x = LONG.PETALOS, y = ANCHO.PETALOS)) +
geom_point() +
facet_grid(ESPECIES ~.)# La variable ESPECIES estĆ” despuĆ©s del sĆmbolo ".~"
# Indica que los paneles se organizarƔn en columnas.
# Cada columna representarƔ una especie diferente, mientras que las filas permanecerƔn constantes.
ggplot(data = iris.es, aes(x = LONG.PETALOS, y = ANCHO.PETALOS)) +
geom_point() +
facet_grid(.~ ESPECIES)
Un tema es una colección de elementos que indican aspectos estéticos del grÔfico.
Con los temas podemos agregar ejes, etiquetas, colores de fondo, tamaƱo de mƔrgenes, entre otros.
Los temas no afectan la forma en que los āgeomsā presentan los datos o como se transforman mediante las escalas.
El tema por defecto que usa ggplot2 es theme_gray()
# GrƔfico de puntos con theme_dark
ggplot(iris.es,aes(LONG.PETALOS, ANCHO.PETALOS)) +
geom_point() +
theme_dark() # GrƔfico de puntos con theme_classic
ggplot(iris.es, aes(LONG.PETALOS, ANCHO.PETALOS)) +
geom_point() +
theme_classic()