El siguiente documento es presentado por los siguientes alumnos del curso de Técnicas de exploración de Datos de la Universidad Nacional Agraria la Molina, Perú
El paquete tiene dos objetivos. Primero, proporciona un tema base que se centra en los elementos tipográficos, incluido dónde se colocan varias etiquetas, así como las fuentes que se utilizan. El segundo objetivo se centra en la productividad para un flujo de trabajo de producción. Un “flujo de trabajo de producción” es cuando tiene la intención de que la salida de su trabajo se coloque en una publicación de algún tipo, ya sea una publicación de blog, un documento académico, una presentación, un informe interno o una publicación de la industria.
Personalizar gráficos: Con la biblioteca HRBRthemes, puedes personalizar tus gráficos utilizando diferentes paletas de colores, estilos de fuente y opciones de diseño. Por ejemplo, puedes utilizar la paleta “Solarized Dark” y el estilo de fuente “Roboto” utilizando el siguiente código:
ggplot(data = iris, aes(x = Sepal.Length, y = Sepal.Width, color = Species)) +
geom_point(size = 3) +
scale_color_manual(values = c("#859900", "#268BD2", "#CB4B16")) +
labs(title = "Longitud y ancho de los sépalos de iris",
x = "Longitud del sépalo (cm)",
y = "Ancho del sépalo (cm)") +
theme_ipsum_rc(grid = "Y",
base_family = "Roboto")# Importar la fuenteEcosans
import_plex_sans()
# Utilizar la fuente en un gráfico
ggplot(datos) +
aes(x=antiguedad, y = edad, color=morosidad) +
geom_point(size=1,alpha=0.5)+
scale_color_ft()+
scale_x_continuous(breaks=seq(0,80,5)) +
scale_y_continuous(breaks=seq(0,70,5))+
theme_ipsum_es(base_family = "IBM Plex Sans",base_size=10.5)Ahora mostraremos un gráfico de caja que muestra la relación entre la
clase de vehículo, las millas por galón (mpg) y el fabricante del
vehículo. Cada caja representa la distribución de los valores de mpg
para una clase de vehículo determinada. La altura de la caja indica la
variación intercuartil de los datos, es decir, la distancia entre el
primer y el tercer cuartil. La línea dentro de la caja representa la
mediana de los datos. Los puntos que están fuera de las cajas
representan valores extremos. Utilizando el paquete HRBRTHEMES,
obtenemos una grafica mas agradable y con un estilo de fuente mas
presentable y profesional.
#importando patvhwork0
library(patchwork)
# Importar la fuente Roboto Condensed
import_econ_sans()
# Utilizar la fuente en un gráfico
ggplot(datos) +
aes(x=antiguedad, y = edad, color=morosidad) +
facet_wrap(morosidad) +
geom_density_2d() +
scale_y_continuous(limits = c(0,90), breaks = seq(0,90,10)) +
scale_x_percent(labels = scales::percent_format(scale = 1)) +
theme_modern_rc(base_family = "IBM Roboto Condensed") +
scale_color_ipsum() +
labs(x = "Antigüedad (0-63) % en años ",
title = "Riesgo de morosidad",
subtitle = "Grupo 6",
caption = "Profesor: Jesús Walter Salinas Flores") +
theme(legend.position = "bottom",
text = element_text(color = "#929299", face="bold"))ggplot(datos) +
aes(x=antiguedad, y = edad, color=morosidad) +
geom_density_2d() +
scale_y_continuous(limits = c(0,90), breaks = seq(0,90,10)) +
scale_x_percent(labels = scales::percent_format(scale = 1)) +
theme_ft_rc(base_family = "IBM Plex Sans") +
scale_color_ipsum() +
labs(x = "Antigüedad (0-63) % en años ",
y = "Edad (años)",
title = "Riesgo de morosidad",
subtitle = "Grupo 6",
caption = "Profesor: Jesús Walter Salinas Flores") +
theme(legend.position = "bottom",
text = element_text(color = "#929299", face="bold"))"mediante la densidad de puntos. Cada punto representa una observación y se representa en un plano cartesiano con la edad en el eje y y la antigüedad en el eje x. Los puntos se agrupan para formar regiones de alta densidad, lo que indica una mayor frecuencia de observaciones en esa región. "## [1] "mediante la densidad de puntos. Cada punto representa una observación y se representa en un plano cartesiano con la edad en el eje y y la antigüedad en el eje x. Los puntos se agrupan para formar regiones de alta densidad, lo que indica una mayor frecuencia de observaciones en esa región. "
Proporciona dos nuevos tipos de capas para mostrar datos de imagen como capas dentro del marco de la Gramática de los Gráficos. Muestra imágenes utilizando un interfaz de rectángulo, con un cuadro delimitador fijo, o una interfaz de punto usando un punto central y parámetro de tamaño general. Las imágenes se pueden dar como locales. Archivos JPEG o PNG, recursos externos o como una columna de lista que contiene datos de imagen de trama.
La capa es paresida al de geom_point, solo se le agrega img en la estetica(aes) en el cual ira las direcciones de las imagenes.
En el siguiente ejemplo en la lectura de imagenes agregamos una columna para en el cual se colocara la direccionen el que se encuentran ubicados.
library(ggimg)
#Lectura de datos
posters$path <- file.path(
system.file("extdata", package="ggimg"), posters$img)
#Grafica básica
ggplot(posters) + geom_point_img(aes(x=year, y=stars,img = path))+
theme_ipsum_es(base_family = "IBM Plex Sans")
### colocando un borde a las imagenes
Se crea una nueva variable img_array en el cual leerá las imagenes de las direcciones de la variable path. Luego a la nueva variable se le agrega los bordes con la nueva funcion img que se especifica en el código.
library(jpeg)
posters$img_array <- lapply(
posters$path, function(path) readJPEG(path))
posters$img_array <- lapply(
posters$img_array, function(img) {
img[c(1, 2, nrow(img) - 1, nrow(img)), , ] <- 0
img[, c(1, 2, ncol(img) - 1, ncol(img)), ] <- 0
img})ggplot(posters) +
geom_point_img(aes(x=year, y=stars,img = img_array), size = 0.7)+
scale_x_continuous(limits = c(2001, 2019), breaks = seq(2001, 2019, 2))+
scale_y_continuous(limits = c(4, 10), breaks = seq(4, 10))+
labs(x = "Años",
y = "Estrellas",
title = "Peliculas animadas estadounidenses mas taquilladas",
subtitle = "Grupo 6",
caption = "Profesor: Jesús Walter Salinas Flores")+
theme_ipsum_tw(base_family = "IBM Plex Sans")#comentario: con la capa geom_point_img trata a los graficos
#como unpunto en espesificoen los ejesLa capa es parecida a geom_rec, por eso debemos establecer la altura y el ancho de las imagenes.
En el siguiente ejemplo estamos usando las variables años(year) y estrella(star) separandolo en 0.5 .
.
ggplot(posters) +
geom_rect_img(aes(
xmin = year - 0.5,
xmax = year + 0.5,
ymin = stars - 0.5,
ymax = stars + 0.5,
img = path))+
theme_modern_rc()+
labs(x = "Años",
y = "Estrellas",
title = "Peliculas animadas estadounidense mas taquilladas",
subtitle = "Grupo 6",
caption = "Profesor: Jesús Walter Salinas Flores")