# class -> shapeggplot(mpg, aes(x = displ, y = hwy, shape = class)) +geom_point()
Warning: The shape palette can deal with a maximum of 6 discrete values because more
than 6 becomes difficult to discriminate
ℹ you have requested 7 values. Consider specifying shapes manually if you need
that many have them.
Warning: Removed 62 rows containing missing values or values outside the scale range
(`geom_point()`).
ggplot puede usar únicamente 6 formas distintas en el argumento shape
Investiga: Qué pasa si mapeas size = class o alpha = class
Resultados
ggplot(mpg, aes(x = displ, y = hwy, size = class)) +geom_point()#> Warning: Using size for a discrete variable is not advised.ggplot(mpg, aes(x = displ, y = hwy, alpha = class)) +geom_point()#> Warning: Using alpha for a discrete variable is not advised.
Mapear una variable categórica, no ordenada como class a una estética ordenada (numéricamente) no tiene sentido: la variable no tiene un orden natural
Establecer la estética manualmente
Las figuras disponibles en ggplot2 están indexadas según este diagrama
R tiene 26 formas por defecto identificadas numéricamente. Algunas parecen estar duplicadas: por ejemplo, 0, 15, y 22 son cuadrados. La diferencia está en las estéticas fill y color. Las formas huecas (0–14) solo tienen color en el borde; las formas sólidas (15–20) tienen un color interno y las formas con relleno (21–25) tienen un trazo y un relleno de color fill.
Ejercicios
Crea un gráfico de puntos de las variables hwy vs displ en el que los puntos sean tríangulos de color rosa sin bordes
Qué hace la estética stroke? Con qué formas funciona? (Hint: use ?geom_point)
Qué pasa si mapeamos una estética a algo que no sea una variable, por ejemplo aes(color = displ < 5)? Nota: No olvides definir también x, y.
Geometrías
Cada geometría tiene una estética definida en aes(...) , también conocida como mapeos o mappings
En caso de omitir el argumento, la estética se hereda del llamado a ggplot(...)
No todas las estéticas tienen los mismos parámetros: si erramos, ggplot2 ignora los argumentos que no tienen relación con la geometría
Una estética interesante es group que agrupa los renglones con los que calcula el objeto geométrico sin asociar esta agrupación a un trazo visual
La segunda capa de geom_point( ) dibuja puntos rojos para los autos de clase 2seater
2
Esta capa añade los círculos externos para enfatizar la diferencia (mismos datos de la segunda capa)
La geometría es todo
Diferentes geometrías resaltan distintos aspectos de los datos. Las geometrías son la base de ggplot2 y una herramienta indispensable para el análisis de datos. Si las geometrías nativas de ggplot no funcionan, visitar aquí
Ejercicios
Qué geometría usarías para trazar un gráfico de línea? Uno de caja y bigote? Una gráfica de áreas?
Qué hace el argumento show.legend = FALSE en una geomtría dada? En qué circunstancia aplica?
Considerando este gráfico: Cuáles son algunas ventajas y desventajas de usar facet_ en vez de la estética color = ... ? Cómo cambiaría tu apreciación si tuvieras un juego de datos más extenso?
Consulta ?facet_wrap y analiza las formas en las que es posible personalizar el display de los gráficos
Cuál de estos gráficos hace más fácil comparar el tamaño del motor (displ) entre autos con distinto tren (drv). Qué aprendemos sobre utilizar la variable para facetar en renglones o columnas?
geom_bar( ) ayuda a graficar variables discretas con barras. Pero qué grafica?
En el eje y está la variable count que no es parte del juego de datos diamonds!
Transformaciones estadísticas
Los diagramas de barras, histogramas, y polígonos de frecuencia separan los datos en bins y grafican el número de observaciones dentro de cada bin
Los smoothers ajustan un modelo de suavizamiento a tus datos y grafican las predicciones de dicho modelo
Los diagramas de caja y bigote calculan el resumen de cinco puntos de la muestra y grafican el boxplot
Transformaciones estadísticas
Los algoritmos con los que se calculan los valores del gráfico se denominan stat
Ilustración del proceso de cálculo del stat para un gráfico de barras
Transformaciones estadísticas
Cada geom_ tiene un stat_ por defecto, y cada stat_ tiene una geom_ por defecto, pero
# 1. Quizás queremos cambiar el estadístico por defectodiamonds |>count(cut) |>ggplot(aes(x = cut, y = n)) +geom_bar(stat ="identity")
# 2. Quizás queremos cambiar el mapeo por defectodiamonds |>ggplot(aes(x = cut, y =after_stat(prop), group =1)) +geom_bar()
# 3. Quizás queremos usar un estadístico que enfatice algo...ggplot(diamonds) +stat_summary(aes(x = cut, y = depth),fun.min = min,fun.max = max,fun = median1 )
1
ggplot2 cuenta con más de 20 stat que podemos usar y cada función tiene ayuda documentada. Por ejemplo ?stat_summary.
Ejercicios:
Cuál es la geom_ asociada por defecto con stat_summary? Utilice esta geometría para repetir el último gráfico (Use su IA favorita si tiene dificultades navegando la ayuda de R)
Qué hace geom_col() y en qué se diferencia de geom_bar()?
geom_y stat_ vienen, muchas veces, en pares. Haga una lista de los pares y analícela suscintamente. (Lea la documentación o use su IA preferida)
Qué variables se calculan cuando se usa stat_smooth( )? Qué argumentos controlan su comportamiento?
Ejercicios:
En el gráfico de porporciones, usamos el mapeo group = 1. Por qué? Qué problema tienen los siguientes gráficos:
ggplot(diamonds, aes(x = cut, y =after_stat(prop))) +geom_bar()ggplot(diamonds, aes(x = cut, fill = color, y =after_stat(prop))) +geom_bar()