Recrear el código para las siguientes figuras
# Creacición de variables
x <- rnorm(100, mean = 0, sd = 2)
y <- 2 + 4 * x + rnorm(100, mean = 0, sd = 3)
# Uso de la librería tidyverse
library(tidyverse)
## -- Attaching packages ------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.2.1 v purrr 0.3.3
## v tibble 2.1.3 v dplyr 0.8.3
## v tidyr 1.0.2 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.4.0
## -- Conflicts ---------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
# Geometrias
# Uso de la librería patchwork para colocar varios GGplots juntos
library(patchwork) # esta libreria permite fácilmente poner varios ggplots juntos
p1 <- ggplot(data = mpg, aes(x = displ, y = hwy)) +
geom_point() +
geom_smooth()
p2 <- ggplot(data = mpg, aes(x = displ, y = hwy, linetype = drv, color = drv)) +
geom_point() +
geom_smooth()
p3 <- ggplot(data = mpg, aes(x = displ, y = hwy, size = cyl, linetype = drv, color = drv)) +
geom_point() +
geom_smooth()
p1 + p2
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
p3
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Ejecuta el código siguiente e interpreta el gráfico, recordemos que podemos ver la descripción de cada variable del dataset mpg utilizando help(mpg). Añade algún otro gráfico si lo consideras conveniente para responder a las siguientes preguntas.
ggplot(mpg, aes(x= displ, y = hwy, size = cyl, col = trans)) +
geom_point(alpha = 0.6) +
facet_wrap( ~ class, nrow = 2)
De acuerdo al análisis gráfico realizado se identifica que la categoría de autos compactos son los que presentan un comportamiento para recorrer mayor cantidad de millas por galón.
La variable “displ” es una variable que expresa el desplazamiento del motor en litros, Entre mas grande el cilindro, más litros o desplazamiento significan más caballos de fuerza y se generan más torque del motor. Entendiendo la variable y la representación gráfica se identifica que en las categorías de vehículos analizadas mientras mayor es la variable “displ” menor es el desplazamiento por galón.
Si influye ya que mientras mayor cantidad de cilindros tien un motor menro es el desplazamiento este fenómeno se lo puede observar en los autos de categoría “Suv” y “Pickup”.
ggplot(mpg, aes(x= displ, y = hwy, size = cyl)) +
geom_point(alpha = 0.6) +
facet_grid(drv ~ . )
Este código permite comparar el comportamiento diferentes categorías dentro de una variable en este caso la variable “drv”
El punto significa la disposición en la cual se quiere comparar las categorías si el punto se encuentra al inicio se comparara las variables en tipo columna facet_grid(. ~ drv ) si se encuentra al final se compara en filas como el ejemplo (drv ~ . ). Ejemplo:
ggplot(mpg, aes(x= displ, y = hwy, size = cyl)) +
geom_point(alpha = 0.6) +
facet_grid(. ~ drv )
Cuantas variables estamos representando:
En los gráficos estamos representando 4 variables: hwy, displ, cyl y drv
Es decir: el desplazamiento en carretera y el desplazamiento del motor de 3 categorías: f = front-wheel drive, r = rear wheel drive, 4 = 4wd y el tamaño de cilindros del motor.
Utiliza la función facet_wrap o facet_grid para ver la relación entre displ y hwy pero para cada combinación de class y fl Utiliza el siguiente gráfico como base .
ggplot(mpg, aes(x= displ, y = hwy)) +
geom_point(alpha = 0.6, position = "jitter") +
facet_grid(class ~ fl )
ggplot(mpg, aes(x= displ, y = hwy)) +
geom_point(alpha = 0.6, position = "jitter") +
facet_wrap(class ~ fl )