Introducción al manejo y visualización de datos

El objetivo de este ejercicio es que el alumno se familarice con el uso, manejo y visualización de datos.

Para esto se utilizará la biblioteca tidyverse y el conjunto de datos “mpg”

Tidyverse es un paquete para manejo de datos mpg es un conjunto de datos ordenados en un marco (data frame) de millas por galón para varios modelos de automóviles

Biblioteca tidyverse

El tidyverse es una coleccción de paquetes R de código abierto introducidos por Hadley Wickham y su equipo que “comparten una filosofia de diseño, gramatica y estructura de datos subyacentes” de los datos ordenados.

library(tidyverse)
## -- Attaching packages ---------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v purrr   0.3.4
## v tibble  3.0.3     v dplyr   1.0.2
## v tidyr   1.1.1     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## -- Conflicts ------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

Nota: al instalar este paquete tambien se isntala dentro de el, el paquete ggplot2 que sirve para elaborar graficas

Visualización de ggplot2

Se realizará una gráfica que relaciona en ella los datos del cilindraje en litros del motor (displ) contra la eficiencia de uso de combustible en millas por galon en carretera (hwy)

ggplot(data = mpg) +
  geom_point(mapping = aes(x=displ, y = hwy) ) +
  ggtitle("Eficiencia de uso de combustibleen carretera")