.

Contexto

El paquete nycflights contiene información sobre todos los vuelos que partieron desde Nueva York (EWR, JFK y LGA) a destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total. Para ayudar a comprender las causas de los retrasos, también incluye otros conjuntos de datos útiles.

Este paquete incluye las siguiente tablas:

  • flights = todos los vuelos que salieron de Nueva York en 2013.
  • weather = datos meteorológicos por hora de cada aeropuerto.
  • planes = información de construcción de cada avión.
  • airports = nombre y ubicaciones de aeropuertos.
  • airlines = relación entre nombres y códigos de las aerolíneas.

Instalar paquetes y llamar librerías

# install.packages("nycflights13")
library(nycflights13)
#install.packages("tidyverse")
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.4.4     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

Guardar bases de datos

flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines

Relación entre las bases de datos

Funciones Básicas de Manejo de Datos

Select

La función select sirve para seleccionar columnas de una tabla (data frame).

df1 <- flights %>% select(carrier, flight)
df2 <- flights %>% select(carrier:distance)
df3 <- flights %>% select(-carrier, -flight)
df4 <- flights %>% select(-carrier:-distance)
df5 <- flights %>% select(aerolinea = carrier)
df6 <- flights %>% rename(aerolinea = carrier)

Filter

La función filter sirve para seleccionar renglones de una tabla (data frame).

df7 <- flights %>% filter(dep_delay >=500)
df8 <- flights %>% filter(dep_delay >=500,dep_delay <600)
df9 <- flights %>% slice(1000:1099)

Distinct

La función distinct sirve para eliminar renglones duplicados.

df10 <- distinct(flights)

Merge

La función merge sirve para juntar bases de datos.

bdgrande <- merge(flights,airlines, by="carrier")
bdgrande <- merge(bdgrande,planes, by="tailnum")
LS0tCnRpdGxlOiAiRGF0YSBXcmFuZ2xpbmcgKHBhcnRlIDEpIgphdXRob3I6ICJDYXJvbGluYSBTdcOhcmV6IEEwMDgzNzkyMiIKZGF0ZTogIjIwMjQtMDItMTkiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIGNvZGVfZG93bmxvYWQ6IHRydWUKLS0tCgohW10oL1VzZXJzL2Nhcm9zdWFyZXovRG93bmxvYWRzL2NhYmVjZXJhX2F2aW9uUEUuanBnKS4gCgojIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPkNvbnRleHRvPC9zcGFuPgoKRWwgcGFxdWV0ZSAqKm55Y2ZsaWdodHMqKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLIHkgTEdBKSBhIGRlc3Rpbm9zIGVuIGxvcyBFc3RhZG9zIFVuaWRvcyBlbiAyMDEzLgpGdWVyb24gMzM2LDc3NiB2dWVsb3MgZW4gdG90YWwuIFBhcmEgYXl1ZGFyIGEgY29tcHJlbmRlciBsYXMgY2F1c2FzIGRlIGxvcyByZXRyYXNvcywgdGFtYmnDqW4gaW5jbHV5ZSBvdHJvcyBjb25qdW50b3MgZGUgZGF0b3Mgw7p0aWxlcy4KCkVzdGUgcGFxdWV0ZSBpbmNsdXllIGxhcyBzaWd1aWVudGUgdGFibGFzOiAgCgorIGZsaWdodHMgPSB0b2RvcyBsb3MgdnVlbG9zIHF1ZSBzYWxpZXJvbiBkZSBOdWV2YSBZb3JrIGVuIDIwMTMuIAorIHdlYXRoZXIgPSBkYXRvcyBtZXRlb3JvbMOzZ2ljb3MgcG9yIGhvcmEgZGUgY2FkYSBhZXJvcHVlcnRvLiAKKyBwbGFuZXMgPSBpbmZvcm1hY2nDs24gZGUgY29uc3RydWNjacOzbiBkZSBjYWRhIGF2acOzbi4gCisgYWlycG9ydHMgPSBub21icmUgeSB1YmljYWNpb25lcyBkZSBhZXJvcHVlcnRvcy4gCisgYWlybGluZXMgPSByZWxhY2nDs24gZW50cmUgbm9tYnJlcyB5IGPDs2RpZ29zIGRlIGxhcyBhZXJvbMOtbmVhcy4gCgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyIgPkluc3RhbGFyIHBhcXVldGVzIHkgbGxhbWFyIGxpYnJlcsOtYXM8L3NwYW4+CmBgYHtyfQojIGluc3RhbGwucGFja2FnZXMoIm55Y2ZsaWdodHMxMyIpCmxpYnJhcnkobnljZmxpZ2h0czEzKQojaW5zdGFsbC5wYWNrYWdlcygidGlkeXZlcnNlIikKbGlicmFyeSh0aWR5dmVyc2UpCmBgYAoKCgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyI+R3VhcmRhciBiYXNlcyBkZSBkYXRvczwvc3Bhbj4KYGBge3J9CmZsaWdodHMgPC0gZmxpZ2h0cwp3ZWF0aGVyIDwtIHdlYXRoZXIKcGxhbmVzIDwtIHBsYW5lcwphaXJwb3J0cyA8LSBhaXJwb3J0cwphaXJsaW5lcyA8LSBhaXJsaW5lcwpgYGAKCiMjIyA8c3BhbiBzdHlsZT0iY29sb3I6IHBpbms7Ij5SZWxhY2nDs24gZW50cmUgbGFzIGJhc2VzIGRlIGRhdG9zPC9zcGFuPgoKIVtdKC9Vc2Vycy9jYXJvc3VhcmV6L0Rvd25sb2Fkcy9yZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPkZ1bmNpb25lcyBCw6FzaWNhcyBkZSBNYW5lam8gZGUgRGF0b3M8L3NwYW4+CgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyI+U2VsZWN0PC9zcGFuPgpMYSBmdW5jacOzbiAqc2VsZWN0KiBzaXJ2ZSBwYXJhIHNlbGVjY2lvbmFyIGNvbHVtbmFzIGRlIHVuYSB0YWJsYSAoKmRhdGEgZnJhbWUqKS4KYGBge3J9CmRmMSA8LSBmbGlnaHRzICU+JSBzZWxlY3QoY2FycmllciwgZmxpZ2h0KQpkZjIgPC0gZmxpZ2h0cyAlPiUgc2VsZWN0KGNhcnJpZXI6ZGlzdGFuY2UpCmRmMyA8LSBmbGlnaHRzICU+JSBzZWxlY3QoLWNhcnJpZXIsIC1mbGlnaHQpCmRmNCA8LSBmbGlnaHRzICU+JSBzZWxlY3QoLWNhcnJpZXI6LWRpc3RhbmNlKQpkZjUgPC0gZmxpZ2h0cyAlPiUgc2VsZWN0KGFlcm9saW5lYSA9IGNhcnJpZXIpCmRmNiA8LSBmbGlnaHRzICU+JSByZW5hbWUoYWVyb2xpbmVhID0gY2FycmllcikKYGBgCgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyI+RmlsdGVyPC9zcGFuPgpMYSBmdW5jacOzbiAqZmlsdGVyKiBzaXJ2ZSBwYXJhIHNlbGVjY2lvbmFyIHJlbmdsb25lcyBkZSB1bmEgdGFibGEgKCpkYXRhIGZyYW1lKikuCmBgYHtyfQpkZjcgPC0gZmxpZ2h0cyAlPiUgZmlsdGVyKGRlcF9kZWxheSA+PTUwMCkKZGY4IDwtIGZsaWdodHMgJT4lIGZpbHRlcihkZXBfZGVsYXkgPj01MDAsZGVwX2RlbGF5IDw2MDApCmRmOSA8LSBmbGlnaHRzICU+JSBzbGljZSgxMDAwOjEwOTkpCmBgYAoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPkRpc3RpbmN0PC9zcGFuPgpMYSBmdW5jacOzbiAqZGlzdGluY3QqIHNpcnZlIHBhcmEgZWxpbWluYXIgcmVuZ2xvbmVzIGR1cGxpY2Fkb3MuCmBgYHtyfQpkZjEwIDwtIGRpc3RpbmN0KGZsaWdodHMpCmBgYAoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPk1lcmdlPC9zcGFuPgpMYSBmdW5jacOzbiAqbWVyZ2UqIHNpcnZlIHBhcmEganVudGFyIGJhc2VzIGRlIGRhdG9zLgpgYGB7cn0KYmRncmFuZGUgPC0gbWVyZ2UoZmxpZ2h0cyxhaXJsaW5lcywgYnk9ImNhcnJpZXIiKQpiZGdyYW5kZSA8LSBtZXJnZShiZGdyYW5kZSxwbGFuZXMsIGJ5PSJ0YWlsbnVtIikKYGBgCgo=