Contexto
El paquete nycflights contiene información sobre
todos los vuelos que partieron desde Nueva York (EWR, JFK y LGA) a
destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Para ayudar a comprender las causas de los retrasos, también incluye
otros conjuntos de datos útiles.
Este paquete incluye las siguiente tablas:
- flights = todos los vuelos que salieron de Nueva York en 2013.
- weather = datos meteorológicos por hora de cada aeropuerto.
- planes = información de construcción de cada avión.
- airports = nombre y ubicaciones de aeropuertos.
- airlines = relación entre nombres y códigos de las aerolíneas.
Instalar paquetes y llamar
librerías
# install.packages("nycflights13")
library(nycflights13)
#install.packages("tidyverse")
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.4.4 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
Guardar bases de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
Relación entre las bases de
datos

Funciones Básicas de Manejo de
Datos
Select
La función select sirve para seleccionar columnas de una
tabla (data frame).
df1 <- flights %>% select(carrier, flight)
df2 <- flights %>% select(carrier:distance)
df3 <- flights %>% select(-carrier, -flight)
df4 <- flights %>% select(-carrier:-distance)
df5 <- flights %>% select(aerolinea = carrier)
df6 <- flights %>% rename(aerolinea = carrier)
Filter
La función filter sirve para seleccionar renglones de una
tabla (data frame).
df7 <- flights %>% filter(dep_delay >=500)
df8 <- flights %>% filter(dep_delay >=500,dep_delay <600)
df9 <- flights %>% slice(1000:1099)
Distinct
La función distinct sirve para eliminar renglones
duplicados.
df10 <- distinct(flights)
Merge
La función merge sirve para juntar bases de datos.
bdgrande <- merge(flights,airlines, by="carrier")
bdgrande <- merge(bdgrande,planes, by="tailnum")
LS0tCnRpdGxlOiAiRGF0YSBXcmFuZ2xpbmcgKHBhcnRlIDEpIgphdXRob3I6ICJDYXJvbGluYSBTdcOhcmV6IEEwMDgzNzkyMiIKZGF0ZTogIjIwMjQtMDItMTkiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIGNvZGVfZG93bmxvYWQ6IHRydWUKLS0tCgohW10oL1VzZXJzL2Nhcm9zdWFyZXovRG93bmxvYWRzL2NhYmVjZXJhX2F2aW9uUEUuanBnKS4gCgojIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPkNvbnRleHRvPC9zcGFuPgoKRWwgcGFxdWV0ZSAqKm55Y2ZsaWdodHMqKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLIHkgTEdBKSBhIGRlc3Rpbm9zIGVuIGxvcyBFc3RhZG9zIFVuaWRvcyBlbiAyMDEzLgpGdWVyb24gMzM2LDc3NiB2dWVsb3MgZW4gdG90YWwuIFBhcmEgYXl1ZGFyIGEgY29tcHJlbmRlciBsYXMgY2F1c2FzIGRlIGxvcyByZXRyYXNvcywgdGFtYmnDqW4gaW5jbHV5ZSBvdHJvcyBjb25qdW50b3MgZGUgZGF0b3Mgw7p0aWxlcy4KCkVzdGUgcGFxdWV0ZSBpbmNsdXllIGxhcyBzaWd1aWVudGUgdGFibGFzOiAgCgorIGZsaWdodHMgPSB0b2RvcyBsb3MgdnVlbG9zIHF1ZSBzYWxpZXJvbiBkZSBOdWV2YSBZb3JrIGVuIDIwMTMuIAorIHdlYXRoZXIgPSBkYXRvcyBtZXRlb3JvbMOzZ2ljb3MgcG9yIGhvcmEgZGUgY2FkYSBhZXJvcHVlcnRvLiAKKyBwbGFuZXMgPSBpbmZvcm1hY2nDs24gZGUgY29uc3RydWNjacOzbiBkZSBjYWRhIGF2acOzbi4gCisgYWlycG9ydHMgPSBub21icmUgeSB1YmljYWNpb25lcyBkZSBhZXJvcHVlcnRvcy4gCisgYWlybGluZXMgPSByZWxhY2nDs24gZW50cmUgbm9tYnJlcyB5IGPDs2RpZ29zIGRlIGxhcyBhZXJvbMOtbmVhcy4gCgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyIgPkluc3RhbGFyIHBhcXVldGVzIHkgbGxhbWFyIGxpYnJlcsOtYXM8L3NwYW4+CmBgYHtyfQojIGluc3RhbGwucGFja2FnZXMoIm55Y2ZsaWdodHMxMyIpCmxpYnJhcnkobnljZmxpZ2h0czEzKQojaW5zdGFsbC5wYWNrYWdlcygidGlkeXZlcnNlIikKbGlicmFyeSh0aWR5dmVyc2UpCmBgYAoKCgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyI+R3VhcmRhciBiYXNlcyBkZSBkYXRvczwvc3Bhbj4KYGBge3J9CmZsaWdodHMgPC0gZmxpZ2h0cwp3ZWF0aGVyIDwtIHdlYXRoZXIKcGxhbmVzIDwtIHBsYW5lcwphaXJwb3J0cyA8LSBhaXJwb3J0cwphaXJsaW5lcyA8LSBhaXJsaW5lcwpgYGAKCiMjIyA8c3BhbiBzdHlsZT0iY29sb3I6IHBpbms7Ij5SZWxhY2nDs24gZW50cmUgbGFzIGJhc2VzIGRlIGRhdG9zPC9zcGFuPgoKIVtdKC9Vc2Vycy9jYXJvc3VhcmV6L0Rvd25sb2Fkcy9yZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPkZ1bmNpb25lcyBCw6FzaWNhcyBkZSBNYW5lam8gZGUgRGF0b3M8L3NwYW4+CgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyI+U2VsZWN0PC9zcGFuPgpMYSBmdW5jacOzbiAqc2VsZWN0KiBzaXJ2ZSBwYXJhIHNlbGVjY2lvbmFyIGNvbHVtbmFzIGRlIHVuYSB0YWJsYSAoKmRhdGEgZnJhbWUqKS4KYGBge3J9CmRmMSA8LSBmbGlnaHRzICU+JSBzZWxlY3QoY2FycmllciwgZmxpZ2h0KQpkZjIgPC0gZmxpZ2h0cyAlPiUgc2VsZWN0KGNhcnJpZXI6ZGlzdGFuY2UpCmRmMyA8LSBmbGlnaHRzICU+JSBzZWxlY3QoLWNhcnJpZXIsIC1mbGlnaHQpCmRmNCA8LSBmbGlnaHRzICU+JSBzZWxlY3QoLWNhcnJpZXI6LWRpc3RhbmNlKQpkZjUgPC0gZmxpZ2h0cyAlPiUgc2VsZWN0KGFlcm9saW5lYSA9IGNhcnJpZXIpCmRmNiA8LSBmbGlnaHRzICU+JSByZW5hbWUoYWVyb2xpbmVhID0gY2FycmllcikKYGBgCgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBwaW5rOyI+RmlsdGVyPC9zcGFuPgpMYSBmdW5jacOzbiAqZmlsdGVyKiBzaXJ2ZSBwYXJhIHNlbGVjY2lvbmFyIHJlbmdsb25lcyBkZSB1bmEgdGFibGEgKCpkYXRhIGZyYW1lKikuCmBgYHtyfQpkZjcgPC0gZmxpZ2h0cyAlPiUgZmlsdGVyKGRlcF9kZWxheSA+PTUwMCkKZGY4IDwtIGZsaWdodHMgJT4lIGZpbHRlcihkZXBfZGVsYXkgPj01MDAsZGVwX2RlbGF5IDw2MDApCmRmOSA8LSBmbGlnaHRzICU+JSBzbGljZSgxMDAwOjEwOTkpCmBgYAoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPkRpc3RpbmN0PC9zcGFuPgpMYSBmdW5jacOzbiAqZGlzdGluY3QqIHNpcnZlIHBhcmEgZWxpbWluYXIgcmVuZ2xvbmVzIGR1cGxpY2Fkb3MuCmBgYHtyfQpkZjEwIDwtIGRpc3RpbmN0KGZsaWdodHMpCmBgYAoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogcGluazsiPk1lcmdlPC9zcGFuPgpMYSBmdW5jacOzbiAqbWVyZ2UqIHNpcnZlIHBhcmEganVudGFyIGJhc2VzIGRlIGRhdG9zLgpgYGB7cn0KYmRncmFuZGUgPC0gbWVyZ2UoZmxpZ2h0cyxhaXJsaW5lcywgYnk9ImNhcnJpZXIiKQpiZGdyYW5kZSA8LSBtZXJnZShiZGdyYW5kZSxwbGFuZXMsIGJ5PSJ0YWlsbnVtIikKYGBgCgo=