
Contexto
El paquete nycflights13 contine información sobre
todos los vuelos que partieron desde Nueva York (EWR, JFK Y LGA) a
destinos en los Estados Unidos en 2013. Fueron 336776 vuelos en total.
Para ayudar a comprender las causas de los retrasos, también incluye
otros conjuntos de datos útiles.
Este paquete incluye las siguientes tablas:
- flights = todos los vuelos que salieron de Nueva York en 2013
- weather = datos meteorológicos por hora de cada aeropuerto
- planes = informacion de construcción de cada avión
- airports = nombres y ubicaciones de aeropuertos
- airlines = relacion entre nombres y códigos de las aerolinea
Instalar paquetes y llamar
librerías
# install.packages("nycflights13")
library(nycflights13)
# install.packages("tidyverse")
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.3 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.3 ✔ tibble 3.2.1
## ✔ lubridate 1.9.2 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
Guardar bases de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
Relacion entre las bases de
datos

Funciones Básicas de Manejo de
Datos
Select
La función select sirve para selecciones columnas de una
tabla (data frame).
df1 <- flights %>% select(carrier, flight)
df2 <- flights %>% select(carrier:distance)
df3 <- flights %>% select(-carrier, -flight)
df4 <- flights %>% select(-carrier, -distance)
df5 <- flights %>% select(aerolinea = carrier)
df6 <- flights %>% rename(Aerolinea = carrier)
Filter
La función Filter sirve para seleccionar renglones de una
tabla (data frame).
df7 <- flights %>% filter(dep_delay >=500)
df8 <- flights %>% filter(dep_delay >=500, dep_delay <600)
df9 <- flights %>% slice(1000:1099)
Distinct
La función distinct sirve para elimianr renglones
duplicados.
df10 <- distinct(flights)
Marge
La función merge sirve para juntar bases de datos.
bdgrande <- merge(flights, airlines, by="carrier")
bdgrande <- merge(bdgrande,planes, by="tailnum")
LS0tDQp0aXRsZTogIkRhdGEgV3JhbmdsaW5nIChQYXJ0ZSAxKSINCmF1dGhvcjogIkZhYmlhbmEgTWVkaW5hY2VsbGkgQTAwODM1ODYiDQpkYXRlOiAiMjAyNC0wMi0xOSINCm91dHB1dDoNCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHRydWUNCiAgICB0b2NfZmxvYXQ6IHRydWUNCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlDQogICAgdGhlbWU6ICJjb3NtbyINCiAgICBoaWdobGlnaHQ6ICJlc3ByZXNzbyIgICAgDQotLS0NCiFbXShDOlxcVXNlcnNcXEhQXFxEZXNrdG9wXFx2aXNpb24gYm9hcmRcXGJiZjUxNDRiMWU0MzIyYjVhNDcyNzNiYTE4YTVmNWVmLmpwZykNCg0KIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogYmx1ZTsiPkNvbnRleHRvPC9zcGFuPg0KDQpFbCBwYXF1ZXRlICoqbnljZmxpZ2h0czEzKiogY29udGluZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLIFkgTEdBKSBhIGRlc3Rpbm9zIGVuIGxvcyBFc3RhZG9zIFVuaWRvcyBlbiAyMDEzLiBGdWVyb24gMzM2Nzc2IHZ1ZWxvcyBlbiB0b3RhbC4gUGFyYSBheXVkYXIgYSBjb21wcmVuZGVyIGxhcyBjYXVzYXMgZGUgbG9zIHJldHJhc29zLCB0YW1iacOpbiBpbmNsdXllIG90cm9zIGNvbmp1bnRvcyBkZSBkYXRvcyDDunRpbGVzLiAgDQoNCkVzdGUgcGFxdWV0ZSBpbmNsdXllIGxhcyBzaWd1aWVudGVzIHRhYmxhczoNCg0KKyBmbGlnaHRzID0gdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgc2FsaWVyb24gZGUgTnVldmEgWW9yayBlbiAyMDEzICAgDQorIHdlYXRoZXIgPSBkYXRvcyBtZXRlb3JvbMOzZ2ljb3MgcG9yIGhvcmEgZGUgY2FkYSBhZXJvcHVlcnRvICAgIA0KKyBwbGFuZXMgPSBpbmZvcm1hY2lvbiBkZSBjb25zdHJ1Y2Npw7NuIGRlIGNhZGEgYXZpw7NuICANCisgYWlycG9ydHMgPSBub21icmVzIHkgdWJpY2FjaW9uZXMgZGUgYWVyb3B1ZXJ0b3MgIA0KKyBhaXJsaW5lcyA9IHJlbGFjaW9uIGVudHJlIG5vbWJyZXMgeSBjw7NkaWdvcyBkZSBsYXMgYWVyb2xpbmVhICANCg0KIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogc2t5IGJsdWU7Ij5JbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXLDrWFzPC9zcGFuPg0KYGBge3J9DQojIGluc3RhbGwucGFja2FnZXMoIm55Y2ZsaWdodHMxMyIpDQpsaWJyYXJ5KG55Y2ZsaWdodHMxMykNCiMgaW5zdGFsbC5wYWNrYWdlcygidGlkeXZlcnNlIikNCmxpYnJhcnkodGlkeXZlcnNlKQ0KYGBgDQojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBza3kgYmx1ZTsiPkd1YXJkYXIgYmFzZXMgZGUgZGF0b3M8L3NwYW4+DQpgYGB7cn0NCmZsaWdodHMgPC0gZmxpZ2h0cw0Kd2VhdGhlciA8LSB3ZWF0aGVyDQpwbGFuZXMgPC0gcGxhbmVzDQphaXJwb3J0cyA8LSBhaXJwb3J0cw0KYWlybGluZXMgPC0gYWlybGluZXMNCmBgYA0KIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogc2t5IGJsdWU7Ij5SZWxhY2lvbiBlbnRyZSBsYXMgYmFzZXMgZGUgZGF0b3M8L3NwYW4+DQohW10oQzpcXFVzZXJzXFxIUFxcRG93bmxvYWRzXFxyZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQ0KDQojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBza3kgYmx1ZTsiPkZ1bmNpb25lcyBCw6FzaWNhcyBkZSBNYW5lam8gZGUgRGF0b3M8L3NwYW4+DQoNCiMjIyA8c3BhbiBzdHlsZT0iY29sb3I6IHNreSBibHVlOyI+U2VsZWN0PC9zcGFuPg0KTGEgZnVuY2nDs24gKnNlbGVjdCogc2lydmUgcGFyYSBzZWxlY2Npb25lcyBjb2x1bW5hcyBkZSB1bmEgdGFibGEgKCpkYXRhIGZyYW1lKikuDQpgYGB7cn0NCmRmMSA8LSBmbGlnaHRzICU+JSBzZWxlY3QoY2FycmllciwgZmxpZ2h0KQ0KZGYyIDwtIGZsaWdodHMgJT4lIHNlbGVjdChjYXJyaWVyOmRpc3RhbmNlKQ0KZGYzIDwtIGZsaWdodHMgJT4lIHNlbGVjdCgtY2FycmllciwgLWZsaWdodCkNCmRmNCA8LSBmbGlnaHRzICU+JSBzZWxlY3QoLWNhcnJpZXIsIC1kaXN0YW5jZSkgDQpkZjUgPC0gZmxpZ2h0cyAlPiUgc2VsZWN0KGFlcm9saW5lYSA9IGNhcnJpZXIpIA0KZGY2IDwtIGZsaWdodHMgJT4lIHJlbmFtZShBZXJvbGluZWEgPSBjYXJyaWVyKSANCmBgYA0KIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogc2t5IGJsdWU7Ij5GaWx0ZXI8L3NwYW4+DQpMYSBmdW5jacOzbiAqRmlsdGVyKiBzaXJ2ZSBwYXJhIHNlbGVjY2lvbmFyIHJlbmdsb25lcyBkZSB1bmEgdGFibGEgKCpkYXRhIGZyYW1lKikuDQpgYGB7cn0NCmRmNyA8LSBmbGlnaHRzICU+JSBmaWx0ZXIoZGVwX2RlbGF5ID49NTAwKQ0KZGY4IDwtIGZsaWdodHMgJT4lIGZpbHRlcihkZXBfZGVsYXkgPj01MDAsIGRlcF9kZWxheSA8NjAwKQ0KZGY5IDwtIGZsaWdodHMgJT4lIHNsaWNlKDEwMDA6MTA5OSkNCmBgYA0KIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogc2t5IGJsdWU7Ij5EaXN0aW5jdDwvc3Bhbj4NCkxhIGZ1bmNpw7NuICpkaXN0aW5jdCogc2lydmUgcGFyYSBlbGltaWFuciByZW5nbG9uZXMgZHVwbGljYWRvcy4NCmBgYHtyfQ0KZGYxMCA8LSBkaXN0aW5jdChmbGlnaHRzKQ0KYGBgDQojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBza3kgYmx1ZTsiPk1hcmdlPC9zcGFuPg0KTGEgZnVuY2nDs24gKm1lcmdlKiBzaXJ2ZSBwYXJhIGp1bnRhciBiYXNlcyBkZSBkYXRvcy4NCmBgYHtyfQ0KYmRncmFuZGUgPC0gbWVyZ2UoZmxpZ2h0cywgYWlybGluZXMsIGJ5PSJjYXJyaWVyIikNCmJkZ3JhbmRlIDwtIG1lcmdlKGJkZ3JhbmRlLHBsYW5lcywgYnk9InRhaWxudW0iKQ0KYGBgDQoNCg==