
Contexto
El paquete nycflights13 contiene información sobre
todos los vuelos que partieron desde Nueva York (EWR,JFK Y LGA) a
destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Para ayudar a comprender las causas de los retrasos, también incluye
otros conjuntos de datos utiles. Este paquete incluye las siguientes
tablas:
- flights = todos los vuelos que salieron de Nueva York en 2013
- weather = datos meteorológicos por hora de cada aeropuerto
- planes = informacion d e construccion de cada avión
- airports = nombres y ubicaciones de aeropuertos
- airlines = relación entre nombres y codigos de las aerolineas
Instalar paquetes y llamar
librerias
#install.packages("nycflights13")
library(nycflights13)
#install.packages("tidyverse")
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.4.4 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
Guardar base de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
Relacion entre la base de
datos

Funciones Básicas de Manejo de
Datos
Select
La función Select sirve para seleccionar columnas de una
tabla (data frame).
df1<- flights %>% select(carrier,flight)
df2<- flights %>% select(carrier:distance)
df3<- flights %>% select(-carrier,-flight)
df4<- flights %>% select(-carrier:-distance)
df5<- flights %>% select(aerolinea=carrier)
df6<- flights %>% rename(aerolinea=carrier)
Filter
La funcion filter sirve para seleccionar renglones de una
tabla (data frame).
df7<- flights%>% filter(dep_delay >=500)
df8<- flights%>% filter(dep_delay >=500, dep_delay <600)
df9<- flights%>% slice (1000:1099)
Distinct
La funcion distinct sirve para eliminar renglones
duplicados.
df10<- distinct(flights)
Merge
La funcion merge sirve para juntar base de datos.
bdgrande <-merge(flights,airlines, by="carrier")
bdgrande <-merge(bdgrande,planes, by="tailnum")
LS0tDQp0aXRsZTogIkRhdGEgV3JhbmdsaW5nIChQYXJ0ZSAxKSINCmF1dGhvcjogIkFsbWEgU2FudGlhZ28gLSBBMDA4MzY2MzYiDQpkYXRlOiAiYDIwMjQtMDItMTlgIg0Kb3V0cHV0OiANCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHRydWUNCiAgICB0b2NfZmxvYXQ6IHRydWUNCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlDQoNCi0tLQ0KIVtdKEM6XFxVc2Vyc1xcaXZvbmVcXERvd25sb2Fkc1xcYXZpLmdpZikNCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6IGJsdWU7Ij5Db250ZXh0bzwvc3Bhbj4NCkVsIHBhcXVldGUgKipueWNmbGlnaHRzMTMqKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUixKRksgWSBMR0EpIGEgZGVzdGlub3MgZW4gbG9zIEVzdGFkb3MgVW5pZG9zIGVuIDIwMTMuIEZ1ZXJvbiAzMzYsNzc2IHZ1ZWxvcyBlbiB0b3RhbC4gUGFyYSBheXVkYXIgYSBjb21wcmVuZGVyIGxhcyBjYXVzYXMgZGUgbG9zIHJldHJhc29zLCB0YW1iacOpbiBpbmNsdXllIG90cm9zIGNvbmp1bnRvcyBkZSBkYXRvcyB1dGlsZXMuDQpFc3RlIHBhcXVldGUgaW5jbHV5ZSBsYXMgc2lndWllbnRlcyB0YWJsYXM6IA0KDQoqIGZsaWdodHMgPSB0b2RvcyBsb3MgdnVlbG9zIHF1ZSBzYWxpZXJvbiBkZSBOdWV2YSBZb3JrIGVuIDIwMTMgIA0KKiB3ZWF0aGVyID0gZGF0b3MgbWV0ZW9yb2zDs2dpY29zIHBvciBob3JhIGRlIGNhZGEgYWVyb3B1ZXJ0bw0KKiBwbGFuZXMgID0gaW5mb3JtYWNpb24gZCBlIGNvbnN0cnVjY2lvbiBkZSBjYWRhIGF2acOzbg0KKiBhaXJwb3J0cyA9IG5vbWJyZXMgeSB1YmljYWNpb25lcyBkZSBhZXJvcHVlcnRvcyANCiogYWlybGluZXMgPSByZWxhY2nDs24gZW50cmUgbm9tYnJlcyB5IGNvZGlnb3MgZGUgbGFzIGFlcm9saW5lYXMNCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6IGJsdWU7Ij5JbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXJpYXM8L3NwYW4+DQpgYGB7cn0NCiNpbnN0YWxsLnBhY2thZ2VzKCJueWNmbGlnaHRzMTMiKQ0KbGlicmFyeShueWNmbGlnaHRzMTMpDQojaW5zdGFsbC5wYWNrYWdlcygidGlkeXZlcnNlIikNCmxpYnJhcnkodGlkeXZlcnNlKQ0KDQpgYGANCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6IGJsdWU7Ij5HdWFyZGFyIGJhc2UgZGUgZGF0b3M8L3NwYW4+DQpgYGB7cn0NCmZsaWdodHMgPC0gZmxpZ2h0cw0Kd2VhdGhlciA8LSB3ZWF0aGVyDQpwbGFuZXMgPC0gcGxhbmVzDQphaXJwb3J0cyA8LSBhaXJwb3J0cw0KYWlybGluZXMgPC0gYWlybGluZXMNCmBgYA0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjogYmx1ZTsiPlJlbGFjaW9uIGVudHJlIGxhIGJhc2UgZGUgZGF0b3M8L3NwYW4+DQoNCiFbXShDOlxcVXNlcnNcXGl2b25lXFxEb3dubG9hZHNcXHJlbGF0aW9uYWwtbnljZmxpZ2h0cy5wbmcpDQoNCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6IGJsdWU7Ij5GdW5jaW9uZXMgQsOhc2ljYXMgZGUgTWFuZWpvIGRlIERhdG9zPC9zcGFuPg0KDQojIyA8c3BhbiBzdHlsZT0iY29sb3I6IGJsdWU7Ij5TZWxlY3Q8L3NwYW4+DQpMYSBmdW5jacOzbiAqU2VsZWN0KiBzaXJ2ZSBwYXJhIHNlbGVjY2lvbmFyIGNvbHVtbmFzIGRlIHVuYSB0YWJsYSAoKmRhdGEgZnJhbWUqKS4NCmBgYHtyfQ0KZGYxPC0gZmxpZ2h0cyAlPiUgc2VsZWN0KGNhcnJpZXIsZmxpZ2h0KQ0KZGYyPC0gZmxpZ2h0cyAlPiUgc2VsZWN0KGNhcnJpZXI6ZGlzdGFuY2UpDQpkZjM8LSBmbGlnaHRzICU+JSBzZWxlY3QoLWNhcnJpZXIsLWZsaWdodCkNCmRmNDwtIGZsaWdodHMgJT4lIHNlbGVjdCgtY2FycmllcjotZGlzdGFuY2UpDQpkZjU8LSBmbGlnaHRzICU+JSBzZWxlY3QoYWVyb2xpbmVhPWNhcnJpZXIpDQpkZjY8LSBmbGlnaHRzICU+JSByZW5hbWUoYWVyb2xpbmVhPWNhcnJpZXIpDQpgYGANCg0KIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBibHVlOyI+RmlsdGVyPC9zcGFuPg0KTGEgZnVuY2lvbiAqZmlsdGVyKiBzaXJ2ZSBwYXJhIHNlbGVjY2lvbmFyIHJlbmdsb25lcyBkZSB1bmEgdGFibGEgKCpkYXRhIGZyYW1lKikuDQpgYGB7ciBtZXNzYWdlPVRSVUUsIHdhcm5pbmc9RkFMU0V9DQpkZjc8LSBmbGlnaHRzJT4lIGZpbHRlcihkZXBfZGVsYXkgPj01MDApDQpkZjg8LSBmbGlnaHRzJT4lIGZpbHRlcihkZXBfZGVsYXkgPj01MDAsIGRlcF9kZWxheSA8NjAwKQ0KZGY5PC0gZmxpZ2h0cyU+JSBzbGljZSAoMTAwMDoxMDk5KQ0KYGBgDQoNCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjogYmx1ZTsiPkRpc3RpbmN0PC9zcGFuPg0KIExhIGZ1bmNpb24gKmRpc3RpbmN0KiBzaXJ2ZSBwYXJhIGVsaW1pbmFyIHJlbmdsb25lcyBkdXBsaWNhZG9zLg0KIA0KYGBge3J9DQpkZjEwPC0gZGlzdGluY3QoZmxpZ2h0cykNCmBgYA0KIA0KIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBibHVlOyI+TWVyZ2U8L3NwYW4+DQogTGEgZnVuY2lvbiAqbWVyZ2UqIHNpcnZlIHBhcmEganVudGFyIGJhc2UgZGUgZGF0b3MuDQpgYGB7cn0NCmJkZ3JhbmRlIDwtbWVyZ2UoZmxpZ2h0cyxhaXJsaW5lcywgYnk9ImNhcnJpZXIiKQ0KYmRncmFuZGUgPC1tZXJnZShiZGdyYW5kZSxwbGFuZXMsIGJ5PSJ0YWlsbnVtIikNCmBgYA0KDQoNCg==