Ejercicio 1 - Sección 5.2.4

Encuentra todos los vuelos que

1) Tuvo un retraso de llegada de dos o más horas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(nycflights13)
library(tidyr)

vuelos <- filter(flights, arr_delay >=120)
vuelos

2) Voló a Houston ( IAH o HOU)

viajeHou <- filter(flights, dest == "IAH" | dest == "HOU")
viajeHou

3) Fueron operados por United, American, o Delta

operadospor <- filter(flights, carrier == "AA" | carrier == "UA" | carrier  =="DL")
operadospor

4) Salió en verano (Julio, Agosto y Septiembre)

vuelos_en_verano <- filter(flights,   month == 7 | month == 8 | month == 9)
vuelos_en_verano

5) LLego más de dos horas tarde, pero no se fue tarde

vuelos_llego_tarde <- filter(flights, dep_delay <= 0, arr_delay >= 120)
vuelos_llego_tarde

6) Se retrasaron al menos una hora, pero se recuperaron más de 30 minutos en vuelo

vuelos_retrasados <- filter(flights, dep_delay - arr_delay > 30, dep_delay >= 60)
vuelos_retrasados

7) Salió entre la medianoche y las 6am (inclusive)

salida_vuelos <- filter(flights, dep_time== 2400 | dep_time <= 600)
salida_vuelos

Ejercicio 2 y 3 - Sección 5.3.1

2) Ordenar flights() para encontrar los vuelos más retrasados. Encuentra los vuelos que salieron antes.

valores_faltantes <- arrange(flights, desc(dep_delay)) 
valores_faltantes

3) Ordenar flights() para encontrar los vuelos más rápidos..

vuelos_mas_rapidos <- arrange(flights, distance/air_time*60)
vuelos_mas_rapidos

Ejercicio 1 y 2 - Sección 5.4.1

1) Una lluvia de ideas de tantas maneras como sea posible para seleccionar dep_time, dep_delay, arr_time, y arr_delay de flights()

seleccion <- select(flights, salida = dep_time,  llegada = arr_time, retrasos_salida = dep_delay,
                    retraso_llegada = arr_delay)
seleccion

2) ¿Qué sucede si incluye el nombre de una variable varias veces en una select()?

R: select() mostrara una vez el contenido de la variable

prueba <- select(flights, dest, dest, dest)
prueba

Ejercicio 1 - Sección 5.5.2

1) Convertir dep_time y sched_dep_time a una representaciòn mas conveniente de la cantidad de minutos desde la media noche

cant_minutos <- mutate(flights, salida = (dep_time %/% 100*60 + dep_time %/% 100)%%1400,
                       sal_programada = (sched_dep_time %/% 100 * 60 + sched_dep_time %% 100) %% 1400)

select(cant_minutos, sched_dep_time, sal_programada, dep_time, salida)

Ejercicio 2 - Sección 5.7.1

2) Qué plano ( tailnum) tiene el peor récord en el tiempo?

peor_record <- flights
peor_record %>%
  group_by(tailnum) %>% 
  summarise(peor_tiempo  = mean(arr_delay)) %>% 
  filter( min_rank(desc(peor_tiempo)) <= 1)