Este taller consiste en aplicar las funciones de la librería dplyr para extraer información de la base de datos flights de la librería nycflights13, y contestar las siguientes preguntas:

Requerimientos previos:

  1. Cargar las librerías
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(nycflights13)
head(flights)
  1. Revisar la descripción de la base flights con la instrucción:
?flights
  1. ¿Cuál es el aeropuerto de NYC que tenga más retraso en salida de vuelos?

  2. En el mes de diciembre, cuál es el aeropuerto de NYC que tenga más retraso en salida de vuelos?

  3. Para ir de NYC a MIAMI, los vuelos demoran menos si salen de JFK?

  4. Cuál es el aeropuerto destino más lejos del aeropuerto EWR de NYC?

  5. En el día 1 de enero de 2013, en promedio en cuánto tiempo se retrasaron la salida de los vuelos ?

  6. En el día 1 de enero de 2013, en promedio en cuánto tiempo se retrasaron la llegada de los vuelos ?

  7. En el 11 de septiembre, hubo más retraso en la salida de los vuelos en JFK?

  8. De todas las aerolíneas (variable carrier), cuál es la que tuvo menos retraso en salida en el aeropuerto LGA?

  9. Qué porcentaje de aerolíneas en el mes de octubre tuvo uno retraso en salida por más de 1 hora?

  10. Para cada mes, calcula el porcentaje de vuelos en el mes de octubre tuvo uno retraso en salida por más de 1 hora?

Modelo. ¿Cuál es el mes con mayor retraso en salida de vuelos desde NYC?

  flights %>% group_by(month) %>% 
  summarise(retraso = mean(dep_delay, na.rm = T)) %>%
  arrange(retraso) 

Respuesta: el mes con mayor retraso en salida de vuelos desde NYC es el mes de julio ya que demora en promedio 21 minutos. También, el mes de junio tiene bastante retraso, esto se explica por el hecho de que en estos dos meses son las vacaciones de verano en los Estados Unidos, implicando mayor cantidad de pasajeros propiciando mayores retrasos. Tabmién se observa que el mes que menos retraso hay es en noviembre, con un promedio de 5 minutos de retraso.