Caso American Airlines en Nueva York

Se nos ha solicitado hacer un estudio sobre la situación actual de la aerolínea American Airlines ya que se necesita revisar sus destinos, horarios y aviones con los que cuenta para hacer propuestas de aumento o reducción de vuelos por destino y horarios, así como la cantidad de aviones.

Análisis Exploratorio de los datos

Librerias a usar

1. Consulta las tablas planes y weather para que conozcas su contenido.

2. Se necesita saber de cada vuelo, la aerolinea, el aeropuerto de origen y el aeropuerto destino.

al = flights %>% select(carrier, origin, dest)
al
## # A tibble: 336,776 x 3
##    carrier origin dest 
##    <chr>   <chr>  <chr>
##  1 UA      EWR    IAH  
##  2 UA      LGA    IAH  
##  3 AA      JFK    MIA  
##  4 B6      JFK    BQN  
##  5 DL      LGA    ATL  
##  6 UA      EWR    ORD  
##  7 B6      EWR    FLL  
##  8 EV      LGA    IAD  
##  9 B6      JFK    MCO  
## 10 AA      LGA    ORD  
## # ... with 336,766 more rows

3. En la consulta anterior se necesita conocere el nombre de la aerolinea

al_name = al %>% left_join(airlines, by = 'carrier')
al_name
## # A tibble: 336,776 x 4
##    carrier origin dest  name                    
##    <chr>   <chr>  <chr> <chr>                   
##  1 UA      EWR    IAH   United Air Lines Inc.   
##  2 UA      LGA    IAH   United Air Lines Inc.   
##  3 AA      JFK    MIA   American Airlines Inc.  
##  4 B6      JFK    BQN   JetBlue Airways         
##  5 DL      LGA    ATL   Delta Air Lines Inc.    
##  6 UA      EWR    ORD   United Air Lines Inc.   
##  7 B6      EWR    FLL   JetBlue Airways         
##  8 EV      LGA    IAD   ExpressJet Airlines Inc.
##  9 B6      JFK    MCO   JetBlue Airways         
## 10 AA      LGA    ORD   American Airlines Inc.  
## # ... with 336,766 more rows

4 Se necesita saber la cantidad de vuelos por cada destino para identificar cuáles son los destinos más buscados.

total_vuelos = flights %>% select(carrier, dest) %>% count(carrier)
total_vuelos[order(desc(total_vuelos$n)),]
## # A tibble: 16 x 2
##    carrier     n
##    <chr>   <int>
##  1 UA      58665
##  2 B6      54635
##  3 EV      54173
##  4 DL      48110
##  5 AA      32729
##  6 MQ      26397
##  7 US      20536
##  8 9E      18460
##  9 WN      12275
## 10 VX       5162
## 11 FL       3260
## 12 AS        714
## 13 F9        685
## 14 YV        601
## 15 HA        342
## 16 OO         32

5 Agregar el nombre de la aerolínea a la tabla anterior.

bd2 = total_vuelos %>% left_join(al_name, by = 'carrier')
## Warning in left_join(., al_name, by = "carrier"): Each row in `x` is expected to
## match at most 1 row in `y`.
order = c('name', 'carrier','origin','dest','n')
bd2 = bd2[,order]
bd2
## # A tibble: 336,776 x 5
##    name              carrier origin dest      n
##    <chr>             <chr>   <chr>  <chr> <int>
##  1 Endeavor Air Inc. 9E      JFK    MSP   18460
##  2 Endeavor Air Inc. 9E      JFK    IAD   18460
##  3 Endeavor Air Inc. 9E      JFK    BUF   18460
##  4 Endeavor Air Inc. 9E      JFK    SYR   18460
##  5 Endeavor Air Inc. 9E      JFK    ROC   18460
##  6 Endeavor Air Inc. 9E      JFK    BWI   18460
##  7 Endeavor Air Inc. 9E      JFK    ORD   18460
##  8 Endeavor Air Inc. 9E      JFK    IND   18460
##  9 Endeavor Air Inc. 9E      JFK    BNA   18460
## 10 Endeavor Air Inc. 9E      JFK    BOS   18460
## # ... with 336,766 more rows
LS0tDQp0aXRsZTogIk1pbmljYXNvIEFBIE5ZIg0KYXV0aG9yOiAiRXJpY2sgZGUgbGEgQ3J1eiBBMDEwMDUwMzAiDQpkYXRlOiAnMjAyMy0wMi0yNScNCm91dHB1dDoNCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHllcw0KICAgIHRvY19mbG9hdDogeWVzDQogICAgY29kZV9kb3dubG9hZDogeWVzDQogIHBkZl9kb2N1bWVudDoNCiAgICB0b2M6IHllcw0KLS0tDQoNCiMgQ2FzbyBBbWVyaWNhbiBBaXJsaW5lcyBlbiBOdWV2YSBZb3JrDQpTZSBub3MgaGEgc29saWNpdGFkbyBoYWNlciB1biBlc3R1ZGlvIHNvYnJlIGxhIHNpdHVhY2nDs24gYWN0dWFsIGRlIGxhIGFlcm9sw61uZWEgDQpBbWVyaWNhbiBBaXJsaW5lcyB5YSBxdWUgc2UgbmVjZXNpdGEgcmV2aXNhciBzdXMgZGVzdGlub3MsIGhvcmFyaW9zIHkgYXZpb25lcyBjb24gDQpsb3MgcXVlIGN1ZW50YSBwYXJhIGhhY2VyIHByb3B1ZXN0YXMgZGUgYXVtZW50byBvIHJlZHVjY2nDs24gZGUgdnVlbG9zIHBvciANCmRlc3Rpbm8geSBob3JhcmlvcywgYXPDrSBjb21vIGxhIGNhbnRpZGFkIGRlIGF2aW9uZXMuDQoNCg0KIyBBbsOhbGlzaXMgRXhwbG9yYXRvcmlvIGRlIGxvcyBkYXRvcw0KDQojIyBMaWJyZXJpYXMgYSB1c2FyDQpgYGB7ciBpbmNsdWRlPUZBTFNFfQ0KbGlicmFyeSh0aWR5dmVyc2UpDQpsaWJyYXJ5KG55Y2ZsaWdodHMxMykNCmxpYnJhcnkoZ2dwbG90MikNCmxpYnJhcnkoZHBseXIpDQpgYGANCg0KIyMgMS4gQ29uc3VsdGEgbGFzIHRhYmxhcyBwbGFuZXMgeSB3ZWF0aGVyIHBhcmEgcXVlIGNvbm96Y2FzIHN1IGNvbnRlbmlkby4NCmBgYHtyIGluY2x1ZGU9RkFMU0V9DQp2aWV3KHBsYW5lcykNCnZpZXcod2VhdGhlcikNCmBgYA0KDQoNCiMjIDIuIFNlIG5lY2VzaXRhIHNhYmVyIGRlIGNhZGEgdnVlbG8sIGxhIGFlcm9saW5lYSwgZWwgYWVyb3B1ZXJ0byBkZSBvcmlnZW4geSBlbCBhZXJvcHVlcnRvIGRlc3Rpbm8uIA0KYGBge3J9DQphbCA9IGZsaWdodHMgJT4lIHNlbGVjdChjYXJyaWVyLCBvcmlnaW4sIGRlc3QpDQphbA0KYGBgDQoNCiMjIDMuIEVuIGxhIGNvbnN1bHRhIGFudGVyaW9yIHNlIG5lY2VzaXRhIGNvbm9jZXJlIGVsIG5vbWJyZSBkZSBsYSBhZXJvbGluZWENCmBgYHtyfQ0KYWxfbmFtZSA9IGFsICU+JSBsZWZ0X2pvaW4oYWlybGluZXMsIGJ5ID0gJ2NhcnJpZXInKQ0KYWxfbmFtZQ0KYGBgDQoNCiMjIDQgU2UgbmVjZXNpdGEgc2FiZXIgbGEgY2FudGlkYWQgZGUgdnVlbG9zIHBvciBjYWRhIGRlc3Rpbm8gcGFyYSBpZGVudGlmaWNhciBjdcOhbGVzICBzb24gbG9zIGRlc3Rpbm9zIG3DoXMgYnVzY2Fkb3MuDQpgYGB7cn0NCnRvdGFsX3Z1ZWxvcyA9IGZsaWdodHMgJT4lIHNlbGVjdChjYXJyaWVyLCBkZXN0KSAlPiUgY291bnQoY2FycmllcikNCnRvdGFsX3Z1ZWxvc1tvcmRlcihkZXNjKHRvdGFsX3Z1ZWxvcyRuKSksXQ0KYGBgDQoNCiMjIDUgQWdyZWdhciBlbCBub21icmUgZGUgbGEgYWVyb2zDrW5lYSBhIGxhIHRhYmxhIGFudGVyaW9yLg0KYGBge3J9DQpiZDIgPSB0b3RhbF92dWVsb3MgJT4lIGxlZnRfam9pbihhbF9uYW1lLCBieSA9ICdjYXJyaWVyJykNCm9yZGVyID0gYygnbmFtZScsICdjYXJyaWVyJywnb3JpZ2luJywnZGVzdCcsJ24nKQ0KYmQyID0gYmQyWyxvcmRlcl0NCmJkMg0KYGBgDQoNCg0KDQoNCg==