Evidencia 2 - Analítica descriptiva (Integración de datos a través de modelo entidad-relación) y el compromiso ético y ciudadano

Situación Problema.

¿Cómo mejorar la posición competitiva de una de las aerolíneas líderes en los aeropuertos de Nueva York?

Exploración

Te acabas de incorporar a una empresa consultora en Inteligencia de Negocios, actualmente están brindando servicios de análisis para la industria de la aviación y les interesa tener a la aerolínea American Airlines como cliente ya que es una de las aerolíneas líderes en los aeropuertos de Nueva York, motivo por el cuál te han contratado.
Te han pedido que identifiques cómo puede dicha aerolínea mejorar su posición competitiva !!
Para identificar oportunidades de mejorar la posición competitiva de la aerolínea American Airlines, necesitas realizar algunos análisis, para determinar si hay variaciones en la posición de liderazgo de dicha aerolínea.

Modelo Entidad - Relación

Se te ha solicitado hacer un estudio sobre la situación actual de la aerolínea American Airlines ya que se necesita revisar sus destinos, horarios y aviones con los que cuenta para hacer propuestas de aumento o reducción de vuelos por destino y horarios, así como la cantidad de aviones.

Consulta y explora el data frame planes y weather para que conozcas su contenido.. Función: View()

library(nycflights13)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
#View(planes)
#View(weather)
summary(flights)
##       year          month             day           dep_time    sched_dep_time
##  Min.   :2013   Min.   : 1.000   Min.   : 1.00   Min.   :   1   Min.   : 106  
##  1st Qu.:2013   1st Qu.: 4.000   1st Qu.: 8.00   1st Qu.: 907   1st Qu.: 906  
##  Median :2013   Median : 7.000   Median :16.00   Median :1401   Median :1359  
##  Mean   :2013   Mean   : 6.549   Mean   :15.71   Mean   :1349   Mean   :1344  
##  3rd Qu.:2013   3rd Qu.:10.000   3rd Qu.:23.00   3rd Qu.:1744   3rd Qu.:1729  
##  Max.   :2013   Max.   :12.000   Max.   :31.00   Max.   :2400   Max.   :2359  
##                                                  NA's   :8255                 
##    dep_delay          arr_time    sched_arr_time   arr_delay       
##  Min.   : -43.00   Min.   :   1   Min.   :   1   Min.   : -86.000  
##  1st Qu.:  -5.00   1st Qu.:1104   1st Qu.:1124   1st Qu.: -17.000  
##  Median :  -2.00   Median :1535   Median :1556   Median :  -5.000  
##  Mean   :  12.64   Mean   :1502   Mean   :1536   Mean   :   6.895  
##  3rd Qu.:  11.00   3rd Qu.:1940   3rd Qu.:1945   3rd Qu.:  14.000  
##  Max.   :1301.00   Max.   :2400   Max.   :2359   Max.   :1272.000  
##  NA's   :8255      NA's   :8713                  NA's   :9430      
##    carrier              flight       tailnum             origin         
##  Length:336776      Min.   :   1   Length:336776      Length:336776     
##  Class :character   1st Qu.: 553   Class :character   Class :character  
##  Mode  :character   Median :1496   Mode  :character   Mode  :character  
##                     Mean   :1972                                        
##                     3rd Qu.:3465                                        
##                     Max.   :8500                                        
##                                                                         
##      dest              air_time        distance         hour      
##  Length:336776      Min.   : 20.0   Min.   :  17   Min.   : 1.00  
##  Class :character   1st Qu.: 82.0   1st Qu.: 502   1st Qu.: 9.00  
##  Mode  :character   Median :129.0   Median : 872   Median :13.00  
##                     Mean   :150.7   Mean   :1040   Mean   :13.18  
##                     3rd Qu.:192.0   3rd Qu.:1389   3rd Qu.:17.00  
##                     Max.   :695.0   Max.   :4983   Max.   :23.00  
##                     NA's   :9430                                  
##      minute        time_hour                     
##  Min.   : 0.00   Min.   :2013-01-01 05:00:00.00  
##  1st Qu.: 8.00   1st Qu.:2013-04-04 13:00:00.00  
##  Median :29.00   Median :2013-07-03 10:00:00.00  
##  Mean   :26.23   Mean   :2013-07-03 05:22:54.64  
##  3rd Qu.:44.00   3rd Qu.:2013-10-01 07:00:00.00  
##  Max.   :59.00   Max.   :2013-12-31 23:00:00.00  
## 

Se necesita saber de cada vuelo, la aerolínea, el aeropuerto de origen y el aeropuerto destino.
Función: select()

vuelos <- select(flights, flight, carrier, origin, dest)
head(vuelos)
## # A tibble: 6 × 4
##   flight carrier origin dest 
##    <int> <chr>   <chr>  <chr>
## 1   1545 UA      EWR    IAH  
## 2   1714 UA      LGA    IAH  
## 3   1141 AA      JFK    MIA  
## 4    725 B6      JFK    BQN  
## 5    461 DL      LGA    ATL  
## 6   1696 UA      EWR    ORD

En la consulta anterior se necesita conocer el nombre de la aerolínea..
Función: left_join()

#left_join()

Se necesita saber la cantidad de vuelos por cada destino para identificar cuáles son los destinos más buscados.. Función: select() y count()

count(vuelos, dest, sort=TRUE)
## # A tibble: 105 × 2
##    dest      n
##    <chr> <int>
##  1 ORD   17283
##  2 ATL   17215
##  3 LAX   16174
##  4 BOS   15508
##  5 MCO   14082
##  6 CLT   14064
##  7 SFO   13331
##  8 FLL   12055
##  9 MIA   11728
## 10 DCA    9705
## # … with 95 more rows

Agregar el nombre de la aerolínea al data frame anterior.. Función: left_join()

#left_join()

Se necesita conocer las aerolíneas (clave y nombre) y destinos que vuelan por la Mañana: de 6 a 12, Tarde: de 12 a 19 , Noche: de 19 a 24 y Madrugada de 24 a 6. Agrega un nuevo campo a la tabla con el nombre de clas_horario y agrega, mañana, tarde, noche y madrugada según sea el caso.. Función: select(), left_join(), mutate(),ifelse con in

horarios <- select(flights, flight, carrier, dest, hour)
head(horarios)
## # A tibble: 6 × 4
##   flight carrier dest   hour
##    <int> <chr>   <chr> <dbl>
## 1   1545 UA      IAH       5
## 2   1714 UA      IAH       5
## 3   1141 AA      MIA       5
## 4    725 B6      BQN       5
## 5    461 DL      ATL       6
## 6   1696 UA      ORD       5
#horarios$categoria <- if(flights$hour>=6 & hour<12) {
# "Mañana"
#}
#head(horarios)

Se necesita saber la cantidad de vuelos por aerolínea y destino que hay por la Mañana, Tarde, Noche y Madrugada.. Función: group_by() y count()

Se necesita saber a qué destinos vuela la aerolínea American Airlines Inc.-AA durante la madrugada.. Función: select(),filter(),group_by()

¿Qué aviones utiliza la aerolínea AA? aerolínea, tipo, motor y número de asientos y ¿Cuántos vuelos se han realizado con cada uno? elimina los NA’s. Función: left_join(), select(), filter(), group_by(), count()

HALLAZGOS

LS0tCnRpdGxlOiAiRXZpZGVuaWNhIDIiCmF1dGhvcjogIkNyaXN0aW5hIEZQIGEwMTU2Njg4MCIKZGF0ZTogIjIwMjMtMDMtMTYiCm91dHB1dDogCiAgaHRtbF9kb2N1bWVudDoKICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OiB0cnVlIAogICAgY29kZV9kb3dubG9hZDogdHJ1ZSAKLS0tCiFbXSgvVXNlcnMvY3Jpc2Zsb3Jlc3BhbGFjaW9zL0Rvd25sb2Fkcy9hZXJvcHVlcnRvLnBuZykgCgojIyBFdmlkZW5jaWEgMiAtIEFuYWzDrXRpY2EgZGVzY3JpcHRpdmEgKEludGVncmFjacOzbiBkZSBkYXRvcyBhIHRyYXbDqXMgZGUgbW9kZWxvIGVudGlkYWQtcmVsYWNpw7NuKSB5IGVsIGNvbXByb21pc28gw6l0aWNvIHkgY2l1ZGFkYW5vCiMjIyBTaXR1YWNpw7NuIFByb2JsZW1hLiAgCsK/Q8OzbW8gbWVqb3JhciBsYSBwb3NpY2nDs24gY29tcGV0aXRpdmEgZGUgdW5hIGRlIGxhcyBhZXJvbMOtbmVhcyBsw61kZXJlcyBlbiBsb3MgYWVyb3B1ZXJ0b3MgZGUgTnVldmEgWW9yaz8gICAKCiMjIyBFeHBsb3JhY2nDs24gClRlIGFjYWJhcyBkZSBpbmNvcnBvcmFyIGEgdW5hIGVtcHJlc2EgY29uc3VsdG9yYSBlbiBJbnRlbGlnZW5jaWEgZGUgTmVnb2Npb3MsIGFjdHVhbG1lbnRlIGVzdMOhbiBicmluZGFuZG8gc2VydmljaW9zIGRlIGFuw6FsaXNpcyBwYXJhIGxhIGluZHVzdHJpYSBkZSBsYSBhdmlhY2nDs24geSBsZXMgaW50ZXJlc2EgdGVuZXIgYSBsYSBhZXJvbMOtbmVhIEFtZXJpY2FuIEFpcmxpbmVzIGNvbW8gY2xpZW50ZSB5YSBxdWUgZXMgdW5hIGRlIGxhcyBhZXJvbMOtbmVhcyBsw61kZXJlcyBlbiBsb3MgYWVyb3B1ZXJ0b3MgZGUgTnVldmEKWW9yaywgbW90aXZvIHBvciBlbCBjdcOhbCB0ZSBoYW4gY29udHJhdGFkby4gIApUZSBoYW4gcGVkaWRvIHF1ZSBpZGVudGlmaXF1ZXMgY8OzbW8gcHVlZGUgZGljaGEgYWVyb2zDrW5lYSBtZWpvcmFyIHN1IHBvc2ljacOzbiBjb21wZXRpdGl2YSAhISAgClBhcmEgaWRlbnRpZmljYXIgb3BvcnR1bmlkYWRlcyBkZSBtZWpvcmFyIGxhIHBvc2ljacOzbiBjb21wZXRpdGl2YSBkZSBsYSBhZXJvbMOtbmVhIEFtZXJpY2FuIEFpcmxpbmVzLCBuZWNlc2l0YXMgcmVhbGl6YXIgYWxndW5vcyBhbsOhbGlzaXMsIHBhcmEgZGV0ZXJtaW5hciBzaSBoYXkgdmFyaWFjaW9uZXMgZW4gbGEgcG9zaWNpw7NuIGRlIGxpZGVyYXpnbyBkZSBkaWNoYSBhZXJvbMOtbmVhLgoKIyMjIyBNb2RlbG8gRW50aWRhZCAtIFJlbGFjacOzbiAKU2UgdGUgaGEgc29saWNpdGFkbyBoYWNlciB1biBlc3R1ZGlvIHNvYnJlIGxhIHNpdHVhY2nDs24gYWN0dWFsIGRlIGxhIGFlcm9sw61uZWEgQW1lcmljYW4gQWlybGluZXMgeWEgcXVlIHNlIG5lY2VzaXRhIHJldmlzYXIgc3VzIGRlc3Rpbm9zLCBob3JhcmlvcyB5IGF2aW9uZXMgY29uIGxvcyBxdWUgY3VlbnRhIHBhcmEgaGFjZXIgcHJvcHVlc3RhcyBkZSBhdW1lbnRvIG8gcmVkdWNjacOzbiBkZSB2dWVsb3MgcG9yIGRlc3Rpbm8geSBob3JhcmlvcywgYXPDrSBjb21vIGxhIGNhbnRpZGFkIGRlIGF2aW9uZXMuCgoqKkNvbnN1bHRhIHkgZXhwbG9yYSBlbCBkYXRhIGZyYW1lIHBsYW5lcyB5IHdlYXRoZXIgcGFyYSBxdWUgY29ub3pjYXMgc3UgY29udGVuaWRvLioqLiAKRnVuY2nDs246IFZpZXcoKQpgYGB7cn0KbGlicmFyeShueWNmbGlnaHRzMTMpCmxpYnJhcnkoZHBseXIpCiNWaWV3KHBsYW5lcykKI1ZpZXcod2VhdGhlcikKc3VtbWFyeShmbGlnaHRzKQpgYGAKCioqU2UgbmVjZXNpdGEgc2FiZXIgZGUgY2FkYSB2dWVsbywgbGEgYWVyb2zDrW5lYSwgZWwgYWVyb3B1ZXJ0byBkZSBvcmlnZW4geSBlbCBhZXJvcHVlcnRvIGRlc3Rpbm8uKiogICAgIApGdW5jacOzbjogc2VsZWN0KCkKYGBge3J9CnZ1ZWxvcyA8LSBzZWxlY3QoZmxpZ2h0cywgZmxpZ2h0LCBjYXJyaWVyLCBvcmlnaW4sIGRlc3QpCmhlYWQodnVlbG9zKQpgYGAKCioqRW4gbGEgY29uc3VsdGEgYW50ZXJpb3Igc2UgbmVjZXNpdGEgY29ub2NlciBlbCBub21icmUgZGUgbGEgYWVyb2zDrW5lYS4qKi4gIApGdW5jacOzbjogbGVmdF9qb2luKCkKYGBge3J9CiNsZWZ0X2pvaW4oKQpgYGAKCioqU2UgbmVjZXNpdGEgc2FiZXIgbGEgY2FudGlkYWQgZGUgdnVlbG9zIHBvciBjYWRhIGRlc3Rpbm8gcGFyYSBpZGVudGlmaWNhciBjdcOhbGVzIHNvbiBsb3MgZGVzdGlub3MgbcOhcyBidXNjYWRvcy4qKi4gCkZ1bmNpw7NuOiBzZWxlY3QoKSB5IGNvdW50KCkKYGBge3J9CmNvdW50KHZ1ZWxvcywgZGVzdCwgc29ydD1UUlVFKQpgYGAKCioqQWdyZWdhciBlbCBub21icmUgZGUgbGEgYWVyb2zDrW5lYSBhbCBkYXRhIGZyYW1lIGFudGVyaW9yLioqLiAKRnVuY2nDs246IGxlZnRfam9pbigpCmBgYHtyfQojbGVmdF9qb2luKCkKYGBgCgoqKlNlIG5lY2VzaXRhIGNvbm9jZXIgbGFzIGFlcm9sw61uZWFzIChjbGF2ZSB5IG5vbWJyZSkgeSBkZXN0aW5vcyBxdWUgdnVlbGFuIHBvciBsYSBNYcOxYW5hOiBkZSA2IGEgMTIsIFRhcmRlOiBkZSAxMiBhIDE5ICwgTm9jaGU6IGRlIDE5IGEgMjQgeSBNYWRydWdhZGEgZGUgMjQgYSA2LiBBZ3JlZ2EgdW4gbnVldm8gY2FtcG8gYSBsYSB0YWJsYSBjb24gZWwgbm9tYnJlIGRlIGNsYXNfaG9yYXJpbyB5IGFncmVnYSwgbWHDsWFuYSwgdGFyZGUsIG5vY2hlIHkgbWFkcnVnYWRhIHNlZ8O6biBzZWEgZWwgY2Fzby4qKi4gCkZ1bmNpw7NuOiBzZWxlY3QoKSwgbGVmdF9qb2luKCksIG11dGF0ZSgpLGlmZWxzZSBjb24gaW4KYGBge3J9CmhvcmFyaW9zIDwtIHNlbGVjdChmbGlnaHRzLCBmbGlnaHQsIGNhcnJpZXIsIGRlc3QsIGhvdXIpCmhlYWQoaG9yYXJpb3MpCiNob3JhcmlvcyRjYXRlZ29yaWEgPC0gaWYoZmxpZ2h0cyRob3VyPj02ICYgaG91cjwxMikgewojICJNYcOxYW5hIgojfQojaGVhZChob3JhcmlvcykKYGBgCgoqKlNlIG5lY2VzaXRhIHNhYmVyIGxhIGNhbnRpZGFkIGRlIHZ1ZWxvcyBwb3IgYWVyb2zDrW5lYSB5IGRlc3Rpbm8gcXVlIGhheSBwb3IgbGEgTWHDsWFuYSwgVGFyZGUsIE5vY2hlIHkgTWFkcnVnYWRhLioqLiAKRnVuY2nDs246IGdyb3VwX2J5KCkgeSBjb3VudCgpCmBgYHtyfQoKYGBgCgoqKlNlIG5lY2VzaXRhIHNhYmVyIGEgcXXDqSBkZXN0aW5vcyB2dWVsYSBsYSBhZXJvbMOtbmVhIEFtZXJpY2FuIEFpcmxpbmVzIEluYy4tQUEgZHVyYW50ZSBsYSBtYWRydWdhZGEuKiouIApGdW5jacOzbjogc2VsZWN0KCksZmlsdGVyKCksZ3JvdXBfYnkoKQpgYGB7cn0KCmBgYAoKKirCv1F1w6kgYXZpb25lcyB1dGlsaXphIGxhIGFlcm9sw61uZWEgQUE/IGFlcm9sw61uZWEsIHRpcG8sIG1vdG9yIHkgbsO6bWVybyBkZSBhc2llbnRvcyB5IMK/Q3XDoW50b3MgdnVlbG9zIHNlIGhhbiByZWFsaXphZG8gY29uIGNhZGEgdW5vPyBlbGltaW5hIGxvcyBOQSdzKiouIApGdW5jacOzbjogbGVmdF9qb2luKCksIHNlbGVjdCgpLCBmaWx0ZXIoKSwgZ3JvdXBfYnkoKSwgY291bnQoKQpgYGB7cn0KCmBgYAoKX19IQUxMQVpHT1NfXyAKCg==