¿Cómo mejorar la posición competitiva de una de las aerolíneas líderes en los aeropuertos de Nueva York?
Te acabas de incorporar a una empresa consultora en Inteligencia de
Negocios, actualmente están brindando servicios de análisis para la
industria de la aviación y les interesa tener a la aerolínea American
Airlines como cliente ya que es una de las aerolíneas líderes en los
aeropuertos de Nueva York, motivo por el cuál te han contratado.
Te han pedido que identifiques cómo puede dicha aerolínea mejorar su
posición competitiva !!
Para identificar oportunidades de mejorar la posición competitiva de la
aerolínea American Airlines, necesitas realizar algunos análisis, para
determinar si hay variaciones en la posición de liderazgo de dicha
aerolínea.
Se te ha solicitado hacer un estudio sobre la situación actual de la aerolínea American Airlines ya que se necesita revisar sus destinos, horarios y aviones con los que cuenta para hacer propuestas de aumento o reducción de vuelos por destino y horarios, así como la cantidad de aviones.
Consulta y explora el data frame planes y weather para que conozcas su contenido.. Función: View()
library(nycflights13)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#View(planes)
#View(weather)
summary(flights)
## year month day dep_time sched_dep_time
## Min. :2013 Min. : 1.000 Min. : 1.00 Min. : 1 Min. : 106
## 1st Qu.:2013 1st Qu.: 4.000 1st Qu.: 8.00 1st Qu.: 907 1st Qu.: 906
## Median :2013 Median : 7.000 Median :16.00 Median :1401 Median :1359
## Mean :2013 Mean : 6.549 Mean :15.71 Mean :1349 Mean :1344
## 3rd Qu.:2013 3rd Qu.:10.000 3rd Qu.:23.00 3rd Qu.:1744 3rd Qu.:1729
## Max. :2013 Max. :12.000 Max. :31.00 Max. :2400 Max. :2359
## NA's :8255
## dep_delay arr_time sched_arr_time arr_delay
## Min. : -43.00 Min. : 1 Min. : 1 Min. : -86.000
## 1st Qu.: -5.00 1st Qu.:1104 1st Qu.:1124 1st Qu.: -17.000
## Median : -2.00 Median :1535 Median :1556 Median : -5.000
## Mean : 12.64 Mean :1502 Mean :1536 Mean : 6.895
## 3rd Qu.: 11.00 3rd Qu.:1940 3rd Qu.:1945 3rd Qu.: 14.000
## Max. :1301.00 Max. :2400 Max. :2359 Max. :1272.000
## NA's :8255 NA's :8713 NA's :9430
## carrier flight tailnum origin
## Length:336776 Min. : 1 Length:336776 Length:336776
## Class :character 1st Qu.: 553 Class :character Class :character
## Mode :character Median :1496 Mode :character Mode :character
## Mean :1972
## 3rd Qu.:3465
## Max. :8500
##
## dest air_time distance hour
## Length:336776 Min. : 20.0 Min. : 17 Min. : 1.00
## Class :character 1st Qu.: 82.0 1st Qu.: 502 1st Qu.: 9.00
## Mode :character Median :129.0 Median : 872 Median :13.00
## Mean :150.7 Mean :1040 Mean :13.18
## 3rd Qu.:192.0 3rd Qu.:1389 3rd Qu.:17.00
## Max. :695.0 Max. :4983 Max. :23.00
## NA's :9430
## minute time_hour
## Min. : 0.00 Min. :2013-01-01 05:00:00.00
## 1st Qu.: 8.00 1st Qu.:2013-04-04 13:00:00.00
## Median :29.00 Median :2013-07-03 10:00:00.00
## Mean :26.23 Mean :2013-07-03 05:22:54.64
## 3rd Qu.:44.00 3rd Qu.:2013-10-01 07:00:00.00
## Max. :59.00 Max. :2013-12-31 23:00:00.00
##
Se necesita saber de cada vuelo, la aerolínea, el aeropuerto
de origen y el aeropuerto destino.
Función: select()
vuelos <- select(flights, flight, carrier, origin, dest)
head(vuelos)
## # A tibble: 6 × 4
## flight carrier origin dest
## <int> <chr> <chr> <chr>
## 1 1545 UA EWR IAH
## 2 1714 UA LGA IAH
## 3 1141 AA JFK MIA
## 4 725 B6 JFK BQN
## 5 461 DL LGA ATL
## 6 1696 UA EWR ORD
En la consulta anterior se necesita conocer el nombre de la
aerolínea..
Función: left_join()
#left_join()
Se necesita saber la cantidad de vuelos por cada destino para identificar cuáles son los destinos más buscados.. Función: select() y count()
count(vuelos, dest, sort=TRUE)
## # A tibble: 105 × 2
## dest n
## <chr> <int>
## 1 ORD 17283
## 2 ATL 17215
## 3 LAX 16174
## 4 BOS 15508
## 5 MCO 14082
## 6 CLT 14064
## 7 SFO 13331
## 8 FLL 12055
## 9 MIA 11728
## 10 DCA 9705
## # … with 95 more rows
Agregar el nombre de la aerolínea al data frame anterior.. Función: left_join()
#left_join()
Se necesita conocer las aerolíneas (clave y nombre) y destinos que vuelan por la Mañana: de 6 a 12, Tarde: de 12 a 19 , Noche: de 19 a 24 y Madrugada de 24 a 6. Agrega un nuevo campo a la tabla con el nombre de clas_horario y agrega, mañana, tarde, noche y madrugada según sea el caso.. Función: select(), left_join(), mutate(),ifelse con in
horarios <- select(flights, flight, carrier, dest, hour)
head(horarios)
## # A tibble: 6 × 4
## flight carrier dest hour
## <int> <chr> <chr> <dbl>
## 1 1545 UA IAH 5
## 2 1714 UA IAH 5
## 3 1141 AA MIA 5
## 4 725 B6 BQN 5
## 5 461 DL ATL 6
## 6 1696 UA ORD 5
#horarios$categoria <- if(flights$hour>=6 & hour<12) {
# "Mañana"
#}
#head(horarios)
Se necesita saber la cantidad de vuelos por aerolínea y destino que hay por la Mañana, Tarde, Noche y Madrugada.. Función: group_by() y count()
Se necesita saber a qué destinos vuela la aerolínea American Airlines Inc.-AA durante la madrugada.. Función: select(),filter(),group_by()
¿Qué aviones utiliza la aerolínea AA? aerolínea, tipo, motor y número de asientos y ¿Cuántos vuelos se han realizado con cada uno? elimina los NA’s. Función: left_join(), select(), filter(), group_by(), count()
HALLAZGOS