##Situación Problema Te acabas de incorporar a una empresa consultora en Inteligencia de Negocios, actualmente están brindando servicios de análisis para la industria de la aviación y les interesa tener a la aerolínea American Airlines como cliente ya que es una de las aerolíneas líderes en los aeropuertos de Nueva York, motivo por el cuál te han contratado. Te han pedido que identifiques cómo puede dicha aerolínea mejorar su posición competitiva !! Para identificar oportunidades de mejorar la posición competitiva de la aerolínea American Airlines, necesitas realizar algunos análisis, para determinar si hay variaciones en la posición de liderazgo de dicha aerolínea.
##Modelo Entidad-Relación Se te ha solicitado hacer un estudio sobre la situación actual de la aerolínea American Airlines ya que se necesita revisar sus destinos, horarios y aviones con los que cuenta para hacer propuestas de aumento o reducción de vuelos por destino y horarios, así como la cantidad de aviones. Para lograrlo considera las funciones sugeridas en los siguientes pasos:
Consulta y explora el data frame planes y weather para que conozcas su contenido
library(nycflights13)
#view(planes)
#View(weather)
Se necesita saber de cada vuelo, la aerolínea, el aeropuerto de origen y el aeropuerto destino
#select(flights)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
vuelos <- select(flights, flight, carrier, origin, dest)
head(vuelos)
## # A tibble: 6 × 4
## flight carrier origin dest
## <int> <chr> <chr> <chr>
## 1 1545 UA EWR IAH
## 2 1714 UA LGA IAH
## 3 1141 AA JFK MIA
## 4 725 B6 JFK BQN
## 5 461 DL LGA ATL
## 6 1696 UA EWR ORD
En la consulta anterior se necesita conocer el nombre de la aerolínea.
#left_join()
Función: Se necesita saber la cantidad de vuelos por cada destino para identificar cuáles son los destinos más buscados.
count(vuelos, dest, sort= TRUE)
## # A tibble: 105 × 2
## dest n
## <chr> <int>
## 1 ORD 17283
## 2 ATL 17215
## 3 LAX 16174
## 4 BOS 15508
## 5 MCO 14082
## 6 CLT 14064
## 7 SFO 13331
## 8 FLL 12055
## 9 MIA 11728
## 10 DCA 9705
## # … with 95 more rows
Agregar el nombre de la aerolínea al data frame anterior.
#lesft_join()
Se necesita conocer las aerolíneas (clave y nombre) y destinos que vuelan por la Mañana: de 6 a 12, Tarde: de 12 a 19 , Noche: de 19 a 24 y Madrugada de 24 a 6.
horarios <- select(flights, flight, carrier, dest, hour)
head(horarios)
## # A tibble: 6 × 4
## flight carrier dest hour
## <int> <chr> <chr> <dbl>
## 1 1545 UA IAH 5
## 2 1714 UA IAH 5
## 3 1141 AA MIA 5
## 4 725 B6 BQN 5
## 5 461 DL ATL 6
## 6 1696 UA ORD 5
#horarios$categoria <- if(flights$hour>=6 && flights$hour<12)
#"Mañana"}
#head(horarios)
Agrega un nuevo campo a la tabla con el nombre de clas_horario y agrega, mañana, tarde, noche y madrugada según sea el caso.
Se necesita saber la cantidad de vuelos por aerolínea y destino que hay por la Mañana, Tarde, Noche y Madrugada.
Se necesita saber a qué destinos vuela la aerolínea American Airlines Inc.-AA durante la madrugada.
¿Qué aviones utiliza la aerolínea AA? aerolínea, tipo, motor y número de asientos y ¿Cuántos vuelos se han realizado con cada uno? elimina los NA’s
head(planes)
## # A tibble: 6 × 9
## tailnum year type manuf…¹ model engines seats speed engine
## <chr> <int> <chr> <chr> <chr> <int> <int> <int> <chr>
## 1 N10156 2004 Fixed wing multi engine EMBRAER EMB-… 2 55 NA Turbo…
## 2 N102UW 1998 Fixed wing multi engine AIRBUS… A320… 2 182 NA Turbo…
## 3 N103US 1999 Fixed wing multi engine AIRBUS… A320… 2 182 NA Turbo…
## 4 N104UW 1999 Fixed wing multi engine AIRBUS… A320… 2 182 NA Turbo…
## 5 N10575 2002 Fixed wing multi engine EMBRAER EMB-… 2 55 NA Turbo…
## 6 N105UW 1999 Fixed wing multi engine AIRBUS… A320… 2 182 NA Turbo…
## # … with abbreviated variable name ¹manufacturer
aviones <- select(planes, type, engine, seats)
tail(aviones)
## # A tibble: 6 × 3
## type engine seats
## <chr> <chr> <int>
## 1 Fixed wing multi engine Turbo-fan 142
## 2 Fixed wing multi engine Turbo-fan 100
## 3 Fixed wing multi engine Turbo-fan 142
## 4 Fixed wing multi engine Turbo-fan 100
## 5 Fixed wing multi engine Turbo-jet 142
## 6 Fixed wing multi engine Turbo-jet 142
Imagina que entregarás estos hallazgos a tu superior, elabora un reporte ejecutivo utilizando los resultados obtenidos. ABC
##Visualización de datos
En los avances anteriores se han realizado diferentes análisis y ahora nos solicitan hacer visualizaciones de la aerolínea American Airlines para los ejecutivos con las siguientes características. Dentro de las aerolíneas el retraso tanto en la hora de partida como en la hora de llegada a su destino van generando indicadores negativos.
Se solicita analizar para la aerolínea American Airlines si los vuelos que tienen retraso en la partida también tienen retraso en la hora de llegada. Realiza una visualización con una gráfica Scatterplot.
Visualiza la tendencia de la temperatura durante los primeros 15 días del mes de Enero en los vuelos que parten del aeropuerto “Newark, EWR”, utilizar una gráfica de línea.
#head(weather)
#g1 <- select(weather, origin=="EWR")
#head(g1)
#g2 <- filter(g1, day <=15)
#summary(g2)
#g3 <- filter(g2, month==1)
#summary(g3)
#g4 <- g3 %>% summarize_if(is.numeric, -mean(.,na.rm= TRUE))
#plot(g3$day, g3$temp, type= "p")
• Visualiza la temperatura más frecuente en los primeros 15 días del mes de Enero, utilizar un histrograma. • Utiliza Facets para observar cómo varía la temperatura en cada mes en él histograma del punto anterior . • Número de vuelos que salieron de Nueva York en 2013 por aerolínea (mostrar solamente las 10 aerolíneas con más vuelos), utilizar gráfica de barras. • Visualiza el punto anterior en una gráfica de pie. • Relaciona el data frame fligths con el data frame airports a través del campo destino ¿cómo lograr estas relación? • Crea un nuevo data frame con el punto anterior únicamente con los 5 carriers con más vuelos por destino. • Realiza una visualización del punto anterior de las siguientes tres formas. hallazgos a tu superior, elabora un reporte ejecutivo utilizando los resultados obtenidos.
• Describe el valor de la integridad. • Agrega una reflexión personal de cómo puedes actuar con respeto y honestidad en los negocios y en el uso de datos cuando realices análisis de datos y estés en contacto con los datos de una empresa. • Agrega al menos 3 bibliografías y cítalas en el punto anterior. http://codigoeticaeintegridad.com/
##Bibliografía
Wickham, H. and Grolemund, G. (2017) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data O’Reilly Media: Sebastopol, California Nycflights13 v1.0.0 https://www.rdocumentation.org/packages/nycflights13/versions/1.0.0