##Situación Problema Te acabas de incorporar a una empresa consultora en Inteligencia de Negocios, actualmente están brindando servicios de análisis para la industria de la aviación y les interesa tener a la aerolínea American Airlines como cliente ya que es una de las aerolíneas líderes en los aeropuertos de Nueva York, motivo por el cuál te han contratado. Te han pedido que identifiques cómo puede dicha aerolínea mejorar su posición competitiva !! Para identificar oportunidades de mejorar la posición competitiva de la aerolínea American Airlines, necesitas realizar algunos análisis, para determinar si hay variaciones en la posición de liderazgo de dicha aerolínea.

##Modelo Entidad-Relación Se te ha solicitado hacer un estudio sobre la situación actual de la aerolínea American Airlines ya que se necesita revisar sus destinos, horarios y aviones con los que cuenta para hacer propuestas de aumento o reducción de vuelos por destino y horarios, así como la cantidad de aviones. Para lograrlo considera las funciones sugeridas en los siguientes pasos:

Consulta y explora el data frame planes y weather para que conozcas su contenido

library(nycflights13)
#view(planes)
#View(weather)

Se necesita saber de cada vuelo, la aerolínea, el aeropuerto de origen y el aeropuerto destino

#select(flights)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
vuelos <- select(flights, flight, carrier, origin, dest)
head(vuelos)
## # A tibble: 6 × 4
##   flight carrier origin dest 
##    <int> <chr>   <chr>  <chr>
## 1   1545 UA      EWR    IAH  
## 2   1714 UA      LGA    IAH  
## 3   1141 AA      JFK    MIA  
## 4    725 B6      JFK    BQN  
## 5    461 DL      LGA    ATL  
## 6   1696 UA      EWR    ORD

En la consulta anterior se necesita conocer el nombre de la aerolínea.

#left_join()

Función: Se necesita saber la cantidad de vuelos por cada destino para identificar cuáles son los destinos más buscados.

count(vuelos, dest, sort= TRUE)
## # A tibble: 105 × 2
##    dest      n
##    <chr> <int>
##  1 ORD   17283
##  2 ATL   17215
##  3 LAX   16174
##  4 BOS   15508
##  5 MCO   14082
##  6 CLT   14064
##  7 SFO   13331
##  8 FLL   12055
##  9 MIA   11728
## 10 DCA    9705
## # … with 95 more rows

Agregar el nombre de la aerolínea al data frame anterior.

#lesft_join()

Se necesita conocer las aerolíneas (clave y nombre) y destinos que vuelan por la Mañana: de 6 a 12, Tarde: de 12 a 19 , Noche: de 19 a 24 y Madrugada de 24 a 6.

horarios <- select(flights, flight, carrier, dest, hour)
head(horarios)
## # A tibble: 6 × 4
##   flight carrier dest   hour
##    <int> <chr>   <chr> <dbl>
## 1   1545 UA      IAH       5
## 2   1714 UA      IAH       5
## 3   1141 AA      MIA       5
## 4    725 B6      BQN       5
## 5    461 DL      ATL       6
## 6   1696 UA      ORD       5
#horarios$categoria <- if(flights$hour>=6 && flights$hour<12)  
  #"Mañana"}
#head(horarios)

Agrega un nuevo campo a la tabla con el nombre de clas_horario y agrega, mañana, tarde, noche y madrugada según sea el caso.

Se necesita saber la cantidad de vuelos por aerolínea y destino que hay por la Mañana, Tarde, Noche y Madrugada.

Se necesita saber a qué destinos vuela la aerolínea American Airlines Inc.-AA durante la madrugada.

¿Qué aviones utiliza la aerolínea AA? aerolínea, tipo, motor y número de asientos y ¿Cuántos vuelos se han realizado con cada uno? elimina los NA’s

head(planes)
## # A tibble: 6 × 9
##   tailnum  year type                    manuf…¹ model engines seats speed engine
##   <chr>   <int> <chr>                   <chr>   <chr>   <int> <int> <int> <chr> 
## 1 N10156   2004 Fixed wing multi engine EMBRAER EMB-…       2    55    NA Turbo…
## 2 N102UW   1998 Fixed wing multi engine AIRBUS… A320…       2   182    NA Turbo…
## 3 N103US   1999 Fixed wing multi engine AIRBUS… A320…       2   182    NA Turbo…
## 4 N104UW   1999 Fixed wing multi engine AIRBUS… A320…       2   182    NA Turbo…
## 5 N10575   2002 Fixed wing multi engine EMBRAER EMB-…       2    55    NA Turbo…
## 6 N105UW   1999 Fixed wing multi engine AIRBUS… A320…       2   182    NA Turbo…
## # … with abbreviated variable name ¹​manufacturer
aviones <- select(planes, type, engine, seats)
tail(aviones)
## # A tibble: 6 × 3
##   type                    engine    seats
##   <chr>                   <chr>     <int>
## 1 Fixed wing multi engine Turbo-fan   142
## 2 Fixed wing multi engine Turbo-fan   100
## 3 Fixed wing multi engine Turbo-fan   142
## 4 Fixed wing multi engine Turbo-fan   100
## 5 Fixed wing multi engine Turbo-jet   142
## 6 Fixed wing multi engine Turbo-jet   142

Imagina que entregarás estos hallazgos a tu superior, elabora un reporte ejecutivo utilizando los resultados obtenidos. ABC

##Visualización de datos

En los avances anteriores se han realizado diferentes análisis y ahora nos solicitan hacer visualizaciones de la aerolínea American Airlines para los ejecutivos con las siguientes características. Dentro de las aerolíneas el retraso tanto en la hora de partida como en la hora de llegada a su destino van generando indicadores negativos.

Se solicita analizar para la aerolínea American Airlines si los vuelos que tienen retraso en la partida también tienen retraso en la hora de llegada. Realiza una visualización con una gráfica Scatterplot.

Visualiza la tendencia de la temperatura durante los primeros 15 días del mes de Enero en los vuelos que parten del aeropuerto “Newark, EWR”, utilizar una gráfica de línea.

#head(weather)
#g1 <- select(weather, origin=="EWR")
#head(g1)
#g2 <- filter(g1, day <=15)
#summary(g2)
#g3 <- filter(g2, month==1)
#summary(g3)
#g4 <- g3 %>% summarize_if(is.numeric, -mean(.,na.rm= TRUE))
#plot(g3$day, g3$temp, type= "p")

• Visualiza la temperatura más frecuente en los primeros 15 días del mes de Enero, utilizar un histrograma. • Utiliza Facets para observar cómo varía la temperatura en cada mes en él histograma del punto anterior . • Número de vuelos que salieron de Nueva York en 2013 por aerolínea (mostrar solamente las 10 aerolíneas con más vuelos), utilizar gráfica de barras. • Visualiza el punto anterior en una gráfica de pie. • Relaciona el data frame fligths con el data frame airports a través del campo destino ¿cómo lograr estas relación? • Crea un nuevo data frame con el punto anterior únicamente con los 5 carriers con más vuelos por destino. • Realiza una visualización del punto anterior de las siguientes tres formas. hallazgos a tu superior, elabora un reporte ejecutivo utilizando los resultados obtenidos.

Compromiso ético y ciudadano

• Describe el valor de la integridad. • Agrega una reflexión personal de cómo puedes actuar con respeto y honestidad en los negocios y en el uso de datos cuando realices análisis de datos y estés en contacto con los datos de una empresa. • Agrega al menos 3 bibliografías y cítalas en el punto anterior. http://codigoeticaeintegridad.com/

##Bibliografía

Wickham, H. and Grolemund, G. (2017) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data O’Reilly Media: Sebastopol, California Nycflights13 v1.0.0 https://www.rdocumentation.org/packages/nycflights13/versions/1.0.0