Q1
data(cars)
median(cars$speed)
## [1] 15
Q2
otp <- read.csv("On_Time_Performance.csv")
str(otp)
## 'data.frame': 570131 obs. of 110 variables:
## $ Year : int 2018 2018 2018 2018 2018 2018 2018 2018 2018 2018 ...
## $ Quarter : int 1 1 1 1 1 1 1 1 1 1 ...
## $ Month : int 1 1 1 1 1 1 1 1 1 1 ...
## $ DayofMonth : int 16 17 18 19 20 21 22 23 24 25 ...
## $ DayOfWeek : int 2 3 4 5 6 7 1 2 3 4 ...
## $ FlightDate : chr "2018-01-16" "2018-01-17" "2018-01-18" "2018-01-19" ...
## $ UniqueCarrier : chr "AA" "AA" "AA" "AA" ...
## $ AirlineID : int 19805 19805 19805 19805 19805 19805 19805 19805 19805 19805 ...
## $ Carrier : chr "AA" "AA" "AA" "AA" ...
## $ TailNum : chr "N128AN" "N128AN" "N121AN" "N129AA" ...
## $ FlightNum : int 228 228 228 228 228 228 228 228 228 228 ...
## $ OriginAirportID : int 12892 12892 12892 12892 12892 12892 12892 12892 12892 12892 ...
## $ OriginAirportSeqID : int 1289206 1289206 1289206 1289206 1289206 1289206 1289206 1289206 1289206 1289206 ...
## $ OriginCityMarketID : int 32575 32575 32575 32575 32575 32575 32575 32575 32575 32575 ...
## $ Origin : chr "LAX" "LAX" "LAX" "LAX" ...
## $ OriginCityName : chr "Los Angeles, CA" "Los Angeles, CA" "Los Angeles, CA" "Los Angeles, CA" ...
## $ OriginState : chr "CA" "CA" "CA" "CA" ...
## $ OriginStateFips : int 6 6 6 6 6 6 6 6 6 6 ...
## $ OriginStateName : chr "California" "California" "California" "California" ...
## $ OriginWac : int 91 91 91 91 91 91 91 91 91 91 ...
## $ DestAirportID : int 12173 12173 12173 12173 12173 12173 12173 12173 12173 12173 ...
## $ DestAirportSeqID : int 1217303 1217303 1217303 1217303 1217303 1217303 1217303 1217303 1217303 1217303 ...
## $ DestCityMarketID : int 32134 32134 32134 32134 32134 32134 32134 32134 32134 32134 ...
## $ Dest : chr "HNL" "HNL" "HNL" "HNL" ...
## $ DestCityName : chr "Honolulu, HI" "Honolulu, HI" "Honolulu, HI" "Honolulu, HI" ...
## $ DestState : chr "HI" "HI" "HI" "HI" ...
## $ DestStateFips : int 15 15 15 15 15 15 15 15 15 15 ...
## $ DestStateName : chr "Hawaii" "Hawaii" "Hawaii" "Hawaii" ...
## $ DestWac : int 2 2 2 2 2 2 2 2 2 2 ...
## $ CRSDepTime : int 2011 2011 2011 2011 2011 2011 2011 2011 2011 2011 ...
## $ DepTime : int 2010 2003 2008 2010 2001 2003 2003 2011 2122 2007 ...
## $ DepDelay : num -1 -8 -3 -1 -10 -8 -8 0 71 -4 ...
## $ DepDelayMinutes : num 0 0 0 0 0 0 0 0 71 0 ...
## $ DepDel15 : num 0 0 0 0 0 0 0 0 1 0 ...
## $ DepartureDelayGroups: int -1 -1 -1 -1 -1 -1 -1 0 4 -1 ...
## $ DepTimeBlk : chr "2000-2059" "2000-2059" "2000-2059" "2000-2059" ...
## $ TaxiOut : num 24 18 14 17 17 17 24 23 26 18 ...
## $ WheelsOff : int 2034 2021 2022 2027 2018 2020 2027 2034 2148 2025 ...
## $ WheelsOn : int 2358 2348 6 2352 2352 1 14 2352 125 2357 ...
## $ TaxiIn : num 7 5 6 3 5 4 3 14 3 2 ...
## $ CRSArrTime : int 29 29 29 29 29 29 29 29 29 29 ...
## $ ArrTime : int 5 2353 12 2355 2357 5 17 6 128 2359 ...
## $ ArrDelay : num -24 -36 -17 -34 -32 -24 -12 -23 59 -30 ...
## $ ArrDelayMinutes : num 0 0 0 0 0 0 0 0 59 0 ...
## $ ArrDel15 : num 0 0 0 0 0 0 0 0 1 0 ...
## $ ArrivalDelayGroups : int -2 -2 -2 -2 -2 -2 -1 -2 3 -2 ...
## $ ArrTimeBlk : chr "0001-0559" "0001-0559" "0001-0559" "0001-0559" ...
## $ Cancelled : num 0 0 0 0 0 0 0 0 0 0 ...
## $ CancellationCode : chr "" "" "" "" ...
## $ Diverted : num 0 0 0 0 0 0 0 0 0 0 ...
## $ CRSElapsedTime : num 378 378 378 378 378 378 378 378 378 378 ...
## $ ActualElapsedTime : num 355 350 364 345 356 362 374 355 366 352 ...
## $ AirTime : num 324 327 344 325 334 341 347 318 337 332 ...
## $ Flights : num 1 1 1 1 1 1 1 1 1 1 ...
## $ Distance : num 2556 2556 2556 2556 2556 ...
## $ DistanceGroup : int 11 11 11 11 11 11 11 11 11 11 ...
## $ CarrierDelay : num NA NA NA NA NA NA NA NA 59 NA ...
## $ WeatherDelay : num NA NA NA NA NA NA NA NA 0 NA ...
## $ NASDelay : num NA NA NA NA NA NA NA NA 0 NA ...
## $ SecurityDelay : num NA NA NA NA NA NA NA NA 0 NA ...
## $ LateAircraftDelay : num NA NA NA NA NA NA NA NA 0 NA ...
## $ FirstDepTime : int NA NA NA NA NA NA NA NA NA NA ...
## $ TotalAddGTime : num NA NA NA NA NA NA NA NA NA NA ...
## $ LongestAddGTime : num NA NA NA NA NA NA NA NA NA NA ...
## $ DivAirportLandings : int 0 0 0 0 0 0 0 0 0 0 ...
## $ DivReachedDest : num NA NA NA NA NA NA NA NA NA NA ...
## $ DivActualElapsedTime: num NA NA NA NA NA NA NA NA NA NA ...
## $ DivArrDelay : num NA NA NA NA NA NA NA NA NA NA ...
## $ DivDistance : num NA NA NA NA NA NA NA NA NA NA ...
## $ Div1Airport : chr "" "" "" "" ...
## $ Div1AirportID : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div1AirportSeqID : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div1WheelsOn : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div1TotalGTime : num NA NA NA NA NA NA NA NA NA NA ...
## $ Div1LongestGTime : num NA NA NA NA NA NA NA NA NA NA ...
## $ Div1WheelsOff : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div1TailNum : chr "" "" "" "" ...
## $ Div2Airport : chr "" "" "" "" ...
## $ Div2AirportID : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div2AirportSeqID : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div2WheelsOn : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div2TotalGTime : num NA NA NA NA NA NA NA NA NA NA ...
## $ Div2LongestGTime : num NA NA NA NA NA NA NA NA NA NA ...
## $ Div2WheelsOff : int NA NA NA NA NA NA NA NA NA NA ...
## $ Div2TailNum : chr "" "" "" "" ...
## $ Div3Airport : logi NA NA NA NA NA NA ...
## $ Div3AirportID : logi NA NA NA NA NA NA ...
## $ Div3AirportSeqID : logi NA NA NA NA NA NA ...
## $ Div3WheelsOn : logi NA NA NA NA NA NA ...
## $ Div3TotalGTime : logi NA NA NA NA NA NA ...
## $ Div3LongestGTime : logi NA NA NA NA NA NA ...
## $ Div3WheelsOff : logi NA NA NA NA NA NA ...
## $ Div3TailNum : logi NA NA NA NA NA NA ...
## $ Div4Airport : logi NA NA NA NA NA NA ...
## $ Div4AirportID : logi NA NA NA NA NA NA ...
## $ Div4AirportSeqID : logi NA NA NA NA NA NA ...
## $ Div4WheelsOn : logi NA NA NA NA NA NA ...
## $ Div4TotalGTime : logi NA NA NA NA NA NA ...
## $ Div4LongestGTime : logi NA NA NA NA NA NA ...
## [list output truncated]
Q3
sum(is.na(otp$Div2WheelsOff))
## [1] 570122
Q4
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
avg_carrier_delay <- otp %>%
group_by(Carrier) %>%
summarise(avg_dep_delay = mean(DepDelay, na.rm = TRUE)) %>%
arrange(desc(avg_dep_delay))
head(avg_carrier_delay)
## # A tibble: 6 × 2
## Carrier avg_dep_delay
## <chr> <dbl>
## 1 B6 20.4
## 2 F9 16.0
## 3 OO 15.1
## 4 OH 13.8
## 5 EV 13.6
## 6 9E 12.4
Q5
library(jsonlite)
## Warning: package 'jsonlite' was built under R version 4.3.3
btc <- "https://min-api.cryptocompare.com/data/v2/histoday?fsym=BTC&tsym=USD&limit=100"
btc_data <- fromJSON(btc)
btc_prices <- btc_data$Data$Data
max(btc_prices$close)
## [1] 106155.6