bici <- read.csv("hour.csv")
head(bici)
## instant dteday season yr mnth hr holiday weekday workingday
## 1 1 2011-01-01 1 0 1 0 0 6 0
## 2 2 2011-01-01 1 0 1 1 0 6 0
## 3 3 2011-01-01 1 0 1 2 0 6 0
## 4 4 2011-01-01 1 0 1 3 0 6 0
## 5 5 2011-01-01 1 0 1 4 0 6 0
## 6 6 2011-01-01 1 0 1 5 0 6 0
## weathersit temp atemp hum windspeed casual registered cnt
## 1 1 0.24 0.2879 0.81 0.0000 3 13 16
## 2 1 0.22 0.2727 0.80 0.0000 8 32 40
## 3 1 0.22 0.2727 0.80 0.0000 5 27 32
## 4 1 0.24 0.2879 0.75 0.0000 3 10 13
## 5 1 0.24 0.2879 0.75 0.0000 0 1 1
## 6 2 0.24 0.2576 0.75 0.0896 0 1 1
names(bici)
## [1] "instant" "dteday" "season" "yr" "mnth"
## [6] "hr" "holiday" "weekday" "workingday" "weathersit"
## [11] "temp" "atemp" "hum" "windspeed" "casual"
## [16] "registered" "cnt"
¿ Que mes es el que tiene la mayor demanda?
library(dplyr)
bici <- tbl_df(bici)
bici %>% group_by(yr,mnth) %>% summarise(demanda = sum(cnt)) %>% top_n(1)
## Selecting by demanda
## Source: local data frame [2 x 3]
## Groups: yr
##
## yr mnth demanda
## 1 0 6 143512
## 2 1 9 218573
Los meses de mayor demanda son Junio del año 0 y Septiembre del año 1
¿Que rango de hora es la de mayor demanda?
bici %>% group_by(hr) %>% summarise(demanda_promedio = mean(cnt)) %>% top_n(1)
## Selecting by demanda_promedio
## Source: local data frame [1 x 2]
##
## hr demanda_promedio
## 1 17 461.4521
La demanda promedio mayor se da a las 17 hrs.
¿Que temporada es la mas alta?
bici %>% group_by(season) %>% summarise(demanda_promedio = mean(cnt)) %>% top_n(1)
## Selecting by demanda_promedio
## Source: local data frame [1 x 2]
##
## season demanda_promedio
## 1 3 236.0162
La mayor demanda se da en la temporada 3 (Otoño)
¿ A que temperatura baja la demanda?
bici %>% group_by(season,temp) %>% select(temp,cnt) %>% summarise(demanda=mean(cnt)) %>% filter(min_rank(demanda) <= 1)
## Source: local data frame [4 x 3]
## Groups: season
##
## season temp demanda
## 1 1 0.08 28.23529
## 2 2 0.16 4.50000
## 3 3 0.44 51.45455
## 4 4 0.18 49.27273
La demanda baja a diferentes temperaturas y para diferentes temporadas. En la temporada 1 (Primavera) la demanda es mas baja a una temperatura de 0.08 (3.3ªC), en la temporada 2 (verano) la demanda es mas baja a una temperatura de 0.16 (6.6ªC) , en la temporada 3 (Otoño) la demanda es mas baja a una temperatura de 0.44 (18ªC) y para la temporada 4 (Invierno) la demanda es mas baja a (7ªC)
¿ A que humedad baja la demanda?
bici %>% group_by(season,hum) %>% select(hum,cnt) %>% summarise(demanda=mean(cnt)) %>% filter(min_rank(demanda) <= 1)
## Source: local data frame [4 x 3]
## Groups: season
##
## season hum demanda
## 1 1 0.13 17.000000
## 2 2 0.86 3.333333
## 3 3 0.93 25.000000
## 4 4 1.00 82.860215
En Verano, Otoño e Invierno humedades altas (\(\approx\) 1) implican baja demanda, en Primavera humedades bajas resultan en baja demanda.
¿Que condiciones serian ideales para nuestra demanda?
bici %>% group_by(season) %>% summarise(demanda=mean(cnt))
## Source: local data frame [4 x 2]
##
## season demanda
## 1 1 111.1146
## 2 2 208.3441
## 3 3 236.0162
## 4 4 198.8689
La demanda promedio maxima se da en el Otoño (season = 3). En esta temporada las condiciones de humedad son bajas y la temperatura es nivel ambiente. Por lo tanto estas son las condiciones ideales.