Свързване към двете бази данни
yang_connection <- dbConnect(RSQLite::SQLite(), "../../python/datasets/db/dota.db")
conl_connection <- dbConnect(RSQLite::SQLite(), "../../python/datasets/db/dota2.db")
df <- tbl(yang_connection, "match") %>%
mutate(data = "Yang") %>%
collect() %>%
bind_rows(
tbl(conl_connection, "match") %>%
mutate(data = "Conley") %>%
collect()
)
Процент игри в които отбор радиант са спечелили
df %>%
group_by(data) %>%
summarise(radiant_win_percentage = sum(radiant_win) / length(radiant_win))
## # A tibble: 2 x 2
## data radiant_win_percentage
## <chr> <dbl>
## 1 Conley 0.865
## 2 Yang 0.535
df %>%
filter(data == "Yang") %>%
ggplot(aes(x = as.factor(radiant_win == 1))) +
geom_bar(mapping = aes(y = (..count..) / sum(..count..)), fill = "steelblue") +
xlab("Радиант побеждава") +
ylab("Процент победи") +
ggtitle("Барплот на победите на Радиант при Yang Данни")

df %>%
filter(data == "Conley") %>%
ggplot(aes(x = as.factor(radiant_win == 1))) +
geom_bar(mapping = aes(y = (..count..) / sum(..count..)), fill = "steelblue") +
xlab("Радиант побеждава") +
ylab("Процент победи") +
ggtitle("Барплот на победите на Радиант при Conley Данни")

Плътности на времетраенето на мачовете
df %>%
ggplot(mapping = aes(x = duration / 60, fill = data)) +
geom_density(alpha = 0.4) +
xlim(c(0, 80)) +
xlab("Времетраене на мач") +
ylab("Плътност") +
ggtitle("Емпирични плътности на времетраенето на мачовете")
## Warning: Removed 1147 rows containing non-finite values (stat_density).
