Свързване към двете бази данни

yang_connection <- dbConnect(RSQLite::SQLite(), "../../python/datasets/db/dota.db")
conl_connection <- dbConnect(RSQLite::SQLite(), "../../python/datasets/db/dota2.db")

df <- tbl(yang_connection, "match") %>%
  mutate(data = "Yang") %>%
  collect() %>%
  bind_rows(
    tbl(conl_connection, "match") %>%
      mutate(data = "Conley") %>%
      collect()
  )
Процент игри в които отбор радиант са спечелили
df %>%
  group_by(data) %>%
  summarise(radiant_win_percentage = sum(radiant_win) / length(radiant_win))
## # A tibble: 2 x 2
##   data   radiant_win_percentage
##   <chr>                   <dbl>
## 1 Conley                  0.865
## 2 Yang                    0.535
df %>%
  filter(data == "Yang") %>%
  ggplot(aes(x = as.factor(radiant_win == 1))) +
  geom_bar(mapping = aes(y = (..count..) / sum(..count..)), fill = "steelblue") +
  xlab("Радиант побеждава") +
  ylab("Процент победи") +
  ggtitle("Барплот на победите на Радиант при Yang Данни")

df %>%
  filter(data == "Conley") %>%
  ggplot(aes(x = as.factor(radiant_win == 1))) +
  geom_bar(mapping = aes(y = (..count..) / sum(..count..)), fill = "steelblue") +
  xlab("Радиант побеждава") +
  ylab("Процент победи") +
  ggtitle("Барплот на победите на Радиант при Conley Данни")

Плътности на времетраенето на мачовете

df %>%
  ggplot(mapping = aes(x = duration / 60, fill = data)) +
  geom_density(alpha = 0.4) +
  xlim(c(0, 80)) +
  xlab("Времетраене на мач") +
  ylab("Плътност") +
  ggtitle("Емпирични плътности на времетраенето на мачовете")
## Warning: Removed 1147 rows containing non-finite values (stat_density).