Wikipediaページビュー数の推移

はじめに

Wikipediaのページビュー数推移を取れるパッケージがあります。

wikipediatrendパッケージです。

使ってみましょう。

特に意味はありませんが、SIer企業のページビュー数を見てみます。

過去50日のWikipediaページビュー数の取得

wp_trendに、下のように引数を与えればOKです。

library(wikipediatrend)
page_views = 
  wp_trend( 
    page = c("新日鉄住金ソリューションズ", "NTTデータ", "野村総合研究所") ,
    lang = "ja",
    from = Sys.Date()-50
  )

## 内容確認
head(page_views)
##   date       count lang page             rank month 
## 1 2015-04-30 72    ja   %e6%96%b0%e6 ... -1   201504
## 2 2015-04-29 45    ja   %e6%96%b0%e6 ... -1   201504
## 3 2015-05-03 17    ja   %e6%96%b0%e6 ... -1   201505
## 4 2015-05-02 23    ja   %e6%96%b0%e6 ... -1   201505
## 5 2015-05-01 40    ja   %e6%96%b0%e6 ... -1   201505
## 6 2015-05-07 64    ja   %e6%96%b0%e6 ... -1   201505
##   title                       
## 1 新日鉄住金ソリューション ...
## 2 新日鉄住金ソリューション ...
## 3 新日鉄住金ソリューション ...
## 4 新日鉄住金ソリューション ...
## 5 新日鉄住金ソリューション ...
## 6 新日鉄住金ソリューション ...

可視化

グラフにしましょう。

library(ggplot2)
library(dplyr)
page_views %>% 
  ggplot() + 
  geom_line(aes(x = date, y = count, color = title, group = title), size = 2) + 
  theme_bw(base_family = "HiraKakuProN-W3")

plot of chunk unnamed-chunk-2