はてなダイアリーとRPubsの場合を書いておく。
hatenabパッケージを使うのでインストールする。
devtools::install_github("dichika/hatenab")
はてなダイアリーの場合はこう。
筆者の場合、2010-02-10から書き始めているので以下の日付になっている。
library(hatenab)
dates <- seq(as.Date("2010-02-10"),as.Date("2015-01-22"), by=1)
dates <- format(dates, "%Y%m%d")
url_hatena <- sprintf("http://d.hatena.ne.jp/dichika/%s/p1", dates)
result_hatena <- getBookmarkCount(url_hatena)
head(result_hatena[order(result_hatena$count, decreasing=TRUE), ], 20)
## page count
## 1545 http://d.hatena.ne.jp/dichika/20140503/p1 84
## 1735 http://d.hatena.ne.jp/dichika/20141109/p1 38
## 1787 http://d.hatena.ne.jp/dichika/20141214/p1 32
## 1790 http://d.hatena.ne.jp/dichika/20141201/p1 20
## 1632 http://d.hatena.ne.jp/dichika/20140716/p1 15
## 1595 http://d.hatena.ne.jp/dichika/20140523/p1 8
## 1716 http://d.hatena.ne.jp/dichika/20141028/p1 8
## 1454 http://d.hatena.ne.jp/dichika/20140310/p1 7
## 1648 http://d.hatena.ne.jp/dichika/20140725/p1 7
## 1677 http://d.hatena.ne.jp/dichika/20140907/p1 7
## 1789 http://d.hatena.ne.jp/dichika/20141202/p1 7
## 1431 http://d.hatena.ne.jp/dichika/20140120/p1 6
## 1478 http://d.hatena.ne.jp/dichika/20140218/p1 6
## 1690 http://d.hatena.ne.jp/dichika/20140828/p1 6
## 1742 http://d.hatena.ne.jp/dichika/20141027/p1 6
## 1797 http://d.hatena.ne.jp/dichika/20150101/p1 6
## 1663 http://d.hatena.ne.jp/dichika/20140905/p1 5
## 1734 http://d.hatena.ne.jp/dichika/20141121/p1 4
## 1184 http://d.hatena.ne.jp/dichika/20130424/p1 3
## 1272 http://d.hatena.ne.jp/dichika/20130828/p1 3
Rpubsの場合はこう。
ユーザーのトップページをスクレイピングしている。
library(rvest)
url_rpubs <- html("http://rpubs.com/dichika") %>% html_nodes("div#pagebody h5 a") %>% html_attr("href")
result_rpubs <- getBookmarkCount(url_rpubs)
head(result_rpubs[order(result_rpubs$count, decreasing=TRUE),], 20)
## page count
## 10 http://rpubs.com/dichika/dplyr_intro 27
## 6 http://rpubs.com/dichika/knitrbootstrap 3
## 12 http://rpubs.com/dichika/dplyr_db 2
## 30 http://rpubs.com/dichika/dtpbf 2
## 1 http://rpubs.com/dichika/ggplot2_label 1
## 5 http://rpubs.com/dichika/gridExtra 1
## 7 http://rpubs.com/dichika/nikuthon1 1
## 8 http://rpubs.com/dichika/wt20141214 1
## 13 http://rpubs.com/dichika/leaf 1
## 15 http://rpubs.com/dichika/twToGmail 1
## 17 http://rpubs.com/dichika/youkaigo 1
## 18 http://rpubs.com/dichika/samplepi 1
## 19 http://rpubs.com/dichika/nplotoptions 1
## 32 http://rpubs.com/dichika/lubridate 1
## 2 http://rpubs.com/dichika/ggplot2_subset 0
## 3 http://rpubs.com/dichika/mac_test 0
## 4 http://rpubs.com/dichika/googlevis 0
## 9 http://rpubs.com/dichika/NGS_R_Bioconductor_1st 0
## 11 http://rpubs.com/dichika/smart50 0
## 14 http://rpubs.com/dichika/wiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii 0