換頁的網址是 javascript ?!
第一次爬蟲就卡關
copy outerHTML 複製部分的程式碼
貼到記事本並存檔,檔案名稱加上 .html
peo變成網頁檔
檢查一下 peo 內容
library(rvest)
read_html('C:/Users/User/Desktop/Crawl_Handouts/peo.html') %>%
html_nodes('#tbList > tbody > tr > td:nth-child(5) > a:nth-child(2)') %>%
html_attr("href") -> addr
url <- paste0('http://data.moi.gov.tw/MoiOD',substring(addr,3))
head(url)## [1] "http://data.moi.gov.tw/MoiOD/System/DownloadFile.aspx?DATA=5D35922E-AEE7-41B8-89C7-2DD907EDCDD0"
## [2] "http://data.moi.gov.tw/MoiOD/System/DownloadFile.aspx?DATA=D2FAB1E7-2DC5-4042-8A28-D4373E1DAB1E"
## [3] "http://data.moi.gov.tw/MoiOD/System/DownloadFile.aspx?DATA=702703F4-9A5A-415C-9691-9B8D57A71796"
## [4] "http://data.moi.gov.tw/MoiOD/System/DownloadFile.aspx?DATA=9B27718D-7CFE-4D3B-A661-BB2C4FA97939"
## [5] "http://data.moi.gov.tw/MoiOD/System/DownloadFile.aspx?DATA=55C3F5D2-1C8D-48D8-B005-4362570F1020"
## [6] "http://data.moi.gov.tw/MoiOD/System/DownloadFile.aspx?DATA=3DA7124E-B14F-45CF-BC4B-6E661CD63BC9"
download.file(url[1],destfile = "peo10606.csv")