1
70ページのhtmlデータをスクラップするにはどうすればよいですか?私はこれを見ていたquestionしかし、私は一般的な方法のセクションの機能に立ち往生しています。 jso1226 @Web複数のページを直列でスクラップR
#attempt
library(purrr)
url_base <-"https://secure.capitalbikeshare.com/profile/trips/QNURCMF2Q6"
map_df(1:70, function(i) {
cat(".")
pg <- read_html(sprintf(url_base, i))
data.frame(startd=html_text(html_nodes(pg, ".ed-table__col_trip-start-date")),
endd=html_text(html_nodes(pg,".ed-table__col_trip-end-date")),
duration=html_text(html_nodes(pg, ".ed-table__col_trip-duration"))
)
}) -> table
#attempt 2 (with just one data column)
url_base <-"https://secure.capitalbikeshare.com/profile/trips/QNURCMF2Q6"
map_df(1:70, function(i) {
page %>% html_nodes(".ed-table__item_odd") %>% html_text()
}) -> table
あなたのURLには、現在のページ番号を表すパラメータがあるはずです。そして、それを 'url_base'で貼り付けて実際のURLを生成する必要があります。あなたは同じURLに70回アクセスしようとしているようです –