いくつかの情報を掻き集めるために、www.geocaching.comからHTML Webページをダウンロードしたいと思います。しかし、私がダウンロードしたいウェブページには、ユーザがログインしているかどうかによって2つの表示方法があります。スクラップしたい情報は、ユーザがログインしたときにのみ表示されます。パスワードポータルからhtmlをダウンロード
以前はdownload.file()
mapply(function(x,y) download.file(x,y), geocache_link_list, geocache_name_list)
をしかし、これはページ内の非ログインダウンロード:URLのリスト(geocache_link_list
)からHTMLファイルをダウンロードし、このように別のリスト(geocache_name_list
)を使用して、それらに名前を付けるmapply()
。
私もRCurl
を使用しようとしましたが、これはまた、ページ内の非ログインをダウンロードし、私はmapply機能に組み込むことを試みたことがない:
library(RCurl)
baseurl <- geocache_link_list[1]
un <- readline("Type the username:")
pw <- readline("Type the password:")
upw <- paste(un, pw, sep = ":")
からブラウザを起動する方法はありますR内でRSelenium
やRCurl
のようなものを使ってログインの詳細を入力し、目的のページにリダイレクトしてダウンロードしますか?