私が購読しているウェブサイトからいくつかのデータを抽出したいと思います。私は手動でcsvファイルを抽出することができますが、毎日のファイルがあり、5年分のデータが必要なので、時間がかかります。ウェブサイトから.csvファイルを抽出する
私はrvestを使用してサイトにログインしましたが、データをダウンロードするために手動でボタンをクリックする必要がありました。どのようにR内でこれを行うことができますか?
手動でファイルをダウンロードすると、大量インポートが可能なので完全にうまくいくダウンロードフォルダに入りますが、同じようにRにデータをロードするだけで簡単にできます。
library(rvest)
url <-"http://www.horseracebase.com/index.php/"
pgsession <-html_session(url) ## create session
pgform <-html_form(pgsession)[[1]] ## pull form from session
filled_form <- set_values(pgform,
`login` = "xxx",
`password` = "yyy")
submit_form(pgsession,filled_form)
これは私が(私は思う)で記録されますが、今、私はデータを抽出する方法がわからない。ここで
は、私がこれまで持っているものでしょうか?
df <- read.csv("http://www.someurl.com/betfairdata.csv")
これはうまく動作しますが、すべてのファイルは、実際のページに必要なボタンのように[いいえ]をクリックし表示されない:
私はのようなものを使用ベットフェアで同じことを行います。
rvestを使用してボタンとやりとりする方法はありますか、または正しいURLを見つける方法があるので、上記のようにread.csv
を使用するだけですか?
おかげ
@ Floo0私はそれを試してみましたが、成功することはありませんでした。 – MidnightDataGeek