2012-04-04 9 views
0

URLに挿入するためにいくつかの変数をループしてWebページにアクセスしていますRスクラップ時に404エラーを回避するには

時々404エラーが発生することがあります。

コードを破損しないように、これらのページに何らかの種類のキャッチを挿入するにはどうすればよいですか。私は現在、XMLパッケージを使用しますが、適切な

TIAは

+0

[これを試してください](http://stackoverflow.com/questions/9404278/using-readhtmltable-from-xml-package-to-scrape-site-uncertain-error-message) – Justin

+0

@ジャスティン。 Tx私はそれを基本として使用しました。答えにしたいですか? – pssguy

答えて

0

回のほとんどは、私がRCurl::url.exists()を使用する場合は、もちろん他の人を読み込むことができます。すべてのURLを含むリストまたはデータフレームがある場合は、これを試すことができます:

map(p, ~ifelse(RCurl::url.exists(.), ., NA)) 

HTH!

関連する問題