私は、MechanizeライブラリでRuby on Railsを使用してストアウェブサイトをスクラップしています。問題は何度も私が特定の要素をクロールできないことです。しかし、私はサイトで「ソースを見る」ときにこれを見ることができます。ベストウエッブスクラップRuby on Railsライブラリ(JavaScriptによって生成されるダイナミックHTMLを扱う)
たとえば、ウォルマートのカテゴリ(この場合、「健康」である)は不可能です。これは動的にHTML(javascriptなど)が作成されているためですこれを掻くためには、Webリクエストを処理するためのブラウザが必要です。
http://www.walmart.com/ip/Replacement-Sensor-Module-for-AlcoMate-Prestige-Breathalyzer/10167376
私はまた、Amazon EC2の上でLinuxマシンを使用しています。 UIスクレイピング用のブラウザをインストールするのは難しいでしょう。私を助けることができるRails gem/pluginはありますか?
ありがとうございました。