2010-12-08 11 views
1

ウェブサイトをクロールし、フォーム提出後に動的に作成されたページから情報を抽出する必要があります。動的ページを含むクロールウェブサイト

私がクロールする必要がある情報は、主にこれらのサイトのデータベースに由来します。

を追加しました:

クローラは通常、別のハイパーリンクからジャンプすることによって動作します。したがって、これらは主に静的なページです。静的には存在せず、オンザフライで作成されたページのクロールはどうでしょうか。

+0

これはうれしいことですが、詳細をお知らせください。 – leppie

+0

私も同じ問題があります。どのように動的なウェブサイトを得ることができます。 http://stackoverflow.com/questions/28085211/any-possiable-to-crawl-open-web-browser-data-using-aperture – BasK

答えて

1

クローラの観点からは大きな違いはありません。あなたはまだgenered HTMLを取得しています。

注意する必要があるのは、無限のページ数につながるリンクだけです。動的に生成され、次/前の月/年へのリンクを持つカレンダー。

関連する問題