スクラップを使用してウェブサイトをクロールするにはどうすればよいですか？

私は、ユーザーがウェブサイトのURLを入力して「クロール」ボタンをクリックすると、治療に基づいてGuiアプリケーションを作成します。その後、ウェブサイト全体がクロールされ、内蔵のscrapy-db（ sqlite）。スクラップを使用してウェブサイトをクロールするにはどうすればよいですか？

ウェブサイトをクロールするのに役立つ治療方法を教えてください。

2012-03-09 NeVeR-BaCk

あなたの質問はうまく構成されていません。あなたがどのようにScrapyを使うことができるかはあなた次第です。

はここScrapyは基本的に何をするかです：

1）ウェブサイトには、ツリー構造A-> B、A-> C、A-> D、B-> E、C-> Fを持っている.....など

2）Scrapyはクロールが、Scrapyは情報のためにあなたが '私の' をすることができます）あなたはツリーを再帰的に

3をクロールできます。そのためにあなたは値を解析し、データベースに保管） http://www.w3schools.com/xpath/

ページでDOMの値を検索し、解析するXPathを学ぶ必要があります。

クロール対象を正確にお知らせください。あなたがクロールしてウェブページを保存しているだけなら、[HTTrack]のようなソフトウェアに行くこともできます。http://www.httrack.com

2013-12-06 06:02:26 zenCoder

答えて