私はBeautiful Soupをサイトの1ページをクロールするのに大成功を収めましたが、サイトの大きなリストをチェックして自分のサイトへの言及やリンクが含まれているかどうかを確認する新しいプロジェクトがあります。したがって、私は各サイトのサイト全体をチェックする必要があります。Scrapyはサイト全体をクロールしたときに「認識」していますか?
BSでは、スクレイパーにサイトで行われたことを伝える方法がまだわからないので、再帰の制限にぶつかっています。それは何かがScrapyが箱から取り除くのですか?
あなたの答えをありがとう。私が見ているドキュメントやチュートリアルは、1つのドメインをクロールするためのものです。ドメインの一覧をどのようにクロールするのかを知っていますか?たぶん、私はちょうど適切なキーワードを使用していないです。 –
私はこのチュートリアル(https://www.youtube.com/watch?v=nnnDshuflSI)を使用します。これは、あなたが構築するための素晴らしいフレームワークを提供します。あなたの時間をかけて、彼が教えていることを学びなさい。彼はScrapyと一緒に働くので、その素晴らしいチュートリアルです。 –
ありがとう、私はそれをチェックアウトします。 –