まず、この質問のための適切な場所であるかどうかわかりません。そうでない場合は申し訳ありません:)特定のコンテンツを見つけるためにスパイダー(webcrawler)を実行する
ウェブを特定の埋め込みファイルを見つけるためにクモを書くことを考えています。
しかし、私は、ISPがスパイダーを動かすことが許可されているかどうかは、速いペースで多くの要求をするだろうと思っていました。
リクエストを遅らせる必要がありますか?
私のISPの契約書を読みましたが、クロールに関する具体的な情報は見つかりませんでした。
オフラインで使用するためにファイルをダウンロードするかどうかを調べます。私はちょうどそれをダウンロードするのではなく、それをインデックス化したいです。私の発見は正しいのですか? – PeeHaa
@PeeHaaあなたは「特定の埋め込みファイル」が何であるかは言わない。彼らが*コンテンツ*によって識別されている場合は、それらをダウンロードする必要があります(私はあなたがサーバー上でコードを実行することはできません)。必ずしもファイル全体をダウンロードする必要はありません。サーバーの構成方法によって異なります。 REST/HTTPはパーツのダウンロードを許可します –
彼らは何であっても問題はありません。 – PeeHaa