0
を許可せず、端末がハングアップする私は、端末でハングのpython3に次のコードピースをしようとしていますターミナルウィンドウを強制終了します。ブラウザのウェブサイトに移動しようとすると、同様の応答が生成されます。ウェブサイトは無期限に読み込まれます。request.getにCtrl-C
この問題を処理するにはどうすればよいですか?
ありがとうございます!
を許可せず、端末がハングアップする私は、端末でハングのpython3に次のコードピースをしようとしていますターミナルウィンドウを強制終了します。ブラウザのウェブサイトに移動しようとすると、同様の応答が生成されます。ウェブサイトは無期限に読み込まれます。request.getにCtrl-C
この問題を処理するにはどうすればよいですか?
ありがとうございます!
ブラウザで同じことが起こる場合、これはサイト固有の問題です。
URLリストを反復処理するときにこれらのタイプのサイトをスキップするには、非同期プロセスが必要です。マルチスレッドを掘り下げたくない場合は、Scrapy
where requests are scheduled and processed asynchronously
accepted answer hereなどが役に立つでしょう。あなたはsempahoreロジックを変更する必要があります(私はマルチスレッド化に精通していないと思います)。
これはスクラピーコールの一部です。私はそれをうまくコーディングしなかった可能性がありますが、これはクローラの治療呼び出しからの行です。 –
'DOWNLOAD_TIMEOUT'を減らそうとしましたか? https://docs.scrapy.org/en/latest/topics/broad-crawls.html#reduce-download-timeout – dijksterhuis
Nope。無限の待機から有限の待機に変わる可能性がありますか? –