私の学士論文では、約40000のウェブサイトからいくつかのデータを取得する必要があります。したがって、私はPythonリクエストを使用していますが、現時点ではサーバからの応答を得るのが実際には遅いです。マルチスレッドのpythonリクエスト
スピードアップして現在のヘッダー設定を維持する方法はありますか?すべてのチュートリアルヘッダーがないところで私は見つけました。ここで
は私のコードが切り取られている:def parse(url):
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/39.0.2171.95 Safari/537.36'}
r = requests.get(url, headers=headers)
for line in r.iter_lines():
...
おそらく 'aiohttp'ですか? – grooveplex
'マルチプロセッシング 'の使い方は? http://stackoverflow.com/questions/28393617/python-requests-module-multithreading – bsa
@bsaマルチプロセスの必要はなく、新しいプロセスのオーバーヘッドが大きすぎるため、スレッドがioバインドに適しています。 –