3
私は200万レコード以上のデータベースを持っています。各レコードには、AWS S3のにダウンロードして保存する必要がある画像のURLが含まれています。MongoDBから大きなデータを取得するための最善のアプローチ
一度に1つずつダウンロードし、一度に1つずつアップロードするのではなく、これに対処するより良い方法がありますか?
私は現在Pythonを使用しており、現在pymongoを使用しています。
for item in itemsCursor:
download_image(item['imageurl')
def download_image(item):
name = 'example.jpg'
response = requests.get(url)
img = Image.open(StringIO(response.content))
img.save('temp.jpg', "JPEG")
s3.meta.client.upload_file('temp.jpg', 'bucket', name)
grequests https://pypi.python.org/pypi/grequests –