私はdjangoモデルで約150〜200億エントリを節約しようとしています。私はpostgresqlを使用しています。私はdjango bulk_createを使用しようとしましたが、私のコンピュータは約45分間立ち往生していました。私の質問は、正しい方法でこれを行う方法ですか?django postgresqlに大量のデータを保存する(ほぼ200億エントリ)
答えて
匿名のダンプ・ファイルに関する権利でありますデータをデータベースからロードする最善の方法です。
ダンプファイルを作成するためにデータベースにアクセスできない場合、ダンプファイルを作成するのが難しくなる可能性があります。そのため、Pythonで動作させる方法は、bulk_create
バッチになります。例えば
:その後、再び
inserts = []
last = len(entries)
batch_size = 10000
for i, entry in enumerate(entries): ## or your datasource
# transform data to django object
inserts.append(EntryObject(attribute='attributes...'))
if i % batch_size == 0 or i == last:
EntryObject.bulk_create(inserts) # insert batch
inserts = [] # reset batch
、それはあなたのデータソースに依存します。また、Djangoビューの一部として呼び出す必要がある場合は、それらを非同期タスクとして実行することもできます。
これは、システムのメモリが不足しているためです(RAM)。理想的な方法は、SQLダンプファイルを作成することです(別のDBから200億レコードを取得していると仮定します)。そして、このSQLファイルを新しいDBにロードします。ダンプファイルにあるすべてのデータはPostgreSQLにロードされます。ダンプファイルを作成するための
は、実行します。
$ pg_dump -U {user-name} {source_db} -f {dumpfilename.sql}
ダンプファイルからの復元のために、実行します。
$ psql -U {user-name} -d {desintation_db}-f {dumpfilename.sql}
チェック:How To Backup and Restore PostgreSQL Database Using pg_dump and psql詳細な情報については、
メモリが不足しました。私のデータソースは、テキストファイルの読み込みです。だから私はバッチbulk_createをやった。私はこのすべてをRDSにアップロードするためにダンプが必要です。ありがとう。 – ThatBird
- 1. 大量のデータをC++で大量に保存する方法
- 2. QHash大量のデータを保存する
- 3. 大量のデータを更新するpostgresql
- 4. phpmyadminで大量のデータをMySQLデータベースに保存するには?
- 5. 大量のデータをコアデータに保存する
- 6. 大量のデータをjavascriptに保存する方法
- 7. npm既定ではほぼ200のライブラリをインストールします
- 8. 大量のデータをJ2MEで保存するためのベストプラクティス
- 9. PostgreSQLへのデータの大量挿入
- 10. Objective-c:大量のデータを保存する方法(iOS RSSアプリケーション)
- 11. Firebaseから大量のデータを保存する
- 12. ハイチャートとほぼほぼ一定の時間間隔のデータ
- 13. 少量のデータを保存する
- 14. HBaseに大量のデータを保存するのが非常に遅い
- 15. Django - PostGresqlデータベースに保存しない
- 16. PostgreSQLの - 最小最大エントリ
- 17. 大量のデータをデータベースに保存する際のRessourceの使用
- 18. Djangoでのデータの大量作成
- 19. PostgreSQLのデータをdockerとOSXに保存
- 20. Node.jsを使用してMongoDBに大量のデータを保存する方法
- 21. 短期間に大量のデータを保存する場合の主キー
- 22. 膨大な量のデータを保存するのに最適な方法
- 23. 大量のデータをフェッチしてデバイスに保存するためのODataコール
- 24. QRコードに保存/保存できるデータ/情報の量は?
- 25. 大量のデータをデータベースに保存する最も効率的な方法
- 26. 大量のデータを.Netアプリケーションに保存/ロードする最も良い方法は?
- 27. ユーザーセッションオブジェクトに保存できるデータ量は?
- 28. Django ORM:大量のデータを適切に整理する
- 29. Djangoデータベースにデータを保存する
- 30. データをdjangoデータベースに保存する
データのSQLダンプファイルはありますか?あなたのデータのソースは何ですか? –
私はこれをチャンクで、それぞれ100万人と言うでしょう。バルクインサートはもちろんです。これはまだまだ時間がかかります。しかし、数字はpostgresqlを使うのは夢中に思えます。 –
@TammoHeerenこれは、PostgreSQLのデータが単一テーブルのエントリである場合は大変です。 –