bigqueryテーブルに約100万行をロードする必要があります。私のアプローチは、データをクラウドストレージに書き込んでから、複数のファイルを一度にロードするためにload apiを使用することです。 これを行う最も効率的な方法は何ですか?私はgcsの部分に書き込みを並列化することができます。私がload apiを呼び出すと、私はすべてのurisを渡すので、一度だけ呼び出す必要があります。このロードがバックエンドでどのように行われているのかよく分かりません。複数のファイル名を渡すと、このロードは複数のプロセスで実行されますか?最高のパフォーマンスを得るために各ファイルのサイズを決めるにはどうすればよいですか? ありがとうGCSからBigQueryにファイルを読み込む - 最適なアプローチは何ですか?
1
A
答えて
3
すべての行を1つのファイルに保存します。ファイルが圧縮されていない場合、BigQueryは多くのワーカーと並行してファイルを読み取ることができます。
https://cloud.google.com/bigquery/quota-policy
からBigQueryは最大4GBの圧縮ファイル(.gzが)を読むことができます。
BigQueryは、最大5,000GBの非圧縮ファイル(.csv、.json、...)を読み込むことができます。 BigQueryは、それを並行して読む方法を見つけ出します。心配する必要はありません。
関連する問題
- 1. GCSからBigQueryにバックアップデータを読み込むことができません
- 2. GCP Dataflow-ストレージからCSVファイルを読み込み、BigQueryに書き込む
- 3. Apache BeamのGCSからファイルを読み込みます。
- 4. ファイルから読み込む
- 5. ファイルから読み込む
- 6. JavaでOutlookの.msgファイルを読み込むのに最適なライブラリは何ですか?
- 7. Cでファイルを読み込むための最適なバッファサイズ
- 8. ファイルからランダムに読み込むのはなぜですか?
- 9. Google Cloud StorageからBigQueryにデータを読み込む
- 10. Google BigQueryからGoogle Cloud Bigtableにデータを読み込む方法
- 11. googleスプレッドシートからbigqueryにデータを読み込むためのスタンドアロンスクリプト
- 12. JDK 1.6で.mp3からデータを読み込むのに最適なアドオン
- 13. セレンのWebドライバでURLを読み込むにはどのアプローチが最適ですか?
- 14. Google Cloud PlatformでDataflowを使用すると、変換なしでCSVファイルをGCSからBigQueryに読み込むことができます
- 15. GCSからJSONを読み込むときにエラーが発生する
- 16. ファイルから読み込み、Javaのファイルに書き込む
- 17. PythonからFoxPro DBFファイルを読み込む最も簡単な方法は何ですか?
- 18. Javaのテキストファイルから読み込む最も速い方法は何ですか?
- 19. ソケットからファイルを読み込む正しい方法は何ですか?
- 20. 大量のテキストをasp.netに読み込むのに最適なコントロールですか?
- 21. ファイルから配列を読み込む
- 22. perlをindex.htmlファイルから読み込む
- 23. ファイルからツリーマップを読み込む(Java)?
- 24. ファイルからテキストを読み込む
- 25. ファイルからデータを読み込む
- 26. Excelファイルからセレンを読み込む
- 27. JavaScriptからファイルを読み込む
- 28. ファイルから設定を読み込む
- 29. コンマで区切られたファイルからクラスを読み込むのに最適な方法
- 30. Python:ファイルを行単位で読み込む最も最適な方法
お返事ありがとうございます。手動でファイルを複数に分割すると速度が上がらないでしょうか? –