私は外部と内部のテーブルをgreenplumに持っています。外部テーブルがcsvファイルをhdfsで指しています。 Hdfsのこのcsvファイルは毎時間テーブルの完全なデータを読み込みます。 greenplumの内部テーブルにインクリメンタルにデータをロードする最適な方法は何ですか?greenplumのインクリメンタルロード
0
A
答えて
0
greenplumのディメンションテーブルを作成します。タイムスタンプやデータポイントのように以前ロードした場所の最後に格納します。
上記のディメンション表を使用すると、新しいファイルが到着するたびにevryを1時間実行し、stage/extrenalテーブルにロードされ、最後にロードされたパラメータがディメンションテーブルからロードされます。関連する/新しいレコードのみを処理します。
おかげで、 ショブハ
+0
https://stackoverflow.com/help/how-to-answerをお読みください –
関連する問題
- 1. SSISのインクリメンタルロード
- 2. インクリメンタルロードのクロスプラットフォーム実装
- 3. 進捗リングでインクリメンタルロード
- 4. SSIS - インクリメンタルロード - 参照オブジェクト
- 5. Airflow <--> Greenplum
- 6. gpfdist vs gpload greenplum
- 7. Greenplumはインストールエラー
- 8. ssisのインクリメンタルロードに最適な方法
- 9. インクリメンタルロードSSISのマージまたは使用
- 10. GreenplumのFirst_valueウィンドウ関数
- 11. greenplumのgreenplum hadoopを生成する方法gphdfs.soを生成するには
- 12. greenplum gpload:設定YMLファイルエラー
- 13. JNIエラー:リンク使用Greenplumは
- 14. JPAは例外Greenplumは
- 15. greenplumのテーブルスキャンとseqスキャンの違い
- 16. greenplumのISDATE()と同等の機能
- 17. greenplumデータベース構築の設計方法
- 18. 同じマシンに2つのgreenplumをインストール
- 19. Excelの電力クエリ - クエリからのインクリメンタルロードと日付の追加
- 20. ajax - 1つのファイルからの要素のインクリメンタルロード
- 21. ListViewアイテムのインクリメンタルロードを実装する方法は?
- 22. Greenplumでアップデートを実行するには?
- 23. greenplumテーブルからbloatを削除する
- 24. Greenplumでクロス・アプライを使用する
- 25. greenplumデータベース「関係はありません」
- 26. sqoopツールを使用してインクリメンタルロードを実行する方法
- 27. MasterDetailsViewでインクリメンタルロードを実装する方法は?
- 28. IcCube - インクリメンタルロード - 新しい日付がロードされない
- 29. SQL Serverの:クロスGreenplumは(Postgresのの前LATERAL版)に参加
- 30. GREENPLUMのlog_alert_ *テーブルのエントリを停止するには?
これは、SLAに依存し、どのくらいの時間がgphdfsを使用して、テーブル全体をロードするのにかかります。切り詰めと挿入が最良の方法かもしれません。 insert into target_table select * from external_tableここで、column> 'value'が最適な方法です。または、負荷ごとに外部表を動的に作成する必要があります。 –
gphdfsを使用してチェックしたところ、外部テーブルのデータ全体を高速に読み込むことができます。ただし、テーブル全体を切り捨てるのではなく、Greenplumで増分ロードを実行したいと考えています。 – vkumar
あなたはあなた自身の質問にちょうど答えたと思います。 –