私はプロジェクトに取り組んでいます。私は次のシナリオで立ち往生しています。Apache Sparkを使用してテーブルに複数挿入する
Iテーブルを持っている:superMerge(ID、名前、給料)
及びI 2つの他のテーブルを有する:TABLE1および表2
すべてのテーブル(テーブル1、表2及びsuperMerge)は、同じ構造を有しています。
私の挑戦は、table1とtable2のsuperMergeテーブルを挿入/更新することです。 テーブル1は10分ごとに更新され、20分ごとにテーブル2が更新されるため、時刻t = 20分に2つのジョブが同じテーブル(この場合はスーパーマージ)を更新しようとしています。
この並列挿入/更新/ Sparkや他のハープアプリケーションを使ってsuperMergeテーブルにマージする。
テーブルについて詳しく説明できますか? superMergeで何をしようとしていますか?常にtable1とtable2を同じ場所に追加し、必要に応じてその場所からsuperMergeを読み込むのは間違っていますか? – ayplam
superMergeは、通常のテーブルではなくテーブル1と2のビューであるため、superMergeを更新する必要はありません。 –
@ArthurJuliãoがビューを作成することはオプションであり、私は実際に直接ルートがないというそのルートを取ることになります。私は解決策を探していますおそらくスパークまたはフェニックスは私が認識していない提供しています – GKV