私はハイブテーブルを持っていますtable_permは100万行あります。日常の新しいデータは、別のハイブテーブルのtable_tempからこのテーブルに追加されます。ハイブテーブルのユニークな値を見つける
のは、表は以下の通りとしましょう:
table_perm id,col2,col3,ts 1,a,b,t1 2,d,e,t1 3,g,h,t1 4,j,k,t2 5,a,e,t2 6,h,d,t2
table_temp id,col2,col3,ts 6,h,k,t3 7,d,r,t3 8,a,h,t3 9,t,q,t3
と私の最終的な出力は非常に基本的には、 id,col2,col3,ts 1,a,b,t1 2,d,e,t1 3,g,h,t1 4,j,k,t2 5,a,e,t2 6,h,k,t3 7,d,r,t3 8,a,h,t3 9,t,q,t3
する必要がありますIDが一意で、データを追加する場合は、ここで検証する必要があります。 idが一意でない場合は、最新のレコードを追加します。
table_permが巨大であることを考慮して、ユニークなid値を見つけてtable_permに挿入するにはどうすればよいでしょうか。id
の各値が冗長になる可能性があります。
P.S. :カラムtsはタイムスタンプで、増分更新は毎日1回発生します。 table_permは巨大です。
のためには、あなたの質問は何ですか?データは正しく追加されていますか? –
@ GordonLinoff:質問を更新しました。 – user2810706