HBase を介してデータをロードしています。。ブタスクリプトは毎日実行され、さまざまなハイブテーブルの更新されたレコードを検索し、結合と処理を実行してHBaseにロードします。私が抱えている問題は、時にはレコードの一部が更新されることですが、他の部分は更新されないということです。値が異なる場合のみHBaseテーブルを更新する
例abcd123のキーを持つレコードがハイブテーブル1とハイブテーブル2にあります。ハイブテーブル1には新しいデータがありますが、ハイブテーブル2にはありません。My pigスクリプトは両方のテーブルを結合し、 hbaseに記録し、hbase内の既存のレコードをキーabcd123に更新します。
私はHBaseが現在キーのhbaseにあるデータが豚スクリプトがロードしようとしているデータと異なっているかどうかをチェックしてから、異なる値の書き込みのみを受け入れる方法がありますか?変化した1つの値を取得するだけで変更されていない束のデータで行を更新する必要はありません。
ありがとう、アプローチ2は私のために働いているようです。ありがとう – knobby