Oracle(または任意のRDBMS)に、毎日フラッシュされるデータを含む表がある場合。sqoopはインポート中に更新された行をどのように扱いますか?
例:
1234,Raj,Kolkata,1000,09092015
と仮定、私はフラットファイルにHDFSに標準sqoopインポートおよびストアを使用して、今日、この行を読み込みます。翌日、元のテーブルから行が削除されますが、7日後に同じレコードが更新された場合(salフィールド1000が2000に更新されたとします)。
私は再びsqoopクエリを実行すると、データをどのように扱い、どのように格納しますか? 同じレコードのエントリが2つあるか、新しい値が更新されますか?
このレコード
<1234, Raj, Kolkata, 1000, 09092015>
は、このいずれかによって置き換えられますか?
<1234, Raj, Kolkata, 2000, 09092015>