2017-12-11 9 views
0

emp_Id = 6が存在せず、Sqoopジョブを作成して追加モードで増分Sqoopを実行した1から10までのemp_idで構成されるテーブルがあります。
この後、次の2つの新しいemp_idが追加されました。つまり、emp_id=6emp_id = 12です。
私の質問は、emp_id =6をインクリメンタルにインポートするか、それともemp_id = 12だけインポートするのでしょうか?新しいレコードのSqoopインクリメンタルインポート

+0

質問にSqoop Jobに書いたことを書いてもらえますか?あなたは[このリンク]を訪問することができます(https://community.hortonworks.com/questions/10710/sqoop-incremental-import-working-fine-now-i-want-k.html) –

+0

これはシナリオです。私はsqoopが増加するデータだけをインポートするので、emp-id = 12を追加すると思います –

答えて

0

--incremental appendで定義されている場合(emp_id = 6と他の値を書き込んだ場合)、ジョブはemp_id = 12レコードのみ書き込みます。しかし、--check-columnパラメーターが既存のレコードで値6を見つけられなかった場合、ジョブはemp_id = 6レコードも書き込みます。

新しいレコードを追加したり、既存のレコードを変更したりする場合は、--last-valueパラメータを考慮してください。 See this。 ジョブが作成されると、最後の値がすでに/ tmp sqoopディレクトリに保存されていることに注意してください。この場合は、sqoopのインポートを使うことをお勧めします。

関連する問題