更新されたレコードをHDFSにインポートしようとしています。以前私はHDFSに3つの部分ファイルを持っていました。私が下のツールを実行すると、マージキーが必要であるというエラーが出ました。しかしsqoop増分はマージキーで最後に変更されました
sqoop import --table employee --username training --password training --connect jdbc:mysql://localhost/loudacre --incremental lastmodified --check-column modified --last-value '2016-08-22 19:02:41'
、私はその中のすべてのレコードを持つ部分のみのファイルを見ることができますマージキーオプションを使用していました。
これを避ける方法はありますか?私は、データベースからmodifedフィールドを取得し、lastmodifiedを使用してHDFSを更新することを意味します。 –
@Deepak_Spark_Beginner私はあなたの意見を得ていませんでした。 –