sqoopジョブがhdfsディレクトリに増分インポートを書き込んでいるとします。 別の(非sqoop)ジョブは、定期的に処理のためにこのディレクトリから別の場所にデータを移動しています。 私はこの仕事が現在sqoopによって修正されているファイルを移動しないようにしたいと思います。彼らは一度移動することができたら、準備ができたファイルを特定のパターンにリネームする方法がありますか?sqoopがファイルへの書き込みを完了したことを確認する方法はありますか?
ファイルが移動されない場合、sqoopは毎回既存のpart-m-000xファイルに新しいコンテンツを追加するだけですか?
はい、まさに私が欲しいものです。私はsqoopを同じ方法で動作させる方法があるかどうかを尋ねています(あるいはデフォルトでこの方法で動作するかどうか)。 – Art
この方法ではデフォルトでは動作しません。スクリプトを作成する必要があります。それを行うスクリプトでsqoopユーティリティを単にラップすることもできます。 –