2017-09-07 9 views
-1

最初の日に私はs3のフォルダ1としてデータを保存し、グルーからジョブを実行すると、 私は予想される出力を得ました。 2日目に、同じ親フォルダにフォルダ2としてデータを保存し、グルーからジョブを実行すると、 フォルダ1のデータが複製され、フォルダ2のデータも出力されました。s3で増分データに対してawsグルージョブを実行するにはどうすればよいですか?

folder1からのデータの複製を避けるにはどうすればよいですか?

+1

SHOUTをしないでください。何かを強調する必要がある場合は、[Markdown](https://stackoverflow.com/help/privileges/comment)で行うことができます。 – Chris

答えて

0

AWSグルージョブでブックマークを有効にしましたか?ブックマークを有効にすると、Glueは既に読み込んでいるものを追跡します。すべてのデータをリロードする必要がある場合は、ジョブメニューに「ブックマークをリセット」オプションがあります。

関連する問題