Apache NiFiでは、FetchS3Objectを使用してS3バケットから読み取ると、バケット内のすべてのオブジェクトを読み取ることができ、追加されるとわかります。それは可能ですか?NiFiでは、FetchS3Objectプロセッサから選択的に読み込むことは可能ですか?
- すでに追加されているオブジェクトではなく、現在追加されているオブジェクトのみを読み取るようにプロセッサを構成しますか?
- バケット内の特定のフォルダを読み取らせるにはどうすればよいですか?
NiFiはよく知られているように、よく知られている多くのプロセッサのドキュメントにその例があります。
ありがとうございました。私はすでにそれを成功させています。私の質問は、新しいファイルが追加されたときだけ読み込み、バケットの古いファイルは読み込めない特定のユースケースに特有のものです。 – Sammy
ListS3は新しいオブジェクトを識別します。あなたはそれを実行して '今'まで読んで、既存のファイルの出力を破棄することができます。 – James
ListS3 + FetchS3ObjectをRouteOnAttributeとともに使用しました。ここで、条件$ {s3.lastModified:ge(1485189600000)}を追加して、最近追加されたドキュメントのみをルーティングしました。 – Sammy