2017-02-10 9 views
0

sparkストリーミングを使用してs3ディレクトリを監視し、そのディレクトリに追加された新しいファイルのパスを返すことを望みます。 textFileStreamもfileStreamもこれを行うことはできないようです。実際に私がしたいことを達成する方法はありますか?スパークストリーミングから新しいs3ファイルパスを読む

Edit:Spark ver。 2.1.0

+0

スパークバージョン? – mrsrinivas

+0

@mrsrinivas spark 2.1.0 – foboi1122

+1

試したコードを追加できますか? s3ファイルシステムにアクセスするためのアクセスキーと秘密鍵が正しく設定されていることを確認してください。 – mrsrinivas

答えて

0

これは、s3a://を使用して行います。私はそれを証明するためのテストを持っています。

  1. ディレクトリをスキャンする際の遅延に対処するための十分なウィンドウを設定し、クリーンアップします。
  2. あなたは宛先 "ディレクトリ"に直接書き込むことができます。書いたり、名前を変更する必要はありません。そうした場合:ファイルがコピーされ、ウィンドウが表示されます。
  3. チェックポイントしないでください。
関連する問題