2017-03-02 8 views
1

Amazon S3のストリーミングデータにはtextFileStreamを使用しています。それは私に最初のバッチだけの出力を与えます。それに加えて、Spark UIの入力レートは常にゼロです。私の質問は、Spark Streaming: Input Rate and File stream [0] has "Avg: 0.00 events/sec" alwaysに似ていますSparkファイルストリーミングのゼロ入力レート

助けていただければ幸いです。

ありがとうございました。

答えて

0

EMRとそのs3://またはApache Sparkとs3n/s3aクライアント?

+0

Amazon EMRを使用してクラスタを作成しました。ファイルはAmazon S3からのストリームです。 – neoguy

+0

私のコードではない、助けができない。 sparkやawsライブラリのログインをクランキングして、実際に何が起こっているのかをデバッグしてみてください。 –

0

私は同じ動作を見ます。 私の推測では、UIは受信側でこれらの指標をベースにしており、実際にはtextFileStreamは受信者( "file streams do not require running a receiver")によって戻ってきていないので、数字は(間違って)0です。 これはseen受信機によってバックアップされていないカフカストリーム。

関連する問題