2017-04-18 3 views
2

Spark Streaming Jobで奇妙な動作が発生しました。 spark.streaming.concurrentJobsのデフォルト値は1です。 バッチ間隔を10分に設定して、同じストリーミングジョブを1日以上実行していました。 突然、キューに入れずに入ってくるすべてのバッチに対して、同じジョブが同時に実行され始めました。Spark Streaming - デフォルトのspark.streaming.concurrentJobs設定で同時にジョブが実行されます

誰もこれに直面していますか? これは大きな助けになるでしょう!

+0

単一ジョブを完了するのに十分な10分の間隔ですか?どのくらいの時間が単一の仕事を完了するためにrequried。 –

+0

はい! 1つの仕事は5〜6分で完了します。そうでない場合でも、他のジョブはQUEUED状態でなければならず、PROCESSING状態ではありません。 –

+0

YARNでSparkの仕事をしていますか? – asmaier

答えて

0

この種の動作は不思議そうですが、一度に1つのジョブしか実行されていない場合、バッチ処理時間<バッチ処理の場合、システムは安定しているようです。

スパークストリーミング作成者Tathagata hsはこれについて:How jobs are assigned to executors in Spark Streaming?について言及しました。

関連する問題