私はスパークストリーミングジョブを1秒のバッチで稼働させています。私はCDH 5.5 Spark 1.5を使用します。 Kafka Create Directstreamを使用します。バックプレッシャーを有効にしました。私たちは動的割り当てを訴えたくありません。そのため、ジョブはエグゼキュータの番号を修正して実行しました。突発スパークストリーミングジョブのスケジューリング遅延の増加他のパラメータの変更なし
投稿者:below image私は、これらが13.50からのスケジューリング遅延の突然の増加であることを見ることができます。しかし、同じ時間の間、私は処理時間にどんなデイリーも見ません。
- スケジューリング時間の増加の理由は何ですか?処理時間は同じです。
- クラスタ内の他のジョブのロードは、現在のストリーミングジョブに影響しますか。私の理解では、ストリーミングのエグゼクティブが事前に割り当てられて既に実行されているので、そうではないはずです。
どのような考えですか?
これを解決できましたか?私はSparkストリーミングアプリで、Kafkaからの入力を読み取る(DirectKafkaStreamアプローチを使用して)非常に似た問題を抱えています – jithinpt
私たちはこれに対して特別な解決策を持っていませんでした。 Batch DurationとExecutor MemoryとVcoresを使って遊んで、私たちの問題を解決しました。 –