Spark Streamingアプリケーションは、基本的に何時間もスケジューリング遅延がゼロですが、突然ジャンプして複数の分にジャンプし、制御不能になります。これは、バッチ間隔を2倍にします。Spark Streamingのスケジューリング遅延の復旧手法
遅延が発生する原因についてはわかりません(理論にはガーベジコレクションが含まれています)。クラスタは、3つ、5つ、または10つのスレーブを使用するかどうかにかかわらず、一般にCPU使用率が低くなります。
遅延がこのような長い期間ゼロであるため、バッチ間隔をさらに増やすことは本当に嫌です。スケジュール遅延の突然の急上昇から回復時間を改善する技術はありますか?私たちはそれがそれ自身で回復するかどうかを見てみましたが、それがまったく回復しても何時間もかかります。
問題の原因となっている最初のバッチにエラーはありますか? – Knight71
いいえ、ジョブはエラーを処理していません。 – CAJ