私はスパークストリーミングアプリケーションでcreateDirectStream
を使用します。私はバッチ間隔を7秒に設定し、バッチジョブは約5秒以内に終了することができます。しかし、非常にまれなケースでは、バッチジョブのコストは60秒で済みます。これにより、一部のバッチジョブが遅れることになります。 合計遅延時間を短縮するために、遅延したジョブを一度に広げるより多くのストリーミングデータを処理できることを願っています。これにより、できるだけ早くストリーミングが正常に戻るのに役立ちます。スパークカフカコンシューマの入力のバッチサイズを動的に更新する
したがって、遅延が発生したときにスパークとカフカの入力のバッチサイズを動的に更新/マージする方法があることを知りたいと思います。