1
各rddジョブにかかる時間(スパークストリーミングジョブを実行しているプログラム)を取得するにはどうすればよいですか。例えばジョブRDD各マイクロバッチのための上記のコードでプログラム内のスパークストリーミングジョブの継続時間
val streamrdd = KafkaUtils.createDirectStream[String, String, StringDecoder,StringDecoder](ssc, kafkaParams, topicsSet)
val processrdd = streamrdd.map(some operations...).savetoxyz
ためにマップとsaveto動作のために実行されます。
各ストリーミングジョブのタイムテーブルを取得したいと考えています。私はポート4040 UIでジョブを見ることができますが、スパークコードそのものに入りたいと思っています。
私の質問が明確でない場合は、ご容赦ください。
ありがとうございましたStreamingListenerは私が望むものを持っています。 –