2017-11-10 6 views
0

私はJava Spark APIを使用しています.KafkaUtils.createDirectStreamのために、オフセットを追跡したいと思います。 fromOffsetというパラメータがあり、カフカトピックのパーティションにオフセットを記録します。最初の実行では、私はどのくらいのパーティションを持っているのか分からず、どうすればこのパラメータを設定できますか? カフカのパラメータに "auto.offset.reset"を設定する必要がありますか? 「はい」の場合、既知のオフセットから回復するコードに影響しますか?スパークストリーミングカフカ初期オフセット

+0

パーティションの数がわからない場合は、各パーティションの開始オフセットをどのように知っていますか? – Mariusz

+0

"auto.offset.reset"を最小または最大に設定すると、各赤色からパーティションとオフセット情報を取得できます – peng

答えて

0

次の2つのオプションがあります:あなたはpartionsに関する情報を持っていない場合は

  • は、createDirectStreamにそのPARAMを提供していません。 createDirectStreamメソッドにはいくつかのインプリメンテーションがあります。その場合は、各トピックごとに最も早く、または最新のオフセットが使用されます(auto.offset.resetパラメータに基づいて)

  • 通常のkafka APIを使用してパーティションを見つけることができます。たとえば、見てHow to find the offset range for a topic-partition in Kafka 0.10?

+0

ありがとうございました!とにかくカフカ0.8のためにありますか? 0.10は実験的なAPIです – peng

関連する問題