私はJava Spark APIを使用しています.KafkaUtils.createDirectStreamのために、オフセットを追跡したいと思います。 fromOffsetというパラメータがあり、カフカトピックのパーティションにオフセットを記録します。最初の実行では、私はどのくらいのパーティションを持っているのか分からず、どうすればこのパラメータを設定できますか? カフカのパラメータに "auto.offset.reset"を設定する必要がありますか? 「はい」の場合、既知のオフセットから回復するコードに影響しますか?スパークストリーミングカフカ初期オフセット
0
A
答えて
0
次の2つのオプションがあります:あなたはpartionsに関する情報を持っていない場合は
は、createDirectStreamにそのPARAMを提供していません。 createDirectStreamメソッドにはいくつかのインプリメンテーションがあります。その場合は、各トピックごとに最も早く、または最新のオフセットが使用されます(
auto.offset.reset
パラメータに基づいて)通常のkafka APIを使用してパーティションを見つけることができます。たとえば、見てHow to find the offset range for a topic-partition in Kafka 0.10?
+0
ありがとうございました!とにかくカフカ0.8のためにありますか? 0.10は実験的なAPIです – peng
関連する問題
- 1. 初期オフセットを持つステートレスウィジェットのFlutterリストビュー
- 2. WhirlyGlobの初期ローテーションがオフセットされています
- 3. Notice:初期化されていない文字列オフセット:0
- 4. 初期化クラスと未定義オフセットに問題がある
- 5. スパークストリーミングカフカの必要バージョンは何ですか?
- 6. Laravel Mail - Gmail - AbstractSmtpTransport.php 399:初期化されていない文字列オフセット:3
- 7. Laravel 5 Mail - Gmail - AbstractSmtpTransport.php 399:初期化されていない文字列オフセット:3
- 8. コレクションビュー内のセルのオフセットまたは初期位置を設定する
- 9. CakePHP:初期化されていない文字列オフセット:0の表示
- 10. オフセットの最初の投稿WordPressのループ
- 11. カフカ保存期間後のオフセット
- 12. 予期しない "未定義オフセット"
- 13. mongodbimport失敗 - FailedToParse:期待 '{':オフセット:0
- 14. 遅延初期化と初期化
- 15. デフォルト初期化と値の初期化
- 16. 初期入力の初期状態
- 17. 初期化子の初期化子
- 18. 初期
- 19. レルムオブジェクトサーバー。同期初期ローカルDB
- 20. 初期化サイクルエラー
- 21. 初期化は
- 22. 初期値
- 23. 初期JsonConvert.DeserializeObject
- 24. が初期化
- 25. Bonobo.Git.Server初期エラー
- 26. シミュレーテッドアニーリング初期解
- 27. 初期化ビューモデル
- 28. モンゴースプレ初期フック
- 29. 初期値
- 30. uint8_tデータタイプ初期
パーティションの数がわからない場合は、各パーティションの開始オフセットをどのように知っていますか? – Mariusz
"auto.offset.reset"を最小または最大に設定すると、各赤色からパーティションとオフセット情報を取得できます – peng