私はカフカを使ってログイベントを処理しています。私は単純なコネクタとストリーム変換のためのKafka ConnectとKafka Streamsの基礎知識を持っています。Kafkaは単一のログイベントラインを結合ログイベントに集約します
今は次の構造を持つログファイルがある:
:timestamp event_id event
ログイベントはEVENT_ID(例えばメールログ)
例により接続されている複数のログ・ラインを有します
1234 1 START
1235 1 INFO1
1236 1 INFO2
1237 1 END
と一般的に複数のイベントがあります。
Exampは、 le:
1234 1 START
1234 2 START
1235 1 INFO1
1236 1 INFO2
1236 2 INFO3
1237 1 END
1237 2 END
タイムウィンドウ(STARTとENDの間)は最大5分です。
は、結果として私が欲しい
event_id combined_log
例のようなトピック:
1 START,INFO1,INFO2,END
2 START,INFO2,END
これを達成するための適切なツールは何ですか?私はカフカストリームでそれを解決しようとしましたが、どういうことか分かります。
答えをいただきありがとうございます。私はプロセッサAPIを見ていきます。はい、注文の問題も考慮する必要があります。 – imehl
プロセッサAPIは解決策です - もう一度ありがとう! – imehl
@imehl:おそらく、問題を解決するために実際にやったことについての情報で、上記の質問を更新したいと思っています。 –