1つのトピックからレコードを読み取り、処理して、別のトピックにレコードを出力する基本的なKafkaストリーミングコードがあります。カフカストリーミング同時実行性?
カフカストリーミングは並行処理をどのように処理しますか?すべてが単一のスレッドで実行されていますか?私はこれがドキュメントに記載されているとは思わない。
シングルスレッドの場合、大量のデータを処理するマルチスレッド処理のオプションが必要です。
マルチスレッドの場合、SQLデータベース接続が異なる処理スレッドで共有されるように、これがどのように動作し、リソースを処理するかを理解する必要があります。
Kafkaの組み込みストリーミングAPIは、他のオプション(Spark、Akka、Samza、Stormなど)と比べて大量のシナリオではお勧めできませんか?
LINEエンジニアのブログへのリンクが途中で壊れています。あなたはここにそれを見つけることができます:https://engineering.linecorp.com/en/blog/detail/80 – Esk
ありがとう、更新された! –
@ MichaelG.Nollストリームアプリケーションの単一インスタンスの複数のスレッド間でリソースを共有することはどうでしょうか。私のValueMapperがスレッドセーフでない場合は、複数のスレッドでアプリケーションインスタンスを実行することはできますか? – mrnakumar