私は、バッファリングシステムとしてKafkaを使用して、Apache NiFiでデータ取り込みワークフローを作成しています。私は同じワークフローを実行する3ノードクラスタを設定しており、各ノードには4つのコアがあります。KafkaによるNiFiワークフローのボトルネック
私は、異なるカフカのトピック間でデータを移動するいくつかの例に頼っていますが、これはワークフローの中で最も遅い部分であり、2つの同一のテストで100%期間の増加。
パブリッシュとコンシューマのカフカプロセッサは3つのノードすべてで実行されており、カフカのトピックには3つのブローカに3つのパーティションがあります。
この矛盾の原因は何か、誰かがそれを緩和してワークフローをスピードアップするために何ができるか考えている人はいませんか?
さらに詳しい情報が必要です... NiFiのバージョンは?カフカブローカーのどのバージョン?カフカプロセッサのどのバージョン(0.9対0.10)? PublishKafkaの前でフローファイルが構築されているのを見ていますか?まったく遅いのは何ですか?一度に1つのメッセージを発行して消費していますか? –
NiFiバージョン1.1.0、Kafkaバージョン0.10.1.2.1、0.10 kafkaプロセッサ、kafkaを公開する前にキューにファイルを構築し、kafkaが望みどおりにファイルを返さないようにします。特定のバッチロジックではなく、時間が含まれています。 – TomRobson