私はKafkaストリーミングアプリケーションを作成しました。私はKafkaクラスタに展開したいと思います。だから私は、jarファイルを構築し、コマンドを使用して、それを実行します。カフカストリーミングアプリケーションをKafkaクラスタに展開する方法
java -jar KafkaProcessing-1.0-SNAPSHOT-jar-with-dependencies.jar testTopic kafka1:9092,kafka2:9092 zookeeper1:2181,zookeeper2:2181 output
それは正しく動作しますが、ジョブが、私は上記のコマンドを実行マシン上で実行されています! BOOTSTRAP-SERVERS
と指定すると、自動的にホストマシンではなくクラスタでコンピューティングが実行されると思いました。
私の質問は、カフカストリーミングジョブをカフカクラスターに提出する方法です。 クラスタにアプリケーションを展開するには、とflink run
のコマンドを提供するSparkとFlinkのようにします。
カフカストリーミングは並列処理エンジンではありませんか? – soheil
これは、並列でデータを処理することができますが、インスタンス内のスレッド数を増やすことはできますが、同じコードを実行します。詳細な説明については、https://stackoverflow.com/questions/39985048/kafka-streaming-concurrencyを参照してください。 –
詳細については、https://www.confluent.io/blog/elastic-scaling-in-kafka-streams/を参照してください。弾性スケーリング。つまり、アプリケーションの複数のインスタンスを実行するだけです。 5倍の処理能力が必要ですか? 5つのインスタンスを実行します。 10倍が必要ですか? 10のインスタンスを実行します。等々。 Spark、Flink、StormのKafka Streamsのメリットの1つは、ライブ操作中(停止時間なし)で並列処理を変更できることです。アプリケーションの実行中にインスタンスを追加/削除して処理能力を追加/削除できます。 –