apache Kafkaを使用してランダムデータを生成し、スパークストリーミングを使用してランダムデータを生成する方法を知りたいと思います。apache kafkaを使用してデータを生成し、スパークストリーミングを使用して受信します
のは、ユースケースをお見せしましょう:
私はこのようなランダムデータを生成したい - >(A、B、[email protected])X秒ながら。 そして、このデータをリアルタイムで(私が受け取っている間)処理するために受け取って、2番目のパラメータがBならば、次のメッセージで「[email protected]」にメールを送ります: "最初パラメータはA "です。
私は動物園のサーバーを起動し、次にカフカブローカーを開始し、次にトピックを作成し、次にプロデューサを作成してこのデータを送信する必要があることを知っています。 kafkaとストリーミングの接続を作成するには、 "createStream"関数を使用する必要があります。しかし、私はこのデータを送信するためにプロデューサーを使用する方法を知らず、それを処理するためにスパークストリーミングで受信します。これらはすべて、同じプログラム内で、Javaを使用しています。
助けが必要ですか?ありがとうございました。
googleです。次に、特定の問題がある場合はお知らせください。 – maasg
私はMatthias J. Saxに言ったのと同じことを書きます。今、私はメッセージ(A、B、[email protected])を追加して、そのデータリンクを生成するためのプロデューサプログラムを持っています。私はスパークプログラムをここにリンクしています。そして、内部で、データを読んで、2番目のパラメータがBならばメールを送信して処理したいと思っています。私はこれに慣れていませんが、試しています。これをテストするには、kafka(zkを含む)を起動しなければなりません。カフカの書き出しのプロデューサプログラムを開始するファイルが1つ(メインクラス)必要です。スパークの場合は、プログラムを提出するだけでいいですか?ありがとうございました! –