以下は、作業しようとしている高レベルの使用例です。Akkaをapache spark streaming&Kafkaで使用しますか?
私たちはKafkaトピックに公開されているストリームデータを持っており、モジュールはストリームとして学生IDを読み込み、各学生の複数のソースから関連データを取得し、各学生の計算を実行し、生徒をカフカの話題にする。
ここで、1つの大きなSparkの仕事を書くこと、またはAkkaを使って各ソースに別々のサービスを提供し、俳優が学生IDの束を並行して作業し、それぞれのソースからデータを取得し、変容と行動、そして最終的に各生徒に関連する計算。
ここでは本当にAkkaを使用する必要がありますか? Sparkは効率的にこれを内部的に処理しますか?
ここで何か考えてみてください。
_ "それは良いです" _は、StackOverflowのトピックをオフにします。あなたの質問を言い換えてください。 –