2017-01-24 12 views
-1

私が理解するように、SparkはSpark Streamingでストリームを分析できます。 そして、カフカは複数のソースからデータを受け取ることができます。 私が理解できないことは、複数のソースからデータを受け取っているKafkaクラスタを持っている場合、Spark Streamingを実行しているデータベースにデータを送信するのでしょうか? Spark Streamingはアプリケーションサーバー上で動作していますか?Spark Streamingはどこで実行されますか?

答えて

1

Spark Streamingを使用する場合は、Sparkクラスタを設定し、Spark Streamingジョブをクラスタに送信します。したがって、あなたは2つのクラスター:Kafka + Spark(または実際には3、KafkaのZookeeperクラスターも必要です)にする必要があります。

+0

私はsparkクラスタを持っているので、sparkジョブがアプリケーションサーバー上で実行されていますか?マップ還元方式でスパーククラスタに分配されますか? – Khan

+1

http://spark.apache.org/docs/latest/cluster-overview.html –

関連する問題