このユースケースでは、どのクラスタマネージャーのスパークが使用されていますか？

私は4つのノードを持つhadoopクラスタを持っています。そして、hdfsに格納されたファイルからいくつかのハイブテーブルを作成します。次に、mysqlをハイブのメタストアとして設定し、sparkのconfフォルダ内にhive-site.xmlファイルをコピーします。このユースケースでは、どのクラスタマネージャーのスパークが使用されていますか？

hadoopクラスタを開始するには、私はdfsを開始し、また、yarn.shも開始しました。それから私は、ハイブのテーブルを作成し、そして今、イムは次のように、hivecontext用いたスパークSQLからハイブのテーブルに対していくつかのクエリを実行：

var hiveContext = new org.apache.spark.sql.hive.HiveContext(sc) 
query = hiveContext.sql("select * from customers"); 
query.show

私の疑問は、クラスタマネージャの火花が使用している。この場合には、ありますか？糸ですか？私は./start-yarn.shコマンドで糸を始めたので？または、私は何かを構成する必要があります糸と私はそれが別のクラスターマネージャーを使用していない場合、嫌な人ですか？あなたの意見では、どのクラスターがこの場合に適していますか？それとも無関心ですか？

出典

2016-05-09 codin

スパーク送信中に--masterに基づいてローカル、クライアント、またはクラスタを使用します。

./bin/spark-submit \ 
    --class myclass \ 
    --master yarn \ 
    --deploy-mode cluster \ 
    --executor-memory 20G \ 
    --num-executors 50 \ 
    myapp.jar \

か、

val conf = new SparkConf() 
      .setMaster("yarn-cluster") 
      .setAppName("myapp") 
val sc = new SparkContext(conf)

以下のようなコードで指定することができ、それは火花シェル、

を

spark-shell --master yarn

デフォルトであれば、私はそれがローカルモードを使用すると信じています。

出典

2016-05-09 07:14:19 WoodChopper

あなたの答えをありがとう。あなたが地元に言っているそのクラスターは、スパークスタンドだけのクラスターですか？ドキュメントでは、それは単なるスタンドアローン、ヤーンまたはメソに見えます。そして、あなたのコードで、クラスマネージャが "val sc = new SparkContext（conf）"のエラーを表示し、Imが "28：error：見つからない：type SparkContext。 – codin

import org.apache.sparkをインポートしましたか？あなたはシェルで作業していますか？ – WoodChopper

シェルで作業しています – codin

このユースケースでは、どのクラスタマネージャーのスパークが使用されていますか？

答えて

関連する問題