私は火花がYARNモードに提出使ってHadoopクラスタ上でスパークタスクを起動しようとしています提出します。スパークはYARNモードHADOOP_CONF_DIRの内容は
私は、私の開発マシンから火花提出立ち上げています。
Running Spark On YARN文書によれば、私はenv var HADOOP_CONF_DIR
またはYARN_CONF_DIR
にhadoopクラスタ構成のパスを提供することになっています。これは難しいところです:リモートのYARNサービスにタスクを送信する場合、なぜこれらのフォルダがローカルマシンに存在する必要がありますか?これは、spake-submitがの中にあることを意味しますか?クラスタですか?したがって、私はスパークタスクをリモートで起動できませんか?そうでない場合、これらのフォルダにはどのような項目を入れる必要がありますか?タスクマネージャーサービスが存在するYARNクラスターノードからhadoop構成フォルダーをコピーする必要がありますか?
ありがとうございます。私はしばらくこの周りを頭で覆そうとしていましたが、ドキュメンテーションは十分にはっきりしていますが、いくつかのユースケースがあり、いくつか混じっていました。私は本当に良い要約が必要でした:-) – NotGaeL
'mapred-site'がSparkに必要ですか? –
@ cricket_007原則としてそうではありません。私はすぐにテストして報告します。 – Serhiy