Spark(1.6.1)クラスタでは、いくつかのノードが他のノードより多くの物理メモリを持っています。しかしexecutor.memory
では、各ノードに、したがって各ノードのワーカーに等しく適用される修正値を入れなければなりません。スパークは、より大きなメモリを持つノードのノードワーカーインスタンスをより多く設定します。
ノードの中には2倍のメモリがありますが、それをすべて使用することはできません。 すべて利用可能なメモリhereを利用しようとすると、SPARK_WORKER_INSTANCES
を使用して、より多くのメモリを持つノードでノードワーカーの数が増えます。
ノードごとにワーカーインスタンスを設定するにはどうすればよいですか?
応答をいただきありがとうございます。実行者20人をインスタンス化するには、 'SPARK_EXECUTOR_INSTANCES = 20'ですか? – echo
あなたのspark-submitコマンドで--num-executors 20を渡すことができます – mgaido