スタンドアロンのSpark 2.0サーバーをセットアップして、分析機能を並列処理しようとしています。これを行うには、複数のエグゼキュータを持つ1人のワーカーを欲しがります。複数のエグゼキュータを持つスタンドアロン構成のスパーク
私が使用しています:
- スタンドアロンスパーク2.0
- 8コア
- 24gigのRAM
- のWindows Server 2008
- pyspark(これは関係のない表示されますが)
これは純粋な概念証明のためのものですが、私は8エグゼキュータ、各コアごとに1つ。
私はこのトピックの他のスレッドに従おうとしましたが、何らかの理由でそれが動作しません。 IE:次のように Spark Standalone Number Executors/Cores Control
私の設定は次のとおりです。
のconf \スパーク-defaults.confに
spark.cores.max = 8
spark.executor.cores = 1
私も無駄に私のspark-env.shファイルを変更しようとしました。代わりに、私の1人の労働者に1人のエグゼクティブしかいないことが示されています。下記のように、8コアの1エグゼキュータを使用してスタンドアロンを表示しています。