私はZeppelinからSpark2を実行しています(HDP 2.6では0.7)、私は何時間も後にクラッシュするidf変換を行っています。これは、マスタと3つのデータノードs1、s2、s3を持つクラスタ上で実行されます。すべてのノードにSpark2クライアントがあり、それぞれに8つのコアと16GBのRAMがあります。Spark2が1つのノードでのみ動作するのはなぜですか?
私はただ1つのノードs3で5つのエグゼキュータを実行していることに気付きました。 zeppelin-env.shで
Iは12グラム〜32とzeppelin.executor.mem
からzeppelin.executor.instances
を設定して、それがラインを有する:
export MASTER=yarn-client
Iがorg.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler
からyarn.resourcemanager.scheduler.class
を設定しています。
また、Spark2インタープリタでspark.executor.instances
を32に設定しました。
他のノードが自分のシェアを獲得しようとすることができますか?