クラスタモードでYARN上で動作するApache Sparkに関する質問があります。 this threadによると、クラスタ内のすべての(作業者)ノードにSpark自体をインストールする必要はありません。私の問題はスパークエグゼキュータです:一般的に、YARNまたはリソースマネージャはリソースの割り当てについて決定することになっています。したがって、Spark Executorsはクラスタ内の任意の(ワーカー)ノード上でランダムに起動できます。しかし、Sparkが(ワーカー)ノードにインストールされていない場合、Spark ExecutorsをYARNがどのように起動することができますか?スパークアプリケーション糸で起動ハイレベルで Spark(YARN上)がワーカーノードにインストールされていない場合、Spark Executorはどのように起動されますか?
答えて
、
- は、アプリケーションマスター(特定スパーク)が糸コンテナのいずれかで作成されます。スパーク労働者(エグゼキュータ)
スパークドライバに使用
火花アセンブリは、独自の機能に関連する 瓶を持っています YARNクラスタとアプリケーションのスパークジョブを実行するために、スパーク関連のjarファイルを提供します。
編集:(2017年1月4日)
スパーク2.0 はもはや生産 展開のための脂肪組立ジャーを必要としません。 source
あなたの答えをありがとう。私はYARNコンテナについて知っています。私が理解している限り、エグゼキュータ(実際にはプロセス)がコンテナ内で起動されます。しかし、実行者自身がSpark固有のコンポーネントです。したがって、私の質問:スパークがどのワーカーノードにもインストールされていない場合、どのようにSpark Executorsを(YARNコンテナ内で)起動できますか? – h4wX
はい!エグゼキュータはプロセスであり、すべてのコンピューティングロジックは、スパークドライバプログラムによってすべてのロジックに渡されます。 ** spark-assembly **のような他のジャーは、アプリケーションの起動時に自動化されたプロセスであるHDFSに移動させることで、すべてのワーカーが利用できます。 – mrsrinivas
はい、そうですが、これは特定のケースでどのように機能しますか? – h4wX
- 1. sparkランタイムjar(../spark-2.0.1-bin-hadoop2.6/jars)は、YARNクラスター内の物理ワーカーノードにどのように配布されるのですか?
- 2. Sparkアプリケーションがクラッシュした後、Spark ExecutorログをYarnに保持する方法
- 3. YARNウェブに表示されていないSpark提出のアプリケーションuu
- 4. SparkワーカーノードがWebUIで開始されているが表示されていない
- 5. HadoopがインストールされていないSpark ML
- 6. Spark SQLクエリはDF上で実行されていますか?
- 7. spark-defaults.confのspark。{driver、executor} .memoryとspark-env.shのSPARK_WORKER_MEMORYの違いは何ですか?
- 8. SparkのワーカーノードでGCが呼び出されたとき
- 9. Spark on YARNとspark-bigqueryコネクタ
- 10. すべてのデータノードにsparkワーカーノードをインストールする必要がありますか?
- 11. Spark DriverのメモリはExecutorリソースにどのように影響しますか?
- 12. Apache Spark 2.1.1のワーカーノードを起動できません
- 13. 他にクラスタソフトウェアがない場合、YARNにSparkを導入する価値はありますか?
- 14. Spark Executorは複数のタスクをどのように実行しますか?
- 15. spark-submit.shを使用していないときに、Yarn Resource Managerが実行されている場所をSparkはどのように知っていますか?
- 16. YARNを使用しないspark-submit
- 17. YARNでSpark Streamingアプリケーションを正常に停止するにはどうすればよいですか?
- 18. wampサーバーがインストールされている場合、phpは自動的にインストールされますか?
- 19. シリアルDispatchQueueでコンテキストスイッチが起動された場合はどうなりますか?
- 20. 指定されたパーティションパスがない場合、SPARK SQLが失敗する
- 21. YARNで実行しているときにSparkスケジューラプールはどのように機能しますか?
- 22. YARNエラーでspark-shellを実行しているApache Sparkエラー
- 23. spark(ワーカーノードのアプリケーションフォルダをクリーンアップ)
- 24. Python Spark/Yarn memory usage
- 25. SparkアプリケーションがYARNで起動する前にすべてのエグゼキュータが割り当てられるまで待つ方法を教えてください。
- 26. SparkContextからApache SparkとYarnを接続するにはどうすればいいですか?
- 27. アクティビティが再び起動されないようにするにはどうすればよいですか?
- 28. YARN動的リソースプール用にキューが構成されているかどうか
- 29. Spark View EngineのパフォーマンスはASP.NETとどのように比較されますか?
- 30. iOSのディープリンク - アプリがインストールされていない場合、Apple Storeに移動
実行者は何らかの形でSparkランタイムを利用できる必要があります。これは、ノードにインストールするか、アプリケーションと共に出荷するかのいずれかで行うことができます。スパークを束ねた太った瓶に入れた。私は思う... – LiMuBei
あなたはfatjar/uberjarにバイナリを含める必要はありません。それはspark-submitによって自動的に提供されます。 –