私は、1つの名前ノード、2つのデータノード、1つのリソースマネージャー、2つのノードマネージャーの設定を持っています。すべてのコンポーネントはドッカーコンテナーとして実行されています。 2台のマシン(2台のクライアント)からspark submit(糸クラスターモード)を実行するたびに、ジョブは順番に完了します。 Job1とJob2の両方がAccepted状態になり、Job1がRunningとFinished状態になり、Job2が選択されて実行を終了します。 これらのジョブが並行して実行される方法はありますか? アプリケーションマネージャは、ノードマネージャにこれらのタスクを与える方法をどのように選択しますか?YARNのアプリケーションマネージャー
0
A
答えて
0
クラスタの設定ではYARN Capacity Scheduler
が使用されています。これは、使用可能なHadoopディストリビューションのほとんどでデフォルトです。複数のジョブが同じユーザによって提出された場合、それらはFIFOに続く同じユーザ待ち行列に入る。これは容量スケジューラのデフォルト動作です。
Fair Scheduler
は、使用可能なリソースを共有することによってジョブを並行して実行するように設定できます。
<property>
<name>yarn.scheduler.fair.allocation.file</name>
<value>/path/to/allocation-file.xml</value>
</property>
このプロパティが設定されていない場合は、ユーザーごとのキューはデフォルトで作成され、アロケーションファイルにyarn-site.xml
<property>
<name>yarn.resourcemanager.scheduler.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
</property>
設定公平スケジューラqueues
にこのプロパティを追加します。
関連する問題
- 1. Hadoop YARN対Yarnパッケージマネージャコマンドの競合
- 2. YARNとHadoopの
- 3. YARNクラスタのsparkR
- 4. の.css、YARN
- 5. AWS EMR-Yarn Container
- 6. スパーク/フェニックス(Kerberos with YARN)
- 7. log4j.propertiesフィルタスパークとYARNログ
- 8. Python Spark/Yarn memory usage
- 9. YARN MRv2 JobClient相当
- 10. JHipster - MavenとYarnの実行
- 11. YARN予約メモリの問題
- 12. `yarn top`コマンドのヘッダー情報
- 13. sparkアプリケーションオーバーライドyarn-site.xml設定パラメータ
- 14. spark submit on yarn-cluster - ハイブエラー
- 15. Spark on YARNとspark-bigqueryコネクタ
- 16. Webpacker、Yarn and capistrano、[email protected]エラー
- 17. YARNしきい値エラー
- 18. YARN:ジョブの並行性の制御
- 19. ヤーン:hadoop-2.7.3内のyarn-default.xmlの位置
- 20. YARN(Hadoop)のコンテナ割り当てコード
- 21. OozieでYARNのクラスパスを編集する
- 22. spark、kerberos、yarn-cluster - > hbaseへの接続
- 23. YARNクラスタモードでのスパーク監視REST API
- 24. スパークはYARNモードHADOOP_CONF_DIRの内容は
- 25. Hadoop Yarnローカルファイルシステムへの書き込み
- 26. 次のアクションでYARNアクションアプリケーションIDを取得
- 27. HadoopのYARN SLS(スケジューラ負荷シミュレータは)
- 28. YARNのLog4jプロパティファイルをカスタマイズする方法
- 29. YARNのログファイルを保存するには?
- 30. yarn api elapsedTimeでアプリケーションを取得
これは機能しました。ありがとう – Aneri