Apache Sparkの場合 "Spark-submit"コマンドの場合、並列性のレベルを制御する "フラグ"がありますか?spark-submitコマンドには、並列レベルを制御するフラグがありますか?
0
A
答えて
1
num-executors
を使用してエグゼキュータの数を設定し、次に再生できるコアの数を--executor-cores
または--total-executor-cores
のいずれかを使用して設定できます。コマンドライン引数として、またはspark設定ファイルに渡すことができます。しかし、これはYARNモードでのみ機能します。
しかし、Sparkの実際の並列処理は、データフレーム/ RDDのパーティション数によって制御されます。一般に、RDDを作成するときに、必要なパーティションの量を指定できます。 sc.defaultParallelism
を使用して、デフォルトの並列性を確認することもできます。したがって、コアの数よりも少ないパーティションを割り当てると、本質的にgのコアのいくつかが無駄になります。
今、SparkはRDDを取り込み、クラスタ全体に分散し、パーティションで動作するタスク(コードから作成されたクロージャです)を生成します。生成されるタスクの数は、クラスタ内のコア数(または合格したパラメータ)になります。一般的な経験則では、Sparkのタスク起動時間が非常に少ないため、1コアあたり2〜3のタスクを持つことです。
関連する問題
- 1. どの並行性制御がより効率的か悲観的または楽観的並行性制御
- 2. 制御文字エスケープする必要があります文字を制御
- 3. スカラ並列コレクションの並行性を制御する方法
- 4. pytest-xdistがテストを並行して実行する方法を制御する方法はありますか?
- 5. ありますか? Pythonの制御フロー?
- 6. pidでサーボを制御する必要がありますか
- 7. アプリケーションのconfのsetMasterとsparkSubmitの--masterフラグとの間に差異や矛盾があります。
- 8. EMBEDコードビデオを制御する方法はありますか?
- 9. Pythonでウィンドウを制御する方法はありますか?
- 10. Sphero Miniを制御するSDKはありますか?
- 11. dojo treegridにレベル制限がありますか?
- 12. RStudioのレベル数に制限はありますか?
- 13. ロボット制御のための並列プログラミング
- 14. ウィンドウのログオンプロセスを制御する必要があります
- 15. ユーザーの検索インターフェイスで並べ替える順序を制御する方法はありますか?
- 16. gitコマンドのデフォルトでフラグを設定する方法はありますか?
- 17. コマンドラインからPeopleを制御する方法はHudsonにありますか?
- 18. CockroachDBの行レベルの配布を制御しますか?
- 19. viを制御するBashコマンド
- 20. URLコマンドでGoProを制御する
- 21. ローカルホストarduinoデバイスを制御するPythonコマンド
- 22. Oracle DBの並列実行を制御する方法
- 23. 並列スレッド(Python)の実行に最大限の制限はありますか?
- 24. FosUserBundleのログインテンプレートにエラーを制御する方法はありますか?
- 25. RではBLAS並列行列積でマルチスレッドを制御する方法
- 26. mongooseのユーザーアクセス制御にエラーがあります
- 27. 並列化レベル
- 28. glibのデバッグ情報のレベルを制御する方法は?
- 29. Excel - フラグを使用してセルレベルの計算を制御する
- 30. Rails:制御コードが制御外にある
--num-executors ?? check spark-submit --help – urug
エグゼキュータ、コアの数を制御したり、各パーティション内の何かを実行することもできます(たとえば、パーティション内のdb接続の作成など)。これらはより多くの並列性を達成するのに役立ちます – void