私はより多くのコアの恩恵を受けることができるタスクを持っていますが、スタンドアロンスケジューラーはサブセットのみが使用可能な場合に起動します。むしろ、このタスクではすべてのクラスタコアを使用したいと思います。Sparkはすべてのコアをタスクに割り当てます
リソースをタスクに割り当てる前にスケジューラにすべてを完了させる方法はありますか?言い換えれば、タスクを実行する前にすべてのパスを終了した場合、またはより多くのコアが使用可能になるまで待っていた場合、DAGはこのジョブに適しています。タスクが太っていることを示唆する方法でしょうか?私はそうではなく、糸を動かさないことを望んでいます。
簡潔に:それ以外のアイドル状態のクラスタでこのマップタスクを実行して、すべてのリソース/コアを持つようにする必要があります。これを行う方法はありますか?ハッキーな答えでさえ評価されるでしょう。
アイデア?
sparkの「タスク」は、あなたが使用しているものとは非常に異なる特定の意味を持っています。 "アプリケーション"はおそらくより良い言葉だろう。 – puhlen