私たちは糸クラスター上でスパークジョブを実行し、十分なリソースがない場合でもスパークジョブが開始することを発見しました。SparkアプリケーションがYARNで起動する前にすべてのエグゼキュータが割り当てられるまで待つ方法を教えてください。
極端な例として、スパークジョブは1000人のエグゼキュータ(4つのコアと20GB RAM)を要求します。そしてクラスタ全体では、r3.xlarge
(4コアと32GB RAM)のノードが30個しかありません。実際には、30人のエグゼキュータだけで作業を開始して実行できます。 動的割り当てをfalseに設定しようとしましたが、容量スケジューラと糸の公平スケジューラの両方を試しました。それは同じだ。
私たちは十分なリソースなしで仕事を始めることができないどのようなアイデアですか?これにはスパークサイドかヤーンサイドの設定がありますか?