親愛なる仲間のApacheスパーク愛好家Apacheのスパーク -
遅いタスクを失敗を避けるためにどのように私は最近、スタンドアロンのスパーククラスタにODROID XU4コンピュータのカップルを回すことを目標に副業プロジェクトをキックオフ。
クラスタをセットアップした後、異機種マルチプロセッサに固有の問題が発生しました。スパーク・エグゼキュータのタスクは、8つのプロセッサーをすべて使用するとXU4上で非常に遅く実行されます。その理由は、以下の私の記事のコメントで述べたように、Sparkは遅いプロセッサで実行されたエグゼキュータを待たないということです。
一つの解決策は、少数のエグゼキュータのコアを使用し、LITTLEプロセッサを使用しないようにCPUアフィニティを設定することです。しかし、これは理想的なソリューションではありません。
遅いエグゼキュータからのフィードバックを少し待つようにSparkに依頼する方法はありますか?明らかに時間がかかりすぎるとパフォーマンスに悪影響を与えます。しかし、すべてのコアを活用することによる肯定的な効果は、否定的な効果を均衡させるべきです。
ありがとうございました!
偉大な@clairewareを見つける。私は設定を適用し、たとえ8コアを使用しても、はるかに優れたパフォーマンスを得ました。しかし、2 - 3は最も安全な番号です。 – TJVR
@TJVRコア数を増やすとRAMのオーバーヘッドが増え、2GBのXU4ボードではこれが重要になります。大規模なデータセットで作業している場合は、計算に使用できるRAMが増えるように1コアにダイヤルするのが最善です。しかし、私は小さなデータセットに対して2〜3のコアを作っています。 – kamprath