2016-07-31 1 views

答えて

1

Charm ++とAdaptive MPIは、ハードウェアの障害や何らかの理由で別の数のコアで実行したいために、使用可能なプロセッサのセットが動的に縮小して拡張する「可鍛性」ジョブをサポートしています。これは、2つの基本的理由から可能です。

1)プログラミングモデルは、物理的なもの(プロセッサ)ではなく論理エンティティ(タスク)に分解作業に基づいています。

2)ランタイムシステムは位置管理を行い、実行中にすべてのタスクとそのデータを移行することができます。

重要な点は、ジョブを縮小/拡張することは、ランタイムシステムの観点から動的に負荷を分散することと同じです。したがって、動的ロード・バランシングが可能なCharm ++プログラムを作成すると、柔軟なジョブと自動チェックポイント/再起動のサポートを利用できます。この機能の例については、Charm ++ソースのmainlineのexamples/charm ++/shrink_expand /を参照してください。

+0

外部リソースへのリンクまたは参照ではなく、最小限の例を回答として提供してください – junkfoodjunkie

+0

チャーム++のフォールトトレランスサポートについては、これらのノードが予期せずネットワークから落ちた場合にも言及してください。 – Novelocrat

関連する問題