1

クラスタ管理上のいくつかのプレゼンテーション(たとえば、1,、3)では、スケジューラの目的の1つは、単一のジョブのタスクを、一緒に失敗する可能性が高い。クラスタのパフォーマンスへの相関障害の影響

単一のジョブ内のタスクの関連障害が望ましくないのはなぜですか?私が正しく理解していれば、仕事が完了する前にすべての仕事を終わらせる必要があります。一見すると、タスクの失敗が少数のジョブに限定され、失敗したタスクの再提出のためにそれらのジョブだけが遅延を経験するようにする方が良いでしょう。

ジョブ内のすべてのタスクが単純に同じ作業を複製していても、ジョブごとに何百ものタスクがある場合は理解できます(フォールトトレランス目的では同じタスクが3〜私は、なぜこれらのタスクグループの相関障害を減らすことが重要であるかを理解しています。

答えて

0

私が逃したものが分かりました。私はどういうわけか、あらかじめ決められた仕事の集合を横断して仕事を分かち合う仕事を考えました。

実際、クラスタ管理のコンテキストでは、作業はタスク間で動的に分割されます。タスクは従業員のようなものです。つまり、ロードバランサに可用性をアナウンスしてから、作業の一部を動的に割り当てます。

この説明では、すべてが明らかです。

タスクが失敗した場合、ロード・バランサは、ジョブ・パフォーマンス・メトリック(バッチ・ジョブの場合は完了までの時間、サービス・ジョブの場合は待ち時間)をわずかに低下させて、 )。しかし、1つのジョブで多すぎるタスクが失敗すると、ジョブのパフォーマンスがあまりにも悪くなります。これは、相関した障害が望ましくない理由です。

関連する問題