5
私の理解は正しいですか?sparkのアプリケーション、ジョブ、ステージ、タスクのコンセプトは何ですか?
アプリケーション: spark submit。
job: 遅延評価が行われると、ジョブが発生します。
ステージ: シャッフルと変換タイプに関係します。 ステージの境界を理解することは難しいです。
タスク: 単位操作です。タスクごとに1つの変換。変換ごとに1つのタスク。
この理解を向上させたいと考えています。
私の理解は正しいですか?sparkのアプリケーション、ジョブ、ステージ、タスクのコンセプトは何ですか?
アプリケーション: spark submit。
job: 遅延評価が行われると、ジョブが発生します。
ステージ: シャッフルと変換タイプに関係します。 ステージの境界を理解することは難しいです。
タスク: 単位操作です。タスクごとに1つの変換。変換ごとに1つのタスク。
この理解を向上させたいと考えています。
主な機能はアプリケーションです。
RDDでアクションを呼び出すと、「ジョブ」が作成されます。ジョブはSparkに提出された仕事です。
ジョブは、シャッフル境界に基づいて「段階」に分割されます。 Thisを理解するのに役立ちます。
各ステージは、RDDのパーティション数に基づいてさらにタスクに分割されます。そのため、タスクはSparkにとって最小の作業単位です。