2017-12-12 3 views
1

私は言うことができますか?タスクとパーティションの関係は何ですか?

  1. Sparkタスクの数はSparkパーティションの数と同じですか?

  2. エグゼキュータは一度実行されます(エグゼキュータのバッチ内)は1つのタスクと同じですか?

  3. すべてのタスクでパーティションが生成されますか?

  4. Sparkパーティションの数に等しい数のSparkタスクがありますか?

+0

データがSparkで処理されるとき、処理はソースからデータを取得し、必要なすべての変換またはアクションを実行するタスクによって実行されます。変換はステージ間で分割され、後続のステージ実行に影響を与える可能性がある異なる数のパーティションで新しいRDDまたはデータフレームを生成することがあります。 – luminousmen

答えて

0

パーティションはRDDの機能であり、設計時(アクションが呼び出される前)にのみ使用できます。

タスクは、TaskSetStage/ActiveJobのSparkアプリケーションの一部です。

Sparkタスクの数はSparkパーティションの数と同じですか?

はい。

エグゼキュータは1回実行されます(エグゼキュータのバッチ内)は1つのタスクと同じですか?

これは再帰的に「エグゼキュータ」を使用しており、それほど意味がありません。

すべてのタスクでパーティションが生成されますか?

ほぼ。

すべてのタスクは、パーティション内のデータのコードを実行する出力を生成します。

Sparkパーティションの数に等しい数のSparkタスクがありますか?

ほぼ。

一段でスパークタスクの数はRDDパーティションの数に等しいです。

関連する問題