私は、合計12個のコアと44 GBのメモリを持つ3ノードの小規模クラスタを持っています。私はhdfs(5メガバイト)から小さなテキストファイルを読み込み、kmeansアルゴリズムを実行しています。エグゼキュータの数を3に設定し、テキストファイルを3つのパーティションに分割しました。アプリケーションUIは、エグゼキュータの1人だけがすべてのタスクを実行していることを示しています。ここで は、アプリケーションのGUI enter image description here のスクリーンショットであり、ここでジョブズUIです: enter image description here 誰か他の人がアイドル状態になっている間、私のタスクはすべて1つのエグゼキュータで実行されている理由は、私が把握助けることができますか?ありがとう。スパーク・スタンドアロン・クラスタ、1つのエグゼキュータ上で実行中のジョブ
0
A
答えて
1
ファイルを12個のパーティションに再分割しようとします。 3つのパーティションがあり、各ノードに4つのコアがある場合は、1つのノードですべてのタスクを実行するだけで十分です。 Sparkは、1つのコアに1つのパーティションとして作業を大まかに分割します。
関連する問題
- 1. スパーク・スタンドアロン・クラスタ・チューニング
- 2. Mesosクラスタ上で複数のSparkジョブを実行中
- 3. 複数のエグゼキュータを持つスタンドアロン構成のスパーク
- 4. ジョブが使用するエグゼキュータのスパーク数
- 5. Jenkins - 2つ以上のエグゼキュータをフリーにしたノードでジョブを実行する
- 6. 1つのエグゼキュータのみを使用してスパーク・ジョブの1つだけを実行するのはなぜですか?
- 7. スパーク・スタンドアロン・クラスタ・モードでスパークを実行するために必要なハードウェアの最小インパクトは何ですか?
- 8. 実行中のスパーク/ハープ・クラスタにhdfsデータ・ノードを追加する
- 9. クラスタ上で複数のparpoolジョブを実行する
- 10. スパークでネストされたジョブを実行中
- 11. クラスタ内でジョブを実行中に強制ロードRパッケージ
- 12. EC2でスパークを実行すると、1つのエグゼキュータのみが使用されます(more)。
- 13. sparkが単一のエグゼキュータ上で複数のパーティションを持つジョブを実行しています
- 14. スパーク:エグゼキュータの一意のID
- 15. Apacheのスパーク:ERRORエグゼキュータ - >イテレータ
- 16. スレーブ上で実行中のスレーブXでJenkinsジョブを開始
- 17. クラスタで実行中のプロジェクトのアップデート
- 18. スパークからスタンドアロンのjarファイルを実行する方法。
- 19. スパーク・スタンドアロン・クラスタvs Eclipseクラス・クラス定義なし
- 20. java.lang.ClassNotFoundExceptionスカラ・アプリケーションをスタンドアロン・スパーク・クラスタに提出するとき
- 21. Flink Avro 1.8.1クラスタ上でNoSuchMethodErrorを実行中
- 22. クラスタ環境でのバッチ・バッチ・ジョブの同時実行の回避
- 23. HighAvailabilityを持つHadoopクラスタでSpark-submitを実行中の例外
- 24. Delayed :: Herokuで2回実行中のジョブ?
- 25. Sparkエグゼキュータ上での並行タスク
- 26. 複数のSQLジョブを1つのジョブで同時に実行する
- 27. DSE 4.8 SparkクラスタでPythonジョブを実行する際のエラー。
- 28. qsub GNUパラレル実行中ジョブ
- 29. スパーク - スパーク・ジョブに割り当てられる実行者とコアの数
- 30. スパーク・ドライバとエグゼキュータのテンポラリ・ファイルを削除
このような重いソフトウェアスタックを、それほど大きなデータや小さなクラスタに使用していないのはなぜですか? –
スパークコードがデータの小さなサブセットで正しく実行されているかどうかを確認し、それを大きなデータで実行したいのです。 –
私は研究のためにkmeansのバリエーションを実際に実行しています。私はちょうど私のスパークコードがデータの小さなサブセットで正しく動作しているかどうかを調べ、それをより大きなデータで実行したいのです。なぜ私のアプリケーションが非常に多くの仕事を生み出しているのか理解できませんでした。しかし、今私はそれについてもっと考えると、私のアルゴリズムは収束しないので、スパークが非常に多くの小さな仕事を生み出すと思います。ジョブが小さすぎるため、1つのエグゼキュータでのみジョブを実行しています。ご協力ありがとうございました。 –