私はSparkのパーティション分割について理解したいと思います。 私のラップトップは、2つの物理コアと4つの論理コアを持っています。スパーク:パーティション分割の理解 - コア
1 /用語:私には、sparkのコア=スレッド。 Sparkのコアは物理的なコアとは違いますよね? Sparkのコアはタスクに関連付けられていますね。 もしそうなら、私はsparksqlデータフレームに4つのパーティションがある場合、パーティションにスレッドが必要なので、4つのスレッドが必要ですか?
2 /私は4つの論理コアを持っていますが、同時に私のラップトップで同時に4つの同時スレッドを実行できますか?スパークの4は?
3 /パーティション数の設定:データフレームのパーティション数を選択して、変換やアクションをできるだけ早く実行する方法を教えてください。 - 私のラップトップは4つの論理コアを持っているので、4つのパーティションが必要ですか? - 物理コアまたは論理コアに関連するパーティションの数はいくつですか? - スパークのドキュメントでは、1 CPUあたり2〜3のタスクが必要だと書かれています。私は2つの物理的なコアがあるので、パーティションのnbは4または6に等しいでしょうか?
は(私は、パーティションの数は、ローカルモードに大きな影響を持っていないことを知っているが、これは単に理解することです)
nit:Sparkのメイン/コアモジュールをRDDで参照するために "spark core"を使用します。それがSpark Coreです。 –