2016-06-16 4 views
0

私はSparkの新機能です。質問がありますスパークのパーティションが増えていますか?

Sparkではパーティションが増えていますか? OOMの問題がある場合は、より多くのパーティションが役立ちますか?

+0

[RDDのパーティション数とSparkのパフォーマンス](http://stackoverflow.com/questions/35800795/number-of-partitions-in-rdd-and-performance-in-spark) – javadba

答えて

0

パーティションによって、並列度が決まります。 Apache Sparkの文書によると、パーティションのサイズは、クラスタ内のコアの数と少なくとも同じでなければなりません。

パーティションが非常に少ない場合、クラスタ内のすべてのコアは使用されません。 パーティションがあまりにも少なく、データが小さければ、あまりにも多くの小さなタスクがスケジュールされます。

メモリ不足の問題が発生した場合は、エグゼキュータのメモリを増やす必要があります。最低8GB必要です。

+1

Iパーティションが[dafaultである[128 MB](http://www.bigsynapse.com/spark-input-output)についてのパーティション用に最適化されていることを追加します。 –

関連する問題