私はSparkの新機能です。質問がありますスパークのパーティションが増えていますか?
Sparkではパーティションが増えていますか? OOMの問題がある場合は、より多くのパーティションが役立ちますか?
私はSparkの新機能です。質問がありますスパークのパーティションが増えていますか?
Sparkではパーティションが増えていますか? OOMの問題がある場合は、より多くのパーティションが役立ちますか?
パーティションによって、並列度が決まります。 Apache Sparkの文書によると、パーティションのサイズは、クラスタ内のコアの数と少なくとも同じでなければなりません。
パーティションが非常に少ない場合、クラスタ内のすべてのコアは使用されません。 パーティションがあまりにも少なく、データが小さければ、あまりにも多くの小さなタスクがスケジュールされます。
メモリ不足の問題が発生した場合は、エグゼキュータのメモリを増やす必要があります。最低8GB必要です。
Iパーティションが[dafaultである[128 MB](http://www.bigsynapse.com/spark-input-output)についてのパーティション用に最適化されていることを追加します。 –
[RDDのパーティション数とSparkのパフォーマンス](http://stackoverflow.com/questions/35800795/number-of-partitions-in-rdd-and-performance-in-spark) – javadba