2017-07-04 19 views
1

私にJava.lang.OutOfMemoryError:Javaヒープスペース(またはGCオーバーヘッド)を与えるSparkジョブがあります。スパークが外部結合メモリの問題を残しました

完全なタスクの統計に75パーセンタイルのメモリが表示され、ディスクスピルが0であるステージでは、最大でそれぞれ1732.5 MBと145.5 MBのように見えます。

私は、leftOuterJoin中にすべての行の70%以上を表すキーを持っていると確信しています。

この結合を実行するときに、複数のパーティションにこのキーに関連付けられた値を分散する方法はありますか?

おかげで

答えて

関連する問題