ハッシュマップを更新する必要があります。私はJavaPairRDDを持っており、このラッパーには9種類のハッシュマップがあります。各ハッシュマップは約40〜50個のcrキーのキーを持っています。 2つのマップ(ReduceByKey in spark)をマージすると、JavaヒープメモリOutOfMemory例外が発生します。以下はコードスニペットです。ハッシュマップスパークでOutOfMemoryを与える大規模なデータセット
このメソッドは小さなデータセットで機能しますが、大きなデータセットでは失敗します。 9つの異なるハッシュマップに同じメソッドが使用されています。増加するヒープメモリを検索しましたが、クラスタ上で動作するので、これを増やす方法は考えられませんでした。私のクラスターのサイズも大きいです(ノード数300)。いくつかの解決策を見つけるのを助けてください。
ありがとうございました。