-5
我々は100,000キットを使用した。 スパークのバージョンは1.6.1、スカラは2.1.0です。 どのようにしてメモリエラーを修正し、良好な結果を得ることができますか?スカラーは、スカラーを使用してDBSCANソースを実行しているときにメモリエラーを引き起こします。どうすればこの問題を解決できますか?
我々は100,000キットを使用した。 スパークのバージョンは1.6.1、スカラは2.1.0です。 どのようにしてメモリエラーを修正し、良好な結果を得ることができますか?スカラーは、スカラーを使用してDBSCANソースを実行しているときにメモリエラーを引き起こします。どうすればこの問題を解決できますか?
スパークのための様々なDBSCANアドオンは、すべての問題があります。
与えるこのレポート:
ノイキルヒェン、ヘルムート。 "ビッグデータと高性能コンピューティングのパラダイムのためのDBSCAN空間クラスタリング実装の調査と性能評価" (2016)。 ScalaのようなJVM言語の
、例えばを呼び出すために簡単なはずELKIとかなり良いパフォーマンスを得る。
ELKIをSparkの代わりに索引付けしてみてください。 –