0
現在、最高のメモリn1-highmem-32(32個のvCPU、208 GBのメモリ)を持つ仮想マシンを実行しています。データセットサイズのためにDatalabカーネルがクラッシュする。ロードバランシングはオプションですか?
私のデータセットは約90ギグですが、今後成長する可能性があります。
データは、多くの圧縮CSVファイルに格納されています。次元数の削減とクラスタリングを行うために、データを疎な行列にロードしています。
詳細を追加できますか?どのようなクラッシュがありますか?スタックトレースはありますか?ステップは素晴らしいでしょう。 – yelsayed