2013-11-28 9 views
5

目的のために私はこのスレッドlinkの解決策を使用しましたが、私のマトリックスAサイズは600万〜40000マトリックスであるため、予想通りにメモリエラーが発生します。したがって、私は相関行列を近似するために他の解決策を探しています。どうすればその問題に予防接種をすることができますか?どんな助けもありがとうございます。大きなスパース行列の相関行列を近似するにはどうすればよいですか?

+0

まず、以下の質問に答えなければなりません。マトリックスには何個の非ゼロ要素がありますか?この番号を「nnz」と呼んでください。それらを格納するのに必要なメモリは約16e-9 * nnz(ギガバイト)です。何ギガバイト必要ですか? –

答えて

1

あなたの問題は、メモリ(6e6^2値?)に結果を保持できないということです。

元の行列から行を削除できます。たとえば、相関の高い行を検索する場合は、問題を解決するために行をクラスタ化することができます。

scipy.sparse.linalg.svdsを使用して列数を縮小することもできます。しかし、あなたはまだ行^ 2相関を扱わなければならないでしょう。

関連する問題