大きなスパース行列の相関行列を近似するにはどうすればよいですか？

目的のために私はこのスレッドlinkの解決策を使用しましたが、私のマトリックスAサイズは600万〜40000マトリックスであるため、予想通りにメモリエラーが発生します。したがって、私は相関行列を近似するために他の解決策を探しています。どうすればその問題に予防接種をすることができますか？どんな助けもありがとうございます。大きなスパース行列の相関行列を近似するにはどうすればよいですか？

出典

2013-11-28 erogol

まず、以下の質問に答えなければなりません。マトリックスには何個の非ゼロ要素がありますか？この番号を「nnz」と呼んでください。それらを格納するのに必要なメモリは約16e-9 * nnz（ギガバイト）です。何ギガバイト必要ですか？ –

あなたの問題は、メモリ（6e6^2値？）に結果を保持できないということです。

元の行列から行を削除できます。たとえば、相関の高い行を検索する場合は、問題を解決するために行をクラスタ化することができます。

scipy.sparse.linalg.svdsを使用して列数を縮小することもできます。しかし、あなたはまだ行^ 2相関を扱わなければならないでしょう。

出典

2013-11-29 03:13:02 cyborg

大きなスパース行列の相関行列を近似するにはどうすればよいですか？

答えて

関連する問題