2016-05-18 3 views
0

の相当なデータセットでARDRegressionを実行しようとしましたが、全能のメモリを使用しているため、Pythonを強制終了する必要があります。以下のコードは、問題scikit-learnでARDRegressionを使用したメモリの問題

import numpy as np 
from sklearn import linear_model 

X = np.random.random((50000, 100)) 
y = np.random.random(50000) 

reg = linear_model.ARDRegression() 
reg.fit(X, y) 

そして、ここを再作成する必要がありますtop

top running whilst fitting model

のスクリーンショットは、だから私の質問は、この大規模なデータセットのARDRegression機能のこの予想される動作ですされますか、私はバグレポートを提出する必要があるメモリリークがありますか?これまでの自動妥当性判定についてはあまり知られておらず、文献はかなり密集しているようです。私が使用している

scikit-learn0.18.dev0とPython 2.7.10

答えて

1

あなたの質問はhereに答えているようです。

私は、開発者を引用してみましょう:それはn_samples *サイズn_samplesの行列を割り当てて

ARDRegressionはスケーラブルではありません。あなたの問題を解決するために、私は上記の回帰モデルを誘導する他の希少性に切り替えるだけです。

関連する問題