2016-04-18 4 views
7

例:私のデータがメモリに収まらない私が行うことができます。(どのように)フィットを使ってsklearnでモデルを2回(複数回)トレーニングすることができますか?

model=my_model 
for i in range(20) 
     model.fit(X_i,Y_i) 

これは最初の19フィットを削除します。最後のものだけを残してください。 どうすればこの問題を回避できますか?保存して読み込んだモデルを再学習することはできますか? ありがとうございます

+0

を参照してくださいあなたが作業している、疎な行列を作成することは実行可能な解決策かもしれません:http://docs.scipy.org/doc/scipy/reference/sparse.htmlこれは私にとって、 「たくさんの」RAM(〜16GB +)を搭載し、ラップトップに4GBのRAMを搭載することができます。また、どのモデルが疎入力をサポートしているのかを事前に計画しておく必要があります(すべてではありません) – Ryan

答えて

4

6.1.3を読む必要があります。 sklearnのドキュメントからのインクリメンタル学習http://scikit-learn.org/stable/modules/scaling_strategies.html

+0

他に解決策はありませんか?私はすでにドキュメントを見ましたが、リストにない別のアルゴリズムが必要です(ICA) –

5

一部のモデルでは、それがフィットから以前のソリューション(とモデルパラメータを初期化します「warm_start」パラメータを、持っている)

は、データの種類に応じて、インスタンスSGDClassifier

関連する問題