2016-05-04 18 views
0

Sklearnで作成したモデル(EmpiricalCovariance、MinCovDet、OneClassSVMなど)を保存し、後で再適用することに興味があります。 私はPKLファイルとjoblibを保存するオプションをよく知っていますが、シリアル化されたpythonオブジェクトではなく明示的にモデルを保存することをお勧めします。 主な動機は、モデルパラメータを簡単に表示できることです。Sklearn - pklファイルのない永続化

は、私はこれをやって1つの参照が見つかりました: http://thiagomarzagao.com/2015/12/07/model-persistence-without-pickles/

質問です: 私は(sklearnのすなわち、新バージョン)時間をかけてこの作業を頼りにすることはできますか?これはあまりにも多くの "ハッキー"な解決策ですか?

誰でもこれをやった経験はありますか?

おかげ ジョナサン

+0

なぜこれは機能しませんか? http://stackoverflow.com/questions/10592605/save-classifier-to-disk-in-scikit-learn私は、あなたがピクルとリロードをするとパラメータを失うとは思わない...あなたが与えた例では、データが巨大であったためです。巨大なデータを扱っていますか?もしそうなら、Sklearnは動作しても動作しなくてもよい。 Googleはクエリ用の永続テーブルを持っていて、それを酸っぱくしているわけではありませんが、大規模に作業しています。酸洗いをしない主な動機は、それが遅すぎるということであり、再度パラメータにアクセスする必要はありません。 – flyingmeatball

答えて

1

私はそれがハック解決策だとは思わない、同僚は、彼がgolangで書かれている得点によって消費されるようにモデルをエクスポートする同様のことを行って、そしてよりもはるかに高速であるましたシキット学習のスコアラー。 Sklearnの将来のバージョンとの互換性について心配している場合は、condavirtualenvのような環境マネージャを使うことを検討してください。 anycauseでこれはちょうど良いソフトウェアエンジニアリングの練習であり、とにかく慣れ始めるべきものです。

関連する問題