私はPythonでいくつかの予測モデルを構築しており、scikits learnのSVM実装を使用しています。それは本当に素晴らしく、使いやすく、比較的速いです。Pythonで使用できる最も速いSVM実装
残念ながら、私はランタイムによって制約を受けるようになり始めています。 650フィーチャで約4 - 5000のフルデータセットでrbf SVMを実行します。各ランは約1分かかります。しかし、5倍のクロスバリデーション+グリッド検索(粗い検索から細かい検索まで)では、私の仕事のために少しでも実現できません。だから一般的に、人々はPythonで使える最速のSVMの実装に関して何か勧告を持っていますか?それとも、私のモデリングをスピードアップする方法?
LIBSVMのGPU実装について聞いたことがありますが、これはうまくいくようです。私は、Pythonで使用可能な他のGPU SVM実装については知らないが、間違いなく他の人にも公開されるだろう。また、GPUを使用するとランタイムが大幅に増加しますか?
また、リビジョンSVM +フィーチャマップをscikitsで近似する方法もあると聞いてきました。このアプローチについて人々がどのように考えているかはわかりません。繰り返しになりますが、このアプローチを使用している人は、ランタイムの大幅な増加ですか?
プログラムの速度を上げるためのすべてのアイデアが大歓迎です。
ありがとうオグリエル。私はこれを見ていきます。間違いなく面白そうだ。 Sklearnはsvmライトフォーマットにエクスポートできますか?それは間違いなく便利です。あなたの以前の答えに応じて、残念ながら、私はtimeseriesを扱っているので、無作為サンプリング+電車/試験へのスピッティングはかなり複雑になります。私のモデルを訓練するためのサブサンプリングは、それほど簡単ではありません。ありがとう! – tomas
申し訳ありませんが、sklearnのユーティリティー機能がSVMライト形式でエクスポートできるかどうか分かりますか? – tomas
確かにドキュメントにはありませんが、そこにはあります:https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py#L142 – ogrisel