LIBSVM(すなわち、どの程度までテスト点が決定境界からのものであり、マージンがどのように広い)分類器の確実性に基づいて、テストポイントのP - 値を算出します。
私はあなたのSVMを訓練することとは別に、機能の重要性を判断することを検討すべきだと思います。
- 分割データセットをKへ:トン「機能の選択」(ちょうど開く任意のテキストブック)のためのアプローチのが、1つ次のように、簡単な方法は、単純なクロスバリデーションだろう理解しやすいがあります。ひだ(例えば、K = 10が一般的です)K折り目のそれぞれについて
- :
- 残りは訓練され、現在の倍はテストセットである(電車/テスト・セットにデータを区切りセット)
- 予測性能
- 平均すべてのkのためのあなたののn -1機能分類器のパフォーマンスを測定のみN -1あなたN機能
- のを使用して、SVM分類器をトレーニングテストフォールド
- 残りのすべての機能について1-3を繰り返します。
nの機能を個別にテストする場合は、逆の操作を行うこともできますが、機能間の重要な2次以上の重要な対話を見逃す可能性があります。
しかし、一般的に、SVMは無関係な機能を無視するのに適しています。
また、プリンシパルコンポーネント分析を使用してデータを視覚化し、データがどのように配布されているかを知ることができます。
「libSVMは分類子の確信度に基づいてテストポイントのp値を計算する」 - 私は回帰をして分類をしていないという違いがありますか? –
私は回帰のためにlibsvmを使ったことがないので、わかりません。 – awesomo