svm

0熱

2答えて

私は、陽性と陰性とラベルが付けられた2つの重い不均衡なデータセットを持っています。そして、95％の真の陽性率（そして5％の偽陰性率を継承します） 99.5％の真の負の割合（0.5％の偽陽性率）。私がROCグラフを作成しようとする問題は、x軸の間隔が0から1、間隔が0.1であることです。代わりに、私の非常に低い偽陽性率を与えられた場合、0から0.04のような値になります。これがなぜ起こるかについ

6熱

1答えて

はロジスティック回帰の大きなマージンの分類器ですか？</p> <p>は、例えば者は、この画像を見てみましょう：私はSVMに大きなマージン効果を理解したよう

我々はパラメータのセットを見つけようとして正則化項で SVMの最適化の目的で（パラメータベクトル）θのノルムは小さい。だから、小さなベクトルであるベータシータと、このベクトルの正例（p）の投影（内積のための小さなシータベクトルを補う）を見つけなければなりません。同時に大きなpは大きなマージンを与えます。この画像では、我々は理想的なシータ、およびそれとの大きなP（と大きなマージン）を見つける：私

5熱

1答えて

libsvm - クロスバリデーションの精度はラベルの比率と同じ

libsvmのPythonインターフェイスを使用していますが、グリッド検索を使用してCとgammaのパラメータ（RBFカーネル）を選択した後、モデルを訓練し、それを検証する（5倍、関連性がある場合）。私が受け取る精度は、トレーニングデータセットのラベルの比率と同じです。私は3947個のサンプルを持っていて、そのうち2898個はラベル-1を持ち、残りはラベル1を持っています。そのためサンプルの73

6熱

3答えて

SVM for People Recognitionの使い方は？

私はopencv 2.4.2 C++を実行しています。私はopencvを使って人々の認識をしようとしています。私は、さまざまな方向の異なる人を含むVidTIMITデータセットを使用しています。私はCvSVMを使ってこれらの人々を分類しています。私の問題は、svmの出力は常に同じであるということです。私は従うアルゴリズムは次のとおりです。顔のハールを使用して顔検出リサイズ（58 * 5

6熱

2答えて

SVMでデータの不均衡をどのように扱いますか？

lrgeトレーニングセットでSVMをトレーニングしていて、クラス変数がTrueまたはFalseの場合、トレーニングセットのFalse値の数と比較してTrue値が非常に少ないとトレーニングモデル/結果に影響しますか？彼らは平等であるべきですか？トレーニングセットにTrueとFalseの均等分布がない場合、トレーニングができるだけ効率的に行われるように、これをどうやって管理しますか？

13熱

1答えて

libsvmシュリンクヒューリスティック

私は次数2の多項式カーネルでC-SVCモードでlibsvmを使用しています。複数のSVMを訓練する必要があります。 -h shrinking : whether to use the shrinking heuristics, 0 or 1 (default 1) とI： WARNING: using -h 0 may be faster * WARNING: reaching max n

15熱

2答えて

非整数クラスラベルScikit-Learn

scikit-learnのクイックSVM質問。あなたはSVMを訓練するとき、それは from sklearn import svm s = svm.SVC() s.fit(training_data, labels) のようなものだ非数値型のリストであることをlabelsための方法はありますか？例えば、 'cat'や 'dog'を1と2にエンコードする何らかの外部ルックアップテーブルを持た

5熱

1答えて

SVM（e1071）のプロファイルをR

私はRとSVMの新人です。の機能をe1071パッケージからプロファイルしようとしています。しかし、入力データのサイズを変えて、結果の良いプロファイリング範囲を得るための大きなデータセットを見つけることはできません。誰もどのようにsvm仕事を知っていますか？どのデータセットを使用する必要がありますか？ svmへの任意の特定のパラメータは、それをより困難にするでしょうか？パフォーマンスをテストするた

7熱

3答えて

カーネルが有効なカーネルかどうかをテストする方法

サポートベクターマシンクラシファイアの2つの入力エンティティ間の類似性を判断する独自の方法を定義し、それをカーネルとして定義すると、私が使用できる有効なカーネルですか？たとえば、自分の入力が文字列で、私が選択したカーネルが何らかの文字列距離メトリックを言うならば、SVMに使用できるかどうかをどうやって決めることができますか？私は、有効なSVMカーネルのいくつかの条件があることを知っています。誰で

8熱

1答えて

scikit-learn SVMのデータのスケーリング

libsvmはScikit-Learn（SVCクラシファイアのlibSVMに基づいている）でデータをスケーリングするためのツールを提供していますが、データのスケールを変更する方法はありません。基本的には、4つの機能を使用したいと思います。そのうちの3つの範囲は0から1までで、最後のものは「大きな」可変数です。（私のデータを自動的にスケールするeasy.pyスクリプトを使って）第4の機能をlib