svm

    0

    2答えて

    私は、陽性と陰性とラベルが付けられた2つの重い不均衡なデータセットを持っています。そして、95%の真の陽性率(そして5%の偽陰性率を継承します) 99.5%の真の負の割合(0.5%の偽陽性率)。 私がROCグラフを作成しようとする問題は、x軸の間隔が0から1、間隔が0.1であることです。代わりに、私の非常に低い偽陽性率を与えられた場合、0から0.04のような値になります。 これがなぜ起こるかについ

    6

    1答えて

    我々はパラメータのセットを見つけようとして正則化項で SVMの最適化の目的で (パラメータベクトル)θのノルムは小さい。だから、小さなベクトルであるベータシータと、このベクトルの正例(p)の投影(内積のための小さなシータベクトルを補う)を見つけなければなりません。同時に大きなpは大きなマージンを与えます。この画像では、我々は理想的なシータ、およびそれとの大きなP(と大きなマージン)を見つける: 私

    5

    1答えて

    libsvmのPythonインターフェイスを使用していますが、グリッド検索を使用してCとgammaのパラメータ(RBFカーネル)を選択した後、モデルを訓練し、それを検証する(5倍、関連性がある場合)。私が受け取る精度は、トレーニングデータセットのラベルの比率と同じです。 私は3947個のサンプルを持っていて、そのうち2898個はラベル-1を持ち、残りはラベル1を持っています。そのためサンプルの73

    6

    3答えて

    私はopencv 2.4.2 C++を実行しています。 私はopencvを使って人々の認識をしようとしています。 私は、さまざまな方向の異なる人を含むVidTIMITデータセットを使用しています。 私はCvSVMを使ってこれらの人々を分類しています。 私の問題は、svmの出力は常に同じであるということです。 私は従うアルゴリズムは次のとおりです。顔のハールを使用して 顔検出 リサイズ(58 * 5

    6

    2答えて

    lrgeトレーニングセットでSVMをトレーニングしていて、クラス変数がTrueまたはFalseの場合、トレーニングセットのFalse値の数と比較してTrue値が非常に少ないとトレーニングモデル/結果に影響しますか?彼らは平等であるべきですか?トレーニングセットにTrueとFalseの均等分布がない場合、トレーニングができるだけ効率的に行われるように、これをどうやって管理しますか?

    13

    1答えて

    私は次数2の多項式カーネルでC-SVCモードでlibsvmを使用しています。複数のSVMを訓練する必要があります。 -h shrinking : whether to use the shrinking heuristics, 0 or 1 (default 1) とI: WARNING: using -h 0 may be faster * WARNING: reaching max n

    15

    2答えて

    scikit-learnのクイックSVM質問。あなたはSVMを訓練するとき、それは from sklearn import svm s = svm.SVC() s.fit(training_data, labels) のようなものだ非数値型のリストであることをlabelsための方法はありますか?例えば、 'cat'や 'dog'を1と2にエンコードする何らかの外部ルックアップテーブルを持た

    5

    1答えて

    私はRとSVMの新人です。の機能をe1071パッケージからプロファイルしようとしています。しかし、入力データのサイズを変えて、結果の良いプロファイリング範囲を得るための大きなデータセットを見つけることはできません。誰もどのようにsvm仕事を知っていますか?どのデータセットを使用する必要がありますか? svmへの任意の特定のパラメータは、それをより困難にするでしょうか? パフォーマンスをテストするた

    7

    3答えて

    サポートベクターマシンクラシファイアの2つの入力エンティティ間の類似性を判断する独自の方法を定義し、それをカーネルとして定義すると、私が使用できる有効なカーネルですか? たとえば、自分の入力が文字列で、私が選択したカーネルが何らかの文字列距離メトリックを言うならば、SVMに使用できるかどうかをどうやって決めることができますか?私は、有効なSVMカーネルのいくつかの条件があることを知っています。誰で

    8

    1答えて

    libsvmはScikit-Learn(SVCクラシファイアのlibSVMに基づいている)でデータをスケーリングするためのツールを提供していますが、データのスケールを変更する方法はありません。 基本的には、4つの機能を使用したいと思います。そのうちの3つの範囲は0から1までで、最後のものは「大きな」可変数です。 (私のデータを自動的にスケールするeasy.pyスクリプトを使って)第4の機能をlib