svmlight

    0

    1答えて

    私は今日text2vecパッケージに出会った。それはまさに私が特定の問題に必要なものだ。しかし、私はtext2vecで作成されたdtmを何らかの出力ファイルにエクスポートする方法を理解できませんでした。私の最終的な目標は、text2vecを使用してRでフィーチャを生成し、結果として生じたマトリクスをH2Oにインポートしてさらにモデリングすることです。 H2Oは、CSV形式またはSVMLight形式

    0

    1答えて

    Webサービスを展開する際に、Azure ML Webサービスを例として作成しましたが、不明なエラーに直面しています。エラーは説明なしで出てくるので、トレースするのは難しいです。 スタジオ内で実験を実行すると、問題なく実験が実行されていました。ただし、Webサービスにデプロイすると、スタジオと同じ入力でテスト機能が失敗しました。 サービスのサンプルを公開して、問題の内容を誰かが確認できるかどうかを

    1

    1答えて

    入力フォーマットを使用してclassificationを使用しており、NaiveBayesクラシファイアを使用しています。しかし、私はNumberFormatExceptionを取得します。私はSVMLightを使うときに文字列の機能をどのように使うことができるのだろうかと思っています。ガイドライン1で読んだとおり、機能を文字列にすることもできます。 誰かが自分のコードや入力に間違っていることを教

    1

    1答えて

    私はsvmライトファイルをスパース行列のストレージとして使用しています。 試験は570601944のエントリ from sklearn.datasets import load_svmlight_file x_train, y_train = load_svmlight_file(train_file) は7minutesを使用するよりもずっと速く import xgboost as xgb

    0

    1答えて

    SVM-Light(ウェブサイトhttp://svmlight.joachims.org/)を使用しています。私はあなたに問題を尋ねたい。 私は "彼はスマートで、彼は良い学生です"という文を持っています。この文は肯定的な文です。この文章から単語のリストを作成すると、{1 - he、2 - is、3 - smart、4 - 、5 - a、6 - good、7 - 学生}。次に、文章を次のように書き

    1

    1答えて

    svmLightデータ形式での各部分の意味については非常に混乱しています。例えば : (ラベル/標的、[(特徴値)、...]、QUERYID)は ラベルは、データとQUERYIDのランクは、オブジェクトのIDであることを意味していますか?例えば : 次の項目の: 2 QID:1~1:4.000000 2:2.772589 3:0.266667 4:0.258154 5:37.330565 6:11

    1

    1答えて

    私はsvm lightを使用してバイナリ分類のモデルを訓練しています。モデルを使用して、私はいくつかの例をテストしました。私は予測ファイルの出力を見るのに驚きました.1より大きい値と-1より小さい値を含んでいます。私は範囲が[-1,1]と思った。私は何か間違っているのですか?

    0

    2答えて

    私のC++コードでSVM Lightツールを使用する必要があります。私はコンパイルとhttp://svmlight.joachims.org/にように私のコードにSVMライトをリンクされたが、今どのように私は私のC++コードからではなく、そのコマンドラインから例えば ./svm_learn -v 0 -x 1 example1/train.dat example1/model を呼び出すことが

    0

    1答えて

    私は、名詞句(NP)が匿名であるかどうかを検出するためにSVMLightを使って分類器を構築しようとしています。私は自分の機能を持っていますが、入力ファイルの形式を理解していないので、すべてのテキストをこの形式に変換するか、正のインスタンスと負のインスタンスを表すNPだけを入れてください。そして、私のファイルをこの形式に翻訳することを可能にするソフトウェアはありますか? <line> .=. <t

    -1

    1答えて

    現在、私はマルチラベル分類に取り組んでいます。クラシファイアとして私はSVMlightを使用し、マルチラベルの問題を二値化しました。これは、私の場合、1000を超える分類を実行することを意味します。 私は固定フィーチャサイズが1000で、モデルのトレーニングに3日以上かかる(2 GHz Intel Core 2 Duo、8 GB)。それは長い時間がかかりますか、パフォーマンスを向上させる方法をアド