2016-04-14 15 views
0

私は、名詞句(NP)が匿名であるかどうかを検出するためにSVMLightを使って分類器を構築しようとしています。私は自分の機能を持っていますが、入力ファイルの形式を理解していないので、すべてのテキストをこの形式に変換するか、正のインスタンスと負のインスタンスを表すNPだけを入れてください。そして、私のファイルをこの形式に翻訳することを可能にするソフトウェアはありますか?SVMLight:分類器を作成するにはどうすればよいですか?

<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info> 
<target> .=. +1 | -1 | 0 | <float> //for positive instance should I put +1 
<feature> .=. <integer> | "qid" //should I do this line for all my feature 
<value> .=. <float> 
<info> .=. <string> //Should this contain the NP 

また、このファイルにはどのような内容が含まれていますか?

ご協力いただき誠にありがとうございます。ここで、なSVMLightの使用のためのコーネルの公式文書を引用

答えて

0

は、入力フォーマットの例である:

-1 1:0.43 3:0.12 9284 0.2限り

私が理解したことは、これは、 "フィーチャー"(あなたの場合はNP)の文書では、上記の行は0.43の重みを持つfeature1、0.22の重みを持つ第3フィーチャー、他のすべてのフィーチャは0の値を持ちます。

この種のフォーマットを生成するためのソフトウェアまたはソースコードまたはライブラリについて - これも私が探しているものであり、したがって私はあなたに答えられません。しかし、フォーマットの説明についてはっきりしていることを願っています。

+0

も参照してください:[link] http://stackoverflow.com/a/37589726 – Nandadeep

関連する問題