私は、名詞句(NP)が匿名であるかどうかを検出するためにSVMLightを使って分類器を構築しようとしています。私は自分の機能を持っていますが、入力ファイルの形式を理解していないので、すべてのテキストをこの形式に変換するか、正のインスタンスと負のインスタンスを表すNPだけを入れてください。そして、私のファイルをこの形式に翻訳することを可能にするソフトウェアはありますか?SVMLight:分類器を作成するにはどうすればよいですか?
<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>
<target> .=. +1 | -1 | 0 | <float> //for positive instance should I put +1
<feature> .=. <integer> | "qid" //should I do this line for all my feature
<value> .=. <float>
<info> .=. <string> //Should this contain the NP
また、このファイルにはどのような内容が含まれていますか?
ご協力いただき誠にありがとうございます。ここで、なSVMLightの使用のためのコーネルの公式文書を引用
も参照してください:[link] http://stackoverflow.com/a/37589726 – Nandadeep