このチュートリアルhttps://weka.wikispaces.com/Text+categorization+with+WEKAの例「TextCategorizationTest.java」を使用しています。インスタンス内に1つのクラスを持たないARFF
"neg"と "pos"の2つのフォルダを持つ1つのディレクトリがあります。これらの2つのフォルダは、自分のARRFにあるクラスを表します。問題は、ARFFファイルを作成しようとすると、インスタンスに "pos"の属性クラスが含まれていないが、属性クラス "neg"にインスタンスが含まれていることです。
ここでは私のARFFファイルです: {1 1,3 1,24 1,27 1,29 1 @data :http://pastebin.com/6nGWEyMq
あなたが見ることができるように、 "POS" のインスタンスは、この形式で表示されています、37 ...} "neg"インスタンスは次の形式で表示されます: {0 neg、1 1,2 1,3 1,6 1 ...}
このARFFを修正するにはどうすればよいですか?私はwekaコードまたはweka GUIの両方のソリューションを受け入れます。
最初に、 "pos"にはインデックス1があり、その後posにはインデックス0があると言いました。公称属性はインデックスを使用して保存されるため、 "neg"はインデックス0、 "pos"はインデックス "1"つまり、 "pos"(インデックス0)がデフォルトであるため、すべての "pos"エントリが欠落しています。 –
あなたが正しいです、私はそれを書いて混乱させてしまいました。それを私が直した。 pos = 0、neg = 1。また、私は "インデックス"コンテキスト依存を使用していることに気付きました。私もそれを明確にすることができればと思います。 – Sentry
ありがとうございました! –