私は単語が果物かどうかを判断する必要があるプロジェクトに取り組んでいます。私はいくつかのアプローチを試みましたが、いずれの結果にも満足していませんでした。助言がありますか?複数のカテゴリへのテキストの分類
マイトレーニングセットは、この
- 入力のようになります。Appleはフルーツです。 出力:アップル。
- 入力:グアバもフルーツです出力:グアバ。
- 入力:パイナップルは季節のフルーツ出力:パイナップルです。
例トレーニングデータ外で実行されている:
- 入力:私はすべての果物を愛するがお気に入りはグアバとリンゴです。 出力:Guava、Apple
これまでに何を試してみましたか?私はあなたがただ用意されたソリューションを望んでいると仮定します。あなたの質問を言い直してください –
私が今までscikitを使って行ってきたのは、SVMが単一ラベル分類ではうまくいきますが、マルチラベルでは性能が良くないことです。私は自分の問題を解決する方法についていくつかのアイデアが必要です。 @ArpitSolanki –
文字列から情報(_i _._ e_。フルーツ名)を抽出するだけですか?もしそうなら、マルチラベル分類器は過度のものかもしれない。 – arturomp