を学びます"と"ユーモア "を同時に表示します。テキスト分類器を使用している場合マシンはアイデアはとても与えられた映画は「行動かもしれない、「タグ」の映画であり、その説明に基づいて映画を分類だから私は(ちょうど楽しみのために)しようとしていたテキストは、Nクラスに1に属しているテキスト分類
は通常、何を得ることは与えられたテキストが属するところにクラスですが、私の場合は私が1 Nへのタグのテキストを割り当てます。
私がしたい場合は、現在の私のトレーニングセットは、例えばので、各タグは、単一のテキストに属しているかどうか私に教えて分類器を訓練することです、私は次のやっている何本
+--------------------------+---------+
| TEXT | TAG |
+--------------------------+---------+
| Some text from a movie | action |
+--------------------------+---------+
| Some text from a movie | humor |
+--------------------------+---------+
| Another text here | romance |
+--------------------------+---------+
| Another text here | cartoons|
+--------------------------+---------+
| And some text more | humor |
+--------------------------+---------+
ようになります。テキストは、私は、次のトレーニングで終わるだろう「ユーモア」として分類されているかどうかを把握するには、その後、私はテキストはユーモアか(同じアプローチであるかどうかを学ぶでしょう分類器を訓練
+--------------------------+---------+
| TEXT | TAG |
+--------------------------+---------+
| Some text from a movie | humor |
+--------------------------+---------+
| Another text here |not humor|
+--------------------------+---------+
| And some text more | humor |
+--------------------------+---------+
を設定しましたタグの残りの部分で実行されます)。その後、私は
- アクション/何のアクション
- ユーモア/なしユーモア
- ロマンス/ノーロマンス
- 漫画/最後にノー漫画
ません4つの分類の合計で終わります私は新しいテキストを取得するときに、4つの分類器のそれぞれに、それが特定のしきい値(たとえば0.9)を超える場合、私に肯定的な分類を与える各分類器(すなわち、XがXではなくXを与える) )、それから私は新しいテキストはタグXに属しています。次に、それぞれの分類子で同じことを繰り返します。
特に私は、アルゴリズムとしてナイーブベイズを使用していますが、同じ確率を出力任意のアルゴリズムを適用することができます。
ここで質問は、このアプローチは正しいですか?ここでひどく間違ったことをしていますか?結果から私は物事を得るのは理にかなっているようですが、私は第二意見をしたいと思います。
なぜこれに否定的なコメントがありますか?私はそれが非常に便利だと思う... upvoteを追加! –
@元、私はあまりにもここでdownvoteを見て驚いたが、有権者が何を持っていたかを説明するコメントはない - 私はそれが非常に "事実上の"投票ではなかったと思います。 – lejlot