2

現在、私はレストランレビューデータを分類しなければならないプロジェクトに取り組んでいます。私は多項式Naive Bayesアルゴリズムを使用しています。私は自分の問題がマルチクラスまたはマルチラベルに関連していると少し混乱しています。マルチクラス対マルチラベル

レビューは、顧客ではなく、犬のようなあなたの顧客を扱うください

を例 - 。私は決して行くことはありません、またはアドバイスを誰もNaivedyam、Hauz Khasに行ってください。彼らは病気と完全なビジネスマンです。食品は、味に悪いのverでしたが、場所とスタッフはそれはトレーニングデータセットを作成する方法

Bad Experience 
Staff Behavior 
food quality 

のような3つの異なるクラスが含まれてい

あまりにも汚れていましたか?

私はマルチラベルを使用し、マルチクラス

Review   Tags 
above review, Bad Experience 
above review, Staff Behavior 
above review, food quality 

に似

ID Content     Tags 
1, "content of the review#1", Bad Experience,Staff Behavior,food quality 

または

のように設定されたトレーニングデータを作成する必要があります任意の提案

+0

私は良いアプローチは 'x'アプローチごとに複数のラベルがあると思います。すなわち、すべてのレビュー「x」に対して、「y」が「n」要素を有するベクトルである(「n」はラベルの数である)ラベル「y」がある。 'y'の値は0と1です(各サンプルの正しいラベルのために1つです)。 – sirfz

答えて

0

あなたの問題はmultilabel classification例です。

一つのアプローチは別々のバイナリ分類問題

X   Y1 Y2 
0 1.438161 0  1 
1 -0.283780 1  1 
2 0.552564 1  0 
3 1.931332 0  1 
4 1.656010 0  1 
5 0.944862 1  0 

Y1として各出力応答を処理することで、Y2は「悪い経験」や「スタッフの行動」が発生したか否かのワンホットエンコーディングです。

scikit-learn documentationでマルチラベル分類の例を見つけることができます。

0

マルチクラス分類:

マルチクラス分類では、我々は、二つ以上のクラスが、一度に一つに属しているものを分類することを目標としています。例:果物の分類フルーツの各イメージが一つ以上のカテゴリに属していないときは、一度に1つのカテゴリのみに属する問題。例:input xはイメージで、xはAppleやOrange、Mangoに属しますが、AppleやOrange、Orange、Mangoクラスには属しません。

マルチラベル分類:マルチラベル分類において

例えば一度にしてもよいが、複数のカテゴリに属する​​エンティティ:新聞記事、製品コメント等に設けられた上記の詳細につきとして

この問題はマルチラベル分類として実証されるべきです。

希望すると、これが役立ちます。 より多くの洞察のために:http://scikit-learn.org/stable/modules/multiclass.html

関連する問題