現在、私はレストランレビューデータを分類しなければならないプロジェクトに取り組んでいます。私は多項式Naive Bayesアルゴリズムを使用しています。私は自分の問題がマルチクラスまたはマルチラベルに関連していると少し混乱しています。マルチクラス対マルチラベル
レビューは、顧客ではなく、犬のようなあなたの顧客を扱うください
を例 - 。私は決して行くことはありません、またはアドバイスを誰もNaivedyam、Hauz Khasに行ってください。彼らは病気と完全なビジネスマンです。食品は、味に悪いのverでしたが、場所とスタッフはそれはトレーニングデータセットを作成する方法
Bad Experience Staff Behavior food quality
のような3つの異なるクラスが含まれてい
あまりにも汚れていましたか?
私はマルチラベルを使用し、マルチクラス
Review Tags
above review, Bad Experience
above review, Staff Behavior
above review, food quality
に似
ID Content Tags
1, "content of the review#1", Bad Experience,Staff Behavior,food quality
または
のように設定されたトレーニングデータを作成する必要があります任意の提案
私は良いアプローチは 'x'アプローチごとに複数のラベルがあると思います。すなわち、すべてのレビュー「x」に対して、「y」が「n」要素を有するベクトルである(「n」はラベルの数である)ラベル「y」がある。 'y'の値は0と1です(各サンプルの正しいラベルのために1つです)。 – sirfz