2017-12-18 10 views
1

私は、取得した一連のTwitterデータに対して異なる感情分析手法を実行しています。それらはレキシコンベース(Vader SentimentおよびSentiWordNet)であり、事前ラベルされたデータを必要としない。辞書ベースの感情分析の精度

クラシファイアの精度を計算する方法(F-Score、ROC/AUCなど)があるのだろうかと思っていました。私が知っているメソッドのほとんどは、結果を比較するターゲットが必要です。

+0

あなたが使用している3番目のテクニックについては何も教えてくれませんでした。あなたの質問に関連していない場合は、よりクリーンな質問でそれを削除する可能性があります。 –

+0

@DarrenCook 3番目のテクニックはNaive Bayesです。私はそれに応じて質問を編集しました。 – mitalip

答えて

0

短い答えはいいえ、私はそうは思わない。 (誰かがメソッドを投稿した場合、私は非常に興味があります。)

教師なしマシン学習の技術によっては、エラーの測定値を得ることができます。例えば。オートエンコーダーは、低次元表現が元の高次元の形状にどれほど正確に再構成できるかを表すMSEを提供します。

しかし、感情分析のために、複数のアルゴリズムを使用して、同じデータに対してそれらの間の一致を測定することが考えられます。彼らがすべて特定の感情に同意する場合、信頼性の高い予測としてマークします。すべての意見が信頼できない予測としてマークします。 (これはおそらくそうでない可能性が高い同じバイアスののアルゴリズムには依存しません)。

通常の方法は、データの一部の割合をラベル付けし、それがデータ全体を表すことを前提としています。