2017-04-09 3 views
0
「単回投与」のようなテキストを持つ

は私のPythonプログラムは、nltkのトーン(感情)分析では、弱い/強烈な感情の指標をどのようにしてスケールで得ることができますか?ご覧のよう

しかし(NaiveBayes分類器とトレーニングデータのセットを使用して)

{'joy': 0.18, 'shame': 0.03, 'sadness': 0.53, 'guilt': 0.01, 'disgust': 0.14, 'anger': 0.08, 'fear': 0.007} 

のような様々な感情の確率の辞書を返します。このテキストはそれに強い感情を持っていません。 したがって、感情がどれほど強いかを示す別の辞書を用意する必要があります。

カスタマーレビューの別の例として、「meh」の弱い感情インジケータではなく、「Fuck this」の強い感情インジケータを返すようにします。 しかし、実際の文章にタグを付けることを望まないように、「土曜日にこれを買った」のように

私はそれを手がかりにしていないので何も試していません。私が望む唯一のことは、上記の辞書を弱点/強度スケールの別の辞書に直接変換し、この目的のための別のトレーニングと分類プロセスを避けることです。

もう一つは、上記辞書で確率の和が1であるが、私の望ましい出力で、それは必ずしも1(すなわち。正規化)する必要がないということである

任意のアイデアが理解されます。

+0

私はあなたを正しく理解していれば、異なる成果(強陽性/弱陽性/弱陰性/強陰性)が必要です。あなたのモデルはあなたの仕事のために設計されていないようです。あなたが別のものを見つけることができるかどうかを見たり、あなた自身を訓練してください。 – HowYaDoing

答えて

0

あなたがNLTK単純ベイズ分類器のコードをチェックした場合:

http://www.nltk.org/_modules/nltk/classify/naivebayes.html

あなたはスコアがこの呼び出しによって正規化されていることがわかります:あなたがのためにその行を変更した場合

return DictionaryProbDist(logprob, normalize=True, log=True) 

normalize = False、生の確率を得るでしょう。

関連する問題