2011-10-25 8 views

答えて

2

通常、「影響の分類」という用語が使用されているときは、テキストではなく音声データの処理を記述します。スピーカーが怒っているかどうかを判断するためにスペクトルやラウドネスなどのオーディオ機能を使用します。これらのタイプの機能は、明らかにテキストにうまく翻訳されません。

テキストの分類について言えば、テキストの作者がテキストの主題について正または負の話しをしているかどうかを判断するために、Sentimentを「オピニオンマイニング」と分類することがより一般的です。これで十分なニュアンスを得ることができれば、幸いなことに、これを手助けするために多額のリソースがあります。 Pythonでは、Natural Language Toolkitは、このタイプの作業によく使用される分類子を提供します(例:this demo)。

このアプローチの欠点は、一般に肯定/否定の分類に限定されており、ドメイン固有のものであることです。たとえば、肯定的な映画レビューを検出するように訓練されたクラシファイアは、ソフトウェアレビューを分類する際に機能しません。

だけでなくthis one on identifying the emotional content of blog posts例として、このpaperのテキストにおける感情の分類に行われたいくつかの作業は、この作業のために同じくらい「事前缶詰」ライブラリのサポートを見つける可能性が低い残念ながら、これを表示さもありますが、研究の情報があれば、NLTKや他の分類/自然言語処理ライブラリの上にこのタイプのシステムを構築することができます。

関連する問題