2012-02-13 15 views
1

このトピックには多くのスレッドがあります。しかしまた私は別のものを掲示しています。すべての投稿は感情分析を行う方法かもしれませんが、私は方法が見つかりませんでした。与えられたテキストの感情分析

感情分析のやり方を実装したいと思います。だから、私に道を見せたい私の研究では、とにかくthisが使用されていることがわかりました。私は、ベイジアンアルゴリズムは、肯定的な単語と否定的な単語を計算し、単語のバッグを使用して、正または負の文の確率を計算するために使用されると思います。

これは言葉にすぎませんが、言語処理も行う必要があると思います。だからもっと知識を持っている人はいますか?はいの場合、私は実装することができるように参照用のリンクを含むいくつかのアルゴリズムで私を導くことができます。私の分析で私を助けてくれるものは特にあります。

また、私は働くことができる言語を好むことができますか? Javaにはかなりの時間がかかり、Javaの使用を推奨していないと言う人もいます。

どのような種類のヘルプも非常に高く評価されています。

+5

既存のスレッドでのセンチメント分析の問題点は何ですか? SOとそれに関するウェブ上の論文には、両方の質問がたくさんあります。特定のアプローチを試してみてください**もしあれば**具体的な質問** – ffriend

答えて

5

まず、感情分析は、文書、文章、フレーズ、およびフィーチャレベルなどのさまざまなレベルで行われます。あなたはどちらに取り組んでいますか?それぞれにはさまざまなアプローチがあります。あなたはこのトピックhereの非常に良い紹介を見つけることができます。機械学習アプローチの場合、最も重要な要素はフィーチャエンジニアリングであり、言葉の袋に限定されません。私はリンクされたチュートリアルとは別のアプリケーションで、他の多くの便利な機能を見つけることができます。あなたがしなければならない言語処理は、あなたが使いたい機能に依存します。あなたの機能にPOS情報が必要な場合など、POSタグ付けが必要な場合があります。

クラシファイアの場合、サポートベクターマシン、最大エントロピー、およびナイーブベイズ(おそらくベースライン)を試すことができます。これらは文献で頻繁に使用されています。 MalletツールキットにはMEとNBが含まれており、SVMlightを使用すると、機能フォーマットをMalletフォーマットに簡単に変換できます。もちろん、これらの分類子には他にも多くの実装があります。

点単位の相互情報が頻繁に使用されるルールベースの方法については

、およびスコアリングベースの方法のいくつかの種類など

・ホープ、このことができます。

+0

イントロトピックをありがとう! :) –

0

NLTKは、感情分析のための本当に良いアルゴリズムを提供します。オープンソースなので、ソースコードを見て、使用されているアルゴリズムをチェックすることができます。あなたは無料でNLTK本をダウンロードすることもできますし、感情分析にいくつかの良い資料があります。

あなたの2番目のポイントに来て、私はJavaが遅いとは思わない。私は自分自身をC++で何年もコーディングしていますが、最近はlucene、solr、hadoop、neo4jのような非常に普及しているオープンソースソフトウェアがJavaで書かれているようにjavaで始まりました。

1

テキスト解析のために、SNOBOLより強い言語はありません。 SNOBOL-4では、例えば、Fortranインタプリタは60行しかかかりません。

関連する問題