2016-05-12 10 views
7

ための任意の事前訓練された分類器を持っている私は、NLTKとスタンフォードCoreNLPを比較すると、後者が評判分析のために提供RNTN(再帰テンソルニューラルネットワーク)の実装を持っていたことが分かりました。ペンツリーバンクのような、それはすでに大規模なデータセットを使用して訓練されているように、我々はそれを訓練する必要はありません例オンラインショーがんNLTKは、センチメント分析

NLTKは、機能の似たようなものを提供していますか? 私がそれについて尋ねるのは、オンラインで見つけたNLTKの実装には、Naive-BayesやMaxEntのような特定のクラスファイヤーを含むトレーニングが含まれていたからです。

P .: PythonはNLTKがより普及していると使いやすいのか?私はNLTKは、すでに多くの事前処理機能を持っていることがわかったので、私はNLTK +パイソンにスタンフォードCoreNLPまたはスイッチを選ぶ必要があり、Javaで

+1

これは明らかにバイアス意見ですが、私はあなたがJavaでNLPをしたい場合、私はスタンフォードCoreNLPを使用して助言するだろうと思います!ここに素晴らしい文書があります:http://stanfordnlp.github.io/CoreNLP/ – StanfordNLPHelp

+1

ありがとう、StanfordNLPHelp :) – Yasen

答えて

7

より快適にしています。 たとえば、このページの最後にあるhttp://www.nltk.org/api/nltk.sentiment.html は、ソーシャルメディア向けに前処理された感情分析が表示されています(「VADER」を参照)。 http://www.nltk.org/nltk_data/ NLTKに組み込まれたすべてのデータセットのフルリストを提供します。処理されたデータ(有名なWORDNETのようなあらゆる種類のレキシコン)を使用して、一部のデータセットの完全なリストを提供します。 スタンフォードのcoreNLPに関する経験はありませんので、関連性のある比較はできません。 はとにかく、これらの助けを願っています:)

+0

ありがとう。 VADERアプローチの論文を読むだけで、Stanford Core NLPの再帰的ネットワークモデルで達成されたのと同じ精度を達成すると主張しますが、単純さのために計算能力と時間が比較的に低いです。それを試してみたいと思っています...スタンフォードCoreNLPは私の経験ではツイート感情分析のためにもう少し時間を要します –

関連する問題