OpenNLPツールスイートよりも優れた結果をもたらす統計エンジンはありますか?私が探しているのは、テキストからキーワードを選び、その動詞にステミングを与えるエンジンです。&名詞、おそらく自然言語処理はここに行く方法ではありません。エンジンは異なる言語でも動作するはずです。純粋な統計または自然言語処理エンジン?
2
A
答えて
2
LingPipeはおそらく完全なNLPツールと見なす価値があります。
しかし、すべてを行う必要がある場合は動詞と名詞を見つけて、それを幹、そしてあなただけの 1)トークン化テキスト 2)POSタガーを実行できる 3)ステマ
スタンフォードツールを実行します私は信じている複数の言語のためにこれを行うことができ、NLTKはそれを試してみる素早い方法です。
しかし、動詞と名詞の後につけてください。名詞句や複数語名詞についてはどうしますか?理想的には、nlpパッケージでこれを処理することができますが、その多くは作業しているドメインによって異なります。残念ながら、多くのNLPはデータがどれだけ良いかを示しています。
1
私はTreeTaggerとの良好な経験を持っていた:
http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
それは速くスタンフォードのものよりも、使いやすく、そしてそこに「良い」ステマー/タガーに属します。すべての操作を一度に行います:トークン化/ステミング/タグ付け。
2
Javaコードをお探しの場合は、Stanford's set of toolsをお勧めします。彼らのPOS taggerは、英語、ドイツ語、中国語、アラビア語で動作しますが(私は英語でのみ使用しました)、(英語のみの)字句解析ツールが含まれています。
これらのツールはすべて無料で、精度はかなり高く、Javaベースのソリューションではそれほど悪くはありません。主な問題はフレークなAPIと高いメモリ使用です。
3
多分異なる言語のステマーを開発したSnowballプロジェクトを探しているかもしれません。
関連する問題
- 1. 自然言語処理データベースクエリ
- 2. トピックの自然言語処理
- 3. iPhone用の自然言語処理
- 4. PHPでの自然言語処理
- 5. 自然言語処理 - Truecaserクラシファイア
- 6. 自然言語クエリ処理のデータベース
- 7. Javaの自然言語処理ライブラリ
- 8. Android用自然言語処理
- 9. Marklogic機械学習またはNLP - 自然言語処理
- 10. サンプルを使ったSharpNLPを使った自然言語処理
- 11. Python対自然言語処理のためのJava
- 12. apacheを使用した自然言語処理OpenNLP
- 13. 自然言語処理のためのARFF
- 14. 自然言語処理の構文木の略語
- 15. SQLクエリコンバータへの自然言語統計クエリ
- 16. 自然言語コマンド言語
- 17. Pythonの自然言語処理(文章参照)
- 18. Google Cloud自然言語処理APIの上限額
- 19. 自然言語処理(syntatctic、セマンティック、progmatic)分析
- 20. 自然言語処理/テキスト構造解析の開始点
- 21. 名前付きエンティティのPython自然言語処理
- 22. 自動タグ付けのための自然言語処理ライブラリ(.NET)
- 23. Junit:大きなデータの自然言語処理のためのユニットテスト
- 24. IBM Bluemix自然言語理解API
- 25. 機能的で純粋なプログラミング言語
- 26. 自然言語処理のための機械学習 - カスタム翻訳
- 27. PDFからのデータ抽出のための自然言語処理
- 28. 数値データを認識するための自然言語処理
- 29. 自然言語処理では、チャンキングの目的は何ですか?
- 30. 自然言語処理におけるチャンクとは何ですか?
NLPはどのように「ここに行く」方法ではありませんか?あなたが言うことは、まさにNLPの問題です。 –
使用しようとしている技術について統計的に何も表示されません。 –
NLPとテキストマイニングが初めてです。テキストマイニングにNLPを使用する人がいると聞いていますが、これらは各言語のモデルに依存しています。私は、ほとんどの言語で動作する純粋な統計エンジンがあり、各言語のモデルは必要ないと聞いています。私はすべての必要な言語のモデルを見つけることができないことを心配しています。私はノルウェー人でOpenNLPは私の言語のモデルを持っていません。 –