2017-04-13 7 views
0

私はプロジェクトに取り組んでいます。私はいくつかの調査をしようとしています。特定のコーパスライブラリを使用して、単語のコロケーションを見つけることができるようにしたい。私は、このタイプの作業を行うために使用できるSDKがいくつかあると思っていました。私は、このオプションを見て:特定のコーパスを使用してコロケーションを作成する

https://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/trees/CollocationFinder.html

とCollocationFinderと呼ばれるが、クラスは多くのドキュメントを見つけるか、コーパスを指定する方法があるかどうかを知ることはできません発見しました。

私はJXtract(http://definingterms.com/projects/Champollion/#smadja93)というプロジェクトも見つけましたが、かなり古くなっていると思われ、著者はバグがあると言います。

私はソフトウェアを開発するために使用できる良いライブラリを知っていますか?コーパスを選択するためのさまざまな方法を選択するだけでなく、コーパスの選択を可能にする何か?

+0

私はNLPに精通していません。しかし、私は何の反応も受けていないと考えて、私の質問が理にかなっていないかどうか疑問に思っています。あるいは、これは現在のソフトウェアライブラリを使用して達成できないものでしょうか? – jason

+0

*「NLPに精通していません。」* [tag:jnlp]のようなタグの有用なタグポップアップにどれだけ注意を払ったのか、私は驚いていません。 –

答えて

0

Javaソリューションである必要があると指定していないので、a collocationand a concordancerapp built using NLTK (Python)があります。それはあなたの要件を満たしています(NLPのための良いライブラリ、コーパスの選択を許可します)。コロケーションを決定するための任意の異なる方法を自然にコーディングすることができます - NLTKのTKは "tool-kit"を表します)

+0

はい、これはJavaで行う必要はありません。推奨していただきありがとうございます。私はこれをチェックします。 – jason

0

スタンフォードCoreNLPのCollocationFinderクラスの目的は、単語をまとめて単一のコロケーショントークンにすることです。コロケーションはWordNetから見つかるため、このクラスはコーパスからのコロケーションの自動抽出には役立ちません。

関連する問題