2011-12-22 8 views
1

自然言語処理のためのJavaの実装は誰でもConstraint Grammarを知っていますか?私はVISL CG3の実装を知っています。それはC++であり、Javaからインタフェースすることはできますが、Javaの実装を見つけることができれば、従来のJavaコードに統合されるため、より簡単になります。 これはPortuguese open source grammar checkerで使用され、LGPLライセンスと互換性があります。Constraint GrammarのJava実装はありますか?

+0

私はその質問を見たとき、私はあなたを救いました。誰がそれを投稿したのを見たとき、私は驚きました。 :) –

+0

こんにちはビクター:) – wcolen

答えて

1

JAPE: Regular Expressions over Annotationsをご覧ください。古いTIPSTERプロジェクトにおけるCPSL(共通パターン仕様言語)に基づく形式。

(コンテキスト文法がそうであるべきである)それは本当のコンテキスト依存ではありませんが、それに文脈依存のことをすることは可能です。これはフリーでオープンソースです。そして多くのJavaの例があります。

XTDL from SPROUT projectもお探しの価値があります。それが無料かどうかはわかりません。

+0

ありがとう!期待しているようだ! – wcolen

+0

私はJAPEのドキュメントを読んでいます。私はそれがパーサー(ツリー構造)の出力で使用できるかどうかを確認する必要があります。ルールによっては、親ノードと孫ノードの関係をチェックするものがあります。 また、Japeのスタンドアロン版が見つかりませんでした。 Jarは小さく、gate-core.jarは4.8 MBを超える必要があります。 – wcolen

+0

JAPEはツリー構造では機能しません。複雑なツリーを構築するのではなく、反復可能な浅い処理を行い、シンプルさの利点を利用します。アノテーション(Java class gate.Annotation)を入力端末として取り、正規表現のようなパターン(ルールの左辺)とマッチさせ、一致が見つかった場合は出力注釈を生成します。ジョブは、各フェーズ(ルールのセット)が前のフェーズで作成されたアノテーションを処理して、他のアノテーションを生成(または削除)するフェーズで実行されます。ドキュメントテキストからTokenizerによって作成された最初の注釈。 – andrey

1

正規表現グラフとツリー構造の正規表現を探しているかどうかはわかりません。その場合は、Tregex and Semgrexがスタンフォードの依存関係グラフと構成ツリーで一致するかどうかを確認できます。

+0

ありがとう、Kenston。とても素敵なプロジェクト。残念ながら、それはGPLであり、私はLGPLオープンソースの文法チェッカーでは使用できません。 – wcolen

1

私はGraph-Expressionを試していませんが、 "マッチの構造 - それはマッチに基づいて構文木を構築することができます"という言葉を提供しています。私はこれがJAPEに匹敵していると思っています。(サイトでは「速い - これはJapeトランスデューサ(gate.ac.uk)に近いプロジェクトです。そして、私はそれがグラフを扱うことができると仮定します.JAPEがうまくいかないかもしれません。

関連する問題