2016-08-04 4 views
1

私が開発しているアプリでは、単語の文字列が名詞句、動詞句などであるかどうかを知る必要があります。NPとVPは依存性もPOSでもないことを理解しています。私はまた、これを行うには何らかのチャンクツールが必要かもしれないと理解していますが、オープンソースのツールを見つけることはできませんでした。文のためのSyntaxNetの出力でChunkingにSyntaxNetを使用しますか?

は「彼女は本当にかわいい黒犬好き」:

likes VBZ ROOT 
+-- She PRP nsubj 
+-- really RB advmod 
+-- dog NN dobj 
    +-- cute JJ amod 
    +-- black JJ amor 

を私はNP「かわいい黒犬」は、独自のツリーノードに置かれていることに気づいた:

+-- dog NN dobj 
    +-- cute JJ amod 
    +-- black JJ amor 

とにかくSyntaxNetをチャンクとして使用できるのかどうか疑問に思っていますか?

+0

NP、VPなどがあるかどうかを知る* – reynoldsnlp

答えて

1

正直言って、正確な高速チャンク(NLTKのような)がありますが、チャンクを抽出するために依存性解析ツリーを使用する理由はわかりません。

this google sample code(これは、アプリケーションに役立つ可能性のあるチャンク、サブジェクト、オブジェクト、動詞を提供しません)、ほとんどの名詞句を抽出する正規表現を定義する方法の手がかりを与えます。

関連する問題