2017-07-13 5 views
1

bag-of-wordsに関連するものがlist of annotationに見つかりません。スタンフォードNLPパーサーのBagOfWordsAnnotationの使い方は?

coreMap.get(CoreAnnotations.BagOfWordsAnnotation.class); 

が、私は、私は有効にする必要がありますどの注釈を知らない:私は、私はそれは次のように使用されていると仮定していること、袋のワードを取得するためのアノテーションクラスがありました。これまで私は試しました:

tokenize, ssplit, pos, lemma, ner, parse, sentiment, natlog, openie 

運がありません。

スタンフォードNLPパーサーのBagOfWordsAnnotationはどのように使用できますか?

+1

このドキュメントはひどいです。私はGitHubの公開リポジトリを検索し、それを使っている誰も見ることができません。アノテーション定義にはヒントもありませんでした。 – Michael

+1

@Michaelも同じことをしました。幽霊のように見えます:) – igr

+1

@Michael fixed :) – igr

答えて

0

tokenizeアノテーションの出力だけを使用していませんか?あるいは、少し洗練された、覚え書きの出力?これと同じように(あなたのユースケースに少し依存する)、例えば:

​​

私はこの注釈を聞いたことがないし、それが存在する場合、それは基本的にトークン化であるとして、私は多分、それは少し意外見つけるだろうLuceneのような他の(NLP指向でIR指向の)パッケージを使用することができます。

+0

私は言葉の袋を作る方法を知っていますが、私はクラスを見ました、そして、図書館が結果を与えるかどうか疑問に思います。あなたの例は問題ありませんが、私はストップワードの削除などを追加するでしょう - したがって、私はライブラリからこの機能を持つことを期待していました(コードにこのクラスがあるので)。 – igr