スタンフォードNLPパーサーのBagOfWordsAnnotationの使い方は？

bag-of-wordsに関連するものがlist of annotationに見つかりません。スタンフォードNLPパーサーのBagOfWordsAnnotationの使い方は？

coreMap.get(CoreAnnotations.BagOfWordsAnnotation.class);

が、私は、私は有効にする必要がありますどの注釈を知らない：私は、私はそれは次のように使用されていると仮定していること、袋のワードを取得するためのアノテーションクラスがありました。これまで私は試しました：

tokenize, ssplit, pos, lemma, ner, parse, sentiment, natlog, openie

運がありません。

スタンフォードNLPパーサーのBagOfWordsAnnotationはどのように使用できますか？

出典

2017-07-13 igr

このドキュメントはひどいです。私はGitHubの公開リポジトリを検索し、それを使っている誰も見ることができません。アノテーション定義にはヒントもありませんでした。 – Michael

@Michaelも同じことをしました。幽霊のように見えます:) – igr

@Michael fixed :) – igr

tokenizeアノテーションの出力だけを使用していませんか？あるいは、少し洗練された、覚え書きの出力？これと同じように（あなたのユースケースに少し依存する）、例えば：

私はこの注釈を聞いたことがないし、それが存在する場合、それは基本的にトークン化であるとして、私は多分、それは少し意外見つけるだろうLuceneのような他の（NLP指向でIR指向の）パッケージを使用することができます。

出典

2017-07-17 15:06:33 Igor

私は言葉の袋を作る方法を知っていますが、私はクラスを見ました、そして、図書館が結果を与えるかどうか疑問に思います。あなたの例は問題ありませんが、私はストップワードの削除などを追加するでしょう - したがって、私はライブラリからこの機能を持つことを期待していました（コードにこのクラスがあるので）。 – igr

スタンフォードNLPパーサーのBagOfWordsAnnotationの使い方は？

答えて

関連する問題