2017-03-21 8 views
1

スタンフォードNERFeatureFactoryの詳細についての詳細は、どこで知ることができますか? https://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/ie/NERFeatureFactory.html が、私はそれらすべてを理解していない(といくつかの説明はありません):スタンフォードNERFeatureFactoryの説明

は、私は1つをお読みください。例えば

:usePrev、 useWordPairs、 conjoinShapeNGrams、 useSum、... または (PW、C)(T、C)

よりよく説明することなく、similar question 2 years前にありました。それ以来何か新しいものが出てきたのかしらと思っていました。

ありがとうございました!

答えて

0

NERFeatureFactoryのソースコードを見ると、何が起こっているのかがわかります。

ソースコードはここで利用可能である:例えばhttps://github.com/stanfordnlp/CoreNLP/blob/master/src/edu/stanford/nlp/ie/NERFeatureFactory.java

useWordPairsは、検討中のワードと次/前の単語のための機能を作成します。あなたはこのテキスト...from New York...に単語Newための機能を考慮し、一例として、

...ライン1062から始まるコードでこれを見ることができる... useWordPairsは特色の機能を生成New-from-W-PWNew-York-W-NW

A機能の多くは、そのファイルにも説明があります。

コードを見て、何が生産されているかを確認すると便利です。例えば、conjoinShapeNGramsの機能は、単語の全体的な形や単語の部分文字列を付ける機能を生成しています。コードを見ることによって、何が起こっているのかを完全に見ることができます。 conjoinShapeNGramsの一例として、

worth-Xxxxxxxxxx-CNGram-CSWords-Xxxxxxxxxx-CNGram-CS、等のような機能になるだろう名前Wordsworthを検討...

この機能は、一緒に特定の部分文字列や単語形状の存在をキャプチャしています。

(PW、C)usePrevフラグにリンクされている「前の単語」と「現在の単語」、

(T、C)「音声タグの一部」と「現在の単語」という用語を指し、それはuseSumは何ももうありません...

+0

のように多くのあなたの答えをありがとう見ていない

useTagsフラグにリンクされています! "printFeatures = True"というプロパティを使用して保存された機能を確認できました。 コード内で、これらの機能を使用するモデルを確認できますか? また、1つの単語の複数の機能がどのように処理されるかを理解することにも興味があります。 ありがとう – yoann