NLTKの品詞タグ付けを試している間に、私はnltk.pos_tag
への呼び出しの出力に多くのVBP
タグがあることに気付きました。私はこのタグがBrown Corpusの声部タグセットにないことに気づいた。しかし、それはUPennタグセットの一部です。音声タグセットのデフォルトのnltk部分は何ですか?
nltkはデフォルトでどのタグセットを使用していますか?私は公式のドキュメンテーションやapidocsでこれを見つけることができません。
NLTKの品詞タグ付けを試している間に、私はnltk.pos_tag
への呼び出しの出力に多くのVBP
タグがあることに気付きました。私はこのタグがBrown Corpusの声部タグセットにないことに気づいた。しかし、それはUPennタグセットの一部です。音声タグセットのデフォルトのnltk部分は何ですか?
nltkはデフォルトでどのタグセットを使用していますか?私は公式のドキュメンテーションやapidocsでこれを見つけることができません。
NtlkはPennTreebankタグセットを使用します。このリンクをご覧くださいhttp://nltk.org/api/nltk.tag.html
Penn Treebank Projectで使用されるPOSタグを使用しています。意味のあるタグのリストは、 "http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html"
のように見えます.Penn Treebankで訓練されているようです。 https://github.com/nltk/nltk/blob/master/nltk/tag/__init__.py#L80 –