2017-02-03 11 views
-1

私は数日間NLTKのPOSタガーを改良しようとしていましたが、わかりません。現在、デフォルトのタグは本当に不正確で、ほとんどの単語に「NN」とタグ付けされています。タガーをより正確に改善するにはどうすればよいですか?私はすでにタガーを練習してみましたが、うまく動かすことができません。Python NLTK PoSタグが不正確

誰にでも簡単な方法がありますか?どうもありがとう。

答えて

1

あなたは一度に1単語または大きなコーパスでそれをやっていますか?通常、POSタグ付けアルゴリズムは、単語がタグタイプ(例えば、「NN」)である確率を使用するが、周囲の文脈コンテキストを使用して、より多くの単語ほど精度が高い可能性が高いと予測する。

さまざまなUnigram、bigram、trigramなどのタグ付けを試して、パフォーマンスを犠牲にしてより高い精度を得ることもできます。ここでそれについて読むことができます:http://www.nltk.org/book/ch05.html

関連する問題