-1
私は数日間NLTKのPOSタガーを改良しようとしていましたが、わかりません。現在、デフォルトのタグは本当に不正確で、ほとんどの単語に「NN」とタグ付けされています。タガーをより正確に改善するにはどうすればよいですか?私はすでにタガーを練習してみましたが、うまく動かすことができません。Python NLTK PoSタグが不正確
誰にでも簡単な方法がありますか?どうもありがとう。
私は数日間NLTKのPOSタガーを改良しようとしていましたが、わかりません。現在、デフォルトのタグは本当に不正確で、ほとんどの単語に「NN」とタグ付けされています。タガーをより正確に改善するにはどうすればよいですか?私はすでにタガーを練習してみましたが、うまく動かすことができません。Python NLTK PoSタグが不正確
誰にでも簡単な方法がありますか?どうもありがとう。
あなたは一度に1単語または大きなコーパスでそれをやっていますか?通常、POSタグ付けアルゴリズムは、単語がタグタイプ(例えば、「NN」)である確率を使用するが、周囲の文脈コンテキストを使用して、より多くの単語ほど精度が高い可能性が高いと予測する。
さまざまなUnigram、bigram、trigramなどのタグ付けを試して、パフォーマンスを犠牲にしてより高い精度を得ることもできます。ここでそれについて読むことができます:http://www.nltk.org/book/ch05.html