2016-03-30 11 views
0

私はpython nltkライブラリを使用して名前付きエンティティ認識を行っています。私はUnigramTaggerをカスタムタグトークンに使用しています。 問題は、私が私のモデルで言及している言葉に、という正確なタグのタグャーです。スペルミスがあれば、その単語を見つけることができません。 この問題を解決するにはどうすればよいですか? 私はfuzzywuzzyが比率検索を許可する方法が好きでしたが、nltkタグャーによって同じ機能が提供されているかどうかはわかりません。ここでいくつかの助けが必要です。nltkのPythonでUnigramTaggerのスペルミスを処理するには?

答えて

0

名前付きエンティティの認識の前にスペルを修正する必要があります。あなたは次のURLからこれを行うことができます..

spell checker