私はpython2.7、nltk 3.2.1とpython-crfsuite 0.8.4を使用しています。私はこのページに従っています:http://www.nltk.org/api/nltk.tag.html?highlight=stanford#nltk.tag.stanford.NERTagger(nltk.tag.crfモジュール用)。私はちょうどこのTypeError:NLTKではstrでなくUnicodeでなければなりません
from nltk.tag import CRFTagger
ct = CRFTagger()
train_data = [[('dfd','dfd')]]
ct.train(train_data,"abc")
を実行して
は、Python 2では、私はこれもf = open("abc","wb")
ct.train(train_data,f)
が、私は次のエラーを取得していますを試してみました
File "C:\Python27\lib\site-packages\nltk\tag\crf.py", line 129, in <genexpr>
if all (unicodedata.category(x) in punc_cat for x in token):
TypeError: must be unicode, not str
「abc」にデータを表示できますか?エラーに応じて、あなたの問題があります... –