2017-08-29 25 views
0

私はspacyパイプラインにデータフレームcsvをロードしようとしています。私はここで引数の文字列のエラーを取得しています私のコードです。spacy pipeline nlpにデータフレームまたはcsvファイルをロードするには?

from __future__ import unicode_literals 
nlp = spacy.load('en') 

data = pd.read_csv("sometextdata.csv") 
text = [] 
for line in data.Line: 
    text.append(clean_text(line)) 

    text_spacy = nlp(data['Line']) 
    data['Line'].apply(nlp) 
    document = nlp(text) 
TypeError: Argument 'string' has incorrect type (expected unicode, got str) 

私は同じエラーが発生しました。

プラットフォーム:OS - Macとのpython 2.7

答えて

1

あなたがunicodeに変数テキストを変換する必要があります。あなたが今見ての通り、str型を持っています。例として、あなたは

document = nlp(unicode(text)) 

または

document = nlp(text.decode()) 
などのように変換してみてください
関連する問題