0
私はnumpyに非常に新しいです。numpy配列のすべての列に関数を適用します。
なぜこれが機能しないのか不思議です。
print items['description']
は
このCOLのすべての行には、この方法を適用しようとすると0 Продам Камаз 6520 20 тонн
1 Весь в тюнинге.
2 Телефон в хорошем состоянии, трещин и сколов н...
3 Отличный подарок на новый год от "китайской ap...
4 Лыжные ботинки в хорошем состоянии, 34 размер
Name: description, dtype: object
が得られます。
items['description'] = vectorize_sentence(items['description'].astype(str))
これは、ベクトル化文の関数定義です。
def vectorize_sentence(self, sentence):
# Tokenize
print 'sentence', sentence
tkns = self._tokenize(sentence)
vec = None
for tkn in tkns:
print 'tkn', tkn.decode('utf-8')
print type(tkn)
if self.model[tkn.decode('utf-8')]:
vec = sum(vec, self.model[tkn.decode('utf-8')])
#vec = sum([self.model[x] for x in tkns if x in self.model])
#print vec
def _tokenize(self, sentence):
return sentence.split(' ')
エラーメッセージ:
AttributeError: 'Series' object has no attribute 'split'
を実装するんだと思うように主に、
.astype(str)
は、単一の長い文字列を返しません。それから達成したい。ありがとう – aceminerあなたのために働くのですか? @aceminer –
本当に。エラーが発生しました: "文字バッファオブジェクトが期待されました" – aceminer