私はX = vect.fit_transform(df.pop('Phrase')).toarray()
に問題を抱えている私は、データフレームに疎行列(156060x11780)を変換したいが、私は、これは私のコードパンダのデータフレームメモリのpython
vect = TfidfVectorizer(sublinear_tf=True, analyzer='word',
stop_words='english' , tokenizer=tokenize,
strip_accents = 'ascii')
X = vect.fit_transform(df.pop('Phrase')).toarray()
for i, col in enumerate(vect.get_feature_names()):
df[col] = X[:, i]
でメモリエラーを取得します。どうすれば解決できますか?
はあなた 'X = vect.fit_transformため、この作業を行う(DFを.pop( 'Phrase'))。todense() '? – MaxU
はありません:(私は –
前にそれを試してみましたどのくらいのRAMで利用可能?:-)を助けるために喜んであなた – MaxU