0
私はそれらがドキュメントに存在するかどうかをチェックする必要がある単語のセットを持っています。Scikit learn CountVectorizerの使い方は?
WordList = [w1, w2, ..., wn]
別のセットには、これらの単語が存在するかどうかを確認する必要があるドキュメントのリストがあります。用語 - 文書行列の特徴は唯一WordList
から単語や各行になるようにscikit-学ぶCountVectorizer
を使用する方法
は、与えられたリストから時間単語の無い各特定の文書がそれぞれの列に表示されます表し?