4
現在、私はCountVectorizer
を使用して機能を抽出しています。しかし、私はフィッティング中に見られない言葉を数える必要があります。CountVectorizerとOOV(Out-of-Vocabulary)トークン?
変換時には、デフォルト動作のCountVectorizer
は、フィッティング中には観察されなかった単語を無視することです。しかし、私は何回このことが起こるかを数えておく必要があります!
どうすればいいですか?
ありがとうございます!