0
トピックモデリングにgensimを使用しています。gensimで制約付きの語彙からコーパス内の単語をフィルタリングする方法は?
wordDict = corpora.Dictionary(trimmedTextTokens)
gsCorpus = [wordDict.doc2bow(text) for text in trimmedTextTokens]
ここで、trimmedTextTokensはストップワードを削除した結果です。今では、限定されたまたは構成された語彙のリストにない用語を、コーパスから除外したいと考えています。何か案は?ありがとうございました!!あなたの制限された語彙リストを想定し
ありがとうございました!!よろしくお願いいたします。 – tom
回答が役に立ったら、それを受け入れていただければ幸いです。 – ginge