2017-05-16 18 views
0

次のword2vecモデルの読み込みで使用したい単語をリストにフィルタリングするとします。これらのフィルタリングされた単語リストだけを含む私自身のKeyedVectorsをどのように構築できますか?いくつかの単語を除外してGensim Word2vecモデルをスピードアップするには?

私が作ってみました:指定された単語の

w2v_model_keyed = w2v_model.wv 
w2v_model_keyed.drop(word) 

が、私は次のエラーを取得:

AttributeError: 'KeyedVectors' object has no attribute 'drop' 

をgensim KeyedVectorsクラスが増分拡張をサポートしていないあなたに

答えて

0

ありがとうございました(.drop()メソッドの場合と同様)。適切なサイズ/コンテンツの新しいインスタンスを作成する必要があります。

gensim KeyedVectors source code、特に.load_word2vec_format() methodを見て、既存のインスタンスがgensimでどのように作成されているかを知り、必要なサイズ/単語だけを作成する方法を模倣する必要があります。

関連する問題