2017-10-12 23 views

答えて

0

gensimなどのツールを使用してword2vecモデルを作成したかどうかはわかりませんが、問題を正しく理解している場合は、gensimを使用してword2vecモデルを読み込みます。これは次のように行われます。

import gensim 
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8') 
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed 

、しかし、何がやりたいことは、純粋にgensimここで使用して最初からモデルを(すなわち、生のテキストから)word2vec訓練することである場合がtutorial on how to train word2vec model using gensimです。

+0

ありがとう、これは私が探しているものです。 –

+0

サンプルw2v_fileを提供してもらえますか、そのフォーマットを生成するのに手伝ってください。私は単語とそのベクトルをスペースで区切られた行に入れ、単語は行で区切ります。ありがとうございました。 @sophros –

+0

次の方法を試しましたか? 'from gensim.models import word2vec モデル= word2vec.Word2Vec.load_word2vec_format( 'path/to/GoogleNews-vectors-negative300.bin'、バイナリ= False)' 重要な部分は 'binary = False'です。 – sophros

関連する問題