事前に訓練された単語ベクトルを使用してgensim word2vecモデルを作成するにはどうすればよいですか？

私は分散型word2vecアルゴリズムを使って単語ベクトルを作成しました。今私は言葉とそれに対応するベクトルを持っています。どのようにこれらの単語とベクトルを使ってgensim word2vecモデルを構築するのですか？事前に訓練された単語ベクトルを使用してgensim word2vecモデルを作成するにはどうすればよいですか？

出典

2017-10-12 Uma Maheswara Rao Pinninti

gensimなどのツールを使用してword2vecモデルを作成したかどうかはわかりませんが、問題を正しく理解している場合は、gensimを使用してword2vecモデルを読み込みます。これは次のように行われます。

import gensim 
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8') 
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed

、しかし、何がやりたいことは、純粋にgensimここで使用して最初からモデルを（すなわち、生のテキストから）word2vec訓練することである場合がtutorial on how to train word2vec model using gensimです。

出典

2017-10-12 09:33:25 sophros

ありがとう、これは私が探しているものです。 –

サンプルw2v_fileを提供してもらえますか、そのフォーマットを生成するのに手伝ってください。私は単語とそのベクトルをスペースで区切られた行に入れ、単語は行で区切ります。ありがとうございました。 @sophros –

次の方法を試しましたか？ 'from gensim.models import word2vec モデル= word2vec.Word2Vec.load_word2vec_format（ 'path/to/GoogleNews-vectors-negative300.bin'、バイナリ= False）' 重要な部分は 'binary = False'です。 – sophros

事前に訓練された単語ベクトルを使用してgensim word2vecモデルを作成するにはどうすればよいですか？

答えて

関連する問題