0
私は分散型word2vecアルゴリズムを使って単語ベクトルを作成しました。今私は言葉とそれに対応するベクトルを持っています。どのようにこれらの単語とベクトルを使ってgensim word2vecモデルを構築するのですか?事前に訓練された単語ベクトルを使用してgensim word2vecモデルを作成するにはどうすればよいですか?
私は分散型word2vecアルゴリズムを使って単語ベクトルを作成しました。今私は言葉とそれに対応するベクトルを持っています。どのようにこれらの単語とベクトルを使ってgensim word2vecモデルを構築するのですか?事前に訓練された単語ベクトルを使用してgensim word2vecモデルを作成するにはどうすればよいですか?
gensim
などのツールを使用してword2vecモデルを作成したかどうかはわかりませんが、問題を正しく理解している場合は、gensimを使用してword2vecモデルを読み込みます。これは次のように行われます。
import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed
、しかし、何がやりたいことは、純粋にgensim
ここで使用して最初からモデルを(すなわち、生のテキストから)word2vec訓練することである場合がtutorial on how to train word2vec model using gensimです。
ありがとう、これは私が探しているものです。 –
サンプルw2v_fileを提供してもらえますか、そのフォーマットを生成するのに手伝ってください。私は単語とそのベクトルをスペースで区切られた行に入れ、単語は行で区切ります。ありがとうございました。 @sophros –
次の方法を試しましたか? 'from gensim.models import word2vec モデル= word2vec.Word2Vec.load_word2vec_format( 'path/to/GoogleNews-vectors-negative300.bin'、バイナリ= False)' 重要な部分は 'binary = False'です。 – sophros