異なるデータを使用して自分のword2vecモデルをトレーニングしています。結果のモデルを分類器に実装し、その結果を元の訓練済みのWord2vecモデルと比較するには、モデルをバイナリ拡張子.binに保存する必要があります。ここに私のコードは、文は短いメッセージのリストです。gensim Word2vecモデルをバイナリ形式で保存します.bin with save_word2vec_format
import gensim, logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
sentences = gensim.models.word2vec.LineSentence('dati.txt')
model = gensim.models.Word2Vec(
sentences, size=300, window=5, min_count=5, workers=5,
sg=1, hs=1, negative=0
)
model.save_word2vec_format('model.bin', binary=True)
最後の方法、save_word2vec_formatは、私は、このエラーを与える:
AttributeError: 'Word2Vec' object has no attribute 'save_word2vec_format'
私はここで何をしないのですか? gensimや他のフォーラムのドキュメントを読んだことがあります。このrepo on githubはほとんど同じ設定を使用しているので、何が間違っているのか理解できません。私はskipgramからcbowに切り替えようとしました。階層的softmaxから結果のない負のサンプリングに切り替えようとしました。
ありがとうございます!
クリスタルクリアな返信ありがとうございます。私はモデルに添付されているものの中でsave_word2vec_formatというメソッドを見ていないので、gensimバージョンの問題かもしれないと思った。私は、Webサイトのドキュメントを読んで、gensimをeasy_install -U gensimにインストールしました。私はgensimをunistalledとプレーンピップのインストールを使用して今はスムーズに動作します。どうもありがとうございました! – carloab
FYI私は1.0.0が公式なので、 'pip install gensim'でもAPIを変更したバージョンが得られると思うが、(KeyedVectorsを使用している人を指すように)エラーメッセージが改善されたとも思う。 – gojomo