私は母国語のための訓練されたword2vecモデルをダウンロードしました。 それは「news.model.bin」ファイルを持っていたし、私はそれを解凍したとき、txt
ファイルまたはpickle
を参照することが期待、しかし、私はこのようなカオスconsistatとそれに別の.bin
のファイルを見つけました:TheanoまたはTensorFlowに ".bin"をロードする
\09\b9\.,-;sdfkf %some really strange symbols and seem to be invalid symbols%
Iそれをコピーすることはできません。なぜなら、私は普通にファイルを開くことができないからです。それは重くて、ラップトップはちょうど死にます。 問題は次のとおりです。この例証コードは事前トランジェントモデルかどうかですか?はいの場合 - 私はそれに対処する必要がありますか?
P.S.私はからモデルだリンク、(モデルは、ページの下部にある):http://ling.go.mail.ru/dsm/ru/about
迅速Googleは(http://mccormickml.com/2016/04/12/googles-pretrained-word2vec- [これ]オンモデルイン・パイソン/)。私はword2vecのための特殊なフォーマットだと思う。それが役に立てば幸い。 – Kh40tiK
[word2vec binファイルをテキストに変換]の複製が可能です(http://stackoverflow.com/questions/27324292/convert-word2vec-bin-file-to-text) –