Pythonのワードムーバーの距離

私はWMDを使って2つのテキストの類似度を計算しようとしています。私はgensimを使用して、Pythonの3に次のコードを使用しようとしました：Pythonのワードムーバーの距離

word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True) 
word2vec_model.init_sims(replace=True) # normalizes vectors 
distance = word2vec_model.wmdistance("string 1", "string 2") # Compute WMD as normal.

しかし、私はこれが私に正しい値を返しているとは思いません。どのように私はこれをPythonで行うべきですか？

出典

2017-04-17 Skinish

文字列を分割してください：

distance = word2vec_model.wmdistance("string 1".split(), "string 2".split()) 
>>> 0.4114476676950455

引数は、文字列のリストにする必要があります。

出典

2017-04-20 04:29:30 Hironsan

問題が簡単な場合があります。ありがとうございました。 Btw、2つのテキストが関連しているかどうかを測定するには、より良い方法を知っていますか？ – Skinish

Pythonのワードムーバーの距離

答えて

関連する問題