2016-12-28 26 views
1

word2vec出力ベクトルの解釈について少し混乱しています! 特定の単語(w1)の後に表示される可能性が最も高い単語を予測したい場合は、最も近い単語をw1に使用できますか? つまり、w1との距離が最も短い単語は、最も確率の高い次の単語として解釈できますか?類似度を計算するためにword2vecの出力ベクトルをどのように使用しますか?

+0

お試しいただいた内容をお見せできますか? – nakashu

答えて

1

私はこれは、言語モデリング

と呼ばれる特定の単語(W1)の後に表示される最も可能性の高い単語、

を予測したい場合は、私が最も最も近い単語を使用することができます〜にw1? つまり、w1との距離が最も短い単語は、最も確率の高い次の単語として解釈できますか?

no:w1に最も近い単語は、w1の最も意味的に近い単語です。

+0

ありがとうございます。 PMIはどうですか?予想される近さを反映することはできますか? –

+0

確率的な出力(ジョイントなど)ではないため、PMIへのリンクはありません。 – user3639557

+0

あなたの答えをありがとう。私はシフトされたPMIとSGNSの間の同等性を記述した論文を見つけました。 "暗黙の行列因子分解として を埋め込む神経ワード"、O. Levy、Y. Golberg、NIPS'14 –

関連する問題