2017-07-11 8 views
-1

私は論文「ニューラルワード埋め込み の情報検索への統合と評価」を読んでいます。エンベディングワードの埋め込み方法は?

私はソースコードを理解しようとした名前のファイル開くとき: vectors_ap8889_skipgram_s200_w20_neg20_hs0_sam1e-4_iter5

を私はこのような単語のベクトル表現が見つかりました: 繁華街「-0.465147 -0.049099 -0.023432 0.058986 -0.085395 -0.027324を - 0.050315 ............................................ "

ください。私は、あなたの価値が何を意味しているのか、言葉がコーパスを参照しているのか、どのように入手できるのかを説明する必要があります。

+1

ようこそ!次の内容を確認し、質問を更新してください: https://stackoverflow.com/help/how-to-ask – garfbradaz

答えて

0

数字には本質的な意味はありません。これは、与えられた単語のn次元埋め込みです。

埋め込みが正しく行われていれば、類似した埋め込みが近い単語が表示されます。たとえば、「良い」は「島」より「素晴らしい」に近くなるはずです。

一般的な使い方は、単語を埋め込みスペースに変換し、それをある種の機械学習問題の入力として使用することです。利点は、埋め込みが問題の場合よりもはるかに多くのデータで訓練されるため、埋め込みがモデルのトレーニングのためのショートカットを提供することです。

関連する問題