2017-08-15 11 views
1

私は、この実装の後にCアプリケーションを使用してテキストコーパスにグローブモデルを構築しましたhttps://github.com/stanfordnlp/GloVe/tree/master/src。 Iは、AがBに関連し、CがDに関連している場合単語の線形代数構造を見つけてグローブモデルを評価する

は、その後-C + Bがベクトル埋め込み、例えばD.に 等しくなければならないような方法で単語埋め込みを検索します の算術 "オーストラリア" - "キャンベラ" + "インド"は "ニューデリー"の埋め込みと同じでなければなりません。

これらの埋め込みをPythonで評価したいと思います。

答えて

1

評価は、任意のA B C Dするための手順:

  1. D' = A-C+BD'のベクトル表現を計算します。
  2. トレーニングされたGloVのすべての単語ベクトルvについては、vD'のコサイン類似度を計算します。
  3. D'の最も類似したベクターが実際には単語Dであることを確認します。

このような結果は、@ top1の情報検索の評価と考えることができます。 3番目のステップを変更して@top kに変更することができます。

+0

ボキャブラリファイルを生成する際の最大ボキャブカウントパラメータはワードベクトルディメンションパラメータにリンクされていますか?evalauting中にエラーが発生しています**シーケンス66の配列をディメンション100のベクトルにコピーできません** – Jayashree

関連する問題