2016-04-07 10 views
0

word2vecアルゴリズムに関する質問があります。実際、私の質問は、訓練コーパスの文章の順序が重要であるかどうかです。例えば、与えられた2つのトレーニングコーパス:word2vec:トレーニングコーパスの設定順序

CorpusA: 文1文2文3

CorpusB: 文3文1文2

ウィルword2vecの結果は異なるでしょうか?最もword2vec実装がSGDを使用して訓練されているので、事前に

おかげで文章の

+0

Whをyは 'java'タグです – kampta

答えて

1

注文は埋め込みに影響を与えるには、テキストコーパスから学びました。

質問に答えてください。はい、word2vecの結果は異なるはずです。

コーパス内の文の順序が重要である場合、word2vecは正しいアルゴリズムではないと思います。あるそのうちのいくつか、単語の出力があるため、複数の理由を変えることができ、心に留めておいてください - ベクトル

  • 負サンプリング
  • あなたのマシンのマルチスレッド
  • 浮動小数点精度の

    • ランダム初期化を

    より良い結果を得るために、私たちはあなたのケースではできませんトレーニングデータを介して複数のエポックを行う

  • 関連する問題