2016-06-16 33 views
1

と表されます。doc2vec functionには、sizeというパラメータがあります。gensim doc2vecのサイズパラメータは、

私は、sizeが出力ベクトルの次元であり、size=400の場合はsize=100よりも優れたコンテンツをキャプチャすることを理解しています。

しかし、わかりませんが、sizeは何を表していますか? Doc2Vecが単語からどのくらい検索して次の単語を予測するのかを意味しますか?それともそれはどういう意味ですか?

どうもありがとう、

答えて

1

sizeは、作成したベクトルの次元数です。したがって、size=100は、各文書(実際には文書タグ)が訓練から100次元のベクトルを受け取ることを意味します。

さらに多くのディメンションが必ずしも優れているわけではありません。これは、トレーニングが遅くなり、モデルが大きくなることを意味します。また、小さなデータセットで作業する場合、あまりにも多くのディメンションが過密になる危険があります。モデルがデータ内の一般化可能なパターンを表現するのを妨げます。

関連する問題