2016-04-20 16 views
1

私はいくつかのエッセイ(Tomas Mikolov ...)で、文のベクトルを形成するより良い方法は単語ベクトルを連結することであることを学びました。単語ベクトル単語ベクトルを連結して文章ベクトルを構成する方法

しかし、数学で私の不器用さのため、私はまだ詳細についてはよく分かりません。例えば

するワードベクトルの次元をmとすると、文は、n個のワードを有します。

連結演算の正しい結果はどうなりますか?

は、1 x m * nの行ベクトルですか?またはm×nの行列?

ベクトルを埋め込む結合する少なくとも3つの一般的な方法があります

おかげ

+1

Mikolovがそれをどこに言及しましたか?紙などへの言及は有用である。あなたの質問に答えるために、連結はベクトルを順番に入れていくことです。したがって、1x100サイズの3つのベクトルがある場合、文ベクトルは1x300になります。 – user3639557

答えて

2

をアドバイスしてください。 (a)合計、(b)平均を&と加算すること、または(c)連結すること。したがって、あなたの場合、連結すると、​​というベクトルが得られます。ここで、aは文の数です。それ以外の場合は、ベクトルの長さは変わりません。 gensim.models.doc2vec.Doc2Vecdm_concatおよびdm_meanを参照してください。これらの3つのオプション[1,2]のいずれかを使用できます。

[1] http://radimrehurek.com/gensim/models/doc2vec.html#gensim.models.doc2vec.LabeledLineSentence

[2] https://github.com/piskvorky/gensim/blob/develop/gensim/models/doc2vec.py

+0

ありがとうございました –

関連する問題