2017-04-07 7 views
0

私は2つのドキュメントベクトルX1とX2を持っているとします。今では、これらをゼロベクトルで埋めて、最大の文書長の制約を受けました。 2つのベクトル間の類似性に影響を与えるか?それとも、私たちをどのように助けてくれるのでしょうか?2つのベクトルの類似性に対するパディングの影響

答えて

1

私は最初の部分に答えることができます。ベクトル間の類似性には影響しません。通常、文書処理では、ベクトル間のコサイン距離を使用します。ゼロを加えることによって、コサイン距離は変更されません。あなたはゼロを加えることによって次元を増やしています。例えば、2次元空間[1、2]、[3、4]では2つの点があります。 3次元では、同じ点が[1,2,0]および[3,4,0]として表される。ディメンションが増加しても、ポイントは同じままです。

関連する問題