調整コサイン類似度を使用するアイテムベースのCFで作業しています。私は最近、一般的なコサインの類似性を追加して、私はまったく異なる結果を得ました。今私の質問は、私のデータをより良く理解できるものですか?調整済みコサイン類似度と正規コサイン類似度の選択
これは、このデータを考慮すると、ユーザー、アイテムおよび評価
User 1 | User 2 | User 3 | User 4 | User 5
Item 1 | 5 | 1 | 1 | 5 | 5
Item 2 | 5 | 1 | 2 | 4 | 5
Item 3 | 1 | 5 | 4 | 2 | 3
の可能なシナリオである、あなたはその項目1と項目2を締結したいが、比較的「似て」です。ここで、異なる類似性係数の結果である:私はこの例のためにそれらを四捨五入2
Adjusted cosine similarity = 0.865
Regular cosine similarity = 0.987
項目1および項目間
類似性
あなたは、これは基本的に同じで見ることができますしかし、アイテム2とアイテム3の類似度を計算しようとすると(まったく似ていない)、全く異なる結果になります。
アイテム2 a ND項目3
Adjusted cosine similarity = -0.955
Regular cosine similarity = 0.656
私は 'より良い' でしょう。この例
これらのためにそれらを四捨五入?調整されたコサイン類似度を使用すると、ユーザーの平均評価が考慮されるため、より良い結果が得られますが、正規のコサイン類似度はなぜこのような「異なる」アイテムに対して正の数になりますか?私は一般的なコサイン類似度の使用を控えるべきですか、特定のシナリオに対してのみ使用しますか?
助けていただけたら幸いです!