コサイン類似度は、2人のユーザが質問に対する回答に基づいて類似しているかどうかを判断するのに適したアプローチですか?ユーザ推奨のコサイン類似度
私はユーザーに10の質問に答えて、10次元の整数ベクトルへの応答を解決しようとしています。同様のユーザーを見つけるためにコサイン類似度を使用する予定です。
私は各質問を整数に分解し、整数を合計して各ユーザを単一の整数に解決することを考えましたが、このアプローチの問題は類似性測度に問題はないということです。つまり、 5に解決される質問1に対する回答と0に解決される質問2に対する回答とを含み、別のユーザは質問1に0を、質問2に5を回答し、両方のユーザは合計5に基本的に異なる回答をする。
したがって、コサインの類似性は、各属性に基づいて良好な類似性の尺度を与えるでしょうか?