アイテムベースのコラボレーションフィルタを使用してレストランの推奨事項を作成する推奨エンジンで作業しています。各レストランには1〜5の評価でレビューがあります。
すべての推奨アルゴリズムはデータの希薄さに問題を抱えているので、正しい相関を計算するソリューションを探していました。アイテムベースのコラボレーティブフィルタの最小データ量
私はレストラン間の調整された余弦の類似性を使用しています。
レストラン間の類似度を計算する場合は、両方のレストランを評価したユーザーが必要です。しかし、両方のレストランに正しい相関を得るように格付けしたユーザーの最小値はどのくらいでしょうか?
テストから、私は、両方のレストランを評価した1組のユーザーが、類似していないことを明らかにしました(明らかに)。多くの場合、それは-1または1です。私はそれを2つのレストランを持つユーザーの2組に増やしました。私は、この類似性が十分であるかどうかを判断するのは難しいと思っています。この類似性の正確さをテストする方法か、最小値がどのようにあるかに関するガイドラインがありますか?