ユーザーが1〜5のスケールで映画に投票したとしましょう。これらの映画にはジャンル情報があり、映画には複数のジャンルが含まれることがあります。このように:評価値のユーザーの中で最も好きなアイテムを見つける
Movie A Rating 4
Action/Sci-Fi
Movie B Rating 5
Comedy/Action
Movie C Rating 4
Comedy/Drama
私たちはどのジャンルが私たちのユーザーを好きであるか学びたいと思っています。
Genre Movie_Count Average_Rating
----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4
明らかに、我々はこのような小さな結果セットを使って何を予測しますが、私たちは、より大きなデータセットをしたと仮定しましょうことができません。ここでは、私たちの結果セットを持っています。
このデータを使用して、このユーザーの最も好きなジャンルをどのように並べ替えることができますか?単に加重平均や何かもっと複雑なものを計算するだけですか?