:http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/マトリックス分解法
すべてが良かったが、この段落は私が興味をそそられました:
質問は今では、あなたの心に来ている可能性があります:私たちは二つの行列PとPXQは、 Rを近似ようQを見つけた場合は、すべての見えない評価の予測がすべてゼロになるということではありませんか?実際、PとQを思いついて、Rを正確に再現することはできません。代わりに、観察されたユーザ - 項目対の誤差を最小限に抑えるよう試みます。言い換えれば、Tを、それぞれが(u_i、d_j、r_ij)の形式のタプルの集合とすると、Tは、関連する評価と一緒に観測されたすべてのユーザ - 項目の対を含む、我々はT内の(u_i、d_j、r_ij)のすべてをe_ijに最小化しようとしているだけです(言い換えれば、Tは私たちのトレーニングデータです)。未知の残りの部分については、ユーザ、アイテム、およびフィーチャ間の関連付けが学習された後のその値
誰かが私にこれを手助けできるかどうか疑問に思っていましたか?潜在的な要素は、各ユーザーとアイテムの動作を理解するのに役立ちますか?
おかげ
あなたの質問は何ですか?明確にすることはできますか? –
どのように潜在的な要因が不明な量を識別するのに役立ちますか?特定の数のユーザーとアイテムの組み合わせを取り出し、テストセットとして作成することができました。私は残りの部分を訓練することができました。私のアルゴリズムは、トレーニングセットのゼロであったテストセットの値をどのように予測しますか? –
私は物事を正しく理解していると、私の予測マトリックスがトレーニングセットから生成されます。私のトレーニングセットでは、ゼロ以外の値の方が大きな値を持つでしょう。私のテストセットには、同じ予測マトリックスをどのように使用できますか? –