私はいくつかの映画の評価データを試しています。現在、ハイブリッドアイテムとユーザーベースの予測を行っています。数学的に私は自分が望むものをどのように実装するのかが分かりません。多分答えは単純明快ですが、他の選択肢があるように感じます。中心に近づく加重平均値
私は私がのために与えられたアイテム
- 項目基づく予測
- ユーザー基づく予測
- グローバル映画の平均の平均値を取得したいことを、今の4つの値を持っています与えられたユーザ
このように進むと、重み付けされたsimilのようなミックスに追加する必要がある他の値がありますアリティ、ジャンルの重み付けなど、私はいくつかのことを確信しています。
今のところ私は上記のように私が利用できるデータに焦点を当てたいと思います。
ここは私の理論です。開始するには、アイテムとユーザーベースの予測に均等に重みを付けることが必要です。これは、グローバル平均よりも大きな重みを持ちます。
私は非常に錆びた数学で感じますが、それほど線形的な解法を考え出す基本的な試みは、高調波のようなものを使うことです。しかし、低い平均値に向かって自然に変化するのではなく、地球平均に向かう傾向にある。
例えば
予測アイテムベースの評価4.5
は、ユーザーベースの格付けを予測2.5
グローバル映画の評価3.8
グローバルユーザー評価3.6
そう」中心 "/グローバルな平均ここでは3.7
私の数学はかなり錆びているので、私は数学的に私が思っているものを表すことができる方法についての任意の考え方は、これと離れているかもしれません?
OR
あなたはF.・リッチらの異なるアプローチ
netflix賞は、「階層化された」SVDの種類のアルゴリズムによって獲得されました。 – wildplasser
確かに、私の手の届かないところで少しです。学習の目的のために、私はこの経路を試していて、どれくらい私がそれを得ることができるかを見ています。私はSVDを見ましたが、どうやってそれを実装するのかはまだ分かりません。 –