2012-02-22 6 views
1

私はいくつかの映画の評価データを試しています。現在、ハイブリッドアイテムとユーザーベースの予測を行っています。数学的に私は自分が望むものをどのように実装するのかが分かりません。多分答えは単純明快ですが、他の選択肢があるように感じます。中心に近づく加重平均値

私は私がのために与えられたアイテム

  • グローバル・ユーザーの平均のための

    1. 項目基づく予測
    2. ユーザー基づく予測
    3. グローバル映画の平均の平均値を取得したいことを、今の4つの値を持っています与えられたユーザ

    このように進むと、重み付けされたsimilのようなミックスに追加する必要がある他の値がありますアリティ、ジャンルの重み付けなど、私はいくつかのことを確信しています。

    今のところ私は上記のように私が利用できるデータに焦点を当てたいと思います。

    ここは私の理論です。開始するには、アイテムとユーザーベースの予測に均等に重みを付けることが必要です。これは、グローバル平均よりも大きな重みを持ちます。

    私は非常に錆びた数学で感じますが、それほど線形的な解法を考え出す基本的な試みは、高調波のようなものを使うことです。しかし、低い平均値に向かって自然に変化するのではなく、地球平均に向かう傾向にある。

    例えば

    予測アイテムベースの評価4.5

    は、ユーザーベースの格付けを予測2.5

    グローバル映画の評価3.8

    グローバルユーザー評価3.6

    そう」中心 "/グローバルな平均ここでは3.7

    私の数学はかなり錆びているので、私は数学的に私が思っているものを表すことができる方法についての任意の考え方は、これと離れているかもしれません?

    OR

    あなたはF.・リッチらの異なるアプローチ

  • +0

    netflix賞は、「階層化された」SVDの種類のアルゴリズムによって獲得されました。 – wildplasser

    +0

    確かに、私の手の届かないところで少しです。学習の目的のために、私はこの経路を試していて、どれくらい私がそれを得ることができるかを見ています。私はSVDを見ましたが、どうやってそれを実装するのかはまだ分かりません。 –

    答えて

    1

    私は「推薦システムハンドブック」を検討することをお勧めします上の任意の考えを持っている、2011年には、それは内のすべての一般的なアプローチをまとめたものエンジンを推奨し、必要な数式をすべて提供します。

    予測増加に使用ネイバーの数、アイテムIの平均評価に向けて傾向が回帰アプローチによって予測評価として:
    ここ4.2.3からの抜粋です。アイテムiが評価範囲のいずれかの端に評価しかない、すなわちそれが愛されているか嫌われているとすると、回帰アプローチはアイテムの価値が平均であるという安全な決定をする。 [...]一方、分類手法は、評価をiに与えられる最も頻繁なものとして予測する。アイテムが「良い」または「悪い」のいずれかに分類されるため、これはより危険です。