2016-08-08 8 views
1

私は、人気度と場所という2つの変数を含む項目のランキングの問題に取り組んでいます。人気度と距離に基づいて重要度を判断する

私が持っている目標は、セット内のアイテムの人気と距離の間のトレードオフを決める方法を考え出すことです。つまり、私の場所(つまり、距離)だけでなく、人気度とジオロケーションのアイテムのセットから、最も重要なものを見つけたいと思います。

次のソリューションは、多くの注目を取得していない前の質問で述べた:人気のP(p)を使って、あなたの場所I(p)の重要性を計算することができる場所pを考えると

と距離D(p)。重みaとbに最適な値を決定するか、見つける必要があります。 、b *表D(P)今

どのように私は最高値a、bの重みを決定します -

I(p)は*のP(p)を=?

私は "解決策"のセットを持っています。各ソリューションには、人気度と距離のある項目のサブセットと、その中の1つの項目が最も関連性が高い/重要であるとみなされた項目が含まれています。

答えて

2

両方の重みは必要ありません。 (

I(p) = a * P(p) + D(p), 

P(p)は、アイテムの品質に基づいて、重要な用語です:あなたは絶対重要性値をしたくないので、あなたは一つのパラメータに減らすことができます(あなただけの他のものよりも重要である項目お伝えしたいと思います)または何でも)であり、D(p)は距離に基づく重要度です。ここでは、おそらく距離の減少関数が必要です。

私が理解する限り、体重を見つけることは、一度だけ実行されるオフラインプロセスです。したがって、非常に単純なサンプリング手法で十分である。

これを行う最も簡単な方法は次のとおりです。aというドメインをいくつかサンプルします(例:合理的な下限と上限を想定し、一定のステップ幅でこの間隔を繰り返します)。ソリューションのサブセットを評価し、最も重要な項目を見つけます。複数のサブセットが適切な関連アイテムを選択したことを数えます。最後に、最高の正しいカウントを生成したaの値が最適な選択肢とみなされます。

+0

私は絶対的な重要性はここではどのように関連性がないかを参照してください。最終的な実装では、これらのアイテムはいつでもランク付けされ、距離の変化は毎回変化します。 距離は重要度/ランクにペナルティを課す必要があるため、D(p)を単純に乗算する方法は正しいですか? –

+0

実際には、aを変更しても差はありません。あるセット内のアイテムのランキング/重要度は、常に同じです。 –

+0

ああ、申し訳ありません。それはタイプミスです。もちろん、プラスでなければなりません。 –

0

実際のデータセットはありますか?同じように、すべての場所の距離D(p)と人気P(p)の本当のランキング??

あなたが最初にあなたの式を訓練することができます、ということがある場合は、それが

I(p) = a * P(p) - b * D(p) 
次のセットで (a,b)の値のすべてのペアと

である - これらすべての100のために>

{(1,1),(1,2), ... , (1,10)} 
{(2,1),(2,2), ... , (2,10)} 
........................... 
........................... 
{(10,1),(10,2), ... , (10,10)} 

すべてのペアのtemporary_ranklistを作成して、&のペアを確認してください。temporary_ranklistが実際のraklistに最も近いです。

そのペアの(a,b)はあなたが探しているものです。私はそれが助けると思う:)

関連する問題