2012-01-23 5 views
1

地元のバドミントンクラブで各プレイヤーのスコアに基づいて最も近い試合を試してみたいと思います。すべてのゲームはシングルです。優勝者は最初の21点と2点のクリアポイントです。最初から21までが2つのクリアポイントを持たない場合は、プレイは続行され、勝者は2つのクリアポイントまたは最初から30ポイント(どちらか早い方のどちらか早い時点)の最初のものになります。したがって、勝者は21から30のスコアを持つことができ、敗者は0から29までのスコアを持つことができます。類似のプレイヤーを見つけるための重み付きアルゴリズム

平均スコア差を計算することによって、2人のプレーヤー間の類似性を調べることができます。平均が低いほど、プレイヤーはより似ています。

しかし、私は、より多くのゲームをプレイしたプレイヤーと、プレイしていないプレイヤーのどちらよりも大きな重み付けをしたいと思います。

遊んだゲームの任意の数からスケーリングする公正な重み付けを追加する最も良い方法は何ですか。

TIA

+0

各プレーヤーの対戦格差の平均値について質問していますか?それから頻繁にプレイするペアに関する多くの情報があり、まれにペアワイズするプレイヤーの類似性に関する情報はほとんどまたはまったくありません。 – hardmath

+0

はい、これは私が後にしたものだと思います。 A対Cがもっと多くのゲームをプレイしたにもかかわらず、プレイヤーA対プレイヤーBだけがプレイしたプレイヤーは、プレイヤーA対プレイヤーCより平均点差が小さくなることがあります。平均の差がかなり小さい場合、プレーヤーCはプレイヤーAにもっと似ていると思いますが、意味ある方法で計算に使用されたゲームの数をどのように処理するのか分かりません。 – Technohead79

答えて

1

あなたは統計からconfidence intervalの概念を適用することができます。信頼区間のサイズは、サンプルサイズ(演奏されたゲームの数に対応する)と基礎となる母集団の分散との両方に(統計的に)依存する。信頼区間の長さは、(推定のためのデータが多いほど)サンプルサイズとともに減少し、基礎となる母集団の分散が増すにつれて増加します。

もちろん、厳密な統計分析を行っていないので、あなたの目的に合った数式で信頼区間のアイデアを自由に適用することができます。リンクされた記事で見ているように、正規母集団の平均を推定するとき、信頼区間のサイズはサンプルサイズの平方根とともに減少します。だからあなたは、ヒューリスティックな正当化を使って人工的にあなたの数式でその要素を使うことができます。

+0

**追加:**「あなたの目的に合った調合」と言えば、2人のプレイヤーがどれほど近いかを測る「距離のような」数量を探しているかもしれないし、それは2人の選手のどちらがより強いかを示すかもしれない。いずれも類似性の尺度とみなすことができますが、もちろんアプリケーションに応じて異なる数式を使用することもできます。もっと私に教えてください、そして私は例を挙げます。 – hardmath

関連する問題