2010-12-02 15 views
0

私が書いているC#プログラムでは、2つのエンティティ(ドキュメント、動物、またはほとんどすべてのもの)で類似点を比較する必要があります。 特定のプロパティに基づいて、ドキュメント(またはエンティティ)間の類似性を計算します。 は私がベストマッチングペアを見つけたい検索選択

X  Y Z 
A|0.6 |0.5 |0.4 
B|0.6 |0.4 |0.2 
C|0.6 |0.3 |0.6 

以下のように表に自分の類似性を置く(例:AX、BY、CZ)最高の類似性スコアに基づきます。ハイスコ​​アは類似性が高いことを示す。

類似点の値が同じ場合、私の問題が発生します。たとえば、AXとCZは両方とも0.6です。選択するペアはどのように決定するのですか?このような問題のための手順/理論はありますか?

ありがとうございました。

+0

@ user528699あなたの問題は何かありましたか? –

答えて

0

一般的に、タイブレーク方法は問題のコンテキストに依存します。場合によっては、すべての結びつきの結果を報告する必要があります。他の状況では、どのアルファベット順が最初であるかなど、任意の選択手段を使用できます。最後に、第一次特性の結合の場合にのみ評価される第二次特性を選択することができます。

さらに、常に1つまたは複数のレポートを作成してから、ユーザーに自分自身を決定できるように同調していることを知らせることができます。この場合

0

、あなたが探しているべきである類似点は次のとおりです。 - バリュー - 行 - 共通して上記のいずれかを持って列

オブジェクトは、「類似」しています。同じ値を持つオブジェクトが同じ列にあるオブジェクトよりも似ているように、各プロパティに重み付けを割り当てることができます。また、同じ値を持ち、同じ列にあるオブジェクトは、同じ値を持つオブジェクトよりも似ています。

データに自然範囲が存在するかどうかによって、範囲の比較も検討できます。たとえば、0〜0.5の範囲の2つの数値は多少類似している可能性があります。

関連する問題