2つの文の間の類似度を計算しようとしているので、2つの単語があり、それぞれが文を表し、2つの単語を受け取り、それらの間の類似性を返す関数(F)方法.. 画像1において2つのベクトル間の類似度を測定
、黒丸は、文Aの言葉であり、赤四角は2つのワードを受信するたびに関数(F)について文B. を表し、それは0.0の間の値を返します例えば1.0の場合、Aの最初の単語とBの3番目の単語の類似度は0.3です。 私は2つの文の順序が同じでないことが多く、単語の数も多いため、M×Nの比較を使用しました。
私の質問は以下のとおりです。すべてのM×N個の比較スコアを取得した後
、どのように私は2つの 文章やリストの類似性を示して0.0〜1.0の最終 のスコアを得ることができますか? ""という2つの文章の長さが常に と等しいので、 "となります。
このアプローチが正しくない場合は、代替手段はありますか?
興味深い。どうやって同様の定義をしましたか? –
私はあなたが何をしようとしているのかがはっきりしているとは思わない。類似性スコアの行列がありますか?私はM×Nの比較がどういう意味か分かりません。いくつかの「類似性」トピックまたは数学に関する質問はありますか?たぶん、 "類似性"の経験が不足している人々は、依然として支援を提供することができます。 –
@NickZiebert、意味論的にオントロジーの最短経路を使用します。 –