2009-03-23 5 views
7

例えば、StackOverflowが他の質問をどのように決定するのかは似ていますか?キーワードで関連トピックのデータストアを検索する

上記の質問に入力し、このメモコントロールにタブすると、私が求めているものと同じかもしれない既存の質問のリストが表示されました。

類似の質問を見つけるためにどのような手法が使用されていますか?

+0

これはひどくフォーマットされた質問ですが、ユーザーの質問ではありません。 ユーザは、ISプログラミングに関連するアルゴリズムについて質問しています。 – DevinB

+0

これはユーザーの声ではありません。私はWinFormsアプリケーションで同様のものを実装する必要があるため、アルゴリズムに関するプログラミング関連の質問をしています。 一部の人々は、彼らに少し力を与え、彼らは狂って行く! –

+0

[Stackoverflow's Related Questions]の可能な複製(http://stackoverflow.com/questions/393505/stackoverflows-related-questions) –

答えて

3

私はそれがどのように機能するかを述べて3月20日に[email protected]からの電子メールを得た:

「質問をする」検索がタイトルを独占的に あると が身体には何も一致しません。なぜ人々はそれが 良いと思う私には 謎です。

私が見つけた検索バーは、私がすでに見た特定の質問を見つけようとしているときにはあまり役に立ちません。

1

普通の単語マッチングだと思います。しかし、私はこの機能がうまく動作しないと付け加えたいかもしれません。関連する提案を提供するためにSOに頼るよりも、site:stackoverflow.com接頭辞でGoogle検索を行う方がはるかに優れています。

1

マッチングプログラムにはすべての質問のインデックスが格納されます。質問をすると、質問内のすべてのキーワードがインデックスと照合されます。これはGoogle検索に似ています。 Luceneオープンソース検索がこれに使用される(可能性が高い)。結果はかなり正確ではないので、私は彼らが近似として質問の見出しだけを索引付けするものと推測します。

他の類似キーワードはcollaborative filteringで、他の同様の顧客の行動に基づいてAmazonを普及させるためのアルゴリズムです。現在のケースでは、協調フィルタリングに基づく代替アルゴリズムは、キーワードが質問から抽出され、次にキーワードに関連付けられた(履歴内の)タグが見つけられる。これらのタグを持つ質問が返されます。実験がうまくいくかどうかは、実験が必要です。

1

MS SQLのフルテキスト検索を使用していません。あなたはLucene、IMOを使って、より良い運があります。トピックの詳細については、Wikipediaの記事Luceneまたは一般的なトピックinformation retrievalを参照してください。

関連する問題