2009-03-25 8 views
3

私は比較的単純なLuceneインデックスを持っていますが、Solrが提供しています。インデックスは、タイトルと本文の2つの主要なフィールドとそれほど重要ではないフィールドで構成されています。おすすめタイトル追加?

ほとんどの検索エンジンは、タイトルの中で、体の上で一致する検索結果との関連性が高くなります。タイトル欄にインデックス時間を追加することから始めます。

私の質問は、人々が通常どのような値をタイトルフィールドに使用しているのですか? 2? 4? 10? 100?

+0

なぜ検索時間の代わりにインデックス時間ブーストを使用しますか? –

答えて

3

メディアン長の中央値をメディアン長で除算することをお勧めします。これはおおまかにあなたにM体の単語のM出現のための要因Mを与えます、それはタイトルに一度現われます。 M * 3のようなものを使用してください。これはもちろん、合理化されたヒューリスティックであり、値を反復処理するのが最良です。はるかに構造化された議論のためにGrant Ingersoll's "Debugging Relevance Issues in Search"を参照してください。

関連する問題