Luceneスコアの結果

それぞれ1つのパーティションしかカバーしていない複数のインデックスがある場合、Luceneでは、なぜ異なるインデックスで同じ検索が異なるスコアで結果を返しますか？異なるサーバーの結果が正確に一致します。Luceneスコアの結果

私が検索した場合、すなわち：

名 - ジョン・スミス
DOB - 1934年11月11日

パーティション0は0.345

のスコアを返しますパーティション1は、0.337

のスコアを返します

名前とDOBの両方が正確に一致します。

出典

2008-08-02 Stephen Hendry

scoringには、Inverse Document Frequency（IDF）が含まれています。「John Smith」という用語が1つのパーティションにある場合は、0回、100回、パーティション1では1回です。ジョン・スミスを検索するスコアは、用語がより少ないため、パーティション1での検索が高くなります。

これを回避するには、インデックスをすべてのパーティションに配置する必要があります。そうしないと、IDFを上書きする必要があります。

出典

2008-08-02 09:51:00

また、すべてのインデックスからマルチサーチを構築することもできます。 –