2012-03-03 3 views
1

私は、solrがメモリを節約するためにfloatの正規化を使用し、2バイト表現にマッピングすることによってコンピューティングをスピードアップすることを知っています。 私の質問ですが、浮動小数点数を使用してクエリ内の用語を増やしてもかまいません(つまり、a^0.00001 +b^0.11111)、それをどういうわけかsolr/lucene計算の精度を失わないように標準化する必要がありますか? 1から1000の間にして2の累乗にします。solr/luceneクエリで因子範囲を上げるための規則はありますか?

答えて

1

索引時間の後押しは圧縮され、スコアを計算する際に重要な精度の低下を招くことがあります(たとえば、In Lucene, why do my boosted and unboosted documents get the same score?を参照)。クエリ時のブースト

クエリー時のブーストはJava floatです。また、Javaの算術演算子を使用してスコアに参加します。もちろん、浮動小数点演算を伴うaccuracy problemsがあるかもしれませんが、結果セット内でドキュメントが無関係な順序で表示されるようなスコアリングにはほとんど影響しません。

関連する問題