2017-09-13 7 views
0

私は弾性検索が初めてです。ドキュメント内のフィールドのブースト値の較正とスケーリングを理解できません。どのようにしてフィールドのブースティング値を決定して、それが期待どおりに動作するようにする必要があります。私はいくつかのオンラインブログとesのドキュメントを見てきました。それは、正規化と内部最適化を行って値を上げることを書かれていますか?それはどのように機能するのですか?ブースティングの正規化と内部最適化はどのように機能しますか?それはどのように関連性に影響しますか?

例:Googleドキュメントのタグ、タイトル、名前、テキストフィールドがある場合、これらの値をどのように増減する必要がありますか?

答えて

0

Elasticsearchはブールモデルを使用してドキュメントを照合し、次に関連性(つまりランキング)を決定するスコアリングモデルを使用します。スコアリングモデルは、いくつかの追加機能と組み合わせたTF/IDFスコアを利用します。これらのTF/IDFスコアは、クエリ内の一致するフィールドごとに計算され、集計されてドキュメントの全体的なスコアが生成されます。このプロセスを掘り下げるために、クエリにexplainを実行して、各フィールドのスコアがドキュメントの全体的な関連性にどのように影響しているかを確認することをおすすめします。

データの熟練者として、ドキュメントの関連性に最も大きく影響するフィールドを決定するのに最適な立場にあります。フィールドの適切なブースト値を見つけることは、あなたが望む結果に最も適した式を見つけるまでレバーを調整することです(また、ユーザーがいる場合は、A/Bテストが役立ちます)。

関連する問題