クエリ結果のソート/ランク付けのために機械学習アルゴリズムを使用する必要があります。 私たちのクエリはelasticsearchで実行されています。 そのためには、説明セクション(説明は返すべきではありますが)と外部ソースから、ドキュメント自体のデータを結合する必要があります。elasticsearchのソートとスコアリング
これはかなり重い計算であるので、私はすべての文書上のが、唯一の上位1000にランク付けアルゴリズムを実行すると、スコアリングプラグインを作成し、私のトップ100
を返さないすべての文書上で実行されます;私はrescoringフェーズのためのプラグインを作成するためのオプションが表示されませんでした。 ソートプラグインを作成する必要があるようです。
私の質問は何ですか - ソート段階で実行されているドキュメントの数はいくつですか?それを制御する方法はありますか(rescoreのwindow_sizeのような)?ページ設定があるとどうなりますか?並べ替えはもう一度実行されますか? 説明セクションのある1000のドキュメントをソートフェーズにすることは可能ですか?説明なしで100だけ戻すことはできますか?
ありがとうございます!
感謝のために起こります。私はどのように再スコアとスコアを組み合わせることができますか?私はドキュメントごとに重いアルゴリズムを実行する必要があるので、私はrescoreフェーズでそれを行う必要があります。どのように私は自分の恋人を再点心で走らせることができますか? – Yonatan
また、ソーティングに関して - 私が100のうち10のドキュメントを求めている場合、作成日によってソートします。トップ10を検索するには、100まで注文する必要があります。何か不足していますか?どのようにそれは10だけでソートを実行しますか? – Yonatan
ドキュメントスコアにアクセスするために_scoreを使用することができます。詳しくはhttps://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-function-score-query.htmlをご覧ください。 –