重複したフィールドを持つデータがあります。検索結果の上に重複が一緒に表示されることは望ましくありませんが、それらを完全に排除したくありません。私はちょうど良いバラエティーを得たいので、同じフィールド値の2番目、3番目... n番目の出現は降格されるでしょう。 ElasticSearchで可能ですか?例えばElasticSearchで重複を排除していますが、重複を排除していません。
:(thisに基づく)
curl -XPOST 'http://localhost:9200/employeeid/info/1' -d '{
"name": "John",
"organisation": "Apple",
"importance": 1000
}'
curl -XPOST 'http://localhost:9200/employeeid/info/2' -d '{
"name":"John",
"organisation":"Apple",
"importance": 2000
}'
curl -XPOST 'http://localhost:9200/employeeid/info/3' -d '{
"name": "Sam",
"organisation": "Apple",
"importance": 0
}'
我々は検索が重要で昇圧されたと仮定した場合、 "アップル" の検索のための自然な結果がJohn
、John
、Sam
だろう。私が探しているのは、John
、Sam
、John
の結果を作る方法です。すなわち、別のJohn
がすでに出現しているので、第2のJohn
にペナルティを科します。
に_scoreの値を前提としています:https://www.elastic.co/ guide/en/elasticsearch/reference/current/modules-scripting-painless.html、https://www.elastic.co/guide/en/elasticsearch/reference/current/modules-advan ced-scripting.html。 –