これは明らかにES内部についての質問です。同じ文書をElasticSearchにもう一度ドロップすると、それを再インデックスするのでしょうか?
私が持っているのは、ESの上に構築されたカスタム検索エンジンで、複数のベンダーからのデータを提供しています。最後の索引付け以降に特定の文書が変更されているかどうかを調べるには(たとえば、ベンダーからの文書を定期的に再プルするときなど、一部の仕入先に「その日から変更された文書のみを与える」という方法はありません)それは何らかの形で修正のためにそれをインデックスに入れてESにドロップしますiff
文書が変更されました。
質問:ESは内部でドキュメントチェックサムを追跡して、が実際ににインデックスを再作成する必要があるかどうかを確認しますか? (もちろん、私はいくつかのフィールド、タイムスタンプなどが各GET
で動的に更新されるHTMLではないと推測しています)。
もしそうであれば(つまり、同一の書類を再インデックスすると償却原価はごくわずかです)、それは明らかに私の更新を簡略化します。
同じ文書IDを使用すると、同じ文書を何度も再インデックスすることができ、検索結果は変更されません。 – Val
@Val:私は理解しますが、私の質問は、同じ文書を何度も何度も再インデックスするコストです。 – LetMeSOThat4U
私たちは何通の文書を書きましたか、その潜在的な再インデックスの頻度は何ですか? – Val