2017-10-27 2 views
1

Solr 4.3.0可能であれば、ドキュメントサイズでフィルタリングするSolrクエリ構文は何ですか?

大きなサイズのドキュメントを探したいですか?

私はメモリ使用量をテストするためにいくつかのテストデータを構築しようとしていますが、サイズの小さいドキュメントは引き続き入手しています。だから、もし私が私の質問にもっと適した文書を見つけるのに役立つだろうdoc size節を追加することができます。

答えて

1

私はこの可能性を認識していません。ほとんどの場合、サポートはありません。

インデックスを作成する際に別のフィールドでドキュメントのサイズを追加することができます。後でフィルタリングするときに使用します。

TermVectorComponentを使用すると、一致するドキュメントの用語ベクトルが返される可能性があります。これは、このドキュメントの「どれくらいの大きさ」をある程度理解する可能性があります。しかし、簡単ではありません。 outputおそらく便利なの 例:

第3の可能なオプション(アイデアMatsLindhへの賛辞):特定のフィールドのsorting functionnorm()を使用します。いくつかの制限があります。sort:norm(field_name) desc

+1

アイデア:

  • あなたは、いくつかの古典的な類似性を使用する必要が
  • あなたがソートしているフィールドは、ソート機能の規範

例が含まれている必要があります。フィールドの 'norm()'によるソートはどのように終わるでしょうか? – MatsLindh

+0

@MatsLindh、まず、試してみると、TFIDFSimilarityが必要です(これは奇妙です)。そして、第二に、ノルムを有効にする必要があります。常にそうではありませんが、間違いなくオプションです。コース。 – Mysterion

+0

"ノルム"が何であるかは不明です。ドキュメントの終わり近くにあることを期待している用語にオフセットを使用すると、サイズのアイデアが得られるはずです。ありがとう – CrashCodes

関連する問題