私は、非常に大きなドキュメントセットの検索を処理するためにSolrを使用しています。ファセットとフィルタを使用した複雑なクエリでパフォーマンスの問題が発生します。 これは、いくつかのデータを取得するために使用Solrのクエリです:Solrパフォーマンスの問題
フル要求のSolr:http://host/solr/discovery/select?q=& FQ =ドメイン%3Acom + OR +ホスト%3Acom + OR + public_suffix%3Acom & FQ = crawl_date%3A%5B2000-01 3DCrawl_year%7Dcrawl_year%3A%282000%29 & fq =%7B%21tag%3Dpublic_suffix%7Dpublic_suffix%3A %28com%29 &開始= 0 &行= 10 &ソート=スコア+ DESC & FL =% 2Cscore & HL =真& hl.fragsize = 200 & hl.simple.pre =%3Cstro NG%3E & hl.simple.post =%3C%2Fstrong%3E & hl.snippets = 10 & hl.fl =コンテンツ& hl.mergeContiguous = falseを& hl.maxAnalyzedChars = 100000 & hl.usePhraseHighlighter =真&面=真& facet.mincount = 1 & facet.limit = 11 & facet.field =%7B%21ex%3Dcrawl_year%7Dcrawl_year & facet.field =%7B%21ex%3Ddomain%7Ddomain & facet.field =%7B%21ex%3Dpublic_suffix% 7Dpublic_suffix & facet.field =%7B%21ex%3Dcontent_language%7Dcontent_language & facet.field =%7B%21ex%3Dcontent_type_norm%7Dcontent_type_norm & shards = shard1 "
約50000件のドキュメントでこのクエリを使用すると約10秒かかりますが、2億件のドキュメントをホスト上で試してみると約4分かかります。私は自然であることを知っています。ホストではかなり長い時間がかかるでしょうが、誰かが同じ問題を抱えていて、より速い結果を得ることができたのだろうかと思います。私が2つのシャードを使用していることを知っている。
あなたの回答を待っています。
Solrのどのバージョンですか?あなたはおそらくあなたのクエリがあなたと働いていると示しているものに非常によく似て作成された[Solr sparse faceting](https://tokee.github.io/lucene-solr/)を見たいと思うでしょう。 – MatsLindh