私たちは86,315,770個のドキュメントを持つsolrインスタンスを持っています。これは最大4GBのメモリを使用しており、コンテンツと呼ばれるトークン化されたフィールドでファセッティングする必要があります。ディスク上のインデックスサイズは23GBです。Solrファセット検索パフォーマンスの推奨事項
なぜトークン化されたフィールドでファセット処理をしていますか?私たちは、そのフィールドで最も使用されている上位n個の用語を検索したいからです。問題は、このようなクエリを実行するのに時間がかかりすぎているかどうかです。このようなファセッティングをするときに時間を改善する方法はありますか?どんな勧告?
ありがとうございます。
あなたは 'facet.limit'を設定していますか?私は、 'facet.limit'が設定されていない場合(あなたの場合は' n 'でもよいでしょう)、このようなクエリが100,000以上のレコードであっても長い時間がかかることに気付きました。 –