SphinxですべてのドキュメントIDを取得する方法

GoogleサイトマップのXMLについては、すべてのドキュメントIDがSphinxによって収集されている必要があります。しかし、1000以上のドキュメントでは、単純なループでそれらをすべて取得しようとすると、最終的に私にはError: searchd error: offset out of bounds (offset=1000, max_matches=1000)が与えられます。SphinxですべてのドキュメントIDを取得する方法

私はmax_matchesの設定を増やすことができましたが、それはパフォーマンスを低下させます。

そして、私は単純にMySQLクエリを実行したくありません。なぜなら、SphinxインデクサクエリにUNIONと多数のチェック/ルールが存在するからです。また、私は保守性のために1か所で質問したい。

私が今やったことは、各カテゴリ（サイトマップにも必要です）で、カテゴリでフィルタリングされたSphinxクエリを実行することです。そのようにして私は1000の文書の限界以下にとどまります。

これにはより良い解決策が必要です。右？

出典

2011-12-21 John

私はここで、このためのPHPコードを掲載しました： http://sphinxsearch.com/forum/view.html?id=7215

基本的に、あなただけの結果にwhileループ内の時間で1000件の文書を盗ん。 sitemapsはファイル内の結果の順序を気にしないので、結果をdocument_idの順序で取得する必要はありません。

出典

2011-12-21 19:46:33 barryhunter

正確に私が必要としたもの。ありがとう！ – John

SphinxですべてのドキュメントIDを取得する方法

答えて

関連する問題