私はsolrインデックスにMySQLデータベースを追加しようとしています。データインポート処理が完了すると、ドキュメントが更新された "1428760"が表示されます。しかし、完全な検索クエリshow numFound="546195"
を解決する。Solr:不正なnumFound値
何が問題ですか?なぜこの不一致?
私はsolrインデックスにMySQLデータベースを追加しようとしています。データインポート処理が完了すると、ドキュメントが更新された "1428760"が表示されます。しかし、完全な検索クエリshow numFound="546195"
を解決する。Solr:不正なnumFound値
何が問題ですか?なぜこの不一致?
チェック:
http://lucene.472066.n3.nabble.com/Changing-value-of-start-parameter-affects-numFound-td2460645.html
いくつかの男がSolrの中に重複した文書について何かを言います。文書を再索引付けする前に文書を明示的に削除する必要があるようです。
私は1,428,760が管理パネルやCoreAdmin APIのような権威を持ち、546,195がワイルドカード検索との一致数であると推測しています。
ヘッダーを確認してください。 partialResults
フラグがtrueに設定されていますか?そうであれば、Solrはインデックスをスキャンするときに内部のtimeAllowed
タイムアウトに達し、一致するすべてのドキュメントの部分集合のみを返します。
これは、Solrのパフォーマンス優先度を示す1つの機能です。可能な限り迅速にクエリに最も関連性の高い結果を提供しようとします。多くのドキュメントがクエリと一致すると、時間を節約し、関連性に影響を与えずにすばやく戻ることができると仮定します。誰が50万回のヒットでページを変更するのだろうか?
とにかく、これ以上の詳細はありませんが、これはちょっと推測して、partialResults
の簡単な説明です。ここ
はあなたのレコードがユニークですか?一次IDごとに??? Solrは同じIDのレコードを上書きします。 – Jayendra
更新された文書1428760人は誰ですか?更新の完了後にコミットしましたか? –
jayendraありがとうございました。あなたのポイントは正しいです。今私はすべてのレコードにユニークなキーを設定します。問題は解決されました..ありがとうございました.... –