2017-08-23 13 views
0

私は10百万のドキュメントを索引付けしています。新しい要件に従って、私のsolrスキーマに余分なフィールドを追加する必要があります。 私の質問は理想的なアプローチでしょうか?私は単純にスキーマにフィールドを追加し、データ全体を再インデックスすることを意味しますか?または一部の部分インデックスですか?または、他の何か?。大量のデータを含むSOLRの索引付けのパフォーマンス

答えて

0

あなたのやることに関係なくデータを送信しなければならないので、答えはおそらく残りのフィールドのサイズによって決まります。小さい場合は、フィールドを追加してすべてのインデックスを再作成します。

非常に大きなフィールドがある場合、Solrがネットワーク経由でコンテンツを送信するのではなく内部的に(つまり部分的な更新)コンテンツをフェッチする方が効果的かもしれませんが、またはdoc値を使用します。

正確に言うことは不可能なので、少数のドキュメントで小さなテストを実行して、データセットのパフォーマンスの正確さを確認する必要があります。

+0

リンデンは説明のためにありがとう – AsadKhan

関連する問題