2017-06-06 6 views
0

SolrCloudで実行中のSolr 6.4.2と、インデックス作成のパフォーマンスに疑問があります。SolrCloud DIHパフォーマンス

MSSQLをデータソースとして、最新のMSSQL用JDBCドライバを使用しています。

Solrには、スタンドアロンとして開始され、私のDataImportは31250のドキュメントで実行されている場合/ sの SolrがSolrCloud(2つのレプリカ)として開始されたとき、私のDataImportは10000のドキュメントで動作します/ sの

に影響を持っているすべての設定パラメータがありますこの?

答えて

0

SolrCloudのインデックス作成は、スタンドアロンSolrのインデックス作成よりも遅くなることが予想されます(これはレプリカにもインデックスを作成する必要があるため、追加のネットワークトラフィックと待ち時間があります)。できるだけ速くなるようにいくつかのことを行うことができます:

  1. インデックスを破ることができます。いくつかの断片へのインデックス作成は高速化する必要があります(差分をテストすると数字が多すぎますので、あまりにも多くなるので狂気にならないでください)
  2. ドキュメントをシャードリーダーに送ります。索引付けは最初にリーダーで行われるため、リーダーに文書を送信すると、ネットワークトラフィックが節約されます。もちろん、ここではDIHを使用している場合はほとんどコントロールできません。 DIHの設定をカスタマイズして複数のハンドラがある場合を除き、それぞれがシャード用のドキュメントのみをインデックスし、シャードノード上の各ハンダを呼び出します。
関連する問題