2012-01-02 13 views
4

1つの物理マシン上で複数のSolrインスタンスを実行することをお勧めしますか?私がone of the comments in this nice articleを読むと、彼らは1台のマシン上で2つのSolrインスタンスを実行すると思います。私は2台のマシンを用意しており、Solrのインデックスを5シャード以上に分割したいと考えています。どう思いますか?1つの物理マシン上で複数の 'big' Solr shardインスタンスを実行する

フルキャパシティの場合、合計80個のインデックスシャードを持つ40台のサーバーが必要です。 1つのシャードには最大20 GBのディスクスペースが必要です。現在、我々は を実行しており、30台のサーバと60個のインデックスシャードを持つクラスタです。

答えて

5

1つのサーバー上で〜40GBの4つのシャードをそれぞれ実行します。あなたが世話をする必要がある重要なことは、特に大規模なキャッシュサイズのケースでは、RAMの使用です。各シャードごとに約16GBを割り当てます。

高いqpsを処理するとレプリケーションが必要になる可能性があるため、qpsレート(1秒あたりのクエリ数)については何も言わなかった。その場合、1つのサーバーに少数の断片を格納することになります。

また、私たちが経験したところでは、シャードが少ないほど、マージ時にCPU時間を節約できるため、クロスシャード分散検索の検索パフォーマンスが向上します。

+0

この情報をお寄せいただきありがとうございます。つまり、あなたはSolrインスタンスの各サーバー上で実行しています。 1つの物理マシン上に複数のSolrシャードが存在するのではないでしょうか? レプリケーションでブーストが発生しません。私はこれを試しました。私たちはそれほど多くのクエリを持っていないので、データの量が増えます。 – High6

+1

いいえ、実際には1台の物理マシンで複数のシャードを実行しています。言われたように、私たちは1台のマシンに4つのシャードを持っています。 –

+0

Ah、ok。それから私は誤解しました。ありがとう。 – High6

関連する問題