2016-12-07 7 views
0

stats apiからのelasticsearchのインストールでの文書数は、実際の文書数がカウントapiから約2700万であるときに約7億人を示します。この違いは入れ子にされた文書数からのものであることを理解しています - 統計情報apiはすべてを示します。弾性検索とLucene文書の制限

Luceneのドキュメントでは、シャードのために20億のハードドキュメント数があることを読んでいます。私はelasticsearchが文書の限界に近づくことを心配すべきですか?または、カウントAPIからデータを監視する必要がありますか?

+0

データを複数のインデックスに分割することを検討する必要があります。 たとえば、時間ベースのデータを保存する場合は、毎日のインデックスを作成できます。 –

+0

実際には、私たちはインデックスを直接制御しません、私たちはインデックスコントロールのためにapache usergridに依存しています。 –

答えて

0

はいシャードあたり20億のドキュメントの数に制限があります。これはルーシンのハード制限です。

単一のLuceneインデックスに含めることができるドキュメントの最大数があります。 https://issues.apache.org/jira/browse/LUCENE-5843[LUCENE-5843の場合、制限は2,147,483,519(= Integer.MAX_VALUE - 128)です。

水平にスケーリングすることを検討する必要があります。