2011-08-03 4 views

答えて

7

はい、Luceneのは、次の資料によると、これを処理することができるはずです。

多数の要因に応じて、単一: http://www.lucidimagination.com/content/scaling-lucene-and-solr

ここで引用ですマシンでは5〜80万件のドキュメントのLucene/Solrインデックスを簡単にホストできますが、分散ソリューションでは何十億ものドキュメントにわたって1秒未満の検索応答時間を提供できます。

この記事では、複数のサーバーへのスケーリングについて深く説明しました。したがって、必要に応じて小規模から小規模に開始することができます。彼は多くの場合、Luceneのためのテスト入力として、ウィキペディアのコンテンツ(25ギガバイト)を使用していますhttp://blog.mikemccandless.com/

Luceneのパフォーマンスについての素晴らしい資源を積極的にはLuceneの開発に関与しているマイク・マッカンドレスのブログです。

また、Twitterのリアルタイム検索が現在Lucene(http://engineering.twitter.com/2010/10/twitters-new-search-architecture.html参照)で実装されているのは興味深いかもしれません。

ただし、あなたが提供した数字が正しいかどうかは疑問です:5億ドキュメント×50 KB =〜23 TB - 本当に多くのデータがありますか?

+0

基本的にはLuceneの分散型ソリューションであるElasticSearchに直接移動することがあります – RobAu

+0

通常のLuceneベースのアプリケーションが実際に負荷に適しているかどうかは不明です。作者はLucene/Solrを使い続けています。その場合、基礎構造がLuceneインデックスであるElasticsearchの場合のように、Luceneが巨大インデックスを扱う正しい選択であるという仮説は真実であると言うことができますか? – eliasah

+0

SolrかESかにかかわらず、どちらも分散Luceneインデックスです。実際、両方のフレームワークで抽象化された抽象度が高いほど、Luceneは巨大なインデックスに適しています。 – eliasah