2009-06-23 8 views
5

私は最近、このリゾートについて知っている、ナットをしばらく使っています。Zend_Search_Luceneのパフォーマンスとボトルネック?

どのようにパフォーマンスが向上し、サポートできるファイルサイズの上限はいくらですか?

さらに、変更があるたびにインデックスを再作成するのではなく、インデックスを削除または更新する方法はありますか?

答えて

8

Zend_Search_LuceneはApache LuceneフォーマットのPHP実装です。現時点(ZF 1.6から開始)でサポートされているLuceneインデックスフォーマットのバージョンは1.4 - 2.3です。 Luceneの詳細については、http://lucene.apache.org/java/docs/をご覧ください。

インデックスのサイズに関する限り、インデックスのサイズは32ビットプラットフォームでは2GB、64ビットプラットフォームでは制限されません。

パフォーマンスは、インデックスの作成方法に基づいて大きく異なります。 manual that deals with performanceのセクションを必ず確認してください。

また、Luke(Luceneインデックスの診断ツール)は、パフォーマンスの最適化とトラブルシューティングに非常に便利です。

P.S.更新に関しては、Luceneインデックスファイルフォーマットはドキュメントの更新をサポートしていません。文書を効果的に更新するには、文書を削除して索引に再追加する必要があります。これはJavaの実装にも当てはまります。

+0

ありがとうございます。 しかし、nutchは新しいインデックスと古いインデックスを別のインデックスにマージできますが、なぜLuceneを使用できないのですか?NutchはLuceneに基づいています。 BTWは、Zend_Search_Luceneが直接使用できるnutchによって生成されたインデックスファイルですか? – omg

+2

インデックスをLuceneおよびZend_Search_Luceneとマージすることができます。たとえば、フィールドを追加するなど、_indexes_自体を更新することもできます。しかし、インデックス内の文書を更新することはできません。 あなたはナッチのことを誤解していると思います。 NutchはLuceneをインデックスと検索に使用する検索エンジンです。だから、そのインデックスは互換性があるはずです。 – jason

+0

うわー、私はZend_Search_Luceneのインクリメンタルインデックス作成を今できると思います。ありがとうございます。 – omg

関連する問題