2012-08-29 2 views
8

私のユースケースではLuceneドキュメントのインデックスが使用されますが、将来、複数のドキュメントを削除して再追加することなく、新しい期間ごとに(パフォーマンスのために、元の条件を保持しないで)なぜLuceneは既存のドキュメントの更新をサポートしていないのですか

文書を本当に更新することはできません。私の質問はなぜですか?

もっと正確に言えば、すべての形式の更新(用語、格納フィールド)がサポートされないのはなぜですか?
既存のドキュメントを指すために別の用語を追加することができないのはなぜですか?技術的には、既存のドキュメントIDをその用語の投稿リストに入れるだけでは不十分です。それはなぜ難しいのですか?途中にある不変の統計がありますか?

既存のドキュメントに用語(索引付きフィールド)を追加する私の用途をサポートするための回避策はありますか?

答えて

4

文書を本当に更新することはできません。私の質問はなぜですか?

ギリ、ドキュメントを編集すると、関連用語のポストが変更されます。これは、ポスティングリスト構造という用語のために問題があります。投稿リストはソートされ、メモリに順次格納されます。したがって、用語の投稿リストに文書を追加するには、文書全体を削除して再索引付けすることによって、より高い数値を付与する必要があります。doc id

+0

TY種別の見知らぬ人。 –

関連する問題