私の理解によると、Luceneは逆索引を使用しています。私はのLucene 6. XXを使用していますが、私は簡単な方法についてはよく分からないですが、解決策はありませんよりも優れている逆インデックス形式のluceneを印刷
term1 <doc1, doc100, ..., doc555>
term1 <doc1, ..., doc100, ..., do89>
term1 <doc3, doc2, doc5, ...>
.
.
.
termn <doc10, doc43, ..., dock>
このソリューションは効率的ではないことに注意してください(たとえば、3日間のつぶやきのインデックスには永久にかかる)。 – sareem
** 3日間のつぶやきのインデックス**は無関係です、ドキュメントの数を言及してください。また、あなたが尋ねた論理に慣れていないことが明らかになりました。パフォーマンス角度は私が見ていないものです。私はパフォーマンス側も見ていきます。小さな文書セットでこれが正しく機能するならば、そのロジックをスケーラブルにすることを考えようとするかもしれません。 –