私は誰かが作成したLuceneインデックスから始めています。私は与えられた言葉に続くすべての言葉を見つけたいと思います。私は、インデックスから関心の用語(org.apache.lucene.index.Term)を抽出してきた、と私はその用語を含む文書を検索することができます。Luceneインデックスから次の用語を引き出す方法は?
segmentTermDocs = segmentReader.termDocs(term);
while (segmentTermDocs.next) {
doc = segmentReader.document(segmentTermDocs.doc);
...
}
は私が見つけることのための方法はあります文書中の用語の位置を特定し、それに続く用語を抽出するか?
アイデアありがとう!これはレポートを生成するためのものなので、パフォーマンスは実際問題ではありません。私は、ブルートフォース検索を行い、興味のある言葉と索引の他のすべての用語で構成されるPhraseQuerysを作成しました。ヒットしたクエリは、対象期間に続いた用語を示しました。 –