Luceneを読み始めました。提供された例の1つでは、文書を索引に追加する前に、ファイル全体が文書に追加されていました。Luceneでの文書サイズの影響
ただし、ドキュメントでは、このインデックス作成手法では優れたパフォーマンスが得られないことが示唆されていました。推奨される方法は、ファイルの各行を別々のドキュメントに保存することです。
インデックス作成のパフォーマンスを向上させる方法がわかりました。
また、すべてのファイル行をドキュメントフィールドとして追加するには、最初にトークンをトークン化してから、トークンを取得してから同じフィールドを作成する必要があることを確認したかったのです。
あなたはそれについて読むことができるドキュメントを指すことができます。 –
私は以前これをやっていることは聞いたことがありません。私にはちょっと変わったようです。 –
パンゲアの質問に答えるには - パッケージorg.apache.lucene.demo.IndexFilesを参照してください。 indexDocsメソッドについては、javadocを参照してください。 –