Lucene.net一致するCSVファイルの行を取得

巨大なcsvファイル内で用語（または複数の用語）を検索する必要があります。私はLucene.Netを高速クエリにする最善の方法と考えています。Lucene.net一致するCSVファイルの行を取得

私はインデックスを作成してクエリを作成できますが、マッチした行全体を取得することはできません。あなたは、インデックス上の個々のドキュメント内の各行を置くべき

どのようにファイルのインデックスを作成しますか？すべてのファイルは、ドキュメント内の単一のフィールドかフィールドごとに1つの行にありますか？ファイルごと、または最初のファイルごとに一致する必要がありますか？ – gumo

各ファイルには多くの行があり、すべての行にはTABで区切られた値のリストがあります。これらのファイルは2GBまでの膨大なもので、luceneのパフォーマンスをチェックしたいと思います。ファイル全体のインデックスを作成します。一致する単語を含む行全体を取得したいのですが... –

文書には、すべての行を含む1つの完全なCSVファイルが含まれる1つのフィールドがありますか？ – gumo

私はハイライトクラスにしようとしているが、私は正しい行の周りの文字列をカットする必要があると私はこれが最善の方法ではないと思います。.. （例えば、"csv_row"フィールドで）、検索結果ドキュメントのdoc.Get("csv_row")でアクセスします。

P.S. Luceneは実際にはデータベースよりもはるかに速く、巨大なテキストファイル内を検索する正しい方法です。

2011-11-12 20:06:59 buru

答えて