2012-02-06 9 views
0

私はSolrにとってとても新しく、評価しています。私の仕事は、書籍のコーパス内の単語を探して、小さい文脈の中でを返すことです。これまでのところ、段落ごとに分割したデータベースにブックを格納しています(改行で本をスライスします)、全文検索を行い、行を返します。Apache Solrで書籍を検索する

Solrでは同じことをする必要がありますか、またはブック全体(.txt形式)を追加することができます。一致するものが見つかるたびに、前に100ワードプラス100ワード、そんな感じ?ありがとうございます

答えて

3

あなたの入札をハイライトします。ここでhttp://wiki.apache.org/solr/HighlightingParameters

があなたのために関連するオプションです:あなたが記述するものについては

hl.snippets 

The maximum number of highlighted snippets to generate per field..... 

hl.fragsize 

The size, in characters, of the snippets (aka fragments) created by the highlighter..... 
The default value is "100". 

hl.mergeContiguous 

Collapse contiguous fragments into a single fragment.... 

は、5を返すように設定(または人間がsanely扱うことができるものは何でも)hl.fltextフィールドからスニペットを。各スニペットの長さは単語/フレーズの周り400文字(私の近似100ワード)。

フレーズのスニペットを作成する場合はhl.regex.slop、マークアップの場合はhl.simple.pre/hl.simple.postも参照してください。

関連する問題