2011-09-13 4 views
2

私は、synonyms.txtファイルにスペルの間違いや訂正された単語のリストを持っています。どのように私はそれをスペルの提案のためにsolrで使うことができますか?solrのsynonyms.txtからスペル候補を取得するには?

synonyms.txtは、次のエントリが含まれています。私はSolrのサーバに「laptap」を照会すると「もしかして?:ラップトップを」と

laptap => laptop 
delll => dell 

、私は提案を取得する必要があります。

私はschema.xmlを、このようになります知っている:

<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true"> 
<analyzer type="index"> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> 
    <filter class="solr.LowerCaseFilterFactory"/> 
    <filter class="solr.StandardFilterFactory"/> 
</analyzer> 
<analyzer type="query"> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> 
    <filter class="solr.LowerCaseFilterFactory"/> 
    <filter class="solr.StandardFilterFactory"/> 
</analyzer> 
</fieldType> 

何solrconfig.xmlについて?私は既にリストを持っているのでインデックスを使用したくない。何か案が?

答えて

2

更新は、フラットファイルからインデックス/辞書を作成しないという要件を収容する:

  1. 所望の挙動を有する
  2. Implement a Custom SpellCheckComponent
  3. のSolr 3.1に加えSuggester機能を見( Suggesterはあなたが望むものに近いと思うが)。

前の提案:ここ

は、ファイルベースのスペルチェックを設定する方法を含んでいるのSolrのスペルチェックを設定するには良い記事です。これに続いて、サンプル構成のspellings.txtファイルをsynonyms.txtファイルに置き換えることができます。

Getting started Spell Checking with Apache Lucene and Solr

+0

FileBasedSpellCheckerを作成し、インデックスの作成と同じであるフラットファイルをオフに基づいてスペリング辞書を使用します。私は訂正された単語へのスペルミスの単語のマッピングを持っており、私はこれらのマッピングを使用してインデックスで検索しません。 FileBasedSpellCheckerを使用してファイルを提案する方法がわかりません。 – qwerty

+0

FileBasedSpellCheckerがフラットファイルからスペルチェック辞書を作成していることに気付かなかった。 –

関連する問題