2016-07-26 5 views
2

私は、Lucene 6.1.0。を使用して、Soundexまたはポルトガル語の適切なアルゴリズムを使用して音声検索を実装したいと考えています。カスタムトークナイザ、アナライザの実装方法を教えて、インターネット経由で多くの不完全なサンプルを見つけましたが、これらのexapmpleで使用される抽象クラスはバージョン6.1.0では同じではないようです。誰かが私がLuceneだけでなく、Java文書だけでなく、どのように物事をまとめる方法を教えることなく、良い文書を見つけることができますか?Luceneを使用して音声検索を実装する方法は?

ありがとうございます。

答えて

4

Analyzer documentationは、アナライザーの作成方法を示しています。

音声分析の場合は、org.apache.lucene.analysis.phoneticパッケージを参照する必要があります( "lucene-analyzer-phonetic-6.1.0.jar"をビルドパスに追加する必要があります)。また、Apacheの "commons-codec-1.10 .jar "、これはget hereです)。

Analyzer analyzer = new Analyzer() { 
    @Override 
    protected TokenStreamComponents createComponents(String fieldName) { 
     Tokenizer tokenizer = new StandardTokenizer(); 
     TokenStream stream = new DoubleMetaphoneFilter(tokenizer, 6, false); 
     return new TokenStreamComponents(tokenizer, stream); 
    } 
}; 
+0

ありがとう:

その後は、セットアップのインスタンスのためのあなたのアナライザのようなものを、することができます。それはうまくいった。 –

関連する問題