2009-10-26 5 views

答えて

3

私自身の目的のために検索をしている間、私はlucene-gosenが見つかりました:

彼らの例では、かなりまともに見えますが、私はそれが広範なテストを必要とするもののようなものだと思います。私はまた、彼らの後方互換性の方針(またはむしろ完全なものの欠如)を心配しています。

+1

lucene-gosenは使用しませんでしたが、gosenを使用しました。だから、私はこの答えを受け入れています(それは十分に近いので、プロジェクトは面白そうです)。 CJKは非常に素朴な検索を行います。これはgosenとは違って、文字と一致するだけの単語ではなく、適切な構文解析のために辞書を使用します。 –

4

LuceneのcontribエリアにあるCJKパッケージを見てください。中国語、日本語、韓国語を扱うためのアナライザとトークナイザがあります。

+0

CJKアナライザは、物事を捜す素朴な方法であると思われ、以前の経験からは、の検索結果。 CJKアナライザーをいくつかの重みなどを変更するように動作させるために特に必要なことはありますか? ありがとうございました –

+0

私はCJKアナライザを使ったことがありません。 Luceneのメーリングリスト(http://lucene.apache.org/java/docs/mailinglists.html#Javaユーザリスト)に、より具体的なヘルプを求めてみることができます。Luceneをよく知っている人がいます。 – adrianbanks

関連する問題