2017-03-03 7 views
0

私はSolrが初めてで、私たちのプロジェクトで人物検索のためにSolrを使用しようとしています。名前、生年月日、性別、住所などのフィールドを持つ個人レコード。我々は、人の記録を検索し、まともな結果を得るために、様々なファジーフィルタと音声フィルタを使用してみました。Solr人名検索の発音アルゴリズム

音声アルゴリズムの場合、これまでに試した他のアルゴリズムよりも比較的優れたBeider Morse音声アルゴリズムを使用しています。誰かがSolrを人の検索のために非常に具体的に使用しているかどうかを知りたいと思います。名前の一致やそれらの比較研究に使用した音声アルゴリズムの経験を共有してください。

多くのおかげ

+0

「Person」というのは、ファイルベースで名前**の名前**を探しているということですか?その場合、あなたの質問を編集するのがいいでしょう。 – Anika

+0

Anikaさんに感謝します。人の詳細を明確にしました。 – thiru

答えて

0

名前マッチングは、Solrのための非常に一般的な使用例であるので、私はそれの経験を持つ人々がたくさんあると確信しています。

しかし、私は最高の表音フィルタを選ぶだけで十分ではないと思います。特定のケースでカスタマイズする必要がある場合でも、例:

  • 名前以外にも、私は通常他のフィールド(国籍、年齢、性別など)に遭遇しています。あなたもやっています。あなたは通常、それらをfqとして、または単なるブーストのために活用します。
  • は、偽陽性または偽陰性が等しく悪いか、または1つが他よりも重度ではありませんか?
  • コーパスには1つの言語が含まれていますが、名前は世界中のどこからでも入力できますか?

などが挙げられる。ベーシスには商用製品があります。これはLucene/Solr革命2015でtheir presentationが表示されていると思います。

+0

感謝persimmonium。私たちはニックネーム、部分的な名前、不注意の名前などの他の側面や、結果セットのスコアを決定する際の年齢、住所などの他の分野も考慮しています。私は音声アルゴリズムについては不明で、今のところBeider Morseを使っています。私たちが持っている名前は英語だけではなく、Beider Morseの読み方も他の多くの言語にも対応できます。他のアルゴリズムに関する提案があればそれを試してみてください。 – thiru

+0

私のポイントは、あなたの最終得点の他のものが(私の最後のセットアップでは、非常に複雑なedismaxをrerankingしてしまいました)Beider Morseや他の発音のあるalgoを使用するより効果があることです – Persimmonium

+0

私は今、あなたの提案とあなたの時間のために非常に! – thiru