部分的な用語を検索できる文書検索エンジン(Xapian、Whoosh、Lucene、Solr、Sphinxなど)を探しています。例えば部分的な単語の文書検索
検索エンジンは「ブリトニー」または「英国」または一般的に単語マッチングR *brit*
接線方向を含む任意の文書のいずれかを含む文書を返すべき用語「ブリット」を探して、私はほとんどのエンジンに気づきました部分的用語ではなく完全な用語に基づくTF-IDF(用語頻度 - 逆文書頻度)またはその派生語を使用する。 TF-IDF以外の文書検索にも成功した技術は他にありますか? luceneので
質問、lucene、Xapian、または少なくとも検索エンジンに検索エンジンタグを追加することをおすすめします。検索は一般的なタグなので、検索エンジンに参加している人は、検索エンジンに関連していない質問に対して、あらゆる種類の奇妙な要求を読んで疲れてしまうかもしれません。がんばろう! – shellter
提案シェルターに感謝します。タグを追加しました。 – GeneralBecos
さまざまなエンジンのドキュメントを読んでいない理由があります。 Lucene(したがってSolr)はワイルドカード検索をサポートしています:http://wiki.apache.org/lucene-java/LuceneFAQ#What_wildcard_search_support_is_available_from_Lucene – ewh