lucene

    6

    2答えて

    アプリケーションのドメインモデルオブジェクトに変更が加えられたときに、Luceneインデックスを最新の状態に保つことに対する人々の考えを知りたいと考えていました。 問題のアプリケーションは、Hibernateを使用するJava/J2EEベースのWebアプリケーションです。私が現在作業している方法は、Hibernateのマップされたモデルオブジェクトがすべて、Luceneに記録されたキー/値ペアのセ

    3

    5答えて

    Microsoft SQLの全文検索の最適な選択肢は何ですか? (MS SQLで動作します) 私はLuceneとLucene.NETと似たようなものを探していますが、.NETとJavaの要件はありません。また、商用アプリケーションで使用可能なソリューションを探したいと思います。

    2

    4答えて

    現在、Lucene 2.1.0をサイト検索に使用しており、難しい問題が発生しました。インデックスフィールドの1つがターゲット検索時に無視されています。ここではGoogleのインデックス内の文書にフィールドを追加するためのコードは次のとおりです。 // Add market_local to index contactDocument.add( new Field( "marke

    4

    1答えて

    誰かがクエリ内の文書のスコアリングを上書きして、項目の内容に対する用語の「関連性」を自分自身の関数によって決定できるようにしましたか?もしそうなら、CustomScoreQueryを実装し、customScore(int、float、float)をオーバーライドしましたか?正確な用語マッチを他のプレフィックス用語マッチよりもずっと高いランク付けできるカスタムソートまたはカスタムスコアラーのいずれか

    14

    5答えて

    Luceneはロシア語をサポートしていません。 RussianAnalyzer(lucene-contribの一部)の品質は非常に低いです。 SnowballのRussianStemmerモジュールはさらに悪いです。 Unicode文字列のロシア語の文字列は認識されません。UnicodeとKOI8-Rの奇妙な組み合わせを代わりに使用しなければならないと仮定しています。 解決策はありますか?

    36

    3答えて

    それぞれ1つのパーティションしかカバーしていない複数のインデックスがある場合、Luceneでは、なぜ異なるインデックスで同じ検索が異なるスコアで結果を返しますか?異なるサーバーの結果が正確に一致します。 私が検索した場合、すなわち: 名 - ジョン・スミス DOB - 1934年11月11日 パーティション0は0.345 のスコアを返しますパーティション1は、0.337のスコアを返します 名前とD

    7

    3答えて

    しばらくの間、プレフィックス検索をしていたアプリを持っていました。最近、インデックスのサイズが増加し、いくつかのプレフィックスは、ルーセンが扱うにはあまりにも多くの量がかかっていたことが判明しました。それはToo Many Clausesというエラーを投げかけていました。私は自分のJARを見て、含まれているコードのどれもブールクエリを実際に使用していないことを確認していたので、非常に不満でした。

    10

    7答えて

    solrを使用してドキュメントを検索しましたが、このクエリ "id:*"を使用してドキュメントを検索しようとすると、*または?を使用してクエリを解析できないことを示すこのクエリパーサー例外が発生します。最初の文字として。 HTTP Status 400 - org.apache.lucene.queryParser.ParseException: Cannot parse 'id:*': '*'