lucene

6熱

2答えて

アプリケーションのドメインモデルオブジェクトに変更が加えられたときに、Luceneインデックスを最新の状態に保つことに対する人々の考えを知りたいと考えていました。問題のアプリケーションは、Hibernateを使用するJava/J2EEベースのWebアプリケーションです。私が現在作業している方法は、Hibernateのマップされたモデルオブジェクトがすべて、Luceneに記録されたキー/値ペアのセ

3熱

5答えて

MS SQL、C++ソリューションに最適なフルテキスト検索の代替語

Microsoft SQLの全文検索の最適な選択肢は何ですか？（MS SQLで動作します）私はLuceneとLucene.NETと似たようなものを探していますが、.NETとJavaの要件はありません。また、商用アプリケーションで使用可能なソリューションを探したいと思います。

2熱

4答えて

Java Luceneのトラブルシューティングフィールドを無視する

現在、Lucene 2.1.0をサイト検索に使用しており、難しい問題が発生しました。インデックスフィールドの1つがターゲット検索時に無視されています。ここではGoogleのインデックス内の文書にフィールドを追加するためのコードは次のとおりです。 // Add market_local to index contactDocument.add( new Field( "marke

4熱

1答えて

Luceneでは、得点の計算にどのように用語が使われますか？それをCustomScoreQueryで上書きできますか？

誰かがクエリ内の文書のスコアリングを上書きして、項目の内容に対する用語の「関連性」を自分自身の関数によって決定できるようにしましたか？もしそうなら、CustomScoreQueryを実装し、customScore（int、float、float）をオーバーライドしましたか？正確な用語マッチを他のプレフィックス用語マッチよりもずっと高いランク付けできるカスタムソートまたはカスタムスコアラーのいずれか

14熱

5答えて

LuceneとLucene.Netのロシア語解析ツール

Luceneはロシア語をサポートしていません。 RussianAnalyzer（lucene-contribの一部）の品質は非常に低いです。 SnowballのRussianStemmerモジュールはさらに悪いです。 Unicode文字列のロシア語の文字列は認識されません。UnicodeとKOI8-Rの奇妙な組み合わせを代わりに使用しなければならないと仮定しています。解決策はありますか？

36熱

3答えて

Luceneスコアの結果

それぞれ1つのパーティションしかカバーしていない複数のインデックスがある場合、Luceneでは、なぜ異なるインデックスで同じ検索が異なるスコアで結果を返しますか？異なるサーバーの結果が正確に一致します。私が検索した場合、すなわち：名 - ジョン・スミス DOB - 1934年11月11日パーティション0は0.345 のスコアを返しますパーティション1は、0.337のスコアを返します名前とD

7熱

3答えて

Luceneと：プレフィックス検索を行うと、なぜ多すぎる句がエラーになるのですか？

しばらくの間、プレフィックス検索をしていたアプリを持っていました。最近、インデックスのサイズが増加し、いくつかのプレフィックスは、ルーセンが扱うにはあまりにも多くの量がかかっていたことが判明しました。それはToo Many Clausesというエラーを投げかけていました。私は自分のJARを見て、含まれているコードのどれもブールクエリを実際に使用していないことを確認していたので、非常に不満でした。

10熱

7答えて

Solrでのワイルドカードクエリのエラー

solrを使用してドキュメントを検索しましたが、このクエリ "id:*"を使用してドキュメントを検索しようとすると、*または？を使用してクエリを解析できないことを示すこのクエリパーサー例外が発生します。最初の文字として。 HTTP Status 400 - org.apache.lucene.queryParser.ParseException: Cannot parse 'id:*': '*'