インデックス作成の2つの方法の違いを理解できませんでした:ANALYZED
とANALYZED_NO_NORMS
私はLucene Javadocを読んだが、その違いを理解していなかった。Luceneでは、ANALYZEDとANALYZED_NO_NORMSの違いは何ですか?
NORMSの詳細を教えてもらえますか?インデックス作成にもたらすメリットや制限は何ですか?
インデックス作成の2つの方法の違いを理解できませんでした:ANALYZED
とANALYZED_NO_NORMS
私はLucene Javadocを読んだが、その違いを理解していなかった。Luceneでは、ANALYZEDとANALYZED_NO_NORMSの違いは何ですか?
NORMSの詳細を教えてもらえますか?インデックス作成にもたらすメリットや制限は何ですか?
は
インデックスに分析を通じて、フィールドの値を実行することによって生成トークンを分析しました。これは一般的なテキストに便利です。アナライザスノーボールステマーアナライザのようなものかもしれません:
ANALYZED_NO_NORMS
はアナライザを使用し、しかし、それはフィールドの規範を作成しません。
規範は、クエリ時に文書の迅速なスコアリングのために作成されます。これらのノルムは通常、すべてがメモリにロードされるため、クエリアナライザをインデックス上で実行すると、検索結果にすばやくスコアを付けることができます。
ノルムがないことは、インデックス時間フィールドとドキュメントブースティングとフィールド長の正規化が無効になっていることを意味します。利点は、索引付けされたフィールドごとに索引内のすべての文書について、ノルムがRAMの1バイトを占めるため、検索時にメモリー使用量が少なくなります。