2017-04-19 12 views
0

私はElasticsearchでインデックス作成の新しいアプローチを定義したいので、tf idfメソッドを編集します。 TF-IDF elasticsearchの実装はどこにありますか? 新しいアプローチを実装するために私が扱う必要があるelasticsearchソースコードのパッケージは何ですか?Elasticsearchでのインデックス作成の新しいアプローチ

答えて

1

TF/IDF類似アルゴリズムはLuceneで実装されていますが、similarity moduleでElasticsearch内で使用する別の類似アルゴリズムを定義する方法があります。 TF/IDFに加えて、7 more similaritiesがサポートされている現在ある:

  • BM25
  • 古典類似
  • DFR類似
  • DFI類似
  • IB類似
  • LMディリクレ類似
  • LM Jelinek Mercerの類似性

それぞれには調整可能なパラメータがあります。おそらく、あなた自身のものを作り出す前に、それらのそれぞれをテストすることは良い考えです。利用可能Luceneの類似性アルゴリズムに関する

さらに詳しい情報:https://lucene.apache.org/core/6_5_0/core/org/apache/lucene/search/similarities/Similarity.html

+0

これらの類似性をテストした後、私はちょうどBM25アルゴリズムは、Javaプラグインを作成することが必要.is編集してカスタムの類似性を作成することを行うための任意のアイデアを? – Sara

関連する問題