0
私は記事のデータベースを入手しました。テキストには500文字から2000文字のデータが含まれています。私は第3rdパーティからそのデータを取得しています。新しいデータの場合は データをパーセントで表示する必要があります。重複パーセンテージは50%以上である場合、そのデータを拒否し、データをデータベースに挿入する必要があります。Solrを使って文書間の一致率を計算できますか?
Solrで重複しているパーセンテージは可能ですか?はいの場合、どのようにこれを達成できますか?
ありがとうございました。
Solr 6以降のバージョンでは、TD25のデフォルトの類似度としてBM25が使用されています(「ClassicSimilarity」として利用可能です) – MatsLindh
ありがとう@MatsLindh私はそれに応じて編集しました。 – AR1
これは私のために働いていない、これを達成するための他のツールですか? –