2012-01-25 34 views
3

Whooshを使用して文書の類似度を取得するにはどうすればよいですか?Whoosh Pythonを使用した文書の比較/類似性検索ライブラリ

文書との類似度が高い他の以前に索引付けされた文書をランク付けする「関連」機能を作成したいと考えています。

ドキュメントを長いクエリ文字列として入力しますか?ドキュメントをインデックスに追加して、そこから何らかの形で類似クエリの結果を抽出しますか?

おかげ

答えて

1

ヒューという音探索クラスが'more_like()'と呼ばれる方法があります。

これを使用すると、インデックス付きドキュメントと他のインデックス付きドキュメントを比較して、指定したドキュメントに類似するドキュメントの一覧を返すことができます。

そして、class whoosh.searching.Hitは、ランクとスコアを与えることができます。

関連する問題