2016-05-18 15 views
0

最後に、検索エンジンを作っています。私はsolrを使用して、後でコーパスとして使用されるオントロジからのデータにアクセスして検索します。私はこれらのこと(情報検索、オントロジー、python、solr)に全く新しいものです。精度、リコール、ソルでのROC

クエリ結果を評価するための情報検索のステップがあります。私はこれを評価するためにPrecision、Recall、ROCのスコアを使うつもりです。精度、リコール、およびROCのスコアを計算するためにsolrで関数を使用できる方法はありますか? solrインターフェースやコードの背後にあってさえ問題ではありません。

答えて

1

私が完全に間違っていない限り、精度とリコールのスコアは、検索エンジンから取得したドキュメントと比較する前に、検索して表示する適切なドキュメントが何であるかを知る必要があります。検索ではすでにクエリと完全に一致していると思われる結果が返されます。したがって、結果が期待どおりの結果であるかどうかを判断する必要があります。

検索エンジンがそれ自身で決めることができるのであれば、精度とリコールの両方に常に1(n/n)が与えられるため、完璧な結果が得られます。それらの数字が何であるかを評価できるなら、検索結果にそれらの数字を含める必要はありません。

特定の用語を検索すると、Solrはその用語を含むすべてのドキュメントを提供します(必要に応じて、そのバリエーションは分析チェーンによって異なります)。この関連性を調整することはあなたの仕事であり、自動的には実行できないため、ビジネスケースに依存するため、実際に決定した回答キーを使用して実際に測定を実行する必要があります。

関連する問題