私はテキストセマンティック検索エンジンを作成しました。しかし、私は自分のシステムの情報検索を評価できるように、ラベル付けされたデータセットを見つけることができません。テキスト情報検索結果解析データセット(テキスト)
ラベルの付いた公開されている文書(テキスト)はありますか?私は情報検索の結果を評価するためにテキスト文書が必要になります。 (リコール、精度、F1値...)
ありがとう。
私はテキストセマンティック検索エンジンを作成しました。しかし、私は自分のシステムの情報検索を評価できるように、ラベル付けされたデータセットを見つけることができません。テキスト情報検索結果解析データセット(テキスト)
ラベルの付いた公開されている文書(テキスト)はありますか?私は情報検索の結果を評価するためにテキスト文書が必要になります。 (リコール、精度、F1値...)
ありがとう。
私はこの方向で研究しています。すべての私の研究では、私はを使用しました。これは3か月間(2006年3月1日から2006年5月31日)に〜650kユーザーから収集された〜20MのWebクエリから構成されています。データは匿名ユーザーIDでソートされ、順番に並べられます。
データセットには{AnonID, Query, QueryTime, ItemRank, ClickURL}
が含まれています。詳細は、上記のリンクを参照してください。私はどのように実装しているのか、可能であればエンジンのコードを共有したいと考えています。また、検索エンジンでAOLデータセットのパフォーマンスを知ることにも興味があります。
私のgit repositoryにデータセットがあります。ありがとう!