information-retrieval

1熱

2答えて

1つまたは複数のテーブルからデータを取得しようとしています。しかし、それは働いていません。車とイメージの2つのモデルがあります。車両は複数の画像を有することができるが、画像は1つの車両のみを有することができる。これは、未定義の変数を示している：画像私のモデルは以下のとおりです。 //Image: class Image extends Model { protected $filla

0熱

1答えて

マルチクラスクラシファイア評価

クラシファイア、特にマルチクラスクラシファイアに関する研究を行った。私の質問は、精度とリコールを使ってクラシファイアを評価すると、の意味がわからないということです。偽陽性と偽陰性の多クラス分類器評価です。たとえば、文書を分類するとき（実際のカテゴリはC-1）、分類器は文書をC-2として分類します。次に、C-2で偽陽性を増やし、C-1で偽陰性を増やすべきですか？（本当の答えはC-1なので）

1熱

1答えて

trec evalはどのようにMAPを計算しますか？

print "Running trec_eval script..." N = len(y_pred_test) df_submission = pd.DataFrame(index=numpy.arange(N), columns=['qid', 'iter', 'docno', 'rank', 'sim', 'run_id']) df_submission['qid'] = qids_t

1熱

2答えて

情報検索システム

文書のTF-IDFランキングとランキングのバイナリ独立モデルの違いは何ですか？私はそれらを区別することができません。私はバイナリ独立モデルの実用的実装がTF-IDFを持つことにつながると思います。私が間違っているなら、私を助けてください。

1熱

1答えて

TF-IDF行列の作成Python 3.6

私は100のドキュメントを持っています（各ドキュメントはそのドキュメントの単純なリストです）。 TF-IDF行列を作成して、ランクごとに小さな単語検索を作成したいと考えています。私はtfidfVectorizerを使って試しましたが、構文が失われました。どんな助けでも大歓迎です。よろしく。編集：私は文字列にリストを変換し、親リストにそれらを追加しました： vectorizer = TfidfVe

0熱

2答えて

類似性マッチングのための後の検索および計算距離測定のために大きなサイズの特徴ベクトルを記憶する最良のデータベースは何ですか？

私は大量の画像データセットから大きなサイズの特徴ベクトルを抽出するコンテンツベースの画像検索プロジェクトに取り組んでいます。後で検索したり、ユークリッド距離のような距離メトリックを使ってクエリ画像と比較するために、それらの特徴ベクトルを格納するための最良のデータベースは何ですか？

1熱

3答えて

Wikipediaから情報（例：型とサブタイプ）を抽出する方法は？

私は何とかWikipediaから型情報を抽出したい。例えば、私が知りたい：すべての「月」のすべての「NFLチーム」リストのすべての「色」のすべて「カロライナ・パンサーズの選手」リストのリストリストいいえ、これを行うにはどうすればいいですか？明らかにAPIを使用していますが、わかっている限り、既存のAPIを使用してWikiからその情報を抽出するのは簡単ではありません。

1熱

1答えて

異なる文字列キーでハッシュマップを比較する

私は2つのHashMapを持っていますが、できるだけ早く比較したいのですが、問題はmapAの文字列がスペースで接続された2つの単語で構成されていることです。 mapBのStringは1つの単語だけです。私はそれがすでに行われている、出現箇所をカウントしたくないは、私はMAPAの最初のキーは「こんにちは」キーとキー「世界」を見つける必要があり mapA: key: hello world, va

0熱

1答えて

弾性検索で上位の文書を取得する

順位が2つの計算フィールドを持つ文書で1つのインデックスがあるとします。popularityとrelevanceです。また、popularityでランク付けされる文書と、relevanceでランク付けされる文書の間に重複がないと仮定します。つまり、システムでは、いくつかの書類はpopularityと他はrelevanceでランク付けされるべきです。その後、私はそれらのN1がpopularityに