information-retrieval

    1

    2答えて

    1つまたは複数のテーブルからデータを取得しようとしています。しかし、それは働いていません。車とイメージの2つのモデルがあります。車両は複数の画像を有することができるが、画像は1つの車両のみを有することができる。これは、未定義の変数を示している:画像私のモデルは以下のとおりです。 //Image: class Image extends Model { protected $filla

    0

    1答えて

    クラシファイア、特にマルチクラスクラシファイアに関する研究を行った。私の質問は、精度とリコールを使ってクラシファイアを評価すると、の意味がわからないということです。偽陽性と偽陰性の多クラス分類器評価です。 たとえば、文書を分類するとき(実際のカテゴリはC-1)、分類器は文書をC-2として分類します。次に、C-2で偽陽性を増やし、C-1で偽陰性を増やすべきですか? (本当の答えはC-1なので)

    1

    1答えて

    print "Running trec_eval script..." N = len(y_pred_test) df_submission = pd.DataFrame(index=numpy.arange(N), columns=['qid', 'iter', 'docno', 'rank', 'sim', 'run_id']) df_submission['qid'] = qids_t

    1

    2答えて

    文書のTF-IDFランキングとランキングのバイナリ独立モデルの違いは何ですか?私はそれらを区別することができません。 私はバイナリ独立モデルの実用的実装がTF-IDFを持つことにつながると思います。私が間違っているなら、私を助けてください。

    1

    1答えて

    私は100のドキュメントを持っています(各ドキュメントはそのドキュメントの単純なリストです)。 TF-IDF行列を作成して、ランクごとに小さな単語検索を作成したいと考えています。私はtfidfVectorizerを使って試しましたが、構文が失われました。どんな助けでも大歓迎です。よろしく。 編集:私は文字列にリストを変換し、親リストにそれらを追加しました: vectorizer = TfidfVe

    0

    2答えて

    私は大量の画像データセットから大きなサイズの特徴ベクトルを抽出するコンテンツベースの画像検索プロジェクトに取り組んでいます。後で検索したり、ユークリッド距離のような距離メトリックを使ってクエリ画像と比較するために、それらの特徴ベクトルを格納するための最良のデータベースは何ですか?

    1

    3答えて

    私は何とかWikipediaから型情報を抽出したい。例えば、私が知りたい:すべての「月」のすべての「NFLチーム」 リストのすべての「色」のすべて「カロライナ・パンサーズの選手」 リストの リスト リスト いいえ、これを行うにはどうすればいいですか? 明らかにAPIを使用していますが、わかっている限り、既存のAPIを使用してWikiからその情報を抽出するのは簡単ではありません。

    1

    1答えて

    私は2つのHashMapを持っていますが、できるだけ早く比較したいのですが、問題はmapAの文字列がスペースで接続された2つの単語で構成されていることです。 mapBのStringは1つの単語だけです。私はそれがすでに行われている、出現箇所をカウントしたくない は、私はMAPAの最初のキーは「こんにちは」キーとキー「世界」を見つける必要があり mapA: key: hello world, va

    0

    1答えて

    順位が2つの計算フィールドを持つ文書で1つのインデックスがあるとします。popularityとrelevanceです。また、popularityでランク付けされる文書と、relevanceでランク付けされる文書の間に重複がないと仮定します。つまり、システムでは、いくつかの書類はpopularityと他はrelevanceでランク付けされるべきです。 その後、私はそれらのN1がpopularityに