information-retrieval

0熱

1答えて

ファイアーベースデータベースとストレージを使用して画像とその説明を保持しています。現時点では、8つのイメージと8つの説明があるようにコード化されています。私はそれを得る方法を試してみたいと思っているので、ユーザが4つの画像を選択して4つの説明に入れれば、それを返すことができます。それは8でうまく動作しますが、4を追加して、そのテーブルを選択すると、5番目の写真のvarに何も格納されていないというエ

-1熱

2答えて

索引付け（転記）の変更Luceneの構造

私は新しい方法で文書を索引付けするための研究を行っています。具体的には、既存の索引構造を変更して、索引付け技術を試してみたいと思います。例えば、Luceneが索引付け時に用語とDoc IDを保存する索引を逆転させている場合、その構造について、その用語に関する位置や統計などの他の情報を保存するように拡張したいと考えています。どのように私はそのような拡張を作るつもりですか？そのような拡張を行っている

3熱

1答えて

k個未満の文書が検索されるときの精度k

情報検索の評価では、k個未満の文書が検索されると、精度はどのくらいになりますか？ 5つの文書しか検索されなかったとしましょう。そのうち3つは関連しています。精度@ 10は3/10か3/5でしょうか？

1熱

1答えて

Lemur Indriのブールクエリの作成

Indriクエリ言語を使用して、次のブール型クエリを書くことができません。私は次の文章を書く必要があります： (Stana or Katic) AND (Jon or Huertas) AND (co-stars or colleagues) 私は上記を含むすべての文書のリストが必要です。これをやり遂げるにはどうすればいいですか？

1熱

1答えて

ADHoc情報の取得

イメージの領収書から総請求額を抽出します。私は画像に存在するデータ全体を抽出することができましたが、今私は必要な情報だけを抽出するという問題に苦しんでいます。これは私が持っている画像です。私はちょうど総法案を抽出したいこのデータから画像 m cm lnnk 3mm: :33; no 1 z m x Visut all! ms“; (or nulnunn mfn an an: nan.

3熱

3答えて

ワード埋め込みベクトルを1つのベクトルに結合する方法は？

私は単語の埋め込み（スキップグラム、CBOW）の意味と方法を完全に知っています。 Googleがword2vector APIを持っているということは、その言葉を得ることによってベクトルを生成できるということです。私の問題はこれです：件名、オブジェクト、動詞を含む句があります。各単語はGoogle APIによって既に埋め込まれています。「これらのベクトルを組み合わせて、その句？例：句：V =

0熱

1答えて

Python - マークアップタグを削除し、ファイルからHTMLを読み込みますか？

私はBBC_news_home.htmlと呼ばれるファイルを持っています。すべてのマークアップタグを削除する必要があります。これまでのところ私が得た： def clean_html(html): cleaned = '' line = html pattern = r'(<.*?>)' result = re.findall(pattern, line, re.S) if

0熱

1答えて

情報検索のランク付けを学ぶ

ランク付けの学習は、機械学習に基づくランキングフレームワークです。ランク付けの学習を実装する方法と、必要なデータ前処理についても説明します。ありがとうございました。

0熱

1答えて

教師なしのクリックログで検索エンジンを評価する

私のウェブサイトで検索したユーザーのログと、入力した検索結果と、クリックした結果があります。私は検索アルゴリズムを改善したいと思います。しかし、まず品質を測定する方法が必要です。私はAmazon Turkなどでデータを収集し、人間にテストスイートを作成させることができます。しかし、私は自分のウェブサイトのログですでに利用可能なデータを使用したいと思います。どのように私はこれを行うことができ、ど

0熱

1答えて

Solr6複数のコアを照会してスコアを正規化する

同じ構造/スキーマを共有する複数のコアがあります。私はそれぞれのコアに同じクエリを送って、結果を返すので、 "結果"という新しいコアに保存します。私は結果コアが他のコアからの得点で注文できるようにスコアを保存するカスタムqパーサープラグインを持っています。さまざまなコレクションのスコアを比較することは理にかなっていますか？最大スコアで割って0と1の間でスコアを正規化すると、特定のクエリで個々の