information-retrieval

    -1

    2答えて

    私は情報検索と抽出を行うためのプログラムを1つ作成しました。ユーザは、検索バーにクエリを入力すると、プログラムは、関連する文および文からなる記事のような関連するtxt結果を示すことができる。 結果を評価する方法についていくつかの調査を行いました。私は精度、リコール、AP、MAPを計算する必要があるかもしれません.... しかし、私はそれが初めてです。結果を計算する方法。私のデータセットにはラベルが

    0

    1答えて

    このように私はこのような状況をどのように処理するかはわかりません。それはほとんど他の多くの壊れたリンク上で動作ではなく、この1: import datetime import praw import re import urllib import requests from bs4 import BeautifulSoup sub = 'dog' imgurUrlPatter

    0

    1答えて

    私は記事Distant Supervision for Relation Extraction using Ontology Class Hierarchy-Based Featuresの遠隔監督のアプローチに従っています。例えば 私はすでにトークン化している文:アテネのアクロポリスに 彼女の最も有名な寺院、パルテノン神殿は、そのタイトル からその名をとり、私はまた、から、字句の機能を持っています

    0

    1答えて

    私は情報検索で手を汚しています。私の教授はこの問題を解決するために私たちに教えてくれましたが、私はそれを回避できません。与えられた行列は、もしそれが距離行列であれば、対角要素はすべて0でなければなりません。しかし、表では、それらは1として与えられます。他の項目も1未満です。これはどのように可能ですか?誰かが説明できますか? 質問5.c.を参照してください。私は手動でテーブルに入ることができず、それ

    0

    2答えて

    同じターム頻度(TF)を含む2つの文書があり、それらのインバース文書頻度(IDF)値も同じであるとします。例えば : - Document1:- tf-idf=0.12 Document2:- tf-idf=0.12 だから、どのように取得し、同じtf-idf値でこれらの文書をランク付けするには?このリンクより多くの情報http://www.tfidf.com/

    -1

    1答えて

    私は、次の形式(txtファイル内)のドキュメント用語リストを持っています。文書の総数は、例えば1400である: DOC 1:こんにちは、私は、ハロー、毎日の費用、(ここではドキュメント1は、テキストファイルである) ドキュメント2:費用、こんにちは(ここではドキュメント2は、テキストでありますファイル) ......... 私はどのようにTFをjavaで実装できますか? TFでどのように多くの用語

    0

    1答えて

    私は、楽しみと利益の両方のためにcamelcamelcamel.comと多少似ているe-comm製品価格比較ツール(Pythonで)を作成しています。私は検索用語を使って、さまざまなウェブサイトから集めたリストと同じアイテムを一致させたいとき、難しい問題に直面しています。私はコサインの類似性を使用していて、同じアイテムを見つけるためにさまざまなアイテムのタイトルを一致させるために、Levensht

    0

    1答えて

    こんにちは私はこの形式では、この逆索引形式のテキストを持っている: 用語の文書1、文書2 poids1 poids2 は、私は名前を軽減haave彼のサイズを小さくしたいです例えば 文書1意志uはuが私に提案することができます任意のアイデアを持っている場合2.5565465454の重量はJavaでexamleため、このような2.55 BigDecimal bd = new BigDecimal(w

    3

    3答えて

    これはかなりの質問であり、具体的な実装を探しているわけではありません(この問題を解決するものが既に存在すれば、それはすばらしいでしょう)。要求された情報がどのように取得されるかについて、誰かが私の考えを伝えることができれば、それは完璧です。 この例で問題を説明します。私は大学(オックスフォード大学など)の名前を持っています。そして、私はこの大学に言及するtwitsを見つけるためにtwitterをフ