relevance

    0

    1答えて

    スフィンクスの近似対応ランクカーは、若干修正されたBM25ランカー(統計的bag-of-words)+後者を強く支持する最長単語サブストリングのマッチ式を使用しますが、Solrは他の統計ランキング機能(BM25ではなく、 +単語bigrams(これはLWSのアプローチに似ています)のために必要に応じてブースト。私は、これらの両方が、関連性の人間の視点をモデル化しておらず、答えの言葉が必ずしも隣接し

    1

    1答えて

    私は可能な限りすべてのメタ情報を使用して、映画のようなテーマのページの関連性を分類するアルゴリズムを行っていますが、本文のテキストコンテンツは除きます。 私は、ページにテーマに関する情報があるかどうかを判断するために何が使えるのかを知りたいと思います。 現時点では、タイトルの40%、ドメインの後ろのリンクの30%、ドメインの20%、メタキーワードの10%の重要性を与えていますが、もっと正確なこと。

    7

    1答えて

    「食べる」「食べる」「食べる」のような文字列に変換したい。私は検索して、解法としてlemmatizationを見つけましたが、私が遭遇したすべてのlemmatizerツールは、ワードリストまたは辞書検索を使用しています。辞書ルックアップを避け、高効率を与えるルミナタイザーはありますか?ルームタイザーはルールに基づいているかもしれません。はい、私は "茎"を探していません。

    0

    2答えて

    私はユーザーがただ1つのフィールドを持つMySQLで検索しようとしています。テーブルには、次のようになります。ユーザの入力だけでblah blubber、検索はすべての単語天気を確認する必要がある場合 ID BIGINT TITLE TEXT DESCRIPTION TEXT FILENAME TEXT TAGS TEXT ACTIVE TINYINT 今すぐフィールド T

    34

    1答えて

    私は 'cards'というINNODBテーブルに約20,000行ありますので、FULLTEXTはオプションではありません。 この表を考えてみてください。 id | name | description ---------------------------------------------------------- 1 John Smith Just some dude 2

    1

    1答えて

    私は、データベースを検索し、ユーザーが入力した文字列に従って検索結果を関連性によってソートするプロジェクトに取り組んでいます。私の現在の検索はかなりうまくいくと思うが、関連性によって結果を並べ替えるためにコンパイラが書いたコンパイラは私に面白い結果を与えている。私は関連性を考慮する必要があるか分からない。私はこれが情報検索の大きな枝であることは知っていますが、関連性によってオブジェクトを並べ替え、

    1

    1答えて

    私たちはLucene.NET Version 2.9を使ってフリーテキストクエリを使って項目を検索しています。関連性によってLuceneによって自動的にソートされたアイテムを取得します。 1つの奇妙なケースを除いて、これは素晴らしい仕事をしています。 アジャイルプロジェクト管理を検索した場合、Luceneが返す上位4項目は以下のとおりです。ダミーについては アジャイルプロジェクト管理アジャイルプロ

    4

    1答えて

    投稿テーブルに2つのフィールドがあります - post_titleとpost_contentです。今では、標準の全文検索を使用して、いくつかのキーワードを両方のフィールドと照合します。タイトルフィールドにコンテンツフィールドよりも関連性を持たせ、関連性によって結果を並べる必要があります。 この目標を達成するには、どのようなmysql構文がありますか?私は、MySQL 5.1

    1

    3答えて

    コンテンツIDに1つのキーワードを割り当てる検索インデックス(2つの列テーブル)を構築しました。 現在、単一のキーワードを検索しています。 しかし、 SELECT media_id, keyword FROM search_index WHERE keyword = 'b' OR keyword = 'a'のような複数のキーワードを検索すると(そして'a'最初にすべてのヒット、'b')アルファベッ

    2

    4答えて

    検索クエリの関連性スコアを持つドキュメントの一覧があります。ランキングプロセスで日付を紹介しようとするために、関連性スコアを下げるために古い文書が必要です。私はすでに1 /(1 + date_difference)のような関数を使っていろいろ試してみましたが、逆関数は最近の最近の日付をあまりにも区別しています。 私はおそらく、範囲(0..1)とドメイン(0..x)を使ってスコアを増幅する数学的関数