ranking-functions

    0

    1答えて

    私は、クエリ文書の対のテキストの類似性(余弦類似度)に基づいて2段階ランキングシステムを作成しました。今度は、適切に検索されたアイテムが正しいかどうかをランキングシステムで確認する必要があります。どのアプローチを選択する必要がありますか。ランキングを検証するためにPointwise/Pairwise/Listwiseアプローチについて読みましたが、ランキングシステムを手動で評価すると便利です。誰か

    -1

    2答えて

    私は'employee_id'と'bonuses'を列に持つemployeesテーブルを持っています。 のemployee_idのが繰り返されます。には異なる額の複数のボーナスがあります()。ボーナスの総額をランク付けします。 ので、これは彼らのボーナス総額の降順で従業員をランク付けするための正しい方法だろう場合、私は思っていた: SELECT employee_id, SUM(bonuses)

    1

    1答えて

    これは4人のスコアのリストです。 ジャック23 ボブ25 lorty 45 SAM 25 iはRANK.EQ関数を使用する場合、それは、ランクlorty-1を与え、ボブ-2、SAM-2及びジャック4 は、どのような方法がありますあなたはランク選手にしたい場合は順位がrank.eqは、それが関係しているものを行い、lorty-1、ボブ-2、SAM-2とジャック-3

    0

    3答えて

    私は約30の変数(列)を持つ約5,000万レコードのデータセットを持っています。 各変数のデータセットをランク付けする必要があります。 この大きなデータセットには大量のメモリが必要なため、Procランクは機能しません。 ランクを手動で与えるには、それぞれの変数列でデータセットをソートし、数式を使用してランク付けする必要があります。しかし問題は、非常に長い時間がかかり、実現不可能な30の変数でデータ

    2

    2答えて

    以下のサンプルデータを投稿しています。 私は何を持っていること(ROW_NUMBER関数を使用して達成される)日付と名前列に基づいて番号を生成し、行番号です。私が今必要とするのは、Group_Numという別の派生列で、各グループ(この場合は3つ)の番号を作成します。これは、私の名前列が繰り返されますが、日付列の値が変わるという事実を考慮して達成できますか? ありがとうございます。

    0

    1答えて

    Arima、H2O.Randomforest、glmnet、lmなどのモデルを使用してRで多変量時系列データの予測モデリングを行っています。 私は選択したモデルを選択して予測を行う機能を作成しました。 Model1 <- function(){ .. return() } Model2 <- function(){ ... return() } Mo

    1

    1答えて

    これは別の質問を拡張したものです:私があれば最初column(c_id)でnullを表示したい c_id c_name c_tax 1001 Element1 1 1001 Element1 2 1001 Element2 1 1001 Element2 2 1002 Element3 null 1002 Element4 1 1002 Element4 2 :How to

    1

    2答えて

    私は現在Elasticsearchを使用していますが、検索結果のランクに気付いたことはほとんどありません。プラグイン/スクリプトを作成する方法があるかES、現在の得点アルゴリズムを変更するために使用できますか?

    1

    1答えて

    私は実際にBM25式のbとk1の値を経験的に検証したり評価したりできますか?言い換えれば最も科学的な評価は何ですか? このタイプの評価がどのように行われているかを見るために参照できる研究論文はありますか?