top-n

    2

    1答えて

    平均処理時間の問題を解決するために取り組んでいます。私は本質的にデータの最高80%だけを平均して異常データを排除しようとしています。 私はグループごとの平均を実行するために、既存のトップNグループソリューションに適応しようとしています。ここではSQL Server 2008の を使用すると、テーブルがどのように見えるかのサンプルです: OpID | ProcessMin | Datestamp

    2

    1答えて

    私は現在ハイブを使用しており、フィールドuser_idとvalueを持つテーブルを持っています。私は、各user_id内で値を降順に並べ替え、各user_idの上位100レコードだけを出力したいと思います。これは私が使用しようとしていますコードです:私はこのクエリを実行すると DROP TABLE IF EXISTS mytable2 CREATE TABLE mytable2 AS SELE

    3

    3答えて

    データフレームとして(浮動小数点数の)1000x1000の行列があります。列と行は0〜1000です。各行について、上位10個の最高値とそのインデックス情報が必要です。 for row, index in df.iterrows(): temp_row = row.copy() sort_row = temp_row.sort() # somehow I want in

    1

    1答えて

    oracleクエリー内のいくつかのグループに対してN回の結果を得る方法を教えてください。 は、例えば以下の表を参照してください。 ID Team Auditor 1 Tm1 Jill 2 Tm2 Jill 3 Tm1 Jill 4 Tm2 Jack 5 Tm2 Jack 6 Tm2 Jack 7 Tm3 Sam

    5

    1答えて

    N個の独立して同一に分布した浮動小数点値のセットのトップk要素を見つけるタスクを考えてみましょう。プライオリティキュー/ヒープを使用することにより、我々は、すべてのN個の要素の上に一回反復し、次の操作によって設定されたトップ-Kを維持することができます。 要素xは、ヒープの頭よりも「より悪い」の場合:廃棄のxヘッドを取り外し、X⇒複雑性O(ログK) 最悪の場合の時間複雑さの挿入:(1) 要素xがヒ

    0

    1答えて

    によって生成された新しい列のトップ10を取得しますか?

    6

    4答えて

    分析関数を使用するのが初めてです。 DEPT EMP SALARY ---- ----- ------ 10 MARY 100000 10 JOHN 200000 10 SCOTT 300000 20 BOB 100000 20 BETTY 200000 30 ALAN 100000 30 TOM 200000

    8

    4答えて

    データフレームからトップ 'n'企業を取得しようとしています。以下は私のコードです。 data("Forbes2000", package = "HSAUR") sort(Forbes2000$profits,decreasing=TRUE) ここで、この並べ替えられたベクトルから上位50個の観測値を取得したいと思います。

    3

    2答えて

    100万を超えるレコードを持つテーブルで、100,000を超えるローを持つユーザーの場合は、最後の20ローを時間軸で取得しようとしています。ユーザーに少数のレコードがある場合、クエリのパフォーマンスは良好です(ms単位)。しかし、約10K-100Kのレコードを持つユーザーの場合、20レコードをフェッチするのに2分以上かかります。 ここでは、クエリです: select * from (select

    0

    2答えて

    汎用TopN IEnumerable<T>拡張を追加しようとしています。 パラメータが正の場合は、Take()と同じですが、負の場合はTake()と同じ操作を実行する必要がありますが、Take()の最後の値と一致する値をすぐに返します。 (SQL TOPとしてのn TIES WITH同じ) これは、現時点で私が持っているコードです: - public static class Test {