2016-11-24 13 views
1

大規模なデータセットの中から各クラスの上位10個の露出を選択しようとしています。各データタイプ(SAS)の上位10個の観測値の選択

以下は、データセットの例です。

dataset example

私はトップ10のエクスポージャーを必要としていたならば、私は単純にソート暴露によって降順(私が行ったように)と(OBS = 10)コマンドを使用します。

ただし、各LOBにはトップ10が必要です。

私はSASでこれをどのように行うことができるか知っていますか?

ありがとうございます!

答えて

1

Iは、ビジネスのライン当たりの露光回数をカウント、カウントするダミー変数を作成し、ダミー変数は、これは、所与の(単一datastepで行うことができる10.

を超えているため、任意の観察を削除するであろうことデータは適切にソートされます)、そのSASコードを使用して(ab-)上から下に実行されます。

proc sort data = have out=temp; by lob descending exposure; run; 

data want(drop=countlob); 
    retain countlob; 
    set temp; 
    by lob; 

    countlob = countlob + 1; 
    if first.lob then countlob = 1; 

    if countlob > 10 then delete; 
run; 
関連する問題