2
私のデータは縦方向です。縦方向のデータを置換しないランダムサンプリング
VISIT ID VAR1
1 001 ...
1 002 ...
1 003 ...
1 004 ...
...
2 001 ...
2 002 ...
2 003 ...
2 004 ...
最終的な目標は、テストを実行するたびに10%の訪問を選ぶことです。私はproc SURVEYSELECTを使用してSRSを置き換えずに行い、 "VISIT"を階層として使用しようとしました。しかし、最後のサンプルには重複IDがあります。たとえば、VISIT = 1およびVISIT = 2の両方でID = 001が選択されている可能性があります。
SURVEYSELECTや他の手順を使用する方法はありますか(Rも問題ありません)?どうもありがとう。
したがって、訪問ごとに10%を使いたいが、最終データセットのすべてのIDは一意である必要がありますか? – useR
はい。あなたが言ったのとまったく同じです。 –
IDは訪問時に一意である限り、ave: 'dat $ picked < - ave(dat。$ VISIT)、dat $ VISIT、sample(c(TRUE、FALSE)、length(x) probs = c(.1、.9)、replac = TRUE)) 'となります。 – lmo