パネルデータセットに対して手動でブートストラップを行いたい。私は後の操作の一貫性を確認するために、つまり、同じ個人のすべての観測をブートストラップサンプルで選択する必要があることを確認するために、個々のレベルでクラスタリングする必要があります。私がしているのは、索引として使用される一意の個別IDのベクトル上の置換えによるリサンプリングを行うことです。R:リサンプリング後にグループごとに行を選択
df <- data.frame(ID = c("A","A","A","B","B","B","C","C","C"), v1 = c(3,1,2,4,2,2,5,6,9), v2 = c(1,0,0,0,1,1,0,1,0))
boot.index <- sample(unique(df$ID), replace = TRUE)
その後、私はboot.index = (B, B, C)
を想定、インデックスに応じて行を選択し、私はどうやらdf1 <- df[df$ID == testboot.index,]
私が欲しいものを与えるものではありません。この
ID v1 v2
B 4 0
B 2 1
B 2 1
B 4 0
B 2 1
B 2 1
C 5 0
C 6 1
C 9 0
のようなデータフレームを持っていると思います。私はsubset
とfilter
をdplyr
に試しましたが、何も動作しません。基本的に、これはグループインデックス、すべての提案でグループ全体を選択する問題ですか?ありがとう!
の順番は重要ではありません。実際には 'C C A'でも 'C C 'でも問題ありません。 – DXC