私は2週間間隔ごとに最大値を見つけることによって大きなデータセット(52k +行)を単純化しようとしています。私はすでにすべての行に週番号の値を割り当てておき、毎週の最大値を見つけるためにaggregate()関数を使用しました。サンプルデータを簡素化集計奇数/偶数のペア
:(:週1 & 2、週3 & 4 ... EX)
week <- c(1:5, 5, 7:10)
conc <- rnorm(mean=50, sd=20, n=10)
df <- data.frame(week,conc)
aggregate(df, by=list(week), FUN=max)
はしかし、私はさらに2週間の間隔に基づいて集計する方法に引っかかっています。毎週サンプルを採取したので、1行おきにまとめるほど簡単ではありません。
私は単純な解決策があると仮定していますが、私はそれをまだ見つけていません。
ありがとうございます!
それぞれ隔週ペアをつかむために
出力はちょうど別のSOクエリにこれを示しました。 'tapplyを試してください(df $ conc、rep(1:(nrow(df)/ 2)、each = 2)、FUN = sum)' – Sagar
5週目にどうしたらいいですか? 5週目の値は返されるべきですか? NA? –
Sagar:欠落している週があればまだペアリングを捨てるようです。あなたのコードが間違っていると解釈しない限り... – keta