11
私は年に最大回数表示されている被写体のみを保持したいと思うパネルデータ(件名/年)を持っています。データセットが大きいので、私はdata.tableパッケージを使用しています。私が下に試したよりもエレガントなソリューションはありますか?R data.table countパネルデータ
library(data.table)
DT <- data.table(SUBJECT=c(rep('John',3), rep('Paul',2),
rep('George',3), rep('Ringo',2),
rep('John',2), rep('Paul',4),
rep('George',2), rep('Ringo',4)),
YEAR=c(rep(2011,10), rep(2012,12)),
HEIGHT=rnorm(22),
WEIGHT=rnorm(22))
DT
DT[, COUNT := .N, by='SUBJECT,YEAR']
DT[, MAXCOUNT := max(COUNT), by='YEAR']
DT <- DT[COUNT==MAXCOUNT]
DT <- DT[, c('COUNT','MAXCOUNT') := NULL]
DT
本質的に、各ビートルの最もデータが豊富な年のすべてのデータを含むdata.tableが必要ですか? –
'j'式と同じように、' data.table'に 'i'式のいくつかの' by'能力があるといいと思います。 –