は、私はこの1つdata.tableでグループ化する:1列以上の結果を取得するには?
library(data.table)
a <- structure(list(PERMNO = c(10006L, 10006L, 10015L, 10015L, 20000L, 20000L),
SHROUT = c(1427L, 1427L, 1000L, 1001L, 200L, 200L),
PRC = c(6.5, 6.125, 0.75, 0.5, 3, 4),
RET = c(0.005, -0.005, -0.001, 0.05, -0.002, 0.0031)),
.Names = c("PERMNO", "SHROUT", "PRC", "RET"),
class = c("data.table", "data.frame"), row.names = c(NA, -6L))
setkey(a,PERMNO)
ようdata.table
オブジェクトを持っていると私はPERMNO
により、計算の数を実行する必要があるが、ここでは、この例では、彼らは唯一の2あるはずましょう:生産
mktcap <- a[ , tail(SHROUT,n=1)*tail(PRC,n=1),by=PERMNO]
sqret <- a[, sum(RET^2),by=PERMNO]
> mktcap
PERMNO V1
[1,] 10006 8740.375
[2,] 10015 500.500
[3,] 20000 800.000
> sqret
PERMNO V1
[1,] 10006 5.000e-05
[2,] 10015 2.501e-03
[3,] 20000 1.361e-05
2つの機能を1つに組み合わせて、マトリックス(またはdata.table、data)を生成したいと考えています。最初のフレームはPERMNO
であり、2番目のフレームはmktcap
で、3番目のフレームはsqrt
です。
このグループ化機能(つまりvariable[ , function(), by= ]
)は、2つの列、つまりキーと結果の2つの列でのみ結果を生成するように見えるという問題があります。
これは私が欲しいものを生産する私の試み(多くの1)である。
PERMNO V1
[1,] 10006 8.740375e+03
[2,] 10006 5.000000e-05
[3,] 10015 5.005000e+02
[4,] 10015 2.501000e-03
[5,] 20000 8.000000e+02
[6,] 20000 1.361000e-05
を生成
comb.fun <- function(datai) {
mktcap <- as.matrix(tail(datai[,1],n=1)*tail(datai[,2],n=1),ncol=1)
sqret <- as.matrix(sum(datai[,3]^2),ncol=1)
return(c(mktcap,sqret))
}
myresults <- a[, comb.fun(cbind(SHROUT,PRC,RET)), by=PERMNO]
は(結果がすべてありますが、それらは一つの列に強制されました) 。私が試しても、2つ以上の列(または複数の結果列)を持つ行列を返すようにグループ化することはできません。
data.table
にグループ化した結果の列を2つ以上取得することはできますか?
+1し、「マクロの明確な説明を誘発するためのMatthew Dowleの表現ありがとう。 –