データフレームを時間間隔で集計し、各列に異なる関数を適用したいとします。私はほとんどaggregate
がダウンしていると思うし、私のデータをchron
パッケージで間隔を空けて分けたが、それは十分に簡単だった。R:列固有の関数を持つ集計
しかし、サブセットの処理方法がわかりません。すべてのマッピング関数*apply
,*ply
は、1つの関数(1つの列または変数を適用する関数のベクトルを取ったが、1つも見つからないものがあると考えていたので)を取るので、私のデータフレームは部分集合であり、インデックスである "時間"とその合計である "Runoff"を除いて、すべての変数の平均値が与えられます。
私はこれを試してみました:それは私に、このエラーを与えていない場合でも、十分な醜いだろう
aggregate(d., list(Time=trunc(d.$time, "00:10:00")), function (dat) with(dat,
list(Time=time[1], mean(Port.1), mean(Port.1.1), mean(Port.2), mean(Port.2.1),
mean(Port.3), mean(Port.3.1), mean(Port.4), mean(Port.4.1), Runoff=sum(Port.5))))
:
Error in eval(substitute(expr), data, enclos = parent.frame()) :
not that many frames on the stack
私は本当に何か間違ったことをやっている私に語っています。私がRの見たところから、これを行うにはエレガントな方法が必要だと思いますが、それは何ですか?
dput:これについて
d. <- structure(list(time = structure(c(15030.5520833333, 15030.5555555556,
15030.5590277778, 15030.5625, 15030.5659722222), format = structure(c("m/d/y",
"h:m:s"), .Names = c("dates", "times")), origin = structure(c(1,
1, 1970), .Names = c("month", "day", "year")), class = c("chron",
"dates", "times")), Port.1 = c(0.359747, 0.418139, 0.417459,
0.418139, 0.417459), Port.1.1 = c(1.3, 11.8, 11.9, 12, 12.1),
Port.2 = c(0.288837, 0.335544, 0.335544, 0.335544, 0.335544
), Port.2.1 = c(2.3, 13, 13.2, 13.3, 13.4), Port.3 = c(0.253942,
0.358257, 0.358257, 0.358257, 0.359002), Port.3.1 = c(2,
12.6, 12.7, 12.9, 13.1), Port.4 = c(0.352269, 0.410609, 0.410609,
0.410609, 0.410609), Port.4.1 = c(5.9, 17.5, 17.6, 17.7,
17.9), Port.5 = c(0L, 0L, 0L, 0L, 0L)), .Names = c("time",
"Port.1", "Port.1.1", "Port.2", "Port.2.1", "Port.3", "Port.3.1",
"Port.4", "Port.4.1", "Port.5"), row.names = c(NA, 5L), class = "data.frame")
大丈夫、私はこれを少し良く理解していると思います。私は強く型付けされた言語に慣れており、Rのクラス強制変換スキームが混乱しているのを発見しています。私が知りたいのは、ほとんどの列の平均を取る単純な方法があるが、それを明示的に行うのではなく、特別に扱うことである。 dfを分離して列を再結合する必要がありますか? – scry