私はdata.frameを集計したいと思います。ここR:2列以上のdata.frame行の集計(中央値)
はサンプルデータである。
data <- structure(list(Charge = c(210133L, 210133L, 210133L, 210152L,
210152L, 210152L, 210152L, 210180L, 210180L, 210180L), Seq = c(1L,
2L, 3L, 1L, 2L, 3L, 4L, 1L, 2L, 2L), x = c(NA, 1.5, 2,
1.5, 1, 0.67, 1.17, 1, 1, 1), y = c(0.5, 0.5, 1, NA, 0.5,
0.5, 0.5, 0.5, 0.5, 0.5)), .Names = c("Charge", "Seq",
"x", "y"), row.names = c(NA, 10L), class = "data.frame")
*説明(上記と同じデータ、異なるフォーマット)の場合:xおよびy列の行の
Charge Seq x y
1 210133 1 NA 0.5
2 210133 2 1.50 0.5
3 210133 3 2.00 1.0
4 210152 1 1.50 NA
5 210152 2 1.00 0.5
6 210152 3 0.67 0.5
7 210152 4 1.17 0.5
8 210180 1 1.00 0.5
9 210180 2 1.00 0.5
10 210180 2 1.00 0.5
中央値は、配列のために実行されなければなりません一意の充電ごとに> 1。
そのため、このサンプルデータのための例えば、私が取得したい配列> 1のためのxとyの列の中央値で追加の行です:
Charge Seq x y
1 210133 1 NA 0.5
2 210133 2 1.50 0.5
3 210133 3 2.00 1.0
4 210133 >1 1.75 0.75 #here is additional row with median of x and y
4 210152 1 1.50 NA
5 210152 2 1.00 0.5...
助けてくれてありがとう!
おかげで、それは魔法のように動作します! –