私はdata.tableおよび/またはdplyrに関する助けを探しています。私はこのようなデータフレームを持っている:data.tableまたはdplyrをgroupbyで使用し、日付のサブセット化を使用してR内のデータを操作する
Name Date X Y
Mike 2016-10-21 3.2 1.6
Mike 2016-10-23 3.1 1.4
Mike 2016-10-24 4.9 3.8
Mike 2016-10-25 5.7 4.2
Mike 2016-10-28 0.2 -1.1
Bob 2016-10-21 2.2 -1.1
Bob 2016-10-22 0.2 -3.6
Bob 2016-10-24 -9.2 -14.1
Bob 2016-10-25 -7.2 -12.1
Alice 2016-10-20 7.2 6.1
Alice 2016-10-21 2.2 0.1
Alice 2016-10-23 13.2 8.1
Alice 2016-10-25 12.6 8.8
Alice 2016-10-27 7.7 4.7
Alice 2016-10-28 8.2 5.0
私は一人一人のためにX & Yの平均値を返すことができるようにしたいのですが、それは値のみを使用するように、しかし、私はそれをサブセットしたいのですが各個人の3つの最新の日付から、古い日付のデータは無視されます。私はまた、これらの3つの最新の日付の間にあった日数を返すこともしたいと思います。
Name DaysBetween avgX avgY
Mike 4 3.6 2.3
Bob 3 -5.4 -9.9
Alice 3 9.5 6.2
編集注:このデータは常に最新で注文することになるので、我々はおそらくだけではなく、一人一人のための「最後の3」のデータポイントを取ることができる理想的には、私はこのようなデータフレームで終わるだろう日付論理を使って、どれが最近のものであるかを見つけることができます。
ありがとうございました!
あなたはエラーや間違った結果を出したものを試しましたか? – lukeA
いいえ、私はしていません。これまでのところ、私は各人のすべてのデータポイントについてX&Yの平均を得ることができました。しかし、私は3つの最新の日付を使用するためだけにサブセットする方法に苦労しています。私はdata.tableとdplyrのつもりです。 – user3808992